De acordo com a OneMillion_AI, a Mistral AI lançou recentemente o Leanstral 1.5, um modelo de prova formal para Lean 4 com 119 bilhões de parâmetros totais e 65 bilhões de parâmetros ativos. O modelo é lançado sob licença Apache-2.0 com acesso gratuito à API. No PutnamBench, o Leanstral 1.5 alcança um custo médio de aproximadamente US$ 4 por problema para resolver, significativamente menor do que sistemas anteriores que custavam dezenas a centenas de dólares por problema.
O modelo resolve 587 dos 672 problemas do PutnamBench e atinge 87% no benchmark de álgebra abstrata FATE-H e 34% no FATE-X, estabelecendo novos recordes de desempenho em sua categoria. Além de provas matemáticas, o Leanstral 1.5 também foi aplicado à verificação de código, descobrindo 11 bugs reais em 57 repositórios Rust de código aberto, sendo 5 anteriormente não relatados.