Menurut OneMillion_AI, Mistral AI baru saja merilis Leanstral 1.5, sebuah model pembuktian formal untuk Lean 4 dengan total 119 miliar parameter dan 65 miliar parameter aktif. Model ini dirilis di bawah lisensi Apache-2.0 dengan akses API gratis. Pada PutnamBench, Leanstral 1.5 mencapai biaya rata-rata sekitar 4 dolar AS per masalah untuk dipecahkan, jauh lebih rendah dibandingkan sistem sebelumnya yang memakan biaya puluhan hingga ratusan dolar AS per masalah.
Model ini memecahkan 587 dari 672 masalah PutnamBench dan mencapai 87% pada tolok ukur aljabar abstrak FATE-H serta 34% pada FATE-X, mencetak rekor performa baru untuk kategorinya. Di luar pembuktian matematika, Leanstral 1.5 juga diterapkan pada verifikasi kode, menemukan 11 bug nyata di 57 repositori Rust sumber terbuka, dengan 5 di antaranya belum pernah dilaporkan sebelumnya.