Mistral AI publie Leanstral : le premier Agent de code open source Lean 4, capable de générer automatiquement des preuves formalisées

Gate News rapporte qu’aujourd’hui, le 17 mars, Mistral AI a lancé Leanstral, le premier agent open source conçu spécifiquement pour l’outil de vérification formelle Lean 4. L’innovation principale de ce modèle réside dans sa capacité à générer du code tout en produisant des preuves formelles vérifiables automatiquement par Lean 4, évitant ainsi le goulot d’étranglement traditionnel de la revue manuelle dans la génération de code par l’IA.

Leanstral utilise une architecture sparse MoE, avec un total de 120 milliards de paramètres et 6 milliards de paramètres d’activation, et est publié sous licence Apache 2.0. Il a été spécialement optimisé pour l’entraînement sur lean-lsp-mcp. Les utilisateurs peuvent le lancer sans configuration via la commande /leanstall dans Mistral Vibe, ou l’appeler via l’API gratuite endpoint labs-leanstral-2603, tout en ayant la possibilité de télécharger les poids pour une déploiement autonome.

Mistral a également publié simultanément la nouvelle référence d’évaluation FLTEval, utilisant le projet de formalisation du théorème de Fermat dans la communauté Lean 4 comme scénario de test. Les résultats de performance montrent que : Leanstral pass@2 coûte 36 dollars pour obtenir un score de 26,3, dépassant le modèle Claude Sonnet 4.6, qui coûte 549 dollars pour un score de 23,7 ; pass@16 coûte 290 dollars pour un score de 31,9, soit 8 points de plus que Sonnet 8, tandis que Claude Opus 4.6 nécessite 1 650 dollars pour atteindre 39,6. Parmi les modèles open source, Qwen3.5-397B-A17B doit effectuer 4 essais pour atteindre 25,4, ce qui reste inférieur à la performance de Leanstral pass@2.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire