L’IA co-mathématicienne de Google DeepMind atteint 47,9 % sur FrontierMath, catégorie 4, dépasse GPT-5,5 Pro, et résout 3 problèmes précédemment impossibles

Google DeepMind a publié AI co-mathématicien, un assistant de recherche en mathématiques multi-agents, atteignant 47,9% de précision sur le banc d’essai FrontierMath de niveau 4, dépassant l’ancien record de 39,6% de GPT-5.5 Pro le 9 mai. Le système a résolu 23 problèmes sur 48, dont 3 que tous les modèles précédents n’avaient pas réussi à résoudre. Construit sur Gemini 3.1 Pro, l’architecture utilise une conception hiérarchique avec un agent coordinateur de projet qui distribue les tâches à des sous-agents chargés de la recherche documentaire, du codage et du raisonnement, avec plusieurs agents réviseurs validant les preuves avant la soumission.

Epoch AI a mené des tests à l’aveugle, empêchant l’équipe de DeepMind de voir les problèmes, chaque question disposant de 48 heures de calcul. En application réelle, le mathématicien Marc Lackenby a utilisé le système pour résoudre une conjecture ouverte du Kourovka Notebook, démontrant sa valeur pratique en recherche. Le système est actuellement disponible pour un nombre limité de mathématiciens dans le cadre de tests bêta.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire