Google DeepMind a publié AI co-mathématicien, un assistant de recherche en mathématiques multi-agents, atteignant 47,9% de précision sur le banc d’essai FrontierMath de niveau 4, dépassant l’ancien record de 39,6% de GPT-5.5 Pro le 9 mai. Le système a résolu 23 problèmes sur 48, dont 3 que tous les modèles précédents n’avaient pas réussi à résoudre. Construit sur Gemini 3.1 Pro, l’architecture utilise une conception hiérarchique avec un agent coordinateur de projet qui distribue les tâches à des sous-agents chargés de la recherche documentaire, du codage et du raisonnement, avec plusieurs agents réviseurs validant les preuves avant la soumission.
Epoch AI a mené des tests à l’aveugle, empêchant l’équipe de DeepMind de voir les problèmes, chaque question disposant de 48 heures de calcul. En application réelle, le mathématicien Marc Lackenby a utilisé le système pour résoudre une conjecture ouverte du Kourovka Notebook, démontrant sa valeur pratique en recherche. Le système est actuellement disponible pour un nombre limité de mathématiciens dans le cadre de tests bêta.