Google DeepMind lanzó AI co-matemático, un asistente de investigación matemática multiagente, logrando 47,9% de precisión en el benchmark FrontierMath Tier 4, superando el récord previo de 39,6% de GPT-5.5 Pro del 9 de mayo. El sistema resolvió 23 de 48 problemas, incluidos 3 que todos los modelos anteriores no lograron resolver. Construido sobre Gemini 3.1 Pro, la arquitectura utiliza un diseño jerárquico con un agente coordinador de proyectos que distribuye tareas a subagentes encargados de recuperación de literatura, codificación y razonamiento, con múltiples agentes revisores validando las pruebas antes de la presentación.
Epoch AI realizó pruebas ciegas, impidiendo que el equipo de DeepMind viera los problemas, con cada pregunta permitida hasta 48 horas de computación. En aplicación en el mundo real, el matemático Marc Lackenby usó el sistema para resolver una conjetura abierta del Kourovka Notebook, demostrando su valor práctico de investigación. El sistema actualmente está disponible para un número limitado de matemáticos en pruebas beta.