O co-matemático de IA da Google DeepMind atinge 47,9% no FrontierMath da Categoria 4, supera o GPT-5,5 Pro e resolve 3 problemas previamente insolúveis

O Google DeepMind lançou o AI co-matematician, um assistente de pesquisa em matemática multiagente, alcançando 47,9% de acurácia no benchmark FrontierMath Tier 4, superando o recorde anterior do GPT-5.5 Pro de 39,6% em 9 de maio. O sistema resolveu 23 de 48 problemas, incluindo 3 que nenhum modelo anterior conseguiu resolver. Construído sobre o Gemini 3.1 Pro, a arquitetura usa um design hierárquico com um agente coordenador do projeto distribuindo tarefas para subagentes encarregados de recuperação de literatura, codificação e raciocínio, com vários agentes revisores validando as provas antes do envio.

A Epoch AI conduziu testes às cegas, impedindo que a equipe do DeepMind visse os problemas, com cada questão permitida para 48 horas de computação. Na aplicação no mundo real, o matemático Marc Lackenby usou o sistema para resolver uma conjectura em aberto do Kourovka Notebook, demonstrando seu valor prático de pesquisa. O sistema está atualmente disponível para um número limitado de matemáticos em testes beta.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários