O co-matemático de IA do Google DeepMind atinge 47,9% no FrontierMath Tier 4, supera o GPT-5.5 Pro e resolve 3 problemas previamente insolúveis

A Google DeepMind lançou o co-matemático de IA, um assistente de investigação matemática multi-agente, alcançando 47,9% de precisão no benchmark FrontierMath Tier 4, superando o recorde anterior do GPT-5.5 Pro de 39,6% a 9 de maio. O sistema resolveu 23 de 48 problemas, incluindo 3 que todos os modelos anteriores falharam em resolver. Construído sobre o Gemini 3.1 Pro, a arquitetura usa um design hierárquico com um agente coordenador de projeto que distribui tarefas por sub-agentes encarregues de pesquisa de literatura, codificação e raciocínio, com vários agentes avaliadores a validar as provas antes da submissão.

A Epoch AI realizou testes cegos, impedindo a equipa da DeepMind de ver os problemas, com cada questão permitida até 48 horas de computação. Numa aplicação no mundo real, o matemático Marc Lackenby usou o sistema para resolver uma conjectura em aberto do Kourovka Notebook, demonstrando o seu valor prático para investigação. O sistema está atualmente disponível para um número limitado de matemáticos em testes beta.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário