A Artificial Analysis lança um benchmark de agente de codificação; Zhipu GLM-5.1 fica em primeiro lugar entre os modelos de código aberto

A Artificial Analysis lançou hoje um novo Coding Agent Index para avaliar como modelos de IA se saem quando combinados com frameworks de agentes em benchmarks importantes, incluindo SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 e SWE-Atlas-QnA. O Zhipu GLM-5.1 ficou em primeiro lugar entre os modelos de código aberto na avaliação, demonstrando desempenho líder em cenários reais de agentes de codificação.
Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários