GLM-5.1 atinge o topo do ranking de código do LMArena: 1.º lugar em open source e 3.º a nível global

Notícias do Gate News, a 10 de abril. Hoje, a plataforma global de avaliação de IA de referência LMArena (plataforma de avaliação de modelos de IA com testes cegos, com participação de milhões de utilizadores) atualizou a tabela de classificação especializada do Code Arena: o GLM-5.1 ficou em primeiro lugar entre os modelos abertos a nível mundial, e em terceiro lugar na classificação global de modelos.

O GLM-5.1 não só herdou as capacidades de codificação em código aberto SOTA da geração anterior, como também alcançou um avanço nas tarefas de longo alcance (Long-Horizon Task), realizando: a construção, do zero, de um ambiente de trabalho Linux em 8 horas; 655 iterações para ultrapassar o gargalo de otimização de uma base de dados vetoriais; e 1000 rondas de chamadas a ferramentas para otimizar a carga de modelos de aprendizagem automática reais.

A destacar ainda que, sob critérios de avaliação equivalentes na tabela METR, o GLM-5.1 é o único modelo aberto a atingir trabalho contínuo ao nível de 8 horas, e é também um dos poucos modelos no mundo, para além do Claude Opus 4.6, com esta capacidade.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários