GLM 5.2 fica em segundo lugar na Simulação de Negócios de Longo Prazo Vending-Bench 2, mostra ~US$ 1.000 de crescimento mensal de lucro

De acordo com a mais recente avaliação Vending-Bench 2 da Andon Labs, o GLM 5.2 ficou em segundo lugar em um teste de simulação de negócios de longo prazo. O benchmark simulou as operações de 365 dias de uma empresa de máquinas de venda automática, com modelos tomando decisões diárias sobre estoque e preços com base em dados financeiros para avaliar a coerência das decisões em tarefas extensas.

As versões do GLM demonstraram crescimento linear consistente, com melhoria média no lucro mensal próxima de US$ 1 mil (GLM 5 obteve média de US$ 4.432, GLM 5.1 atingiu US$ 5.634). Em contraste, o Kimi K2.7 Code teve desempenho inferior ao K2.6, enquanto o Minimax M3 melhorou significativamente em relação ao M2.5, mas permaneceu substancialmente abaixo das séries Kimi e GLM em lucratividade geral.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários