Artificial Analysis выпускает бенчмарк для кодирующих агентов; Zhipu GLM-5.1 занимает первое место среди моделей с открытым исходным кодом

Artificial Analysis сегодня выпустила новый Index Coding Agent, чтобы оценить, как AI-модели показывают себя при совместном использовании с агентными фреймворками на ключевых бенчмарках, включая SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 и SWE-Atlas-QnA. Zhipu GLM-5.1 заняла первое место среди открытых моделей в ходе оценки, продемонстрировав лидирующие результаты в реальных сценариях работы кодинговых агентов.
Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев