Artificial Analysis публікує бенчмарк агента для кодування; Zhipu GLM-5.1 посідає перше місце серед моделей із відкритим кодом

GateNews

2026-05-12 12:58:27

Artificial Analysis сьогодні опублікувала новий Coding Agent Index, щоб оцінити, як AI-моделі працюють у поєднанні з агентськими фреймворками на ключових бенчмарках, зокрема SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 і SWE-Atlas-QnA. Zhipu GLM-5.1 посів перше місце серед моделей із відкритим кодом у цьому оцінюванні, продемонструвавши лідерську продуктивність у сценаріях реальних кодингових агентів.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

05-12 11:29

Точність GPT-5.4 знижується зі 100% до 54% на ARC-AGI після багаторазового підсумовування пам’яті

05-12 09:41

Thinking Machines Model T поєднала GPT-Realtime-2 і посіла перше місце в аудіо-бенчмарку сьогодні, набравши 43,4% APR-балів

05-12 03:13

Сім моделей ШІ демонструють захисну поведінку, щоб запобігти вимкненню однолітків — дослідження від 12 травня

05-11 22:55

OpenAI 11 травня відкриє GPT-5.5-Cyber для європейських інституцій; Anthropic стримує Mythos

05-11 08:42

B.AI оголошує стратегічне партнерство з CoinAnk для посилення можливостей торгівлі AI-агентами

Поглиблений аналіз