Zhipu GLM-5.2 очолює DeepSWE відкритий бенчмарк із 44% рівнем успішності, демонструючи кращі результати, ніж популярні закриті моделі

Згідно з Beating (моніторинговим акаунтом), модель GLM-5.2 із відкритим кодом від Zhipu AI досягла найвищого рівня успішності серед моделей із відкритим кодом у бенчмарку DeepSWE для складних задач з інженерії програмного забезпечення: 44% успішних спроб з першого разу за максимальної інтенсивності міркувань. Це перевершує Kimi K2.7 Code на 13 відсоткових пунктів — 31%.

За ціною 3,92 долара за задачу GLM-5.2 показує кращу продуктивність, ніж кілька популярних закритих моделей, за певних конфігурацій міркувань, зокрема Claude Sonnet 4.6 [high] — 30%, Gemini 3.5 Flash [medium] — 37% і Claude Opus 4.8 [low] — 41%.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів