Kimi K2 Thinking установил новые рекорды в бенчмарках оценки логического мышления, кодирования и агентских способностей

GateNews
Данные Jin10 8 ноября: согласно официальному сайту Yue Zhi An Mian, Kimi K2 Thinking установил новые рекорды в бенчмарках оценки логического мышления, кодирования и агентских способностей. K2 Thinking достиг 44.9% SOTA в бенчмарке HLE, 60.2% в тесте BrowseComp и 71.3% в тесте SWE-Bench Verified, демонстрируя мощные обобщающие способности как передовая модель агента мышления.
Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев