Sina Weibo открывает исходный код VibeThinker-3B, модель с 3B параметров соответствует уровню рассуждений на уровне передовых решений

По данным Beating intelligence, команда Sina Weibo недавно открыла исходный код VibeThinker-3B — рассуждательной модели с 3 миллиардами параметров, которая демонстрирует уровень, сопоставимый с передовым, в задачах по математике и программированию, а некоторые метрики приближаются к показателям или превышают DeepSeek V3.2, GLM-5 и Gemini 3 Pro.

Построенная на Qwen2.5-Coder-3B, модель использует конвейер обучения Spectrum-to-Signal с пространством рассуждений 64K. Благодаря самодистилляции и проверке на уровне шагов во время инференса VibeThinker-3B улучшила результаты теста по AIME26 с 94,3 до 97,1.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев