Сообщение Gate News, 27 апреля — команда PAI компании Alibaba выпустила и открыла исходный код AgenticQwen, небольшую агентную языковую модель, предназначенную для прикладных задач вызова инструментов промышленного уровня. Модель поставляется в двух версиях: 8B и 30B-A3B. Обученная в рамках инновационной фреймворка обучения с подкреплением "двойного флайвилла данных", AgenticQwen достигает почти агентичных возможностей на уровне модели с триллион параметров, при этом существенно снижая затраты на инференс.
Механизм двойного флайвилла данных решает проблему гомогенизации в традиционных синтетических данных. Флайвилл рассуждений автоматически генерирует более сложные варианты на основе ошибок модели, а агентный флайвилл расширяет простые линейные рабочие процессы (такие как одиночные процессы бронирования) в многоветвистые деревья поведения с ограничениями, отклонениями и противодействующими (адверсариальными) условиями, моделируя реальные сложные сценарии принятия решений. Бенчмарки показывают, что AgenticQwen-8B набрала 47,4 на реальных тестах инструментальной среды (TAU-2 и BFCL-V4), значительно превосходя базовую Qwen3-8B (23,8) и приближаясь к Qwen3-235B (52,0). AgenticQwen-30B-A3B (с задействованием всего 3B параметров) достигла 50,2.
Модель внедрена во внутренние производственные системы, аналогичные Manus, заметно сократив разрыв с моделями 235B по времени сквозного инференса. Однако модель ограничена нативной длиной контекста 40K токенов, что сдерживает ее производительность в задачах глубокого поиска.