阿里巴巴 PAI 发布开源 AgenticQwen 模型:8B 版本借助双数据飞轮接近 235B 的性能

快讯信息,4月27日——阿里巴巴 PAI 团队发布并开源了 AgenticQwen,这是一款为工业级工具调用应用打造的小规模智能体语言模型。该模型提供两个版本:8B 和 30B-A3B。通过一种创新的“双数据飞轮”强化学习框架进行训练,AgenticQwen 在显著降低推理成本的同时,实现了接近万亿参数级别的模型层面智能体能力。

“双数据飞轮”机制解决了传统合成数据中同质化的问题。推理飞轮会从模型错误中自动生成更难的变体,而智能体飞轮则将诸如单次预订流程(等简单线性工作流)扩展为带约束、拒绝与对抗条件的多分支行为树,从而模拟真实世界中复杂的决策场景。基准测试显示,AgenticQwen-8B 在真实工具环境基准(TAU-2 和 BFCL-V4)上的得分为 47.4,远超基础 Qwen3-8B (23.8),并接近 Qwen3-235B (52.0)。AgenticQwen-30B-A3B (仅激活 3B 个参数) 达到 50.2。

该模型已部署到类似 Manus 的内部生产系统中,端到端推理时间方面与 235B 模型的差距显著缩小。不过,模型的原生上下文长度为 40K tokens,这限制了其在深度搜索任务中的表现。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات