門戶消息,4月27日——阿里巴巴PAI團隊已發布並開源了 AgenticQwen,一款面向工業級工具調用應用的小規模代理式語言模型。該模型提供兩個版本:8B 與 30B-A3B。透過一個創新的 "雙數據飛輪" 強化學習框架訓練,AgenticQwen 在顯著降低推理成本的同時,實現了接近萬億參數規模模型層面的代理能力。
雙數據飛輪機制解決了傳統合成數據中的同質化問題。推理飛輪會從模型錯誤中自動生成更具挑戰性的變體,而代理式飛輪則將簡單的線性工作流程 (例如單次預訂流程) 擴展為具有約束、拒絕與對抗條件的多分支行為樹,從而模擬真實世界的複雜決策情境。基準測試顯示,AgenticQwen-8B 在真實工具環境基準 (TAU-2 和 BFCL-V4) 上得分 47.4,遠超基礎 Qwen3-8B (23.8),並接近 Qwen3-235B (52.0)。AgenticQwen-30B-A3B (僅激活 3B 參數) 的得分為 50.2。
該模型已部署在類似 Manus 的內部生產系統中,端到端推理時間上與 235B 模型的差距顯著縮小。然而,該模型受到原生上下文長度 40K tokens 的限制,這會制約其在深度搜尋任務上的表現。