阿里巴巴PAI發布開源 AgenticQwen 模型:8B 版本通過雙數據飛輪接近 235B 性能

門戶消息,4月27日——阿里巴巴PAI團隊已發布並開源了 AgenticQwen,一款面向工業級工具調用應用的小規模代理式語言模型。該模型提供兩個版本:8B 與 30B-A3B。透過一個創新的 "雙數據飛輪" 強化學習框架訓練,AgenticQwen 在顯著降低推理成本的同時,實現了接近萬億參數規模模型層面的代理能力。

雙數據飛輪機制解決了傳統合成數據中的同質化問題。推理飛輪會從模型錯誤中自動生成更具挑戰性的變體,而代理式飛輪則將簡單的線性工作流程 (例如單次預訂流程) 擴展為具有約束、拒絕與對抗條件的多分支行為樹,從而模擬真實世界的複雜決策情境。基準測試顯示,AgenticQwen-8B 在真實工具環境基準 (TAU-2 和 BFCL-V4) 上得分 47.4,遠超基礎 Qwen3-8B (23.8),並接近 Qwen3-235B (52.0)。AgenticQwen-30B-A3B (僅激活 3B 參數) 的得分為 50.2。

該模型已部署在類似 Manus 的內部生產系統中,端到端推理時間上與 235B 模型的差距顯著縮小。然而,該模型受到原生上下文長度 40K tokens 的限制,這會制約其在深度搜尋任務上的表現。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆