阿里巴巴的 Qwen 開源 Qwen-Scope 可解釋性模組,於 4 月 30 日涵蓋 7 個模型

根據 PANews,4 月 30 日,阿里巴巴的 Qwen 宣布開源 Qwen-Scope,這是一個可解釋性模組,已在 Qwen3 與 Qwen3.5 系列模型上進行訓練。該釋出涵蓋 7 個大型語言模型,包含密集式以及混合專家(mixture-of-experts)變體,並提供 14 組稀疏自編碼器(sparse autoencoder)權重。
免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆