根據深圳政府說法,6 月 5 日,一支包含華為技術(Huawei Technologies)的研究團隊使用該公司的 Ascend 910C 晶片,完成了 DeepSeek-V4-Pro 的全參數後訓練。該專案在一個由超過 1,000 顆華為晶片所驅動的叢集中,運行了 DeepSeek 迄今最大的模型,包含 1.6 兆參數。團隊成員包括華為、深圳 Loop Area Institute、哈爾濱工業大學深圳校區,以及深圳大數據研究院。這標誌著中國在努力下,從以 AI 推論為主轉向在美國出口限制下使用國產硬體進行模型訓練。
免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱
免責聲明。