Hugging Face 開放原始碼 ml-intern:用於自主式 ML 研究的 AI 代理

Gate News 訊息,4 月 22 日——Hugging Face 已開源 ml-intern,這是一款 ML 研究代理,能夠自主完成整個工作流程:閱讀論文、整理資料集、啟動 GPU 訓練、評估結果,並持續迭代改進。該專案基於 Hugging Face 的 smolagents 框架,並提供 CLI 與網頁式介面,程式碼可在 GitHub 上取得。

ml-intern 工具鏈以 Hugging Face 生態系為核心。它從 arXiv 與 HF Papers 擷取論文,同時追蹤引用鏈以便進行更深入的閱讀;在 HF Hub 上瀏覽資料集、驗證品質,並重新格式化資料以用於訓練;當本地 GPU 資源不可用時,會呼叫 HF Jobs 來啟動基於雲端的訓練任務。訓練完成後,代理會自動閱讀評估輸出、診斷失敗原因,並重新執行實驗。預設情況下,它使用 Claude Sonnet 4.5 來驅動決策迴圈,每次執行最多 300 次迭代;當超過 170k tokens 時,會自動進行情境壓縮。

Hugging Face 展示了三個使用案例。在科學推理任務中,該代理透過引用鏈找出 OpenScience 與 NemoTron-CrossThink 資料集,並根據難度等級從 ARC、SciQ 與 MMLU 篩選出 7 個變體;接著在 Qwen3-1.7B 上進行 12 輪的監督式微調,使 GPQA 分數在 10 小時內從 10% 提升到 32%。在醫療應用中,該代理判定既有資料集不足,撰寫腳本以生成 1,100 個合成資料樣本,並將其擴增 50 倍用於訓練;在 HealthBench 上,其效能超過 Codex 60%。在競賽型數學情境中,該代理編寫了 GRPO 訓練腳本,並透過 HF Spaces 在 A100 GPU 上啟動訓練;隨後在觀察到獎勵崩潰後進行了消融研究。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆