Codex 以手寫程式碼在流體控制領域超越 DRL,總成本 14 美元

根據 Beating,OpenAI 的後訓練研究員 Paul Garnier 展示了 Codex 5.5 能在流體力學應用中產生可解釋的控制程式,且其表現優於深度強化學習基準。Garnier 並非訓練神經網路,而是使用模型透過分析物理模擬,迭代精修 Python 腳本,並在超過一半的測試情境中取得更佳的效能。

由 AI 生成的控制規則在物理上是可解釋的,例如「當局部曲率超過門檻時延遲噴射注入」。與神經網路黑盒不同,基於程式碼的方法在分佈轉移下顯得更具韌性;當測試時長延長四倍時,傳統 DRL 模型崩潰,但融入物理知識的程式碼仍保持穩定。實作完整的控制策略消耗 2125 萬個 token,總計低於 14 美元。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆