根據 Beating,OpenAI 的後訓練研究員 Paul Garnier 展示了 Codex 5.5 能在流體力學應用中產生可解釋的控制程式,且其表現優於深度強化學習基準。Garnier 並非訓練神經網路,而是使用模型透過分析物理模擬,迭代精修 Python 腳本,並在超過一半的測試情境中取得更佳的效能。
由 AI 生成的控制規則在物理上是可解釋的,例如「當局部曲率超過門檻時延遲噴射注入」。與神經網路黑盒不同,基於程式碼的方法在分佈轉移下顯得更具韌性;當測試時長延長四倍時,傳統 DRL 模型崩潰,但融入物理知識的程式碼仍保持穩定。實作完整的控制策略消耗 2125 萬個 token,總計低於 14 美元。