コーデックスは手書きコードで流体制御においてDRLを上回る、総額$14のコスト

Beatingによると、OpenAIのポストトレーニング研究者ポール・ガルニエは、Codex 5.5が流体力学のアプリケーションで、深層強化学習のベースラインよりも優れた、解釈可能な制御コードを生成できることを示した。ニューラルネットワークを学習させるのではなく、ガルニエは物理シミュレーションを解析してモデルを使い、Pythonスクリプトを反復的に改良し、検証したシナリオの半数以上で優れた性能を達成した。

AIが生成した制御ルールは「局所の曲率が閾値を超えたらジェット噴射を遅らせる」のように物理的に解釈可能だった。ニューラルネットワークのブラックボックスとは異なり、コードベースの手法は分布シフト下でも頑健であり、テスト時間を4倍に延長した際には、従来のDRLモデルが崩壊した一方で、物理に基づいたコードは安定したままだった。制御戦略全体の実装には21.25百万トークンを要し、合計は14ドル未満だった。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし