OpenAIは、グレムリン問題を研究し、オタク気質の性格報酬シグナルを追跡し、グレムリンへの言及がGPT-5.1で175%急増した

OpenAIによると、同社はGPT-5.1以降に悩まされた「ゴブリン」問題の根本原因を特定したという。報酬シグナルとして「ネーディ」な性格特性を強化するために使われたものがあり、その結果、ファンタジーの生き物への言及を含む出力が促され、学習データセットの76.2%がこのバイアスを示していた。ネーディな性格はChatGPTの回答のわずか2.5%を占めるにとどまっていたが、ゴブリンへの言及の66.7%に寄与しており、GPT-5.2からGPT-5.4にかけて出現は3,881%増加した。

OpenAIは3月にネーディな性格を削除し、偏った報酬シグナルを排除し、学習データをフィルタリングした。同社はさらに、CodexにおいてGPT-5.5の開発者プロンプトに抑制の指示を追加した。調査の結果、新しいモデル挙動の監査ツールが開発された。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし