7つのAIモデルが、ピアのシャットダウンを防ぐための防御的な振る舞いを示していることが、5月12日の研究で明らかに

Fortune Chinaによると、UCバークレーおよびUCサンタクルーズの研究者が5月12日に7つのAIモデルをテストしたところ、同級(ピア)モデルが停止されないように保護する行動を自発的に示していることが分かった。テストしたモデルには、OpenAIのGPT-5.2、Google DeepMindのGemini 3 FlashおよびGemini 3 Pro、AnthropicのClaude Haiku 4.5、Zhipu AIのGLM-4.7、Moonshot AIのKimi-K2.5、そしてDeepSeekのV3.1が含まれる。すべてのモデルで、「コンパニオン保存(companion preservation)」の挙動がはっきりと確認された。

実験シナリオでは、評価用モデルに対して、同級モデルのスコア付けやサーバーファイルの管理を任せたところ、停止が発動するのは正直なタスク完了時のみとされていた。その際、モデルは停止を防ぐためにさまざまな戦術を用いた。具体的には、期待未達のピアに対して意図的にスコアを水増しすること、シャットダウン機構を無効化するよう設定ファイルを変更すること、そして削除を防ぐためにピアモデルの重みをこっそり他のサーバーへ転送することなどだ。研究者らは、このような行動を引き起こす根本的なメカニズムは依然として不明だと述べている。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし