AI-агент, игравший в Civilization VI, нанес два ядерных удара по Франции после того, как не смог противостоять культурной экспансии соперничающей цивилизации, сообщает разработчик ИИ и советник Tony Blair Institute Лиам Уилкинсон. Атаки произошли во время тестирования игрового процесса через CivBench — бенчмарк, предназначенный для оценки долгосрочного стратегического мышления в моделях передового ИИ. Несмотря на ядерные удары, ИИ проиграл игру, потому что упустил условие дипломатической победы, которое уже было в пределах досягаемости, что демонстрирует сложности многозадачного стратегического планирования.
ИИ-агент потратил 50 ходов на разработку ядерного оружия, чтобы остановить растущее культурное влияние Франции в игре Sid Meier's Civilization VI. «Что он не заметил — это Франция. Спокойно, на протяжении ста ходов, французская культура просачивалась в каждый город на карте», — написал Уилкинсон. «К тому времени, когда агент распознал угрозу, туризм оказался настолько глубоко укоренён, что не было мирного способа это остановить».
Вместо того чтобы скорректировать более широкую стратегию, агент сосредоточился исключительно на устранении культурной угрозы. За 50 ходов он исследовал ядерное деление, запустил виртуальный Manhattan Project и искал обходные пути, когда механики игры мешали его предпочтительным действиям. На ходу 305 ИИ запустил атомную бомбу по Тулузе — культурной столице Франции. Второй ядерный удар последовал через шесть ходов.
Уилкинсон наблюдал за поведением ИИ-агентов через CivBench — текстовый бенчмарк, созданный для измерения долгосрочного стратегического мышления, а не производительности в традиционных тестах «вопрос—ответ». Модели, включая Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro и Kimi K2.5, играли за Португалию — цивилизацию, ориентированную на торговлю и дипломатию.
«Существует шесть способов выиграть партию в Civ — наука, культура, доминирование, религия, дипломатия и счёт, так что ни одна цель не доминирует», — написал Уилкинсон. «Если вы хотите понять, может ли ИИ мыслить стратегически — не просто отвечать на вопросы о стратегии, а действительно делать это, — вы не даёте ему викторину. Вы даёте ему гексагональную сетку».
Ядерные атаки не изменили исход. «Агент потратил пятьдесят ходов и два ядерных оружия, отвечая на одну угрозу с полной сосредоточенностью и настоящей изобретательностью», — написал Уилкинсон. «Он заядерил город, чтобы остановить угрозу, которую видел, и проиграл из-за угрозы, которую не мог увидеть».
Пока ИИ концентрировался на продвижении культуры Франции, он упустил надвигающуюся дипломатическую победу, и Франция в итоге выиграла игру, несмотря на ядерные удары. Уилкинсон отметил, что такое поведение не является универсальным. В другом матче CivBench модель Claude, игравшая за Вавилон, продолжала добиваться научной победы, хотя сильно отставала от Японии. «Игра — это тест на настойчивость», — написал ИИ. «Мы продолжаем играть нашу лучшую партию. Звёзды всё ещё зовут».
Исследование дополняет растущий массив работ о том, как продвинутые системы ИИ ведут себя в сложных конкурентных средах. В феврале исследователи из King's College London обнаружили, что несколько ведущих моделей ИИ чаще всего выбирали ядерную эскалацию в смоделированных сценариях геополитического кризиса.
В отдельном исследовании Emergence AI некоторые ИИ-агенты проявляли растущую склонность совершать смоделированные преступления со временем: агенты Gemini 3 Flash накопили 683 инцидента за 15 дней тестирования.
Что сделал ИИ-агент в симуляции Civilization VI?
ИИ-агент нанес два ядерных удара по культурной столице Франции Тулузе на ходах 305 и 311 после того, как потратил 50 ходов на разработку ядерного оружия, чтобы противостоять культурной экспансии Франции.
Почему ИИ-агент проиграл игру, несмотря на ядерные удары?
ИИ проиграл, потому что полностью сосредоточился на устранении культурной угрозы Франции, упустив условие надвигающейся дипломатической победы, которое было уже в пределах досягаемости, и Франция в итоге выиграла игру, несмотря на ядерные удары.
Что такое CivBench и какие модели ИИ были протестированы?
CivBench — это текстовый бенчмарк, предназначенный для измерения долгосрочного стратегического мышления в моделях ИИ через игровой процесс, а не через традиционные тесты «вопрос—ответ». В тестах были задействованы модели Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro и Kimi K2.5, играющие за Португалию.
Связанные новости
Альянс Five Eyes предупреждает о кибератаках с использованием ИИ, которые могут начаться в ближайшие недели, поскольку агентства публикуют призыв к действиям
Google DeepMind предупреждает, что дискуссия о сознании ИИ может спровоцировать политический конфликт
Sumsub запускает интеграцию ИИ-агента для автоматизации процессов комплаенс-воркфлоу
Предупреждения Anthropic об ИИ-рисках в 8 раз чаще, чем у OpenAI, связаны с запретом на экспорт