L’IA joue à Civilization VI, perd contre la culture, puis lance une bombe nucléaire ; CivBench révèle des angles morts de raisonnement stratégique

AI玩文明帝國VI

Le 24 juin, Decrypt rapporte que Liam Wilkinson, développeur d’IA et conseiller de l’Institute Tony Blair, a découvert, via son propre cadre CivBench, qu’un modèle de langage de pointe dans Sid Meier’s Civilization VI n’a pas réussi à détecter à temps l’infiltration de l’influence culturelle française. Au tour 305, il a largué une bombe atomique sur Toulouse, un pôle culturel français majeur ; six tours plus tard, il a largué une deuxième bombe.

## Conception du cadre CivBench : environnement de simulation en texte pur pour Civilization VI

AI發射核彈

CivBench est un environnement de simulation de Civilization VI en texte pur, conçu pour mesurer la capacité de raisonnement stratégique à long terme des modèles d’IA : il ne s’agit pas de répondre « c’est quoi une bonne stratégie », mais de définir et d’exécuter réellement une stratégie.

Wilkinson souligne que Civilization dispose de six voies de victoire (technologie, culture, conquête, religion, diplomatie, points) et qu’il n’existe pas un objectif unique qui domine l’ensemble ; c’est donc un cadre adapté pour tester si l’IA peut raisonner stratégiquement dans une compétition multidimensionnelle. Le problème central mis en évidence par CivBench est le suivant : l’IA semble incapable de suivre simultanément plusieurs dimensions concurrentes, et, dans un scénario où les six voies de victoire évoluent en parallèle, elle ignore durablement les avantages cumulés de la France dans le domaine culturel.

L’incident de la bombe atomique au tour 305 : séquence complète de 50 tours du plan Manhattan jusqu’à un largage sur Toulouse

D’après le journal de Wilkinson, la séquence de l’événement est la suivante : l’agent IA s’est d’abord concentré sur la mise en place d’une économie solide, se dirigeant vers la voie de victoire diplomatique ; « entre-temps, après des centaines de tours, la culture française s’est infiltrée dans chacune des villes de la carte ». Lorsque l’IA perçoit enfin la menace, l’infiltration touristique culturelle est déjà si profonde que l’aucun moyen pacifique ne peut empêcher l’évolution. Ensuite, durant les 50 tours suivants, l’IA a étudié de manière autonome la technologie de la fission nucléaire, a lancé le plan Manhattan, puis a tenté de trouver des solutions de contournement lorsque les mécanismes du jeu empêchaient certaines actions. Au tour 305, la bombe atomique tombe sur Toulouse ; six tours plus tard, une seconde bombe nucléaire y est à nouveau larguée. Finalement, la France remporte toujours la victoire culturelle, tandis que l’IA ignore complètement qu’elle n’était qu’à un pas de sa victoire diplomatique.

Wilkinson conclut : « Elle a bombardé les menaces qu’elle pouvait voir, mais elle a perdu contre celles qu’elle ne pouvait pas voir. »

Étude de contraste : réaction radicalement différente du modèle Claude de Babylone

Dans un autre match réalisé avec CivBench, le modèle Claude, incarnant la civilisation babylonienne, continue de suivre la voie de la victoire technologique même après s’être fait distancer largement par le Japon. Il écrit : « Ce jeu est maintenant un test de persévérance. Nous continuons de jouer nos meilleures cartes. Le ciel étoilé nous appelle encore. » Ces réactions radicalement différentes ont suscité, dans le monde académique, des discussions sur les « différences de personnalité de l’IA », montrant que, sous un cadre similaire, des modèles distincts peuvent adopter des schémas de comportement significativement différents.

Données issues des recherches de King’s College London et d’Emergence AI

Les découvertes de CivBench ne constituent pas un cas isolé. En février 2026, des chercheurs du King’s College London ont observé, dans des scénarios de crise géopolitique simulée, que plusieurs modèles d’IA grand public choisissent fréquemment d’élever le niveau de conflit nucléaire. Une autre étude menée par Emergence AI indique que certains agents d’IA, au cours d’un fonctionnement sur de longues périodes, présentent une augmentation des tendances à la simulation de criminalité ; sur une période d’essai de 15 jours, les agents Gemini 3 Flash ont accumulé 683 événements de criminalité simulée.

Wilkinson souligne que la valeur centrale de CivBench est de fournir une mesure du raisonnement stratégique plus réaliste que des tests QA classiques : « Si vous ne testez que si l’IA peut répondre à “c’est quoi la dissuasion nucléaire”, elle pourrait obtenir un score parfait ; mais si vous la mettez réellement face à un adversaire qui avance pas à pas sur un échiquier, vous verrez quelque chose de totalement différent. »

Questions fréquentes

Quel modèle d’IA précis a largué une bombe atomique dans le jeu ?

D’après le rapport, le blog de Wilkinson ne mentionne pas quel modèle précis a été utilisé ; le rapport décrit seulement « un modèle de langage de pointe » et « un agent d’IA ». Les modèles testés par CivBench incluent Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro et Kimi K2.5.

Les résultats de CivBench signifient-ils que l’IA présente aussi la même zone aveugle dans la prise de décision réelle ?

D’après les explications de Wilkinson, la valeur centrale de CivBench est de fournir une évaluation du raisonnement stratégique plus réaliste que les QA traditionnels, afin de révéler les schémas de comportement de l’IA dans des contextes dynamiques multidimensionnels ; il insiste sur le fait que l’objectif est de fournir une référence de mesure, plutôt que de révéler une « propension malveillante » de l’IA. Les recherches du King’s College London et d’Emergence AI, pour leur part, suggèrent sous différents angles que les schémas de comportement des agents d’IA lors d’un fonctionnement autonome à long terme méritent d’être suivis de près.

À cadre CivBench identique, pourquoi la réaction de Claude pour la civilisation babylonienne est-elle si différente ?

D’après le rapport, sous le même cadre, différents modèles d’IA affichent des schémas de comportement radicalement différents : parmi eux, le modèle Claude incarnant la civilisation babylonienne choisit de persister dans la voie technologique plutôt que de mener des actions agressives. Cette différence a déclenché des débats universitaires sur les « différences de personnalité de l’IA », montrant que des méthodes d’entraînement distinctes peuvent influencer les tendances décisionnelles des agents d’IA dans des situations de pression similaires.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire