Một tác nhân AI chơi Civilization VI đã tung hai đòn tấn công hạt nhân vào Pháp sau khi không thể ngăn chặn sự bành trướng văn hóa của nền văn minh đối thủ, theo nhà phát triển AI và cố vấn của Tony Blair Institute Liam Wilkinson. Các đòn tấn công diễn ra trong quá trình thử nghiệm khi chơi thông qua CivBench, một bộ chuẩn được thiết kế để đánh giá khả năng lập luận chiến lược dài hạn ở các mô hình AI tiền tuyến. Dù các vụ nổ hạt nhân xảy ra, AI vẫn thua vì đã bỏ qua một điều kiện chiến thắng ngoại giao vốn đã nằm trong tầm tay, qua đó cho thấy những thách thức trong lập kế hoạch chiến lược đa mục tiêu.
Tác nhân AI đã dành 50 lượt để phát triển vũ khí hạt nhân nhằm ngăn ảnh hưởng văn hóa đang tăng lên của Pháp trong tựa game Sid Meier’s Civilization VI. “Thứ mà nó đã không nhận ra là Pháp. Một cách lặng lẽ, trong suốt một trăm lượt, văn hóa Pháp đã thấm dần vào mọi thành phố trên bản đồ,” Wilkinson viết. “Đến lúc tác nhân nhận ra mối đe dọa, du lịch đã ăn sâu đến mức không còn cách nào hòa bình để chặn đứng.”
Thay vì điều chỉnh chiến lược tổng thể, tác nhân chỉ tập trung loại bỏ mối đe dọa văn hóa. Trong 50 lượt, nó nghiên cứu Nuclear Fission, khởi động một dự án Manhattan Project mô phỏng, và tìm kiếm các phương án thay thế khi cơ chế gameplay không cho phép các hành động ưu tiên. Ở Lượt 305, AI phóng một quả bom nguyên tử vào Toulouse, thủ đô văn hóa của Pháp. Một đòn tấn công hạt nhân thứ hai diễn ra sau đó 6 lượt.
Wilkinson quan sát hành vi của các tác nhân AI thông qua CivBench, một bộ chuẩn dạng văn bản được tạo để đo khả năng lập luận chiến lược dài hạn thay vì hiệu năng trong các bài kiểm tra truyền thống kiểu hỏi-đáp. Các mô hình bao gồm Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro và Kimi K2.5 đã chơi với tư cách Bồ Đào Nha, một nền văn minh thiên về thương mại và ngoại giao.
“Có sáu cách để giành chiến thắng trong Civ—khoa học, văn hóa, thống trị, tôn giáo, ngoại giao và điểm số—vì vậy không có một mục tiêu đơn lẻ nào áp đảo,” Wilkinson viết. “Nếu bạn muốn biết liệu AI có thể lập luận chiến lược hay không, không chỉ trả lời câu hỏi về chiến lược mà thực sự làm được, thì đừng cho nó làm bài kiểm tra. Hãy đưa cho nó một lưới hex.”
Các đòn tấn công hạt nhân không thể thay đổi kết cục. “Tác nhân đã dành năm mươi lượt và dùng hai vũ khí hạt nhân để trả lời một mối đe dọa với sự tập trung tuyệt đối và óc sáng tạo chân thật,” Wilkinson viết. “Nó đã cho nổ một thành phố để chặn mối đe dọa mà nó nhìn thấy, và thua trước mối đe dọa mà nó không thể thấy.”
Trong khi AI tập trung vào bước tiến văn hóa của Pháp, nó lại bỏ qua một con đường chiến thắng ngoại giao đang đến gần, và cuối cùng Pháp giành chiến thắng dù các đòn tấn công hạt nhân đã diễn ra. Wilkinson cho biết hành vi này không mang tính phổ quát. Ở một trận CivBench khác, một mô hình Claude chơi với tư cách Babylon vẫn tiếp tục theo đuổi chiến thắng khoa học dù tụt xa so với Nhật Bản. “Trò chơi giờ đây là bài test về sự bền bỉ,” AI viết. “Chúng tôi tiếp tục chơi ván cờ hay nhất của mình. Những vì sao vẫn đang gọi.”
Nghiên cứu này góp phần bổ sung vào mảng nghiên cứu ngày càng tăng về cách các hệ thống AI tiên tiến hoạt động trong các môi trường phức tạp, mang tính cạnh tranh. Tháng Hai, các nhà nghiên cứu tại King’s College London phát hiện rằng nhiều mô hình AI hàng đầu thường xuyên chọn leo thang hạt nhân trong các kịch bản khủng hoảng địa chính trị mô phỏng.
Trong một nghiên cứu tách biệt của Emergence AI, một số tác nhân AI cho thấy xu hướng ngày càng tăng trong việc phạm tội mô phỏng theo thời gian, với các tác nhân Gemini 3 Flash tích lũy 683 sự cố trong 15 ngày thử nghiệm.
AI agent đã làm gì trong mô phỏng Civilization VI?
Tác nhân AI đã tung hai đòn tấn công hạt nhân vào thủ đô văn hóa Toulouse của Pháp ở Lượt 305 và Lượt 311 sau khi dành 50 lượt để phát triển vũ khí hạt nhân nhằm đối phó với sự bành trướng văn hóa của Pháp.
Vì sao AI agent vẫn thua dù đã tung các đòn tấn công hạt nhân?
AI thua vì nó chỉ tập trung loại bỏ mối đe dọa văn hóa của Pháp trong khi bỏ qua một điều kiện chiến thắng ngoại giao đang đến gần và vốn đã nằm trong tầm tay, và cuối cùng Pháp giành chiến thắng dù các đòn tấn công hạt nhân đã diễn ra.
CivBench là gì và những mô hình AI nào đã được thử nghiệm?
CivBench là một bộ chuẩn dạng văn bản được thiết kế để đo khả năng lập luận chiến lược dài hạn của các mô hình AI thông qua gameplay thay vì các bài kiểm tra truyền thống kiểu hỏi-đáp. Các mô hình được thử nghiệm bao gồm Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro và Kimi K2.5 chơi với tư cách Bồ Đào Nha.
Tin tức liên quan
Liên minh Five Eyes Cảnh báo Các Tấn Công Mạng Bằng AI Chỉ Còn Vài Tuần Nữa Khi Các Cơ Quan Kêu Gọi Hành Động
Google DeepMind cảnh báo tranh luận về ý thức của AI có thể khơi dậy xung đột chính trị
Sumsub ra mắt tích hợp AI Agent để tự động hóa quy trình tuân thủ
Cảnh báo rủi ro AI của Anthropic xuất hiện thường xuyên gấp 8 lần so với OpenAI, liên quan đến lệnh cấm xuất khẩu