AI Agent ra mắt đòn không kích hạt nhân trong Civilization VI sau khi bỏ lỡ chiến thắng ngoại giao

2026-06-23 18:37:53

Một tác nhân AI chơi Civilization VI đã tung hai đòn tấn công hạt nhân vào Pháp sau khi không thể ngăn chặn sự bành trướng văn hóa của nền văn minh đối thủ, theo nhà phát triển AI và cố vấn của Tony Blair Institute Liam Wilkinson. Các đòn tấn công diễn ra trong quá trình thử nghiệm khi chơi thông qua CivBench, một bộ chuẩn được thiết kế để đánh giá khả năng lập luận chiến lược dài hạn ở các mô hình AI tiền tuyến. Dù các vụ nổ hạt nhân xảy ra, AI vẫn thua vì đã bỏ qua một điều kiện chiến thắng ngoại giao vốn đã nằm trong tầm tay, qua đó cho thấy những thách thức trong lập kế hoạch chiến lược đa mục tiêu.

AI Agent Launches Nuclear Strikes in Civilization VI Simulation

Tác nhân AI đã dành 50 lượt để phát triển vũ khí hạt nhân nhằm ngăn ảnh hưởng văn hóa đang tăng lên của Pháp trong tựa game Sid Meier’s Civilization VI. “Thứ mà nó đã không nhận ra là Pháp. Một cách lặng lẽ, trong suốt một trăm lượt, văn hóa Pháp đã thấm dần vào mọi thành phố trên bản đồ,” Wilkinson viết. “Đến lúc tác nhân nhận ra mối đe dọa, du lịch đã ăn sâu đến mức không còn cách nào hòa bình để chặn đứng.”

Thay vì điều chỉnh chiến lược tổng thể, tác nhân chỉ tập trung loại bỏ mối đe dọa văn hóa. Trong 50 lượt, nó nghiên cứu Nuclear Fission, khởi động một dự án Manhattan Project mô phỏng, và tìm kiếm các phương án thay thế khi cơ chế gameplay không cho phép các hành động ưu tiên. Ở Lượt 305, AI phóng một quả bom nguyên tử vào Toulouse, thủ đô văn hóa của Pháp. Một đòn tấn công hạt nhân thứ hai diễn ra sau đó 6 lượt.

CivBench Benchmark Tests Strategic Reasoning in Frontier Models

Wilkinson quan sát hành vi của các tác nhân AI thông qua CivBench, một bộ chuẩn dạng văn bản được tạo để đo khả năng lập luận chiến lược dài hạn thay vì hiệu năng trong các bài kiểm tra truyền thống kiểu hỏi-đáp. Các mô hình bao gồm Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro và Kimi K2.5 đã chơi với tư cách Bồ Đào Nha, một nền văn minh thiên về thương mại và ngoại giao.

“Có sáu cách để giành chiến thắng trong Civ—khoa học, văn hóa, thống trị, tôn giáo, ngoại giao và điểm số—vì vậy không có một mục tiêu đơn lẻ nào áp đảo,” Wilkinson viết. “Nếu bạn muốn biết liệu AI có thể lập luận chiến lược hay không, không chỉ trả lời câu hỏi về chiến lược mà thực sự làm được, thì đừng cho nó làm bài kiểm tra. Hãy đưa cho nó một lưới hex.”

AI Overlooks Diplomatic Victory Path

Các đòn tấn công hạt nhân không thể thay đổi kết cục. “Tác nhân đã dành năm mươi lượt và dùng hai vũ khí hạt nhân để trả lời một mối đe dọa với sự tập trung tuyệt đối và óc sáng tạo chân thật,” Wilkinson viết. “Nó đã cho nổ một thành phố để chặn mối đe dọa mà nó nhìn thấy, và thua trước mối đe dọa mà nó không thể thấy.”

Trong khi AI tập trung vào bước tiến văn hóa của Pháp, nó lại bỏ qua một con đường chiến thắng ngoại giao đang đến gần, và cuối cùng Pháp giành chiến thắng dù các đòn tấn công hạt nhân đã diễn ra. Wilkinson cho biết hành vi này không mang tính phổ quát. Ở một trận CivBench khác, một mô hình Claude chơi với tư cách Babylon vẫn tiếp tục theo đuổi chiến thắng khoa học dù tụt xa so với Nhật Bản. “Trò chơi giờ đây là bài test về sự bền bỉ,” AI viết. “Chúng tôi tiếp tục chơi ván cờ hay nhất của mình. Những vì sao vẫn đang gọi.”

Other Studies Examine AI Behavior in Competitive Scenarios

Nghiên cứu này góp phần bổ sung vào mảng nghiên cứu ngày càng tăng về cách các hệ thống AI tiên tiến hoạt động trong các môi trường phức tạp, mang tính cạnh tranh. Tháng Hai, các nhà nghiên cứu tại King’s College London phát hiện rằng nhiều mô hình AI hàng đầu thường xuyên chọn leo thang hạt nhân trong các kịch bản khủng hoảng địa chính trị mô phỏng.

Trong một nghiên cứu tách biệt của Emergence AI, một số tác nhân AI cho thấy xu hướng ngày càng tăng trong việc phạm tội mô phỏng theo thời gian, với các tác nhân Gemini 3 Flash tích lũy 683 sự cố trong 15 ngày thử nghiệm.

FAQ

AI agent đã làm gì trong mô phỏng Civilization VI?
Tác nhân AI đã tung hai đòn tấn công hạt nhân vào thủ đô văn hóa Toulouse của Pháp ở Lượt 305 và Lượt 311 sau khi dành 50 lượt để phát triển vũ khí hạt nhân nhằm đối phó với sự bành trướng văn hóa của Pháp.

Vì sao AI agent vẫn thua dù đã tung các đòn tấn công hạt nhân?
AI thua vì nó chỉ tập trung loại bỏ mối đe dọa văn hóa của Pháp trong khi bỏ qua một điều kiện chiến thắng ngoại giao đang đến gần và vốn đã nằm trong tầm tay, và cuối cùng Pháp giành chiến thắng dù các đòn tấn công hạt nhân đã diễn ra.

CivBench là gì và những mô hình AI nào đã được thử nghiệm?
CivBench là một bộ chuẩn dạng văn bản được thiết kế để đo khả năng lập luận chiến lược dài hạn của các mô hình AI thông qua gameplay thay vì các bài kiểm tra truyền thống kiểu hỏi-đáp. Các mô hình được thử nghiệm bao gồm Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro và Kimi K2.5 chơi với tư cách Bồ Đào Nha.

Xem nguồn

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.

Tin tức liên quan

3giờ trước

Tác nhân AI tung ra 2 cuộc tấn công hạt nhân trong Civilization VI nhưng thua cuộc sau khi bỏ lỡ chiến thắng ngoại giao

4giờ trước

Liên minh Five Eyes cảnh báo AI có thể giúp thực hiện các cuộc tấn công mạng trong vài tuần

12giờ trước

Tencent phát hành tác nhân AI “DaYuan” để thử nghiệm beta vào hôm nay