GPT-5.5-Cyber của OpenAI đạt 85,6% trên bộ chuẩn CyberGym, vượt qua mô hình Mythos bị cấm của Anthropic

OpenAI đã công bố việc ra mắt đầy đủ GPT-5.5-Cyber vào ngày 22/6, như một phần của chương trình phòng thủ mạng Daybreak. Trên bộ benchmark CyberGym—đánh giá các tác nhân AI trong việc tái tạo 1.507 lỗ hổng phần mềm đã biết từ 188 dự án mã nguồn mở—mô hình đạt 85,6%, vượt Mythos 5 của Anthropic với 83,8% và Claude Opus 4,7 với 73,1%.

Việc ra mắt diễn ra trong bối cảnh Mythos 5 và Fable 5 của Anthropic vẫn ngoại tuyến sau lệnh cấm của chính phủ Mỹ ban hành ngày 12/6, với lý do lo ngại an ninh quốc gia và rủi ro jailbreak tiềm ẩn. Ngược lại, GPT-5.5-Cyber chỉ được cung cấp cho các chuyên gia an ninh mạng đã được xác minh và đã được các cơ quan liên bang chấp thuận trước, bao gồm cả Văn phòng Giám đốc An ninh Mạng Quốc gia. OpenAI đã hợp tác với các công ty an ninh mạng như CrowdStrike, Cisco và Cloudflare để tích hợp mô hình vào các công cụ của họ.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận