El GPT-5.5-Cyber de OpenAI alcanza el 85,6% en el benchmark CyberGym, superando al modelo Banned Mythos de Anthropic

OpenAI anunció el lanzamiento completo de GPT-5.5-Cyber el 22 de junio como parte de su programa de defensa cibernética Daybreak. En el benchmark CyberGym, que prueba agentes de IA reproduciendo 1.507 vulnerabilidades de software conocidas de 188 proyectos de código abierto, el modelo logró 85,6%, superando a Mythos 5 de Anthropic con 83,8% y a Claude Opus 4.7 con 73,1%.

El lanzamiento ocurre mientras Mythos 5 y Fable 5 de Anthropic permanecen fuera de línea tras una prohibición del gobierno de EE. UU. emitida el 12 de junio, citando preocupaciones de seguridad nacional y posibles riesgos de jailbreak. En cambio, GPT-5.5-Cyber está disponible solo para profesionales de seguridad verificados y ya fue preaprobado por agencias federales, incluido el Office of the National Cyber Director. OpenAI se ha asociado con empresas de ciberseguridad, incluyendo CrowdStrike, Cisco y Cloudflare, para integrar el modelo en sus herramientas.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios