O GPT-5.5-Cyber da OpenAI atinge 85,6% no benchmark CyberGym, superando o modelo Banned Mythos da Anthropic

A OpenAI anunciou o lançamento completo do GPT-5.5-Cyber em 22 de junho, como parte do seu programa de defesa cibernética Daybreak. No benchmark CyberGym — que testa agentes de IA na reprodução de 1.507 vulnerabilidades conhecidas de software a partir de 188 projetos de código aberto — o modelo obteve 85,6%, superando Mythos 5 da Anthropic em 83,8% e Claude Opus 4.7 em 73,1%.

O lançamento acontece enquanto Mythos 5 e Fable 5 da Anthropic permanecem offline após uma proibição do governo dos EUA emitida em 12 de junho, citando preocupações de segurança nacional e riscos potenciais de jailbreak. Em contraste, o GPT-5.5-Cyber está disponível apenas para profissionais de segurança verificados e já foi pré-aprovado por agências federais, incluindo o Office of the National Cyber Director. A OpenAI fez parcerias com empresas de cibersegurança, incluindo CrowdStrike, Cisco e Cloudflare, para integrar o modelo às suas ferramentas.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários