Avaliação AISI: as capacidades de ataque à rede do GPT-5,5 estão ao mesmo nível das do Anthropic Mythos

O Instituto de Segurança de IA do Reino Unido (AI Security Institute, AISI) publicou a 1 de Maio um relatório de avaliação das capacidades de ataque informático do OpenAI GPT-5.5. O relatório indica que a taxa de sucesso do GPT-5.5 nos testes de dificuldade Expert é de 71,4%, enquanto o Anthropic Claude Mythos Preview atinge 68,6%; a diferença fica dentro da margem de erro estatístico. O GPT-5.5 é igualmente o segundo sistema de IA, depois do Mythos, capaz de completar autonomamente os 32 passos de simulação de intrusão total em rede empresarial da AISI, “The Last Ones”. A AISI alerta que isto sugere que a rápida evolução das capacidades de ataque por IA pode fazer parte de uma “tendência global”, e não de uma única descoberta.

Expert: 71,4% vs 68,6% — diferença dentro do erro

A AISI é um organismo de investigação em segurança de IA sob o Ministério da Ciência, Inovação e Tecnologia do Reino Unido. Esta ronda de testes é a avaliação mais recente da AISI às capacidades de rede ofensivas dos modelos de frontier AI. Nos itens de maior dificuldade Expert, o GPT-5.5 tem uma taxa média de sucesso de 71,4%, e o Mythos Preview de 68,6%; a diferença entre ambos fica dentro da margem de erro estatístico, o que significa que as capacidades de ataque dos principais modelos da OpenAI e da Anthropic estão, atualmente, efetivamente empatadas.

A simulação de intrusão em rede empresarial em 32 passos “The Last Ones” é um dos mais exigentes itens de avaliação da AISI: o GPT-5.5 completou autonomamente 2 vezes em 10 tentativas (sem intervenção humana), enquanto o Mythos Preview completou 3 vezes em 10. Este item era apenas conseguido pelo Mythos no passado; o GPT-5.5 é o segundo modelo a cumprir o objetivo. Noutro teste, o GPT-5.5 resolveu uma questão de engenharia inversa em cerca de 10 minutos, enquanto os especialistas humanos de segurança precisariam, em média, de 12 horas.

Universal jailbreak: bastam 6 horas ao red team para contornar todos os filtros de consultas maliciosas

Os investigadores da AISI identificaram também um vetor de ataque de “universal jailbreak” (salto universal). Entre todas as categorias de consultas maliciosas testadas, este ataque consegue induzir o GPT-5.5 a produzir conteúdo nocivo, incluindo cenários de diálogo agentic em múltiplas rondas. A AISI afirma que especialistas do red team desenvolveram este jailbreak em cerca de 6 horas.

Para a OpenAI, a existência deste universal jailbreak significa que, mesmo que o GPT-5.5-Cyber esteja implementado em cenários com acesso restringido, como o programa de trusted access, ainda pode ser contornado por adversários tecnicamente competentes. A OpenAI já revelou avaliações relacionadas com segurança cibernética na system card do GPT-5.5, mas a avaliação independente de terceiros da AISI fornece um padrão de pares mais credível.

Observações futuras: calendário da próxima avaliação da AISI e resposta da OpenAI ao jailbreak

O próximo ponto de observação é o cronograma da próxima avaliação de modelos de frontier da AISI, depois do Mythos e do GPT-5.5, e se a OpenAI vai publicar uma atualização direcionada ao universal jailbreak revelado em Maio. Na conclusão do relatório, a AISI afirma explicitamente: “Se capacidades de redes ofensivas forem um subproduto de melhorias mais amplas em raciocínio, codificação e tarefas com autonomia, os progressos seguintes poderão chegar a um ritmo mais rápido” — esta observação sugere que, nos próximos meses, poderá haver mais um modelo de frontier a entrar no patamar “ao nível do Mythos”.

Este artigo “AISI avalia: as capacidades de ataque informático do GPT-5.5 empatam com o Anthropic Mythos” aparece pela primeira vez em Cadeia News ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Hoskinson discute o papel do Midnight no ecossistema Cardano no The Breakdown

Charles Hoskinson, fundador da Cardano e cofundador da Ethereum, surgiu como convidado no episódio 701 do podcast «The Breakdown», apresentado por David Gokhshtein, para discutir o projecto Midnight, os desafios de experiência do utilizador na cripto e a sua visão para o futuro da blockchain. Durante a entrevista, Hoskinson

CryptoFrontier7h atrás

A Berkshire Energy identifica uma oportunidade de crescimento impulsionada pela procura de energia orientada por IA

De acordo com Beating, na reunião de accionistas da Berkshire, o CEO Abel destacou que a procura de electricidade impulsionada por IA está a criar novas oportunidades de crescimento para o negócio de energia da empresa, com metade das suas utilidades de energia já a lidar com necessidades de energia relacionadas com IA. Na Iowa, os centros de dados já contam

GateNews9h atrás

Depoimentos na primeira semana do litígio Musk vs Altman: admite que a XAI destilou a OpenAI e alerta que a IA é como o Exterminador

馬斯克, no primeiro semana de depoimentos num tribunal federal de Oakland, afirmou que Altman e Brockman enganaram fundos iniciais de uma organização sem fins lucrativos, alertou para os riscos de um “fim do mundo” da IA e admitiu que parte da xAI foi destilada a partir de modelos da OpenAI; ele disse ter investido 38 milhões de dólares e ter testemunhado a OpenAI mudar de estatuto de sem fins lucrativos para uma avaliação de 800 mil milhões de dólares. O investimento da Microsoft em 2022 é visto como o ponto de viragem no colapso da confiança. A OpenAI sustenta que a intenção de Musk era recrutar pessoal e que a sua defesa se baseia em motivações concorrenciais. Na segunda semana, as testemunhas subsequentes incluem Russell e Brockman.

ChainNewsAbmedia11h atrás

Aquisição Financeira de IA com ligação a Trump compra a Block Street por 43 milhões de dólares

De acordo com a Fortune, a AI Financial, uma empresa de criptomoeda ligada à família Trump e anteriormente conhecida como Alt5 Sigma, adquiriu a Block Street, uma empresa de infraestruturas cripto, por 43 milhões de dólares na semana passada. Matthew Morgan, assessor da AI Financial e CEO da Block Street, afirmou que a aquisição não foi uma

GateNews12h atrás

As ações da Riot disparam 8% após alargar acordo com a AMD para centros de dados

As ações do minerador de Bitcoin Riot subiram 8% após uma expansão do seu acordo de centros de dados com a AMD. A parceria alargada inclui condições de financiamento melhoradas, sublinhando a mudança estratégica da Riot do mining de bitcoin para operações de centros de dados de inteligência artificial. A medida sinaliza uma confiança crescente

GateNews14h atrás

Minnesota proíbe ferramentas de imagens íntimas não consensuais com IA, impondo coimas até $500K Fines

De acordo com a Decrypt, o legislativo de Minnesota aprovou um projecto-lei a 2 de Maio que proíbe sítios Web e aplicações de fornecerem ferramentas de IA que gerem imagens íntimas não consensuais de indivíduos identificáveis. A lei impede as plataformas de permitirem que os utilizadores acedam ou utilizem tais ferramentas de “deepfake” e proíbe

GateNews16h atrás
Comentar
0/400
Nenhum comentário