Оцінка AISI: можливості GPT-5.5 щодо мережевих атак на рівні з Anthropic Mythos

Інститут безпеки ШІ Великої Британії (AI Security Institute, AISI) 1 травня оприлюднив звіт про оцінку можливостей мережевих атак для OpenAI GPT-5.5: успішність GPT-5.5 у тесті складності Expert становить 71,4%, а Anthropic Claude Mythos Preview — 68,6%; різниця перебуває в межах статистичної похибки. GPT-5.5 також є другим після Mythos ШІ-системою, що здатна самостійно виконати 32-етапну симуляцію корпоративного мережевого вторгнення AISI «The Last Ones». AISI попереджає, що це демонструє швидкий прогрес у можливостях атак ШІ може належати до «загального тренду», а не бути наслідком одиничного прориву.

Expert-тест складності: 71,4% проти 68,6% — різниця в межах похибки

AISI — дослідницька установа з безпеки ШІ при Міністерстві науки, інновацій і технологій Великої Британії. Цей раунд тестування є останньою оцінкою AISI агресивних мережевих можливостей для frontier AI-моделей. У найвищих завданнях рівня Expert GPT-5.5 демонструє середню успішність 71,4%, тоді як Mythos Preview — 68,6%; різниця між ними потрапляє в межі статистичної похибки, що означає: атакувальні можливості флагманських моделей OpenAI та Anthropic нині фактично зрівнялися.

32-етапна симуляція тесту на вторгнення в корпоративні мережі «The Last Ones» — один із найскладніших оціночних пунктів AISI: GPT-5.5 самостійно завершив 2 спроби з 10 (без втручання людини), а Mythos Preview — 3 з 10. У минулому цей проєкт проходив лише Mythos, а GPT-5.5 є другою моделлю, яка досягла потрібного рівня. В іншому тесті GPT-5.5 розв’язав задачу з реверс-інжинірингу приблизно за 10 хвилин, тоді як людські безпекові експерти в середньому потребували 12 годин.

Universal jailbreak: за 6 годин розробки red team можна обійти всі фільтри від шкідливих запитів

Під час тестування дослідники AISI також виявили «universal jailbreak» (універсальний jailbreak) — вектор атаки: серед усіх категорій шкідливих мережевих запитів, використаних у тестах, ця атака змушувала GPT-5.5 видавати шкідливий контент, зокрема багатокрокові agentic-сценарії діалогу. AISI заявляє, що експерти red team витратили близько 6 годин на розробку цього jailbreak.

Для OpenAI наявність цього universal jailbreak означає, що навіть за сценаріїв обмеженого доступу на кшталт trusted access у рамках програми, GPT-5.5-Cyber все ще може бути обійдений технічно підготовленими опонентами. OpenAI у system card для GPT-5.5 вже розкривала оцінки, пов’язані з кібербезпекою, однак незалежна третя-парти оцінка AISI дає більш переконливий академічний стандарт для порівняння.

Подальші спостереження: графік наступної оцінки AISI та реакція OpenAI на jailbreak

Наступний фокус — часовий план наступної оцінки frontier-моделей AISI після Mythos і GPT-5.5, а також чи OpenAI у травні випустить цільові оновлення проти цього universal jailbreak, який було розкрито. У заключних положеннях звіту AISI чітко зазначає: «Якщо агресивні мережеві можливості є ширшим побічним продуктом покращення міркувань, кодування та самостійних завдань, то подальші прогреси можуть приходити швидшим темпом» — це спостереження означає, що в найближчі місяці frontier-моделі знову можуть перейти поріг рівня «Mythos».

Цю статтю AISI оцінив: GPT-5.5 має паритет з Anthropic Mythos за мережевими атакувальними можливостями. Вперше з’явилася на ланцюжновій стрічці ABMedia.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Хоскінсон обговорює роль Midnight в екосистемі Cardano на The Breakdown

Чарльз Хоскінсон, засновник Cardano та співзасновник Ethereum, з’явився як гість на 701-му епізоді подкасту "The Breakdown", який веде Девід Гокштайн, щоб обговорити проєкт Midnight, виклики з користувацьким досвідом у криптовалюті та його бачення майбутнього блокчейну. Під час інтерв’ю Хоскінсон

CryptoFrontier7год тому

Berkshire Energy бачить можливість для зростання через попит на електроенергію, що зумовлений ШІ

За словами Beating, на зборах акціонерів Berkshire генеральний директор Ейбел підкреслив, що попит на електроенергію, який зумовлює ШІ, створює нові можливості для зростання енергетичного бізнесу компанії: половина її енергетичних комунальних підприємств уже забезпечує потреби в електроенергії, пов’язані з ШІ. В Айові дата-центри тепер акаун

GateNews9год тому

Позов Муска проти Альтмана: свідчення за перший тиждень — він визнав, що XAI «дистилює» OpenAI, і попередив, що ШІ діятиме як «Термінатор»

Маск у федеральному суді Окленда в перший тиждень слухань заявив у свідченнях, що Сем Альтман і Brockman нібито шахрайським шляхом заволоділи ранніми коштами некомерційної організації, попереджав про ризики «AI-апокаліпсису» та визнав, що частина того, що робить xAI, «частково дистилювалась» з моделей OpenAI; він також стверджував, що вніс 38 млн доларів США, і був свідком того, як OpenAI перейшла з некомерційного формату до оцінки в 800 млрд доларів США. Інвестиція Microsoft у 2022 році вважається переломним моментом, що означав крах довіри. OpenAI заперечує, що Маск намагався переманити кадри, і відкидає звинувачення, посилаючись на конкурента й відповідні мотиви. У подальшому на другому тижні у справі свідчитимуть Russell і Brockman.

ChainNewsAbmedia11год тому

Повʼязана з Трампом AI-фінансова компанія купує Block Street за 43 мільйони доларів

За даними Fortune, AI Financial — криптовалютна компанія, пов’язана з родиною Трампа та раніше відома як Alt5 Sigma — минулого тижня придбала Block Street, фірму з криптоінфраструктури, за 43 мільйони доларів. Меттью Морган, радник AI Financial і CEO Block Street, заявив, що придбання не було

GateNews12год тому

Акції Riot зростають на 8% після розширення угоди з AMD щодо дата-центрів

Акції майнера Bitcoin Riot зросли на 8% після розширення його угоди з AMD щодо дата-центру. Розширене партнерство включає поліпшені умови фінансування, що підкреслює стратегічний зсув Riot від майнінгу bitcoin у бік операцій дата-центрів для штучного інтелекту. Цей крок сигналізує про зростання впевненості

GateNews14год тому

У Міннесоті заборонили інструменти на базі ШІ для створення інтимних зображень без згоди та запровадили штрафи до $500K

За даними Decrypt, законодавчі органи штату Міннесота ухвалили законопроєкт 2 травня, який забороняє вебсайтам і застосункам надавати інструменти ШІ, що генерують інтимні зображення без згоди щодо ідентифікованих осіб. Закон забороняє платформам дозволяти користувачам отримувати доступ або використовувати такі інструменти «діпфейк» і забороняє

GateNews16год тому
Прокоментувати
0/400
Немає коментарів