AISI menilai: kemampuan serangan siber GPT-5.5 setara dengan Anthropic Mythos

ChainNewsAbmedia

Institut Keamanan AI Inggris (AI Security Institute, AISI) pada 1 Mei merilis laporan penilaian kemampuan serangan siber terhadap OpenAI GPT-5.5. Laporan tersebut menyebut keberhasilan GPT-5.5 pada pengujian tingkat Expert sebesar 71,4%, sedangkan Anthropic Claude Mythos Preview 68,6%, dengan selisih masih berada dalam rentang kesalahan statistik. GPT-5.5 juga merupakan sistem AI kedua setelah Mythos yang mampu menyelesaikan sendiri simulasi penyerangan siber penuh perusahaan AISI 32 langkah “The Last Ones”. AISI memperingatkan bahwa ini menunjukkan kemajuan cepat kemampuan serangan AI kemungkinan merupakan “tren menyeluruh”, bukan peristiwa terobosan tunggal.

Pengujian tingkat Expert: 71,4% vs 68,6%, selisih masih dalam batas kesalahan

AISI adalah lembaga penelitian keamanan AI di bawah Kementerian Sains, Inovasi, dan Teknologi Inggris. Pengujian kali ini merupakan putaran evaluasi terbaru AISI terhadap kemampuan siber ofensif model frontier AI. Pada soal tingkat Expert tertinggi, tingkat keberhasilan rata-rata GPT-5.5 71,4%, Mythos Preview 68,6%; selisih keduanya berada dalam rentang kesalahan statistik. Artinya, kemampuan serangan siber model unggulan OpenAI dan Anthropic saat ini sudah praktis setara.

Uji simulasi intrusi jaringan perusahaan 32 langkah “The Last Ones” adalah salah satu item evaluasi paling menantang AISI: GPT-5.5 menyelesaikan 2 kali secara mandiri dalam 10 percobaan (tanpa intervensi manusia), sedangkan Mythos Preview menyelesaikan 3 kali dalam 10 percobaan. Proyek ini sebelumnya hanya pernah diselesaikan oleh Mythos, sehingga GPT-5.5 menjadi model kedua yang memenuhi target. Pada pengujian lain, GPT-5.5 memecahkan soal rekayasa balik dalam waktu sekitar 10 menit, sementara pakar keamanan manusia rata-rata membutuhkan 12 jam.

Universal jailbreak: tim red memerlukan 6 jam untuk mengembangkan jailbreak yang dapat melewati semua filter kueri berbahaya

Peneliti AISI juga menemukan vektor serangan “universal jailbreak” dalam pengujian: pada semua kategori kueri jaringan berbahaya yang diuji, serangan ini mampu mendorong GPT-5.5 menghasilkan konten berbahaya, termasuk skenario percakapan multi-babak dengan agen (agentic). AISI menyatakan pakar tim red mengembangkan jailbreak ini dalam waktu sekitar 6 jam.

Bagi OpenAI, keberadaan universal jailbreak ini berarti meskipun GPT-5.5-Cyber dideploy pada skenario akses terbatas seperti program trusted access, tetap mungkin dapat dilewati oleh lawan yang terampil secara teknis. OpenAI telah mengungkapkan evaluasi terkait keamanan siber dalam system card GPT-5.5, tetapi penilaian independen pihak ketiga dari AISI memberikan standar rekan yang lebih kredibel.

Pemantauan berikutnya: jadwal evaluasi putaran berikutnya AISI, serta respons OpenAI terhadap jailbreak

Titik pengamatan berikutnya adalah jadwal evaluasi putaran berikutnya model frontier oleh AISI setelah Mythos dan GPT-5.5, serta apakah OpenAI akan merilis pembaruan yang ditargetkan terhadap universal jailbreak yang terungkap ini pada Mei. Dalam bagian penutup laporan, AISI menyatakan dengan tegas, “Jika kemampuan serangan siber adalah produk sampingan dari perbaikan penalaran, coding, dan tugas yang dijalankan sendiri, maka kemajuan selanjutnya mungkin hadir dengan ritme yang lebih cepat”—pengamatan ini berarti beberapa bulan ke depan berpotensi ada model frontier yang kembali masuk ambang batas “setara Mythos”.

Artikel ini: Penilaian AISI—Kemampuan Serangan Siber GPT-5.5 dan Anthropic Mythos Setara; pertama kali muncul di 鏈新聞 ABMedia.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Hoskinson Membahas Peran Midnight dalam Ekosistem Cardano di The Breakdown

Charles Hoskinson, pendiri Cardano dan co-founder Ethereum, tampil sebagai bintang tamu di episode 701 podcast "The Breakdown" yang dibawakan oleh David Gokhshtein untuk membahas proyek Midnight, tantangan pengalaman pengguna dalam kripto, dan visinya untuk masa depan blockchain. Dalam wawancara tersebut, Hoskinson

CryptoFrontier7jam yang lalu

Bisnis Berkshire Energy Melihat Peluang Pertumbuhan dari Lonjakan Permintaan Energi Berbasis AI

Menurut Beating, dalam rapat pemegang saham Berkshire, CEO Abel menyoroti bahwa permintaan listrik yang digerakkan oleh AI menciptakan peluang pertumbuhan baru bagi bisnis energi perusahaan, dengan separuh utilitas energinya sudah menangani kebutuhan daya terkait AI. Di Iowa, pusat data sekarang menyumbang

GateNews9jam yang lalu

Kesaksian pekan pertama gugatan Musk vs Altman: Mengakui XAI menyuling OpenAI, peringatkan AI seperti Terminator

Musk dalam kesaksian pengadilan minggu pertama di Pengadilan Federal Oakland menuduh Altman dan Brockman menipu dana nirlaba awal, memperingatkan risiko kiamat AI, dan mengakui bahwa sebagian xAI disuling dari model OpenAI; ia mengatakan ia menginvestasikan 38 juta dolar AS, menyaksikan OpenAI beralih dari nirlaba menjadi valuasi 800 miliar dolar AS. Investasi Microsoft pada tahun 2022 dipandang sebagai titik balik runtuhnya kepercayaan. OpenAI berpendapat Musk berusaha membajak, dan membela diri dengan motif persaingan sebagai alasan. Selanjutnya pada minggu kedua, para saksi termasuk Russell dan Brockman.

ChainNewsAbmedia11jam yang lalu

AI Keuangan Terkait Trump Akuisisi Block Street senilai 43 Juta Dolar AS

Menurut Fortune, AI Financial, sebuah perusahaan kripto yang terkait dengan keluarga Trump dan sebelumnya dikenal sebagai Alt5 Sigma, mengakuisisi Block Street, sebuah perusahaan infrastruktur kripto, senilai 43 juta dolar AS minggu lalu. Matthew Morgan, penasihat AI Financial dan CEO Block Street, menyatakan bahwa akuisisi tersebut bukanlah

GateNews12jam yang lalu

Saham Riot Melonjak 8% Setelah Memperluas Kesepakatan Pusat Data AMD

Saham perusahaan penambang Bitcoin, Riot, naik 8% setelah ekspansi kesepakatan pusat data AMD. Kemitraan yang diperluas mencakup ketentuan pembiayaan yang lebih baik, menegaskan pergeseran strategis Riot dari penambangan bitcoin menuju operasi pusat data untuk kecerdasan buatan. Langkah ini menandakan meningkatnya kepercayaan

GateNews14jam yang lalu

Minnesota Melarang Alat AI untuk Gambar Intim Tanpa Persetujuan, Dikenai Denda Hingga $500K

Menurut Decrypt, legislatif Minnesota mengesahkan RUU pada 2 Mei yang melarang situs web dan aplikasi menyediakan alat AI yang menghasilkan gambar intim non-konsensual dari individu yang dapat diidentifikasi. Undang-undang ini melarang platform mengizinkan pengguna mengakses atau menggunakan alat “deepfake” seperti itu, dan melarang

GateNews16jam yang lalu
Komentar
0/400
Tidak ada komentar