GPT-5.5-Cyber milik OpenAI mencapai 85,6% pada Benchmark CyberGym, melampaui model Mythos yang diblokir milik Anthropic

OpenAI mengumumkan peluncuran penuh GPT-5.5-Cyber pada 22 Juni sebagai bagian dari program pertahanan siber Daybreak. Pada benchmark CyberGym—yang menguji agen AI dalam mereproduksi 1.507 kerentanan perangkat lunak yang diketahui dari 188 proyek open-source—model ini meraih 85,6%, mengungguli Mythos 5 milik Anthropic dengan 83,8% dan Claude Opus 4.7 dengan 73,1%.

Peluncuran ini terjadi sementara Mythos 5 dan Fable 5 milik Anthropic masih offline setelah adanya larangan pemerintah AS yang dikeluarkan pada 12 Juni, dengan alasan kekhawatiran keamanan nasional dan potensi risiko jailbreak. Sebaliknya, GPT-5.5-Cyber tersedia hanya untuk profesional keamanan yang terverifikasi dan telah disetujui terlebih dahulu oleh lembaga federal termasuk Office of the National Cyber Director. OpenAI telah bekerja sama dengan perusahaan keamanan siber termasuk CrowdStrike, Cisco, dan Cloudflare untuk mengintegrasikan model tersebut ke dalam alat mereka.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar