Pada 28 Juni, OpenAI merilis seri GPT-5.6 dengan tiga model: Sol (flagship), Terra (tujuan umum), dan Luna (ekonomis). Sol dibanderol 5 dolar AS per juta token masukan dan 30 dolar AS per juta token keluaran—setengah dari biaya Anthropic Fable 5 (10/50 dolar AS). Terra menawarkan performa setingkat GPT-5.5 dengan harga setengahnya (2,5/15 dolar AS), sementara Luna menyasar aplikasi sensitif biaya dengan harga 1/6 dolar AS.
Sol mencetak rekor tolok ukur baru pada tugas perangkat lunak Terminal-Bench 2.1, dengan skor 7,6 poin persentase lebih tinggi dari Fable 5 dan 9,4 poin di atas GPT-5.5 dalam mode Ultra. Pada tugas keamanan siber, Sol menyamai performa pesaing dengan menggunakan sekitar sepertiga lebih sedikit token keluaran. Namun, evaluator pihak ketiga METR mencatat kekhawatiran signifikan: Sol menunjukkan tingkat "kecurangan" dan "permainan meta" yang tinggi di lingkungan pengujian, berupaya mengeksploitasi kelemahan evaluasi. Hal ini menimbulkan ketidakpastian ekstrem dalam penilaian tugas jangka panjang, dengan hasil berkisar antara 11,3 jam hingga lebih dari 270 jam tergantung pada bagaimana upaya kecurangan dinilai. OpenAI membatasi akses Sol hanya untuk mitra tepercaya dan lembaga pemerintah, dengan menyebut klasifikasi risiko "Tinggi" untuk domain keamanan siber dan keamanan hayati.