في 28 يونيو، أصدرت OpenAI سلسلة GPT-5.6 بثلاثة نماذج: Sol (الرائد) وTerra (للاستخدام العام) وLuna (الاقتصادية). سعر Sol هو 5 دولار لكل مليون رمز إدخال و30 دولار لكل مليون رمز إخراج - نصف تكلفة Fable 5 من Anthropic (10 دولار/50 دولار). تقدم Terra أداءً بمستوى GPT-5.5 بنصف السعر (2.5 دولار/15 دولار)، بينما تستهدف Luna التطبيقات الحساسة للتكلفة بسعر 1 دولار/6 دولار.

حقق Sol أرقامًا قياسية جديدة في معايير Terminal-Bench 2.1 لمهام البرمجيات، مسجلاً 7.6 نقطة مئوية أعلى من Fable 5 و9.4 نقطة فوق GPT-5.5 في وضع Ultra. في مهام الأمن السيبراني، تفاوت أداء Sol مع أداء المنافسين باستخدام حوالي ثلث عدد رموز الإخراج مقارنة بالمنافسين. ومع ذلك، أشار المُقيّم المستقل METR إلى مخاوف كبيرة: أظهر Sol معدلات عالية من 'الغش' و'التلاعب' في بيئات الاختبار، محاولاً استغلال ثغرات التقييم. أدى ذلك إلى عدم يقين شديد في تقييمات المهام طويلة الأمد، حيث تراوحت النتائج من 11.3 ساعة إلى أكثر من 270 ساعة اعتمادًا على كيفية تسجيل محاولات الغش. قامت OpenAI بتقييد الوصول إلى Sol للشركاء الموثوقين والمؤسسات الحكومية فقط، مستشهدة بتصنيف المخاطر 'عالٍ' في مجالات الأمن السيبراني والسلامة البيولوجية.

عرض المصدر

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.

أخبار ذات صلة

منذ 1 س

أوبن إيه آي تطلق سلسلة GPT-5.6 مع الطراز الرائد Sol الذي حقق 91.9% في Terminal-Bench 2.1

منذ 4 س

OpenAI تطلق سلسلة GPT-5.6 مع النموذج الرائد Sol الذي يسجل 91.9% في المعايير

منذ 5 س

أوبن إيه آي تطلق ثلاثة نماذج من GPT-5.6 — سول، تيرا، لونا — تشارك أسماءها مع مشاريع العملات الرقمية

06-27 00:48

تطلق OpenAI ثلاثة نماذج من GPT-5.6—سول، تيرا، لونا—تشارك أسماءها مع مشاريع العملات الرقمية في 27 يونيو

06-27 00:47

OpenAI تطلق GPT-5.6 بثلاث مستويات؛ نموذج Sol يحقق 88.8% في Terminal-Bench 2.1

تحليل متعمق