قدّم DeepSeek منهج «البدائيات البصرية» لتعزيز الاستدلال متعدد الوسائط في 30 أبريل

وفقاً للتقرير التقني لــ DeepSeek، في 30 أبريل، قدمت الشركة Visual Primitives، وهي طريقة تُضمّن وحدات بصرية أساسية مثل النقاط ومربعات الإحاطة داخل سلاسل الاستدلال لمعالجة مشكلة Reference Gap في المهام متعددة الوسائط. تقلّل الطريقة استهلاك رموز الصور عبر ضغط ذاكرة KV cache.

في اختبارات العدّ والاستدلال المكاني، يطابق هذا النهج أداء GPT-5.4 وClaude-Sonnet-4.6 وGemini-3-Flash عبر أبعاد مختارة. صرّحت DeepSeek بأنها ستطرح أجزاءً من الاختبارات والبيانات كمصدر مفتوح، مع إصدار أوزان النماذج بعد اكتمال عملية الدمج.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات