أخبار ME News، في 14 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 1M AI News، أطلقت شركة جوجل DeepMind نموذج Gemini Robotics-ER 1.6، المصمم كنموذج استنتاج عالي المستوى للروبوتات، والذي يُظهر تحسينات ملحوظة مقارنة بالإصدارات السابقة ER 1.5 و Gemini 3.0 Flash في الاستنتاج المكاني والفهم متعدد الزوايا. النموذج متاح الآن للمطورين عبر واجهة برمجة التطبيقات Gemini و Google AI Studio. تشمل الترقيات الأساسية ثلاث قدرات: 1. تحسين دقة التوجيه (pointing): يمكن استخدامه للكشف الدقيق عن الأجسام، العد، الاستنتاج حول العلاقات المكانية (مثل «حدد جميع الأجسام التي يمكن وضعها في الكوب الأزرق») وتخطيط مسارات الحركة، مع القدرة على رفض التوجيه الصحيح للأجسام غير الموجودة في الصورة 2. الكشف الناجح من زوايا متعددة: يمكن الآن للروبوت دمج صور من عدة كاميرات لتحديد ما إذا كانت المهمة قد أُنجزت، مع الحفاظ على الدقة حتى في حالات التعتيم أو البيئة الديناميكية 3. إضافة قدرة قراءة الأدوات: يمكنه تفسير أدوات صناعية متنوعة مثل مقياس الضغط الدائري، مؤشرات مستوى السائل العمودية، وشاشات العرض الرقمية، من خلال الرؤية الوكيلة (الاستنتاج البصري + تنفيذ الكود) لتحقيق استنتاج تدريجي، حيث يتم تكبير المنطقة التفصيلية أولاً، ثم استخدام التوجيه والحسابات البرمجية لقياس النسب والفواصل، وأخيرًا دمج المعرفة العالمية للوصول إلى القراءة. تعتمد قدرة قراءة الأدوات على التعاون بين DeepMind و Boston Dynamics. أعلنت Boston Dynamics في نفس اليوم أنها دمجت Gemini و Gemini Robotics-ER 1.6 في منتجها Orbit AIVI-Learning، والذي تم إطلاقه لجميع عملاء AIVI-Learning في 8 أبريل. بعد الدمج، أُضيف دعم لوحدة القياس (gauges)، حيث يمكن الآن للروبوت رباعي الأرجل Spot أن يقوم بالمراقبة الذاتية للمرافق الصناعية وقراءة بيانات الأدوات مثل مقياس الضغط. وذكرت Boston Dynamics أن بفضل قدرات الاستنتاج لنموذج Gemini، شهدت أداء AIVI-Learning وتحسين دقته في المهام القائمة على الفحص البصري، وعدّ الأطباق، والكشف عن السوائل، ارتفاعًا ملحوظًا. وتقول DeepMind إن ER 1.6 هو «أكثر نماذج الروبوتات أمانًا لديها». في مهام الاستنتاج المكاني المقاوم للهجمات، تفوق بشكل كبير على ER 1.5 من حيث الالتزام بالتعليمات الأمنية. وفي اختبارات تحديد مخاطر السلامة استنادًا إلى تقارير الإصابات الحقيقية، سجلت نماذج ER نسبة أعلى بنسبة 6% في سيناريوهات النصوص، و10% في سيناريوهات الفيديو مقارنة بـ Gemini 3.0 Flash. (المصدر: BlockBeats)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
WCTCTradingKingPK
535.86K درجة الشعبية
#
USSeeksStrategicBitcoinReserve
58.75M درجة الشعبية
#
IsraelStrikesIranBTCPlunges
39.51K درجة الشعبية
#
BitcoinETFOptionLimitQuadruples
1.02M درجة الشعبية
#
#FedHoldsRateButDividesDeepen
42.63K درجة الشعبية

تثبيت

خريطة الموقع

أطلقت جوجل ديب مايند جيميني روبوتيكس-إر 1.6، وقد أصبح روبوت سبوت قادرًا على قراءة لوحات العدادات تلقائيًا

المواضيع الرائجة

WCTCTradingKingPK

USSeeksStrategicBitcoinReserve

IsraelStrikesIranBTCPlunges

BitcoinETFOptionLimitQuadruples

#FedHoldsRateButDividesDeepen

تثبيت