أطلقت علي بابا Qwen-Robot Suite بثلاثة نماذج، مع إتاحة كُتَل روبوتات متعددة «بشكل كامل ومفتوح المصدر».

Qwen-Robot Suite模型

أعلنت فرقـة Qwen لدى شركة Alibaba في 17 يونيو نشر Qwen-Robot Suite، وهي مجموعة ذكاء تجسيدي كاملة من نماذج أساسية تضم ثلاثة نماذج: Qwen-RobotNav (التنقل)، وQwen-RobotManip (التحكم الآلي)، وQwen-RobotWorld (محاكاة العالم الفيزيائي). تم إتاحة النماذج الثلاثة كمصدر مفتوح.

Qwen-RobotNav: توحيد خمس مهام، و15.60 مليون سجل بيانات تدريب

يُدمج Qwen-RobotNav خمس مهام هي: اتباع التعليمات، والتنقل نحو الأهداف، والبحث عن الأجسام، وتتبع الأهداف، والقيادة الذاتية، ويقدم واجهة قابلة للتخصيص (ميزانية tokens، وتناقص زمني، وأوزان لكل لقطة). تم تدريب النموذج على 15.60 مليون عينة، وحقق معدل نجاح بلغ 76.5% في معيار VLN-CE RxR (التنقل البصري واللغوي في بيئات حقيقية)، ووصل إلى 90% في معيار EVT-Bench (تتبع الأهداف المتحركة).

Qwen-RobotManip: 38,100 ساعة بيانات تدريب، والمرتبة الأولى في RoboChallenge Table30-v1

تختلف طرق تمثيل حركات الروبوتات اختلافًا كبيرًا بين الأنواع (يستخدم ذراع Franka زوايا المفاصل، وتستخدم ALOHA مواضع واتجاهات الكماشة، بينما يستخدم الروبوت على هيئة بشر إحداثيات الجسم بالكامل). قامت Alibaba بتجميع نحو 38,100 ساعة من بيانات التدريب من قواعد بيانات الروبوتات مفتوحة المصدر ومقاطع فيديو بشرية، دون الاعتماد على جمع بيانات خاصة. حقق النموذج المركز الأول في معيار RoboChallenge Table30-v1، متفوقًا على الطرق السابقة بنسبة 20%.

Qwen-RobotWorld: 8.60 مليون مقطع فيديو ضمن بيانات نصية، والمرتبة الأولى في EWMBench وDreamGen Bench

يُعد Qwen-RobotWorld نموذج عالم فيديو مُشروطًا باللغة، إذ يحوّل اللغة الطبيعية إلى واجهة عامة للعمل: فتعليمة مثل «التقط الكوب الأحمر واسكب الماء على الزهور» تُستخدم عبر وكلاء الكماشة أو القيادة الذاتية أو وكلاء التنقل المتحرك. تشمل مجموعة بيانات التدريب 8.60 مليون مقطع فيديو مع اقترانات نصية، و200 مليون إطار، عبر مجالات التحكم (5.90 مليون عينة، و1,300+ مهارة، و20+ هيئة)، والقيادة الذاتية (Waymo، وNVIDIA PhysicalAI-AD)، والتنقل داخل المباني، بالإضافة إلى نقل الإنسان والآلة عبر 14 نوعًا من الأذرع الآلية. احتل كل من EWMBench وDreamGen Bench المرتبة الأولى في الاختبارات المعيارية، وحقق اختبار الاتساق الفيزيائي درجات كاملة.

توضيح من Qwen: نماذج برمجية وليست روبوتات مادية، لم تُعلن التسعيرة والجدول الزمني بعد

بحسب توضيح منشور في مدونة Qwen الرسمية، فإن Qwen-Robot Suite عبارة عن نماذج برمجية وليست روبوتات مادية، ولا يزال النشر الفعلي في سيناريوهات منزلية يحتاج إلى عدة سنوات. لم تُعلن Alibaba حتى الآن عن التسعير أو الجدول الزمني أو قائمة العملاء خارج خطط التجربة. وتسعى أيضًا مختبرات غربية مثل Google DeepMind وNvidia وFigure وPhysical Intelligence إلى أهداف مماثلة، لكن ورد في تقارير أن معظمها يركز على قدرات منفصلة مثل التنقل أو التحكم، وليس على مجموعة موحدة قابلة للتركيب.

الأسئلة الشائعة

لماذا تستهدف نماذج Qwen-Robot Suite الثلاثة سيناريوهات مختلفة؟

وفقًا لمدونة Qwen الرسمية، تتمثل تحديدات النماذج الثلاثة في: يتولى Qwen-RobotNav مسؤولية التنقل (توحيد خمس مهام)؛ ويختص Qwen-RobotManip بالتحكم الآلي عبر أنواع مختلفة من الروبوتات (مع توافقه مع أساليب تمثيل الحركات المختلفة)؛ ويقوم Qwen-RobotWorld بمحاكاة العالم الفيزيائي (لتكون اللغة واجهة عامة للحركة). تعمل النماذج الثلاثة بشكل مستقل، وبجمعها تتشكل منظومة الذكاء التجسيدي الكاملة.

هل تم تحديد «لحظة أندرويد للروبوتات» على أنها من كلام Qwen نفسه؟

نعم. «لحظة أندرويد في مجال الروبوتات» هو توصيف استخدمته Qwen الرسمية لدى Alibaba عند الإعلان، ويعني أن Qwen-Robot Suite هو منصة على مستوى نظام التشغيل وليست عتادًا. إنه وصف تموضع تسويقي من Qwen، وليس تقييمًا من طرف ثالث.

هل تُتاح Qwen-Robot Suite كمصدر مفتوح للجميع؟

وفقًا لمدونة Qwen الرسمية، تم إصدار النماذج الثلاثة بالكامل كمصدر مفتوح. جاءت بيانات تدريب Alibaba من قواعد بيانات الروبوتات مفتوحة المصدر ومقاطع الفيديو البشرية، دون الاعتماد على جمع بيانات خاصة، وتعد سياسة الإتاحة كجزء أساسي من الرسائل التي تم نشرها في هذا الإعلان.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات