الرئيس التنفيذي لشركة MiniMax: نموذج الذكاء الاصطناعي يطابق GPT-4، وتقنيات الوكلاء تحتاج إلى وقت

MINIMAX%7.42

صرّح الرئيس التنفيذي لشركة MiniMax Intelligence، لي داهاي، في مؤتمر بكين تشييوان لعام 2026 بأن تقنية الوكلاء تتطلب نهجًا محسوبًا رغم التقدم السريع. وفي حديثه إلى Pengpai News ووسائل إعلام أخرى، أوضح لي أن توقعات الجمهور بشأن وكلاء خالين من الأخطاء تمامًا تتجاوز ما يمكن أن تتيحه منحنى التطور التقني الحالي، إذ لا تزال التكنولوجيا بحاجة إلى وقت كي تنضج. وحدّد 2025 بوصفه أول عام للوكلاء، متوقعًا نموًا انفجاريًا سيؤثر بعمق في المجتمع البشري، مع التأكيد على ضرورة تقييم هادئ لقدرات التكنولوجيا الحالية في مجال وكلاء الذكاء الاصطناعي.

وصف لي داهاي لقيود تقنية الوكلاء والتطور السريع

أقرّ لي داهاي بأن دمج النماذج الكبيرة مع تقنية الوكلاء يتطور بسرعة، وأن بعض السيناريوهات باتت بالفعل تقع ضمن تطبيقات عملية. وعندما تطرق إلى قيود الوكلاء، قال بوضوح: "المشكلات في كل مكان". وأضاف أن "تطور تقنية النموذج والوكيل سريع جدًا"، موضحًا أن "ربما كانت لدى بعض الأعمال اليوم نسبة خطأ تبلغ 10%، وبحلول الشهر المقبل تنخفض نسبة الخطأ إلى 1% — أصبح التطور السريع اتجاهًا أساسيًا".

الرئيس التنفيذي لـ MiniMax يردّ على تصور تقطير النماذج الصغيرة

تحدّى لي داهاي بشكل مباشر الاعتقاد السائد في الصناعة بأن "صنع نماذج صغيرة جيدة يجب أن يأتي من تقطير نماذج أساس فائقة الضخامة"، واصفًا ذلك بأنه "وهم معرفي". وأوضح: "هناك خلف عملية التقطير افتراض محدد جدًا: يجب أن يكون كيان التقطير نفسه نموذجًا جيدًا. فالتقطير جوهريًا: بالنسبة للشركات التي تفتقر إلى القدرة على تطوير نماذج الأساس بنفسها لكنها تريد الانتقال إلى تطبيقات تحقق مخرجات، تعتمد نماذج أساس قائمة بحجم صغير وتتحصل على قدرات سيناريوهات محددة عبر الضبط الدقيق. وفي هذه العملية، قد تستخدم بالفعل نماذج كبيرة أخرى لتوليد بيانات تجعل النماذج الصغيرة تكتسب قدراتها المقابلة." وقال إن هذه هي المنظومة الخاصة بتدريب جميع نماذج النماذج الكبيرة، وليست مقتصرة على النماذج الصغيرة وحدها.

MiniMax ينقل أحمال التدريب إلى رقائق محلية

كشف لي داهاي: "منذ هذا العام، ومع انتقال الصناعة ككل إلى إجراء الاستدلال على رقائق محلية، نقوم نحن أيضًا بنقل أحمال التدريب تدريجيًا إلى رقائق محلية وعناقيد محلية". وحدّد مسارين متوازيين لتحسين منظومة الحوسبة المحلية: الأول هو التحسين التصاعدي من الأسفل إلى الأعلى، حيث تقوم شركات النماذج الكبيرة بتحسين المنظومة تدريجيًا من خلال ممارسات تدريبها الخاصة، "مثل ريّ حجر على لوح حجري خطوة بخطوة، وهو ما يستغرق وقتًا." أما المسار الثاني فهو التخطيط من الأعلى إلى الأسفل، وتجسده الشراكة العميقة لدى MiniMax مع معهد Zhiyuan البحثي على منظومة برمجيات FlagOS، حيث تُنشئ شركات النماذج الكبيرة وشركات الرقائق تعاونًا عميقًا وتتحركان ضمن خطة. وأشار لي يوكسوان، رئيس قسم AIInfra في MiniMax Intelligence، إلى أن الاستدلال يتطلب دقة أعلى من التدريب فعليًا، وأن تقنية تكبير النماذج التي اقترحتها MiniMax كانت قفزة محورية: تحقيق تأثير التنبؤ بالنماذج الكبيرة عبر نماذج صغيرة جدًا، وتقديم تقييمات معمّقة على رقائق محلية، ومواءمة التفاصيل التجريبية مع الشركات المصنعة في الخارج، والتأكد من أن دقة التدريب قابلة للاستخدام. وأعلنت MiniMax أنها حققت تدريبًا واعيًا لقياس الكوانتة بعرض بت منخفض للغاية على منصة هواوي، بنسبة تصل إلى 95% من كفاءة التدريب العادي. وشرح لي داهاي أن نسبة الخسارة البالغة 5% تعود إلى عبء المقنّن نفسه، وأنه من خلال التعاون العميق مع هواوي تم تحسين هذا العبء إلى الحد الأدنى.

MiniCPM-5 1B يحقق أداء قريبًا من GPT-4o على معيار ArtificialAnalysis

أعلنت MiniMax Intelligence أن إصدار MiniCPM Small Cannon للجيل الخامس بحجم 1B حقق درجة 17.9 في التقييم الموثوق لدى ArtificialAnalysis (AA). وقارن باحثو مجتمع المصدر المفتوح ووجدوا أن GPT-4o (200 مليار بارامتر)، الصادر في مايو 2024، سجل 18.3-18.6 في نوع التقييم نفسه، مع اختلاف لا يتجاوز 0.4-0.7 نقطة بين النموذجين. وقال لي داهاي: "في 2024 تنبأنا بأنه بحلول نهاية 2026 يمكن أن يصل مستوى ذكاء نماذج الحافة إلى مستوى GPT-4. ومن بيانات الوقت الحالي، تحقق هذا الهدف قبل الموعد المحدد."

وخلال "أسبوع MiniMax للمصدر المفتوح" السابق، أطلقت MiniMax Intelligence نموذجين كبيرين على الحافة: MiniCPM5-1B وBitCPM-CANN. وجرّدت MiniCPM5-1B مرة أخرى الحد الأعلى لكثافة ذكاء النماذج: وبحجم 1B بارامتر فقط، تجاوز جميع النماذج الأقل من 2B بارامتر على لوحة الصدارة AA-Index ذات السمعة الدولية؛ وبالمقارنة مع Qwen3.5-2B الذي تم إصداره قبل 3 أشهر، لم يقدم MiniCPM5-1B أداءً أفضل فحسب، بل خفّض عدد البارامترات إلى النصف أيضًا.

ForgeTrain إطار مكتوب بالذكاء الاصطناعي يدرّب أسرع بنسبة 10% من NVIDIA Megatron

تم تدريب نموذج MiniCPM5-1B مسبقًا بواسطة إطار تدريب ذكاء اصطناعي طورته MiniMax Intelligence بشكل مستقل باسم ForgeTrain، وهو أول إطار تدريب لتوليد النماذج الكبيرة بدرجة جاهزية إنتاج مكتوب بالكامل بواسطة الذكاء الاصطناعي في العالم، دون مشاركة أي مبرمج بشري. سرعة التدريب أعلى بنسبة 10% من NVIDIA Megatron.

الأسئلة الشائعة

ماذا قال لي داهاي عن قيود تقنية الوكلاء في مؤتمر بكين تشييوان لعام 2026؟

صرّح لي داهاي بأن توقعات الجمهور لوكلاء خالين من الأخطاء تمامًا تتجاوز ما يمكن أن يقدمه منحنى التطور التقني الحالي، وأن التكنولوجيا ما تزال بحاجة إلى وقت كي تنضج. وقد وصف قيود الوكلاء الحالية بأنها "مشكلات في كل مكان"، لكنه أكد أن معدلات الخطأ تنخفض بسرعة — من 10% إلى 1% خلال شهر في بعض الحالات.

كيف تتم مقارنة أداء MiniCPM-5 1B مع GPT-4o على معيار ArtificialAnalysis؟

سجلت MiniCPM-5 1B (بما فيها 1B بارامتر) درجة 17.9 في تقييم ArtificialAnalysis، بينما سجل GPT-4o (بما فيها 200B بارامتر، الصادر في مايو 2024) درجة 18.3-18.6 في التقييم نفسه، ما أدى إلى فارق لا يتجاوز 0.4-0.7 نقطة بين النموذجين.

ما هو ForgeTrain وكيف يقارن بـ NVIDIA Megatron؟

ForgeTrain هو إطار تدريب ذكاء اصطناعي طورته MiniMax Intelligence بشكل مستقل، وهو أول إطار جاهز للإنتاج لتدريب النماذج الكبيرة مكتوب بالكامل بواسطة الذكاء الاصطناعي دون مشاركة أي مبرمج بشري. يقوم بالتدريب بسرعة أعلى بنسبة 10% من NVIDIA Megatron.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات