أخيرًا شركة مايكروسوفت تدخل سوق الوكيل الذكي بقوة 7 مليارات، فارا-7B يتيح لك رؤية الصور والتفاعل مع المتصفح، ومصدره مفتوح من MIT ويبدو مثيرًا للاهتمام

شاهد النسخة الأصلية
MeNews
مايكروسوفت تطلق أول نموذج لوكيل ذكي للتحكم بالحاسوب بوساطة 7 مليارات معلمة فارا-7B
رسالة AIMPACT، 16 مايو (UTC+8)، أطلقت مايكروسوفت Fara-7B، وهو أول نموذج لغة ذكي مكون من 7 مليارات معلمة مصمم خصيصًا لسيناريوهات استخدام الحاسوب. يعتمد النموذج على بنية فك التشفير متعددة الوسائط، ويمكنه استقبال لقطات الشاشة والنصوص السياقية، والتنبؤ مباشرة بسلاسل تفكير ومعاملات ذات معلمات وإجراءات. تم بناؤه استنادًا إلى Qwen 2.5-VL (7B)، ويدعم طول سياق يصل إلى 128 ألف، وتم تدريبه على مدى يومين ونصف على 64 بطاقة GPU من نوع H100، ونُشر بموجب ترخيص MIT في 24 نوفمبر 2025. يتيح Fara-7B إدراك مدخلات المتصفح من خلال لقطات الشاشة، ويجمع بين الاستنتاج الداخلي وسجلات الحالة التاريخية للتنبؤ بالخطوة التالية والإجراءات والمعلمات (مثل إحداثيات النقر)، ويعتمد في تدريبه على مجموعة بيانات اصطناعية ضخمة كاملة التركيب. يمكن للنموذج تخطيط وتنفيذ مهام عالية المستوى (مثل حجز المطاعم، التقدم لوظائف، وضع خطط).
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت