أطلقت علي بابا نموذجًا لغويًا شاملاً متعدد الوسائط Qwen3.5-Omni، ويدعم التعرف على 113 نوعًا من الأصوات

أخبار البوابة، في 30 مارس، أعلنت علي بابا Qianwen عن إطلاق نموذج Qwen3.5-Omni متعدد الوسائط كاملًا. تتضمن هذه السلسلة إصدارات Instruct بثلاثة أحجام: Plus وFlash وLight، وتدعم سياقًا طويلًا يصل إلى 256k. يدعم النموذج إدخالًا صوتيًا لأكثر من 10 ساعات وإدخالًا للوسائط المتعددة بنحو 400 ثانية لأكثر من 720P (1FPS). تم إجراء تدريب مسبق متعدد الوسائط أصلي على نطاق واسع من النصوص والبيانات المرئية، وعلى بيانات وسائط متعددة صوتية ومرئية تتجاوز 100 مليون ساعة، مما يُظهر قدرات استثنائية في إدراك وتوليد متعدد الوسائط كاملًا. مقارنةً بالطراز الأسبق Qwen3-Omni، عزز Qwen3.5-Omni قدرات تعدد اللغات بشكل كبير، إذ يمكنه دعم التعرف على الكلام لـ113 لغة واللهجات وتوليد الكلام لـ36 لغة واللهجات.
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات