تستخدم شركة Tencent رمز Claude من Anthropic في أحدث تدريب لنموذج Hy3، حسبما أفادت The Information

بحسب موقع The Information، مع الاستشهاد بمذكرات داخلية لشركة Tencent ومصادر، استخدم موظفو Tencent أداة Claude Code من شركة Anthropic خلال مرحلة ما بعد التدريب لنموذج Hy3، وهو أحدث نماذجها اللغوية الكبيرة، وذلك رغم الحظر الصريح من Anthropic على تقديم خدمات تجارية للشركات الصينية بحجة مخاوف تتعلق بالأمن القومي.

يتميز Hy3 ببنية خليط خبراء (mixture-of-experts) تضم 295B معلمة. خلال مرحلة RLHF (التعلم المعزز من خلال ملاحظات البشر)، خدم موظفو Tencent كمقيّمين بشريين مع تقييد الاستخدام بآلاف الرموز لكل شخص. وقدمت المذكرات الداخلية أدلة لتثبيت Claude Code. استخدم موظفو Tencent Claude Code لإنشاء أمثلة مرجعية عالية الجودة لتقييم مخرجات نموذج مجهولة الهوية، بدلًا مما وصفوه بأنه "التقطير" (distillation). صرّح متحدث باسم Anthropic بأن الشركة تراقب بنشاط هجمات التقطير، لكنه لم يتناول مباشرة استخدام Tencent لـ Claude Code.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات