بحسب موقع The Information، مع الاستشهاد بمذكرات داخلية لشركة Tencent ومصادر، استخدم موظفو Tencent أداة Claude Code من شركة Anthropic خلال مرحلة ما بعد التدريب لنموذج Hy3، وهو أحدث نماذجها اللغوية الكبيرة، وذلك رغم الحظر الصريح من Anthropic على تقديم خدمات تجارية للشركات الصينية بحجة مخاوف تتعلق بالأمن القومي.
يتميز Hy3 ببنية خليط خبراء (mixture-of-experts) تضم 295B معلمة. خلال مرحلة RLHF (التعلم المعزز من خلال ملاحظات البشر)، خدم موظفو Tencent كمقيّمين بشريين مع تقييد الاستخدام بآلاف الرموز لكل شخص. وقدمت المذكرات الداخلية أدلة لتثبيت Claude Code. استخدم موظفو Tencent Claude Code لإنشاء أمثلة مرجعية عالية الجودة لتقييم مخرجات نموذج مجهولة الهوية، بدلًا مما وصفوه بأنه "التقطير" (distillation). صرّح متحدث باسم Anthropic بأن الشركة تراقب بنشاط هجمات التقطير، لكنه لم يتناول مباشرة استخدام Tencent لـ Claude Code.