Tencent menggunakan kode Claude dari Anthropic dalam pelatihan model Hy3 terbaru, lapor The Information

Menurut The Information, mengutip memo internal Tencent dan sumber-sumber, karyawan Tencent menggunakan Anthropic's Claude Code selama fase post-training Hy3, model bahasa besar terbaru perusahaan itu, meskipun Anthropic secara eksplisit melarang layanan komersial kepada perusahaan Tiongkok dengan alasan kekhawatiran keamanan nasional.

Hy3 menampilkan arsitektur mixture-of-experts dengan 295B parameter. Selama tahap RLHF (reinforcement learning from human feedback), staf Tencent berperan sebagai penilai manusia dengan penggunaan dibatasi hingga ribuan token per orang. Memo internal menyediakan panduan instalasi Claude Code. Karyawan Tencent menggunakan Claude Code untuk menghasilkan contoh referensi berkualitas tinggi guna penilaian atas keluaran model yang dianonimkan, bukan seperti yang mereka sebut sebagai distilasi. Juru bicara Anthropic menyatakan perusahaan secara aktif memantau serangan distilasi, tetapi tidak secara langsung menanggapi penggunaan Claude Code oleh Tencent.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar