テンセントは最新のHy3モデルのトレーニングでAnthropicのClaude Codeを使用していると、The Informationが報じた

The Informationによると、社内のテンセント・メモと情報源を引用しながら、テンセントの従業員が、同社の最新の大規模言語モデルであるHy3のポストトレーニング段階において、国の安全保障上の懸念を理由に中国企業向けの商用サービスを明確に禁じているAnthropicのClaude Codeを使用していたという。

Hy3は295Bのパラメータを持つ混合専門家(mixture-of-experts)アーキテクチャを備えている。RLHF(人間のフィードバックからの強化学習)段階では、テンセントのスタッフが人間の評価者として務め、1人あたりの利用は数千トークンまでに制限されていた。社内メモには、Claude Codeのインストール手順のガイドが示されていた。テンセントの従業員は、「蒸留」と彼らが呼んでいたものではなく、匿名のモデル出力を採点するための高品質な参照用の例を生成するのにClaude Codeを用いた。Anthropicのスポークスパーソンは、同社が蒸留攻撃を積極的に監視していると述べたが、テンセントによるClaude Codeの使用については直接は取り上げなかった。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし