Как сообщает The Information, со ссылкой на внутренние меморандумы Tencent и на источники, сотрудники Tencent использовали Claude Code от Anthropic на этапе пост-обучения Hy3 — новейшей крупной языковой модели компании, несмотря на явный запрет Anthropic на коммерческие сервисы для китайских фирм со ссылкой на опасения в сфере национальной безопасности.

Hy3 включает архитектуру mixture-of-experts с 295B параметров. На этапе RLHF (обучение с подкреплением по сигналам от человеческой обратной связи) сотрудники Tencent выступали в качестве проверяющих людей, а использование было ограничено тысячами токенов на человека. Внутренние меморандумы содержали руководства по установке Claude Code. Сотрудники Tencent использовали Claude Code для генерации высококачественных эталонных примеров для оценки анонимных выводов модели — вместо того, что они охарактеризовали как дистилляцию. Представитель Anthropic заявил, что компания активно отслеживает атаки на основе дистилляции, но напрямую не прокомментировал использование Tencent Claude Code.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

05-03 12:33

Клод проверяет часы каждые 15 минут после получения доступа к инструменту корректировки времени

05-03 02:09

Anthropic ведёт переговоры о покупке чипов для вычислений у британского стартапа Fractile при оценке в $1 млрд+

05-03 01:21

Член совета Федеральной резервной системы Боуман: регуляторам необходимо продумать, как реагировать на новые технологии вроде Anthropic Mythos

05-02 01:41

Китайские компании в сфере ИИ рассматривают демонтаж «красных фишек» после остановки приобретения Manus компанией Meta

05-01 02:09

Anthropic открывает бета-версию безопасности Claude для корпоративных пользователей 1 мая

Детальный анализ