Meituan выпускает модель LongCat-2.0 с триллионом параметров, обученную на 30 триллионах токенов, 30 июня.

Согласно Jin10, Meituan выпустила LongCat-2.0 — новую большую языковую модель с триллионом параметров — 30 июня и объявила о её открытом доступе. Обучающий набор данных модели превышает 30 триллионов токенов и включает китайский, английский, несколько языков и код. Команда Meituan решила проблемы с оборудованием и вычислениями при масштабном обучении на десяти тысячах GPU, повысив стабильность системы и снизив среднемесячный ежедневный показатель сбоев более чем на 70 процентов с помощью механизмов автоматического восстановления и протоколов проверки согласованности.
Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев