Meituan випускає трильйон-параметрову модель LongCat-2.0 з 30 трильйонами токенів 30 червня.

Згідно з Jin10, Meituan випустила LongCat-2.0, нову велику мовну модель з трильйоном параметрів, 30 червня та оголосила про її відкриту доступність. Набір даних для попереднього навчання моделі перевищує 30 трильйонів токенів і охоплює китайську, англійську, кілька мов та код. Команда Meituan вирішила апаратні та обчислювальні проблеми під час масштабного навчання на 10 тис. графічних процесорів, підвищивши стабільність системи та зменшивши середню місячну щоденну частоту збоїв більш ніж на 70 відсотків завдяки механізмам автоматичного відновлення та протоколам перевірки узгодженості.
Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів