Модель Ling-2.6-flash від Ant Group відкрито у вихідному коді: 104B параметрів із 7,4B активними, досягає кількох орієнтирів SOTA

Повідомлення Gate News, 29 квітня — вагові коефіцієнти моделі Ling-2.6-flash від Ant Group тепер відкрито у вихідному коді, раніше вони були доступні лише через API. Модель має 104 мільярди загальних параметрів із 7,4 мільярда активованих на кожен запит, вікно контексту 256K і ліцензію MIT. Доступні версії точності BF16, FP8 та INT4 на HuggingFace і ModelScope.

Ling-2.6-flash упроваджує вдосконалення гібридної лінійної уваги поверх Ling 2.0, оновлюючи початкову GQA до архітектури 1:7 MLA плюс Lightning Linear у поєднанні з дуже розрідженою MoE. Ефективність інференсу значно перевищує показники зіставних моделей: пікова швидкість генерації досягає 340 токенів/с на 4x GPU H20, а пропускна здатність prefill і decode приблизно в 4 рази вища, ніж у зіставних відкритих моделей. Бенчмарки, пов’язані з агентами, демонструють сильну продуктивність: BFCL-V4, TAU2-bench, SWE-bench Verified (61.2%), Claw-Eval і PinchBench досягають або наближаються до рівня SOTA. У всьому комплексі бенчмарків Artificial Analysis загальне споживання токенів становить лише 15 мільйонів. На AIME 2026 модель набрала 73,85%.

Офіційний вебсайт Ant Group також вказує флагманську версію Ling-2.6-1T (з трильйоном параметрів) і полегшену версію Ling-2.6-mini (lightweight version), однак станом на момент публікації їхні вагові коефіцієнти залишаються нерозміщеними на HuggingFace, доступним для завантаження є лише серія flash.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів