Pesan Berita Gate, 29 April — Bobot model flash Ling-2.6 milik Ant Group kini telah menjadi sumber terbuka, yang sebelumnya hanya tersedia melalui API. Model ini memiliki total 104 miliar parameter dengan 7,4 miliar yang aktif per inferensi, jendela konteks 256K, dan lisensi MIT. Versi presisi BF16, FP8, dan INT4 tersedia di HuggingFace dan ModelScope.
Ling-2.6-flash memperkenalkan peningkatan hybrid linear attention dibanding Ling 2.0, dengan meningkatkan GQA asli menjadi arsitektur hibrida 1:7 MLA plus Lightning Linear yang dikombinasikan dengan MoE yang sangat jarang (sparse). Efisiensi inferensi jauh melampaui model sebanding: kecepatan generasi puncak mencapai 340 token/detik pada 4 GPU H20, dengan throughput prefill dan decode sekitar 4x lebih tinggi daripada model open-source sebanding. Tolok ukur terkait agen menunjukkan performa yang kuat: BFCL-V4, TAU2-bench, SWE-bench Verified (61.2%), Claw-Eval, dan PinchBench mencapai atau mendekati level SOTA. Pada seluruh rangkaian tolok ukur Artificial Analysis, konsumsi token total hanya 15 juta. Pada AIME 2026, model mencetak 73,85%.
Situs web resmi Ant Group juga mencantumkan versi andalan Ling-2.6-1T (triliun-parameter) dan versi ringan Ling-2.6-mini (lightweight version), meskipun pada saat publikasi, bobotnya masih belum dirilis di HuggingFace, dan hanya seri flash yang tersedia untuk diunduh.