Model Ling-2.6-flash Ant Group Dijadikan Sumber Terbuka: 104B Parameter dengan 7,4B Aktif, Mencapai Berbagai Tolok Ukur SOTA

Pesan Berita Gate, 29 April — Bobot model flash Ling-2.6 milik Ant Group kini telah menjadi sumber terbuka, yang sebelumnya hanya tersedia melalui API. Model ini memiliki total 104 miliar parameter dengan 7,4 miliar yang aktif per inferensi, jendela konteks 256K, dan lisensi MIT. Versi presisi BF16, FP8, dan INT4 tersedia di HuggingFace dan ModelScope.

Ling-2.6-flash memperkenalkan peningkatan hybrid linear attention dibanding Ling 2.0, dengan meningkatkan GQA asli menjadi arsitektur hibrida 1:7 MLA plus Lightning Linear yang dikombinasikan dengan MoE yang sangat jarang (sparse). Efisiensi inferensi jauh melampaui model sebanding: kecepatan generasi puncak mencapai 340 token/detik pada 4 GPU H20, dengan throughput prefill dan decode sekitar 4x lebih tinggi daripada model open-source sebanding. Tolok ukur terkait agen menunjukkan performa yang kuat: BFCL-V4, TAU2-bench, SWE-bench Verified (61.2%), Claw-Eval, dan PinchBench mencapai atau mendekati level SOTA. Pada seluruh rangkaian tolok ukur Artificial Analysis, konsumsi token total hanya 15 juta. Pada AIME 2026, model mencetak 73,85%.

Situs web resmi Ant Group juga mencantumkan versi andalan Ling-2.6-1T (triliun-parameter) dan versi ringan Ling-2.6-mini (lightweight version), meskipun pada saat publikasi, bobotnya masih belum dirilis di HuggingFace, dan hanya seri flash yang tersedia untuk diunduh.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar