Alibaba Meluncurkan Model AgenticQwen Open-Source: Versi 8B Mendekati Kinerja 235B melalui Dual Data Flywheels

Pesan Gate News, 27 April — Tim PAI Alibaba telah merilis dan membuka sumber AgenticQwen, sebuah model bahasa agen berskala kecil yang dirancang untuk aplikasi pemanggilan alat kelas industri. Model ini hadir dalam dua versi: 8B dan 30B-A3B. Dilatih melalui kerangka reinforcement learning "dual data flywheel" yang inovatif, AgenticQwen mencapai kapabilitas agen tingkat model yang mendekati skala triliunan parameter sambil secara signifikan menurunkan biaya inferensi.

Mekanisme dual data flywheel mengatasi masalah homogenisasi pada data sintetis tradisional. Flywheel penalaran secara otomatis menghasilkan varian yang lebih sulit dari kesalahan model, sementara flywheel agen memperluas workflow linear sederhana (seperti proses pemesanan tunggal) menjadi tree perilaku multi-cabang dengan batasan, penolakan, dan kondisi adversarial, mensimulasikan skenario keputusan kompleks di dunia nyata. Benchmark menunjukkan AgenticQwen-8B mencetak 47,4 pada benchmark lingkungan alat nyata (TAU-2 dan BFCL-V4), jauh melampaui Qwen3-8B dasar (23,8) dan mendekati Qwen3-235B (52,0). AgenticQwen-30B-A3B (dengan hanya 3B parameter yang diaktifkan) mencapai 50,2.

Model ini telah diterapkan di sistem produksi internal yang mirip Manus, secara signifikan mempersempit kesenjangan dengan model 235B dalam waktu inferensi end-to-end. Namun, model ini dibatasi oleh panjang konteks aslinya 40K token, yang membatasi kinerjanya pada tugas deep search.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar