Dòng MiMo-V2.5 của Xiaomi ra mắt mã nguồn mở: 1T tham số, hiệu quả token vượt trội so với GPT-5.4

Tin cổng, ngày 27 tháng 4 — Nhóm MiMo của Xiaomi đã phát hành mã nguồn mở cho dòng mô hình ngôn ngữ lớn MiMo-V2.5 theo giấy phép MIT, hỗ trợ triển khai thương mại, huấn luyện tiếp tục và tinh chỉnh. Cả hai mô hình đều có cửa sổ ngữ cảnh 1 triệu token. MiMo-V2.5-Pro là mô hình mixture-of-experts văn bản thuần (MoE) với tổng cộng 1,02 nghìn tỷ tham số và 42Bỷ tham số hoạt động, trong khi MiMo-V2.5 là mô hình đa phương thức gốc với tổng cộng 1Mỷ tham số và 310Bỷ tham số hoạt động, hỗ trợ hiểu văn bản, hình ảnh, video và âm thanh.

MiMo-V2.5-Pro nhắm đến các tác vụ tác nhân phức tạp và lập trình. Trong các benchmark ClawEval, nó đạt 64% Pass@3 trong khi tiêu thụ khoảng 70.000 token cho mỗi quỹ đạo tác vụ—ít hơn 40% đến 60% token so với Claude Opus, Gemini 3.1 Pro và GPT-5.4. Mô hình đạt 78,9 trên SWE-bench Verified. Trong một bản demo, V2.5-Pro tự độc lập triển khai hoàn chỉnh bộ biên dịch SysY-to-RISC-V cho một dự án môn học của Đại học Bắc Kinh trong 4,3 giờ với 672 lần gọi công cụ, đạt điểm tuyệt đối 233/233 trên các tập kiểm thử ẩn.

MiMo-V2.5 được thiết kế cho các kịch bản tác nhân đa phương thức, được trang bị bộ mã hóa tầm nhìn chuyên dụng (729 triệu tham số) và bộ mã hóa âm thanh (261 triệu tham số), đạt 62,3 trên phân tập tổng quát Claw-Eval. Cả hai mô hình đều sử dụng kiến trúc lai kết hợp cơ chế chú ý cửa sổ trượt (SWA) và chú ý toàn cục (GA), đi kèm module dự đoán đa token 3 lớp (MTP) để tăng tốc suy luận. Trọng số mô hình có sẵn trên Hugging Face.

Cùng với bản phát hành mã nguồn mở, nhóm MiMo đã ra mắt "Chương trình ưu đãi Orbit Quadrillion Token Creator Incentive Program", cung cấp 100 nghìn tỷ token miễn phí trong 30 ngày cho người dùng trên toàn cầu. Các nhà phát triển cá nhân, đội nhóm và doanh nghiệp có thể đăng ký thông qua trang chương trình với chu kỳ đánh giá khoảng 3 ngày làm việc; các lợi ích được phê duyệt sẽ được phân phối dưới dạng Token Plans hoặc tín dụng trực tiếp, tương thích với các công cụ như Claude Code và Cursor.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận