Mercury 2 của Inception Labs đạt 90% trên AIME 2026, vượt trội DiffusionGemma của Google

Vào Thứ Năm (18/6), Inception Labs đã công bố Mercury 2, khẳng định đây là mô hình ngôn ngữ suy luận nhanh nhất thế giới, tạo ra khoảng 1.000 token mỗi giây. Theo thông báo của công ty, Mercury 2 đạt 90% trên AIME 2026 (các bài toán của American Invitational Mathematics Examination), so với DiffusionGemma của Google đạt 69,1% trên cùng chuẩn đánh giá. Mô hình cũng đạt 77% trên GPQA, một chuẩn đánh giá khoa học cấp tiến sĩ. Augment Code, một công ty AI viết mã kiêm tác tử, cho biết họ ghi nhận giảm độ trễ 82% và cắt giảm 90% chi phí sau khi thay Mercury 2 bằng Claude Opus 4.7 của Anthropic, vẫn giữ chất lượng đầu ra.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận