Google Gemini 3.1 Flash-Lite chính thức ra mắt: giá đầu vào rẻ hơn 75% so với Claude 4.5 Haiku, điểm GPQA đạt 86,9%

Theo Beating, Google Gemini 3.1 Flash-Lite đã chuyển từ giai đoạn preview sang khả dụng chung (GA) vào ngày 8/5, trở thành mẫu rẻ nhất và nhanh nhất trong dòng Gemini 3. Giá nhập được đặt ở mức 0,25 USD cho mỗi 1 triệu token và giá xuất ở mức 1,50 USD cho mỗi 1 triệu token—chi phí nhập thấp hơn 75% so với Claude 4.5 Haiku (1,00 USD) và chi phí xuất thấp hơn 70% (5,00 USD). Mô hình có cửa sổ ngữ cảnh 1 triệu token và đạt thông lượng 363 token mỗi giây, nhanh hơn 45% so với Gemini 2.5 Flash.

Các bài benchmark hiệu năng cho thấy GPQA Diamond (lập luận khoa học ở trình độ sau đại học) đạt 86,9%, vượt Claude 4.5 Haiku (73,0%) và GPT-5 mini (82,3%). MMMU-Pro (lập luận đa phương thức) đạt 76,8%. Nhóm người dùng sớm gồm nền tảng dịch vụ khách hàng Gladly, cho biết giảm 60% chi phí và tỷ lệ thành công 99,6% trên các tác vụ chạy thực tế, cùng JetBrains, tích hợp Flash-Lite vào các công cụ hỗ trợ trong IDE.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận