OpenRouter Fusion API Khớp Hiệu Năng Claude Fable 5 với Chi Phí Bằng Nửa

2026-06-20 18:08:05

OpenRouter đã ra mắt Fusion vào ngày 12/6, một API phía máy chủ phân phối prompt qua nhiều mô hình AI đồng thời và tổng hợp câu trả lời của chúng thành một đáp án thống nhất. Công ty phát triển hệ thống này để đạt hiệu năng tương đương Claude Fable 5 với chi phí xấp xỉ chỉ bằng một nửa, theo thử nghiệm benchmark trên bộ dữ liệu DRACO của Perplexity. Việc ra mắt diễn ra ngay sau khi Anthropic đình chỉ quyền truy cập Fable 5 và Mythos 5 sau một chỉ đạo kiểm soát xuất khẩu của Mỹ, dẫn chiếu một phát hiện jailbreak gây tranh cãi, tạo ra khoảng trống thị trường cho các lựa chọn AI hiệu năng cao có thể tiếp cận với người dùng quốc tế.

OpenRouter Fusion sử dụng kiến trúc bảng multi-model

Fusion hoạt động bằng cách gửi một prompt duy nhất tới nhiều mô hình AI song song, trong đó mỗi mô hình được cung cấp quyền truy cập vào công cụ tìm kiếm web và bash. Một mô hình “judge” sẽ trích xuất các điểm đồng thuận, mâu thuẫn và “lỗ hổng” từ toàn bộ câu trả lời. Claude Opus 4.8 đóng vai trò bộ tổng hợp mặc định, tạo ra câu trả lời cuối cùng dựa trên phân tích của judge. Người dùng có thể truy cập Fusion bằng cách chuyển chuỗi mô hình sang "openrouter/fusion" để dùng cấu hình bảng mặc định, thêm một công cụ fusion cho các lượt gọi chọn lọc, hoặc xây dựng các bảng tùy chỉnh thông qua giao diện phòng chat Fusion mà không cần lập trình.

Bảng AI theo ngân sách đạt 64,7% trên benchmark DRACO

OpenRouter đã thử nghiệm Fusion trên DRACO, benchmark của Perplexity được xây dựng từ các yêu cầu nghiên cứu sâu của người dùng thật. Một bảng kết hợp Fable 5 và GPT-5.5 của OpenAI, được tổng hợp bởi Opus, đạt điểm cao nhất là 69%. Fable 5 đơn lẻ đạt 65,3%, dù vậy 7 trong số 100 tác vụ của nó không chạy do bị chặn bởi bộ lọc nội dung. Cấu hình theo ngân sách—Gemini 3 Flash kết hợp với Kimi K2.6 và DeepSeek V4 Pro, được tổng hợp bởi Opus—đạt 64,7%, vượt qua GPT-5.5 đơn lẻ (60%) và Opus 4.8 đơn lẻ (58,8%) với chi phí xấp xỉ chỉ bằng một nửa so với Fable 5. Một bảng ghép Opus 4.8 với một phiên bản riêng của chính nó đạt 65,5%, tương ứng cải thiện 6,7 điểm so với Opus đơn lẻ; OpenRouter cho rằng khoảng ba phần tư mức tăng này đến từ bước tổng hợp và phần còn lại đến từ độ đa dạng mô hình. Công ty cũng xác định rủi ro nhiễm bẩn khi các mô hình truy cập thang chấm điểm của DRACO thông qua kết quả tìm kiếm web, và OpenRouter đã khắc phục bằng cách loại trừ các miền máy chủ của benchmark khỏi các công cụ tìm kiếm. Tất cả các điểm số được công bố phản ánh cấu hình đã hiệu chỉnh này.

Việc ra mắt Fusion diễn ra sau khi bị đình chỉ xuất khẩu Fable 5

Anthropic đã đình chỉ Fable 5 và Mythos 5 vào tuần trước đối với tất cả công dân nước ngoài trên toàn thế giới sau một chỉ đạo kiểm soát xuất khẩu của Mỹ, dẫn chiếu một phát hiện jailbreak gây tranh cãi. OpenRouter công bố Fusion vào ngày hôm sau, cho biết API mang lại "trí tuệ ở mức Fable với giá chỉ bằng một nửa". Fusion vận hành hoàn toàn dựa trên các mô hình được định tuyến qua hạ tầng của OpenRouter và không giải quyết các hạn chế xuất khẩu gốc.

OpenRouter xác định các giới hạn của Fusion cho tác vụ lập trình

OpenRouter cho biết Fusion không phải là một sự thay thế hoàn chỉnh cho Fable 5. Benchmark DRACO loại trừ các công việc tầm nhìn dài hạn, nơi Fable 5 được cho là vẫn có lợi thế. Với các ứng dụng lập trình, Fusion hoạt động như một công cụ mà các mô hình lập trình gọi chọn lọc chứ không phải là một sự thay thế toàn diện. OpenRouter định vị Fusion cho nghiên cứu sâu, lập kế hoạch phức tạp và các tác vụ mà việc đối chiếu nhiều góc nhìn từ nhiều mô hình mang lại giá trị. Nhà nghiên cứu AI Andrew Trask gọi vụ ra mắt là "một chuyện lớn hơn nhiều so với vẻ ngoài," lập luận rằng các phòng thí nghiệm tiên phong sẽ không còn độc quyền kiểm soát “tiên phong”. Các nhà phê bình nêu kết quả lập trình kém, việc gọi công cụ chưa đáp ứng và thiếu minh bạch do Fable 5 không sẵn có để so sánh trực tiếp.

FAQ

OpenRouter đã ra mắt gì vào ngày 12/6?
OpenRouter đã ra mắt Fusion, một API phía máy chủ gửi prompt đến nhiều mô hình AI song song, sử dụng mô hình judge để phân tích câu trả lời và dùng bộ tổng hợp để tạo ra một câu trả lời thống nhất.

Bảng AI theo ngân sách hoạt động thế nào trên benchmark DRACO?
Bảng theo ngân sách kết hợp Gemini 3 Flash, Kimi K2.6 và DeepSeek V4 Pro đạt 64,7% trên DRACO, nằm trong vòng 1 điểm phần trăm so với Fable 5 đơn lẻ (65,3%) với chi phí xấp xỉ chỉ bằng một nửa.

Vì sao Anthropic đình chỉ Fable 5 và Mythos 5?
Anthropic đã đình chỉ Fable 5 và Mythos 5 vào tuần trước sau một chỉ đạo kiểm soát xuất khẩu của Mỹ, dẫn chiếu một phát hiện jailbreak gây tranh cãi, ảnh hưởng đến tất cả công dân nước ngoài trên toàn thế giới.

Xem nguồn

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.

Tin tức liên quan

1giờ trước

OpenRouter ra mắt Fusion API, khớp hiệu năng Fable 5 với chi phí chỉ bằng một nửa khi Anthropic tạm dừng mô hình

18giờ trước

Mẫu flagship GLM-5.2 ra mắt trò chuyện web trên nền tảng B.AI, sau lần phát hành API ngày 18 tháng 6

06-19 18:22

Thời gian phản hồi của ChatGPT tăng lên 60+ phút trong thử nghiệm GPT-5.6 A/B được nghi ngờ tuần này