OpenRouter đã ra mắt Fusion vào ngày 12/6, một API phía máy chủ phân phối prompt qua nhiều mô hình AI đồng thời và tổng hợp câu trả lời của chúng thành một đáp án thống nhất. Công ty phát triển hệ thống này để đạt hiệu năng tương đương Claude Fable 5 với chi phí xấp xỉ chỉ bằng một nửa, theo thử nghiệm benchmark trên bộ dữ liệu DRACO của Perplexity. Việc ra mắt diễn ra ngay sau khi Anthropic đình chỉ quyền truy cập Fable 5 và Mythos 5 sau một chỉ đạo kiểm soát xuất khẩu của Mỹ, dẫn chiếu một phát hiện jailbreak gây tranh cãi, tạo ra khoảng trống thị trường cho các lựa chọn AI hiệu năng cao có thể tiếp cận với người dùng quốc tế.
OpenRouter Fusion sử dụng kiến trúc bảng multi-model
Fusion hoạt động bằng cách gửi một prompt duy nhất tới nhiều mô hình AI song song, trong đó mỗi mô hình được cung cấp quyền truy cập vào công cụ tìm kiếm web và bash. Một mô hình “judge” sẽ trích xuất các điểm đồng thuận, mâu thuẫn và “lỗ hổng” từ toàn bộ câu trả lời. Claude Opus 4.8 đóng vai trò bộ tổng hợp mặc định, tạo ra câu trả lời cuối cùng dựa trên phân tích của judge. Người dùng có thể truy cập Fusion bằng cách chuyển chuỗi mô hình sang "openrouter/fusion" để dùng cấu hình bảng mặc định, thêm một công cụ fusion cho các lượt gọi chọn lọc, hoặc xây dựng các bảng tùy chỉnh thông qua giao diện phòng chat Fusion mà không cần lập trình.
Bảng AI theo ngân sách đạt 64,7% trên benchmark DRACO
OpenRouter đã thử nghiệm Fusion trên DRACO, benchmark của Perplexity được xây dựng từ các yêu cầu nghiên cứu sâu của người dùng thật. Một bảng kết hợp Fable 5 và GPT-5.5 của OpenAI, được tổng hợp bởi Opus, đạt điểm cao nhất là 69%. Fable 5 đơn lẻ đạt 65,3%, dù vậy 7 trong số 100 tác vụ của nó không chạy do bị chặn bởi bộ lọc nội dung. Cấu hình theo ngân sách—Gemini 3 Flash kết hợp với Kimi K2.6 và DeepSeek V4 Pro, được tổng hợp bởi Opus—đạt 64,7%, vượt qua GPT-5.5 đơn lẻ (60%) và Opus 4.8 đơn lẻ (58,8%) với chi phí xấp xỉ chỉ bằng một nửa so với Fable 5. Một bảng ghép Opus 4.8 với một phiên bản riêng của chính nó đạt 65,5%, tương ứng cải thiện 6,7 điểm so với Opus đơn lẻ; OpenRouter cho rằng khoảng ba phần tư mức tăng này đến từ bước tổng hợp và phần còn lại đến từ độ đa dạng mô hình. Công ty cũng xác định rủi ro nhiễm bẩn khi các mô hình truy cập thang chấm điểm của DRACO thông qua kết quả tìm kiếm web, và OpenRouter đã khắc phục bằng cách loại trừ các miền máy chủ của benchmark khỏi các công cụ tìm kiếm. Tất cả các điểm số được công bố phản ánh cấu hình đã hiệu chỉnh này.
Việc ra mắt Fusion diễn ra sau khi bị đình chỉ xuất khẩu Fable 5
Anthropic đã đình chỉ Fable 5 và Mythos 5 vào tuần trước đối với tất cả công dân nước ngoài trên toàn thế giới sau một chỉ đạo kiểm soát xuất khẩu của Mỹ, dẫn chiếu một phát hiện jailbreak gây tranh cãi. OpenRouter công bố Fusion vào ngày hôm sau, cho biết API mang lại "trí tuệ ở mức Fable với giá chỉ bằng một nửa". Fusion vận hành hoàn toàn dựa trên các mô hình được định tuyến qua hạ tầng của OpenRouter và không giải quyết các hạn chế xuất khẩu gốc.
OpenRouter xác định các giới hạn của Fusion cho tác vụ lập trình
OpenRouter cho biết Fusion không phải là một sự thay thế hoàn chỉnh cho Fable 5. Benchmark DRACO loại trừ các công việc tầm nhìn dài hạn, nơi Fable 5 được cho là vẫn có lợi thế. Với các ứng dụng lập trình, Fusion hoạt động như một công cụ mà các mô hình lập trình gọi chọn lọc chứ không phải là một sự thay thế toàn diện. OpenRouter định vị Fusion cho nghiên cứu sâu, lập kế hoạch phức tạp và các tác vụ mà việc đối chiếu nhiều góc nhìn từ nhiều mô hình mang lại giá trị. Nhà nghiên cứu AI Andrew Trask gọi vụ ra mắt là "một chuyện lớn hơn nhiều so với vẻ ngoài," lập luận rằng các phòng thí nghiệm tiên phong sẽ không còn độc quyền kiểm soát “tiên phong”. Các nhà phê bình nêu kết quả lập trình kém, việc gọi công cụ chưa đáp ứng và thiếu minh bạch do Fable 5 không sẵn có để so sánh trực tiếp.
FAQ
OpenRouter đã ra mắt gì vào ngày 12/6?
OpenRouter đã ra mắt Fusion, một API phía máy chủ gửi prompt đến nhiều mô hình AI song song, sử dụng mô hình judge để phân tích câu trả lời và dùng bộ tổng hợp để tạo ra một câu trả lời thống nhất.
Bảng AI theo ngân sách hoạt động thế nào trên benchmark DRACO?
Bảng theo ngân sách kết hợp Gemini 3 Flash, Kimi K2.6 và DeepSeek V4 Pro đạt 64,7% trên DRACO, nằm trong vòng 1 điểm phần trăm so với Fable 5 đơn lẻ (65,3%) với chi phí xấp xỉ chỉ bằng một nửa.
Vì sao Anthropic đình chỉ Fable 5 và Mythos 5?
Anthropic đã đình chỉ Fable 5 và Mythos 5 vào tuần trước sau một chỉ đạo kiểm soát xuất khẩu của Mỹ, dẫn chiếu một phát hiện jailbreak gây tranh cãi, ảnh hưởng đến tất cả công dân nước ngoài trên toàn thế giới.