DeepSeek giới thiệu phương pháp Visual Primitives để nâng cao khả năng suy luận đa phương thức vào ngày 30 tháng 4

Theo báo cáo kỹ thuật của DeepSeek, vào ngày 30/4 công ty đã giới thiệu Visual Primitives, một phương pháp nhúng các đơn vị hình ảnh cơ bản như điểm và khung giới hạn vào các chuỗi suy luận nhằm giải quyết vấn đề Reference Gap trong các tác vụ đa phương thức. Phương pháp này giúp giảm mức tiêu thụ token hình ảnh thông qua nén KV cache.

Trong các bộ benchmark đếm và suy luận không gian, cách tiếp cận đạt hiệu năng tương đương với GPT-5.4, Claude-Sonnet-4.6 và Gemini-3-Flash ở một số hạng mục được chọn. DeepSeek cho biết sẽ mở mã nguồn một phần của các benchmark và bộ dữ liệu, đồng thời các trọng số mô hình sẽ được phát hành sau khi tích hợp.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận