Artificial Analysis công bố điểm chuẩn tác nhân mã hoá; Zhipu GLM-5.1 xếp hạng đầu trong các mô hình mã nguồn mở

Artificial Analysis hôm nay đã công bố Chỉ số Coding Agent mới để đánh giá hiệu quả của các mô hình AI khi được kết hợp với khung tác nhân (agent) trên nhiều chuẩn đánh giá quan trọng, bao gồm SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 và SWE-Atlas-QnA. Zhipu GLM-5.1 xếp hạng đầu trong nhóm các mô hình mã nguồn mở ở lần đánh giá này, cho thấy hiệu suất dẫn đầu trong các kịch bản tác nhân mã hóa ngoài đời thực.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận