Zhipu GLM-5.2 vượt mốc DeepSWE benchmark mã nguồn mở với tỷ lệ thành công 44%, vượt trội các mô hình đóng nguồn phổ biến

2026-06-21 03:05:19

Theo Beating (một tài khoản giám sát), mô hình mã nguồn mở GLM-5.2 của Zhipu AI đạt tỷ lệ thành công cao nhất trong số các mô hình mã nguồn mở trên bộ benchmark DeepSWE cho các tác vụ kỹ thuật phần mềm phức tạp, với tỷ lệ thành công one-shot 44% ở cường độ suy luận tối đa. Kết quả này vượt Kimi K2.7 Code với 31%, tương đương hơn 13 điểm phần trăm.

Với chi phí 3,92 USD mỗi tác vụ, GLM-5.2 vượt hiệu năng của một số mô hình đóng phổ biến trong các cấu hình suy luận cụ thể, bao gồm Claude Sonnet 4.6 [high] ở 30%, Gemini 3.5 Flash [medium] ở 37% và Claude Opus 4.8 [low] ở 41%.

Xem nguồn

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.

Tin tức liên quan

06-20 01:13

Mẫu flagship GLM-5.2 ra mắt trò chuyện web trên nền tảng B.AI, sau lần phát hành API ngày 18 tháng 6

06-19 09:14

Các nhà phát triển Mỹ đẩy nhanh việc áp dụng các mô hình AI của Trung Quốc, DeepSeek tăng mạnh lên 17% trong tháng 5

06-19 04:00

GLM-5.2 của Zhipu AI xếp thứ 2 tại Code Arena, đạt 51 điểm trên Artificial Analysis Index sau khi ra mắt

06-17 09:47

GLM-5.2 của Zhipu đứng đầu các mô hình mã nguồn mở trong bài benchmark AA với 51 điểm, khớp với GPT-5.5 trong bài kiểm tra GDPval

06-17 03:01

Z.ai Ra mắt mô hình AI GLM-5.2 mã nguồn mở với ngữ cảnh 1 triệu token vào ngày 17 tháng 6

Phân tích chuyên sâu