Anthropic Xác Định Ba Thay Đổi Ở Lớp Sản Phẩm Dẫn Tới Suy Giảm Chất Lượng Claude Code, Không Phải Lỗi Từ Mô Hình

Tin Cổng, ngày 23 tháng 4 — Nhóm kỹ thuật của Anthropic đã xác nhận rằng sự suy giảm chất lượng của Claude Code được người dùng báo cáo trong tháng qua bắt nguồn từ ba thay đổi độc lập ở lớp sản phẩm, không phải từ vấn đề API hay từ mô hình nền tảng. Ba vấn đề này đã được khắc phục lần lượt vào ngày 7 tháng 4, ngày 10 tháng 4 và ngày 20 tháng 4, với phiên bản cuối cùng hiện là v2.1.116.

Thay đổi đầu tiên diễn ra vào ngày 4 tháng 3, khi nhóm giảm mức độ nỗ lực suy luận mặc định cho Claude Code từ “high” xuống “medium” để xử lý các đỉnh độ trễ cực đoan thỉnh thoảng xảy ra ở Opus 4.6 khi cường độ suy luận cao. Sau khi nhận được nhiều phàn nàn từ người dùng về hiệu năng giảm, nhóm đã hoàn tác thay đổi vào ngày 7 tháng 4. Mặc định hiện tại bây giờ là “xhigh” cho Opus 4.7 và “high” cho các mô hình khác.

Vấn đề thứ hai là một lỗi được đưa vào ngày 26 tháng 3. Hệ thống được thiết kế để xóa các bản ghi suy luận cũ sau khi sự bất hoạt trong cuộc trò chuyện vượt quá một giờ nhằm giảm chi phí khôi phục phiên. Tuy nhiên, một sai sót trong quá trình triển khai khiến việc xóa được thực thi lặp lại ở mọi lượt tiếp theo thay vì chỉ chạy một lần, khiến mô hình dần dần mất đi ngữ cảnh suy luận trước đó. Điều này thể hiện qua sự hay quên ngày càng tăng, các thao tác lặp lại và việc gọi công cụ bất thường. Lỗi cũng dẫn đến bỏ sót cache ở mọi yêu cầu, làm tăng tốc việc tiêu hao hạn mức của người dùng. Hai thí nghiệm nội bộ không liên quan đã che giấu các điều kiện tái hiện, kéo dài quá trình gỡ lỗi lên hơn một tuần. Sau khi khắc phục vào ngày 10 tháng 4, nhóm đã xem xét mã gây vấn đề bằng Opus 4.7 và phát hiện rằng Opus 4.7 có thể nhận diện được lỗi trong khi Opus 4.6 thì không.

Thay đổi thứ ba được triển khai vào ngày 16 tháng 4 cùng với Opus 4.7. Nhóm đã thêm hướng dẫn vào system prompt để giảm đầu ra dư thừa. Kiểm thử nội bộ trong nhiều tuần cho thấy không có suy giảm, nhưng sau khi ra mắt, tương tác với các prompt khác đã làm chất lượng lập trình giảm đi. Đánh giá mở rộng cho thấy mức sụt giảm hiệu năng 3% ở cả Opus 4.6 và 4.7, dẫn đến việc quay lại vào ngày 20 tháng 4.

Ba thay đổi này đã tác động đến các nhóm người dùng khác nhau vào những thời điểm khác nhau, và tác động kết hợp của chúng tạo ra tình trạng suy giảm chất lượng rộng khắp và không nhất quán, làm cho việc chẩn đoán trở nên phức tạp. Anthropic cho biết hiện họ sẽ cần nhiều nhân viên nội bộ hơn để sử dụng cùng phiên bản bản dựng công khai như người dùng, chạy đầy đủ các bộ đánh giá mô hình cho mọi lần sửa đổi system prompt và triển khai các giai đoạn triển khai theo từng bước. Như một hình thức bù đắp, Anthropic đã đặt lại hạn mức sử dụng cho tất cả người dùng gói đăng ký.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

DeepSeek huy động vốn ở mức $45B định giá giữa cuộc cạnh tranh AI

Phòng thí nghiệm AI Trung Quốc DeepSeek đang trong cuộc đàm phán để huy động vòng tài trợ đầu tiên, với mức định giá được cho là 45 tỷ USD, theo TechCrunch. Mức định giá này là một bước tăng đáng kể so với mức định giá ước tính 20 tỷ USD chỉ vài tuần trước đó, sau khi thu hút sự chú ý vào các mô hình AI của công ty nhằm

CryptoFrontier4phút trước

Huawei, Cambricon tích hợp DeepSeek V4 trên chip nội địa; dự kiến 750.000 đơn vị Ascend 950PR vào năm 2026

Theo South China Morning Post, Huawei và Cambricon đã bắt đầu tích hợp DeepSeek V4 với các nền tảng chip trong nước vào năm 2026. Huawei cho biết V4 hiện chạy trên Ascend 950PR của họ và các bộ xử lý Ascend khác, đồng thời có kế hoạch sản xuất khoảng 750.000 chip 950PR trong năm nay sau khi bắt đầu sản xuất hàng loạt st

GateNews25phút trước

Microsoft có thể trì hoãn mục tiêu điện không phát thải carbon vào năm 2030 khi việc mở rộng trung tâm dữ liệu AI làm gia tăng nhu cầu năng lượng

Theo Bloomberg, Microsoft có thể trì hoãn hoặc hủy mục tiêu năm 2030 của mình nhằm đáp ứng toàn bộ mức tiêu thụ điện mỗi giờ bằng điện phát thải bằng không, khi việc mở rộng trung tâm dữ liệu AI làm nhu cầu năng lượng tăng lên và chi phí cao hơn. Mục tiêu 100/100/0 được công bố vào năm 2021 nghiêm ngặt hơn so với mục tiêu tương ứng năng lượng tái tạo hàng năm của công ty.

GateNews25phút trước

Google DeepMind sẽ huấn luyện AI trên Eve Online, nắm giữ một phần vốn thiểu số tại Fenris Creations

Theo Bloomberg, vào ngày 6/5, Google DeepMind đã công bố sẽ huấn luyện các hệ thống AI trên Eve Online và đồng thời nắm giữ một tỷ lệ cổ phần thiểu số tại Fenris Creations, công ty đứng sau trò chơi không gian nhiều người chơi. Khoản đầu tư có giá trị lên tới hàng triệu đô la Mỹ. Giám đốc điều hành của DeepMind, Adrian Bolton, cho biết Eve Online dùng để thử nghiệm AI

GateNews25phút trước

Apple nâng chi tiêu R&D lên mức cao nhất trong 30 năm nhờ thúc đẩy đầu tư AI

Apple đã chi 10,3% doanh thu cho nghiên cứu và phát triển trong quý tháng Ba của mình, đánh dấu tỷ trọng R&D cao nhất trong ít nhất 30 năm, khi công ty đẩy mạnh phát triển AI, theo CNBC. Chi tiêu cho R&D tăng gần 34% so với cùng kỳ năm trước trong khi doanh thu tăng 17%, theo công ty.

CryptoFrontier35phút trước

Anthropic ký hợp đồng với SpaceX Colossus 1 để cung cấp năng lực tính toán cho AI

Vào hôm thứ Tư, Anthropic cho biết hãng sẽ sử dụng toàn bộ năng lực tính toán tại trung tâm dữ liệu Colossus 1 của SpaceX, đánh dấu quan hệ hợp tác mới nhất trong kế hoạch mở rộng hạ tầng AI của công ty sản xuất Claude. Thỏa thuận này nhấn mạnh chiến lược của Anthropic trong việc đảm bảo các tài nguyên tính toán chuyên dụng khi hãng mở rộng quy mô AI

CryptoFrontier53phút trước
Bình luận
0/400
Không có bình luận