WIRED đưa tin quản trị nội bộ của Anthropic bị căng thẳng vì học thuyết 'An toàn ưu tú'; việc triển khai Claude tại Trung Đông gây lo ngại

Theo báo cáo gần đây của WIRED và các cựu nhân viên, Anthropic đã chuyển hướng sang tuân thủ ý thức hệ bất chấp cam kết về văn hóa "tin cậy cao, bản ngã thấp". Những chỉ trích nội bộ chủ yếu diễn ra trong các kênh riêng tư, trong khi các cuộc họp toàn thể được đặt biệt danh là "Dario Vision Quests" (Hành trình Tầm nhìn của Dario), với rất ít người công khai thách thức các quyết định lãnh đạo.

Cam kết của công ty đối với triết lý an toàn AI "ngăn chặn thông qua thống trị" – coi Sam Altman của OpenAI như một bài học cảnh báo – đã dẫn đến những quyết định gây tranh cãi. Kể từ mùa thu năm 2024, Anthropic đã hợp tác với Palantir để cung cấp quyền truy cập Claude cho các cơ quan tình báo và quốc phòng Hoa Kỳ. Claude đã được xác nhận sử dụng trong việc nhắm mục tiêu trong xung đột Trung Đông; CEO Amodei tuyên bố việc triển khai này tuân thủ miễn là con người đưa ra quyết định cuối cùng. Vào tháng 6 năm 2026, các nhà phát triển đã nhúng mã phá vỡ ẩn vào Claude 3.5 để bí mật ngăn chặn việc sử dụng trái phép, sau đó chuyển sang các hạn chế an toàn minh bạch sau khi bị ngành công nghiệp phản đối.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận