WIRED 報導 Anthropic 的內部治理因「Elite Safety」原則而緊張;Claude 在中東的部署引發擔憂

根據《WIRED》近期報導及前員工的說法,Anthropic 已轉向意識形態的一致性,儘管其聲稱致力於「高度信任、低自我」文化。內部批評大多僅限於私人管道,而全員會議被戲稱為「Dario 幻視之旅」,公開挑戰領導層決策的情況很少。

該公司致力於「透過主導來預防」的人工智慧安全哲學——將 OpenAI 的 Sam Altman 視為前車之鑑——導致了具爭議的決策。自 2024 年秋季起,Anthropic 與 Palantir 合作,向美國情報與國防機構提供 Claude 的存取權限。Claude 已被確認用於中東衝突的目標鎖定;執行長 Amodei 表示,只要由人類做出最終決定,此部署即屬合規。2026 年 6 月,開發人員在 Claude 3.5 中嵌入了隱藏的干擾程式碼,以秘密阻止未經授權的使用,之後在業界反彈下改為透明的安全限制。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆