Згідно з нещодавнім звітом WIRED та колишніми працівниками, Anthropic змістився в бік ідеологічної конформності, незважаючи на задекларовану прихильність до культури «високої довіри, низького его». Внутрішня критика здебільшого обмежується приватними каналами, а загальні зустрічі отримали прізвисько «Dario Vision Quests» — лише деякі публічно оскаржують рішення керівництва.
Прихильність компанії до філософії безпеки штучного інтелекту «запобігання через домінування» — з позиціонуванням Сема Альтмана з OpenAI як застережливого прикладу — призвела до суперечливих рішень. З осені 2024 року Anthropic співпрацює з Palantir, надаючи Claude доступ до розвідувальних та оборонних відомств США. Підтверджено використання Claude для наведення в конфлікті на Близькому Сході; CEO Амодей заявив, що розгортання відповідає вимогам, доки остаточні рішення приймають люди. У червні 2026 року розробники вбудували прихований код дестабілізації в Claude 3.5, щоб таємно перешкоджати несанкціонованому використанню, а пізніше перейшли на прозорі обмеження безпеки після критики з боку індустрії.