A Anthropic Identifica Três Mudanças na Camada de Produto Por Trás da Queda de Qualidade do Claude Code, e Não um Problema de Modelo

Mensagem do Gate News, 23 de abril — A equipe de engenharia da Anthropic confirmou que a degradação da qualidade do Claude Code relatada pelos usuários no último mês se deveu a três mudanças independentes na camada de produto, e não a problemas de API ou do modelo subjacente. Os três problemas foram corrigidos em 7 de abril, 10 de abril e 20 de abril, respectivamente, com a versão final agora em v2.1.116.

A primeira mudança ocorreu em 4 de março, quando a equipe reduziu o nível de esforço de raciocínio padrão do Claude Code de “high” para “medium” para tratar picos ocasionais de latência extrema no Opus 4.6 sob alta intensidade de raciocínio. Após queixas generalizadas dos usuários sobre desempenho reduzido, a equipe reverteu a mudança em 7 de abril. O padrão atual agora é “xhigh” para o Opus 4.7 e “high” para outros modelos.

O segundo problema foi um bug introduzido em 26 de março. O sistema foi projetado para limpar registros antigos de raciocínio após a inatividade da conversa exceder uma hora, para reduzir custos de recuperação de sessão. Porém, uma falha na implementação fez com que a limpeza fosse executada repetidamente em cada turno subsequente, em vez de uma única vez, fazendo com que o modelo perdesse progressivamente o contexto de raciocínio anterior. Isso se manifestou como aumento da falta de memória, operações repetidas e invocações anormais de ferramentas. O bug também resultou em falhas de cache em toda solicitação, acelerando o consumo do limite de cota do usuário. Dois experimentos internos não relacionados mascararam as condições de reprodução, estendendo o processo de depuração para mais de uma semana. Após a correção em 10 de abril, a equipe revisou o código problemático usando o Opus 4.7 e descobriu que o Opus 4.7 conseguia identificar o bug enquanto o Opus 4.6 não.

A terceira mudança foi lançada em 16 de abril junto com o Opus 4.7. A equipe adicionou instruções ao prompt do sistema para reduzir a saída redundante. Testes internos ao longo de várias semanas não mostraram regressão, mas após o lançamento a interação com outros prompts degradou a qualidade de codificação. Avaliações estendidas revelaram uma queda de desempenho de 3% tanto no Opus 4.6 quanto no 4.7, levando a um rollback em 20 de abril.

Essas três mudanças afetaram grupos de usuários diferentes em momentos diferentes, e seu efeito combinado gerou uma queda de qualidade ampla e inconsistente, complicando o diagnóstico. A Anthropic afirmou que agora será necessário que mais funcionários internos usem a mesma versão pública de build que os usuários, executem conjuntos completos de avaliação do modelo para cada modificação no prompt do sistema e implementem períodos de rollout em etapas. Como compensação, a Anthropic redefiniu as cotas de uso de todos os usuários assinantes.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

As demonstrações financeiras da Arm superaram as expectativas; o CEO alertou sobre a fraqueza do mercado de celulares e lançou o “AGI CPU” para ampliar sua participação no mercado de IA

A Arm publicou resultados financeiros que mostram a empresa fazendo a transição de dispositivos móveis para data centers de IA. No quarto trimestre, a receita foi de US$ 1,49 bilhão, alta de 20% em relação ao ano anterior, e o EPS foi de 0,60. Os royalties de US$ 671 milhões ficaram abaixo do esperado, e as ações caíram após o fechamento. A perspectiva para o próximo trimestre é de receita de US$ 1,26 bilhão e EPS de 0,40. Com o mercado de celulares fraco, a Arm vai concentrar esforços em automotivo, IoT e infraestrutura de nuvem, além de lançar um CPU AGI, que deve contribuir com mais de US$ 200 milhões em 2027–2028. A SoftBank detém cerca de 90% das participações, impulsionando sinergias e a estratégia de ecossistema de IA.

ChainNewsAbmedia32m atrás

Líder do Claude Code, Boris: agentes de IA aumentam a produtividade humana e reescrevem a história do desenvolvimento de software

O responsável da Claude Code, Boris Cherny, afirmou em entrevista à CNBC que ferramentas de agentes de IA como o Co-Work podem delegar tarefas tediosas ao processamento por IA, fazendo com que engenheiros deixem de operar e passem a orientar, além de permitir acionar vários agentes para tratar depuração ao mesmo tempo, elevando significativamente a produtividade. As empresas precisam reorganizar processos tendo a IA como núcleo; a IA tem mostrado valor em todas as áreas e, no desenvolvimento de software, a atividade sairá de escrever códigos para se tornar uma colaboração guiada por lógica e conversas, com redução das barreiras técnicas e surgimento de um crescimento explosivo em inovação e startups.

ChainNewsAbmedia41m atrás

Reid Hoffman: NFTs podem voltar à medida que os agentes de IA precisam de confiança cripto

Reid Hoffman, sócio da Greylock e cofundador do LinkedIn, disse que agentes autônomos precisarão de sistemas de confiança baseados em cripto para fazer transações pela internet aberta, sugerindo que NFTs podem voltar a ter força, de acordo com sua declaração. Agentes de IA e infraestrutura de confiança As observações de Hoffman apontam para um possível

CryptoFrontier2h atrás

Scale AI recebe $500M contrato do Pentágono para processamento de dados de IA

De acordo com a ChainCatcher, o Departamento de Defesa dos EUA concedeu à Scale AI, apoiada pela Meta Platforms, um contrato de US$ 500 milhões para ajudar a processar dados e apoiar a tomada de decisões militares. A premiação é cinco vezes maior do que o contrato de US$ 100 milhões que a empresa sediada em São Francisco recebeu em

GateNews2h atrás

xAI, de Elon Musk, vai rebrandizar como SpaceXAI à medida que o status de empresa independente chega ao fim

De acordo com a Odaily, Elon Musk anunciou que a xAI será rebatizada como SpaceXAI, já que a empresa não vai mais operar como uma entidade independente.

GateNews3h atrás

IBM amplia sua suíte de IA corporativa com novas ferramentas baseadas em agentes na Think 2026

Segundo a IBM, a empresa anunciou uma expansão de suas capacidades de IA corporativa na conferência Think 2026, em Boston, lançando novas ferramentas baseadas em agentes para ajudar organizações a incorporar inteligência artificial nas operações do dia a dia. O Context Studio, agora disponível de forma geral, permite que empresas

GateNews3h atrás
Comentário
0/400
Sem comentários