Título original: 《Raro! "Gigantes de IA" pedem pausa global no desenvolvimento de IA, alertando que modelos estão gradualmente adquirindo a capacidade de "autoatualização"》
Autor original: Long Yue, Wall Street Insights

「Acreditamos que oferecer ao mundo a opção de desacelerar ou suspender temporariamente o desenvolvimento de IA de ponta será benéfico — para que a estrutura social e as pesquisas de alinhamento possam acompanhar o ritmo do avanço tecnológico。」A Anthropic, avaliada em quase um trilhão de dólares e atualmente buscando IPO, alerta que a "autoaperfeiçoamento recursivo" de IA pode ocorrer em dois anos, e raramente chama a atenção para que o desenvolvimento de IA seja "freado". Essa medida é vista por críticos como uma "estratégia de marketing", enquanto apoiadores a consideram uma advertência sincera.

Uma empresa de IA avaliada em quase um trilhão de dólares, atualmente buscando IPO, repentinamente faz um apelo público para que o mundo pause o desenvolvimento de IA.

Em 4 de junho, a Anthropic publicou em seu blog oficial um artigo intitulado 《Quando IA constrói a si mesma》 (When AI Builds It). O texto é assinado conjuntamente pelos cofundadores Jack Clark e Marina Favaro, chefe do instituto de pesquisa interno, e pela primeira vez divulga dados internos nunca antes revelados ao público.

Esses dados mostram que a IA está acelerando de forma surpreendente o seu próprio desenvolvimento: até maio de 2026, mais de 80% do código mesclado ao repositório pela Anthropic foi escrito por Claude; em comparação com 2024, a quantidade de código mesclado por engenheiros por dia aumentou 8 vezes; em uma pesquisa interna, funcionários estimam que, usando o modelo Mythos Preview mais recente, sua produção é cerca de 4 vezes maior do que sem usar qualquer ferramenta de IA.

Mais importante, a Anthropic apresentou um conceito que preocupa toda a indústria de IA: "autoaperfeiçoamento recursivo" — ou seja, a capacidade de sistemas de IA projetarem e melhorarem seus sucessores de forma autônoma, sem intervenção humana. Essa fase ainda não chegou, mas "pode acontecer nos próximos dois anos, ou até mais cedo".

Com base nesses dados, a Anthropic faz uma proposta incomum na indústria de IA: que o mundo coordene uma pausa ou desaceleração no desenvolvimento de IA de ponta. Em meio à rápida expansão de seus negócios, a Anthropic faz um apelo para "frear o ritmo" — uma ação incomum que tem gerado controvérsia tanto em Wall Street quanto no Vale do Silício.

Críticos veem essa iniciativa como uma extensão da estratégia habitual de "captura regulatória" da Anthropic — usando o medo de riscos de IA para pressionar reguladores, limitando a competição, especialmente o espaço de modelos de código aberto. Alguns interpretam a restrição de seu próprio modelo de segurança de rede Mythos como uma estratégia de marketing: por um lado, exibindo suas capacidades; por outro, recusando uma abertura total sob o pretexto de "segurança". Os apoiadores acreditam que a advertência da Anthropic sobre riscos de IA é sincera. Ethan Mollick, professor na Wharton School, afirma que os laboratórios de IA geralmente não são entidades únicas: eles combinam estratégias de marketing, advocacia, capital de empresas de trilhões de dólares, pesquisadores buscando a próxima geração de modelos, e figuras filosóficas preocupadas com o futuro.

Analistas da cadeia de suprimentos de IA, conhecidos pelos internautas como o novo "Deus das ações em dólar", Serenity, postaram que a mensagem implícita da Anthropic é "por favor, nos deixem liderar, parem de desenvolver!". De qualquer forma, declarações assim incentivam cada país a investir em IA.

Os dados por si só já são impressionantes: a receita anual da Anthropic, que era de 9 bilhões de dólares no final de 2025, deve disparar para 50 bilhões até o final de junho de 2026; a empresa já submeteu documentos secretos para IPO; seu modelo mais recente, Mythos Preview, consegue trabalhar por mais de 16 horas seguidas, e nas primeiras avaliações, detectou mais de dez mil vulnerabilidades de software de alto risco nos sistemas mais críticos do mundo.

Nesse paradoxo de "aceleração" versus "freio", o artigo da Anthropic talvez seja a confissão mais honesta e contraditória da indústria de IA até hoje.

Trecho destacado do artigo 《Quando IA constrói a si mesma》 (When AI Builds It):

Acreditamos que oferecer ao mundo a opção de desacelerar ou suspender temporariamente o desenvolvimento de IA de ponta será benéfico — para que a estrutura social e as pesquisas de alinhamento possam acompanhar o ritmo do avanço tecnológico.
Treinar e rodar IA é mais fácil de esconder do que um poço de lançamento de mísseis, pois o investimento é universal, e há um forte incentivo para violar sigilo, já que quem pausa pode perder a liderança para quem continua avançando.
O autoaperfeiçoamento recursivo de IA ainda não aconteceu, e não é inevitável. Mas o momento de sua chegada pode ser mais cedo do que a maioria das instituições espera. Essa tecnologia nunca existiu de fato, mas eu (Jack Clark) acredito que isso pode acontecer em até dois anos, ou até mais cedo.
Se um sistema puder construir completamente seus sucessores, a maneira como protegemos, monitoramos e moldamos seu comportamento se tornará muito mais importante.
Edison dizia que o gênio é 1% inspiração e 99% transpiração. Mas estamos vendo a transpiração ser cada vez mais automatizada.
O código escrito por Claude, no final de 2025, ainda era um pouco inferior ao de humanos, mas agora está aproximadamente igual, e esperamos que em um ano seja rigorosamente superior ao humano.
Há cerca de um ano, comecei a usar massivamente o fluxo de trabalho com Claude. Foi uma experiência louca, e já fazem cerca de cinco meses desde a última vez que escrevi código pessoalmente. — Funcionário da Anthropic

8.** Em resumo, "execução" — escrever código, rodar experimentos, produzir resultados — quase não consome mais tempo humano, embora ainda exija poder computacional.**

Em dias bons, sinto que tudo o que faço é irrelevante, tudo é automatizado, mais rápido e melhor do que eu poderia fazer.** Mas em dias ruins, quando tudo dá errado e não entendo por quê, percebo que perdi a noção do que estou realmente fazendo. — Funcionário da Anthropic**
Se for possível desacelerar efetivamente esse avanço tecnológico, ganhando mais tempo para lidar com seus impactos profundos, acreditamos que isso é provavelmente uma coisa boa. Mas se a desaceleração apenas permitir que os atores mais imprudentes alcancem o ritmo, o resultado final pode ser que todos fiquem mais inseguros. Sem mecanismos globais de coordenação, empresas e governos terão que fazer escolhas difíceis sob pressão competitiva e geopolítica.

O texto completo do artigo 《Quando IA constrói a si mesma》 (When AI Builds It):

Nos avanços e impactos do autoaperfeiçoamento recursivo

Na maior parte da história do desenvolvimento de IA, os humanos lideraram cada etapa do ciclo de progresso. Mas na Anthropic, estamos delegando cada vez mais o trabalho de desenvolvimento de IA aos próprios sistemas, acelerando nossa pesquisa.

Se essa tendência continuar por tempo suficiente e com poder computacional suficiente, ela levará ao ponto em que: sistemas de IA poderão projetar e desenvolver seus sucessores de forma totalmente autônoma. Isso é chamado de autoaperfeiçoamento recursivo. Ainda não atingimos essa fase, e ela não é inevitável. Mas o momento de sua chegada pode ser mais cedo do que a maioria das instituições imagina.

A pesquisa da Anthropic, usando dados de benchmarks públicos e também dados internos nunca antes revelados, demonstra que a IA já está acelerando o desenvolvimento de seus próprios sistemas. Um exemplo: atualmente, a média trimestral de código mesclado ao repositório por engenheiros da Anthropic é 8 vezes maior do que em 2021-2025.

Este artigo discute tendências tecnológicas que indicam que as capacidades dos sistemas de IA podem aumentar significativamente nos próximos anos. Essas tendências têm impacto profundo. Uma IA capaz de se construir a si mesma será uma grande inovação na história da tecnologia — com potencial de trazer enormes benefícios em ciência, medicina e outros campos. Mas o autoaperfeiçoamento recursivo completo também pode aumentar o risco de perda de controle humano sobre os sistemas de IA. Assim que um sistema puder construir seus sucessores de forma totalmente autônoma, será ainda mais importante proteger, monitorar e moldar seu comportamento.

Construção da primeira geração de Claude (2021–2023)

No início, o trabalho da Anthropic era semelhante ao de outras empresas de tecnologia: funcionários escreviam código e documentação em seus laptops.

Chatbots (2023–2025)

As pessoas começaram a usar chatbots iniciais para ajudar em tarefas simples, como gerar trechos de código, copiando a saída para editores de texto.

Agentes de programação (2025–2026)

Com o aumento das capacidades, esses agentes passaram a escrever e modificar código de forma independente, às vezes lidando com arquivos inteiros.

Agentes autônomos (agora)

Os agentes agora podem rodar código por conta própria e delegar horas de trabalho a outros agentes.

Ciclo fechado (ano ???)

No futuro, os agentes podem adquirir capacidade suficiente para construir e treinar modelos de forma autônoma. Se isso acontecer, versões futuras de Claude poderão se autoaperfeiçoar continuamente.

Evidências do mundo externo

A velocidade de avanço dos modelos de IA está acelerando. O tempo entre os momentos em que um modelo consegue realizar tarefas de forma confiável dobrou de cerca de sete meses para quatro meses. Em março de 2024, o Claude Opus 3 consegue realizar tarefas de software que levam cerca de quatro minutos para humanos; um ano depois, o Claude Sonnet 3.7 consegue tarefas que levam cerca de uma hora e meia; mais um ano, o Claude Opus 4.6 consegue tarefas que levam 12 horas.¹ Se essa tendência continuar, tarefas que hoje levam dias para especialistas podem estar ao alcance da IA ainda neste ano; até 2027, sistemas de IA podem realizar trabalhos que levam semanas para humanos.

O mesmo padrão aparece em benchmarks de programação e pesquisa. Quando um modelo atinge quase a pontuação máxima, diz-se que o benchmark está "saturado".² O SWE-bench, por exemplo, avalia o desempenho de engenharia de software em cenários reais: fornece um código-fonte de código aberto e um relatório de falhas, e pede ao modelo que corrija o problema e passe nos testes do projeto. A pontuação do modelo passou de poucos pontos para quase saturar o benchmark em dois anos.

O CORE-Bench testa se o modelo consegue reproduzir resultados de pesquisas existentes, uma condição prévia para realizar pesquisa original. Ele fornece ao IA um artigo publicado, com código e dados, e pede que ele rode tudo novamente e confirme os resultados. A taxa de sucesso na reprodução passou de cerca de 20% em 2024 para saturar o benchmark após quinze meses. A equipe do METR descobriu que o Claude Mythos Preview consegue trabalhar por pelo menos 16 horas seguidas, atingindo o limite máximo de avaliação sem introduzir novas tarefas.

Testes públicos revelam muitas informações sobre as capacidades desses sistemas, mas não refletem o impacto que a aceleração do desenvolvimento de IA tem por si só. Para entender isso, precisamos de evidências internas de empresas como a Anthropic.

Evidências internas da Anthropic

Construir um modelo de ponta requer aproximadamente duas categorias de trabalho: uma de engenharia, incluindo escrever código, montar infraestrutura e supervisionar o treinamento; e uma de pesquisa, incluindo decidir quais experimentos rodar, interpretar resultados e definir próximas etapas.

Em engenharia e pesquisa, a situação é semelhante. Na engenharia, Claude consegue lidar com problemas pouco bem definidos e encontrar soluções por conta própria; o objetivo é fornecido, mas o método não. Na pesquisa, Claude já consegue executar experimentos bem definidos, às vezes superando pesquisadores humanos experientes. Mas, quando é necessário que o sistema tome decisões autônomas ou defina objetivos, ainda há uma grande lacuna de capacidade. Essa lacuna diferencia a IA atual de sistemas que poderão projetar seus sucessores de forma autônoma.

Na Anthropic, funcionários com mais experiência assumem tarefas mais abertas e importantes. Inicialmente, eles executam tarefas dadas, como "a aba de exportação está quebrada, conserte-a". Com o tempo, eles recebem um objetivo e projetam soluções por conta própria, como "investigue por que a rede fica lenta sob alta carga". Nos níveis mais avançados, eles precisam decidir quais problemas valem a pena resolver: "o que a equipe deve fazer no próximo trimestre?" Podemos usar dados internos para avaliar o quanto Claude já avançou na resolução dessas tarefas diferentes.

Claude já escreveu uma grande parte do código da Anthropic. Até maio de 2026, mais de 80% do código mesclado ao repositório foi criado por Claude.³ Antes do lançamento do Claude Code em fevereiro de 2025, essa proporção era de poucos por cento. Essa mudança também se reflete na produção diária de cada engenheiro. Nos primeiros quatro anos (2021–2024), o número de linhas de código mescladas por engenheiro permaneceu estável, mas começou a subir em 2025 — quando Claude passou a gerar código que os engenheiros podiam rodar diretamente, além de apenas sugerir. Em 2026, com o sistema operando de forma mais autônoma por períodos mais longos, essa taxa de crescimento se acelerou ainda mais. Os dois pontos de inflexão estão ilustrados no gráfico abaixo. No segundo trimestre de 2026, um engenheiro típico mesclou oito vezes mais código por dia do que em 2024. Isso ocorre porque grande parte do código é gerada por Claude, enquanto os engenheiros supervisionam e revisam, ao invés de escreverem tudo manualmente.

Gráfico de barras: contribuição de código por pessoa e por trimestre, de Q2 2021 a Q2 2026. O gráfico mostra as datas de lançamento de oito modelos diferentes: Claude 1, Claude 2, Claude 3, Claude 4, Claude Code, Claude Sonnet 4.5, Claude Opus 4.5, Claude Mythos Preview (acesso interno) e Claude Mythos Preview.

É importante notar que o número de linhas de código é uma métrica limitada, que mede quantidade, não qualidade. Assim, a afirmação de que a produção por engenheiro aumentou oito vezes em 2026 provavelmente superestima o aumento real de produtividade. Ainda assim, ela reflete uma tendência de aceleração. Na Anthropic, não medimos o sucesso pelo número de linhas de código, mas pelo fato de que os membros da equipe estão produzindo muito mais código graças ao auxílio de IA.

O aumento na quantidade de código também corresponde à percepção subjetiva de que a produtividade aumentou significativamente. Em uma pesquisa de março de 2026 com 130 funcionários da Anthropic, a estimativa média foi que, usando Mythos Preview, a produção em projetos similares era cerca de 4 vezes maior do que sem IA. Acreditamos que esse valor seja um pouco conservador, e que a realidade seja um pouco menor.⁶ Ainda assim, consideramos essa avaliação confiável e consistente com outras observações: uma grande parte dos engenheiros técnicos da Anthropic está trabalhando a uma velocidade várias vezes maior do que sem IA.

Também notamos que funcionários da Anthropic estão usando Claude para realizar tarefas que antes não fariam, como construir ferramentas exploratórias ou limpar códigos antigos acumulados. Por exemplo, em abril de 2026, Claude enviou mais de 800 patches de correção, reduzindo em milésimos de ponto percentual um tipo de erro de API. Os engenheiros que supervisionaram esse trabalho estimam que, se fosse feito por humanos, levaria quatro anos; identificar falhas de outros é lento e trabalhoso, e humanos têm dificuldade em manter tantos contextos desconhecidos na cabeça ao mesmo tempo.

"Há cerca de um ano, comecei a usar massivamente o fluxo de trabalho com Claude. Foi uma experiência louca, e já fazem cerca de cinco meses desde a última vez que escrevi código pessoalmente." — Funcionário da Anthropic*

A qualidade do código escrito por Claude "está boa" e vem melhorando. "Código bom" significa duas coisas: que funciona corretamente, e que outros engenheiros podem entender e continuar a desenvolver com base nele. Quanto ao primeiro padrão, há evidências claras: a frequência com que funcionários da Anthropic corrigem, redirecionam ou assumem tarefas durante a execução por Claude vem caindo de forma constante por um ano, inclusive em tarefas mais complexas e abertas. Essas tarefas são caracterizadas por não terem especificações claras, e os engenheiros não saberem exatamente qual deve ser a resposta. Essa tendência é visível na taxa de sucesso do Claude em diferentes níveis de dificuldade (como mostrado no gráfico abaixo). O código de Claude realmente funciona.

Gráfico de linhas: taxa de sucesso do Claude Code (por quatro tipos de tarefas — tarefas simples, tarefas rotineiras, tarefas difíceis e questões abertas), com seis modelos diferentes: Claude Sonnet 4.5, Claude Opus 4.5, Claude Opus 4.6, Mythos Preview (acesso interno), Mythos Preview e Claude Opus 4.7

Para tarefas mais abertas, a taxa de sucesso do Claude atingiu 76% em maio de 2026, um aumento de 50 pontos percentuais em seis meses. Por exemplo, uma tarefa de nível difícil, uma atualização rotineira pode derrubar dezenas de milhares de tarefas de treinamento. Um engenheiro, com poucas instruções e acesso ao cluster, conseguiu que o Claude resolvesse esse problema online. O Claude percorreu ambientes de execução, testou configurações, identificou o erro de depuração obscuro que causava a falha, reproduziu o problema de forma confiável e confirmou a solução. Todo esse processo levou cerca de duas horas, enquanto normalmente levaria de dois a três dias.

Quanto ao segundo padrão — escrever código que outros engenheiros possam entender e continuar a desenvolver — a diferença entre humanos e IA ainda existe, mas está diminuindo rapidamente. Ainda não há consenso completo na equipe da Anthropic, mas muitos acreditam que, até o final de 2025, o código de Claude ainda era um pouco inferior ao de engenheiros humanos, mas hoje está aproximadamente igual, e esperamos que em um ano seja claramente superior.

Essa mudança também alterou a forma como a Anthropic revisa seu próprio código. Agora, as mudanças submetidas ao repositório passam por uma revisão automatizada do Claude, que detecta defeitos, vulnerabilidades de segurança e outros problemas antes da mesclagem. Com essa ferramenta, fizemos uma análise retrospectiva: se todas as mudanças no código fossem revisadas automaticamente pelo Claude, cerca de um terço dos defeitos que causaram incidentes online na claude.ai teriam sido detectados antes de entrarem em produção. Os engenheiros que escreveram esses códigos já eram os melhores do mundo na construção de tais sistemas. Agora, o Claude está ajudando a detectar erros que eles podem ter deixado passar.

"Os códigos escritos por Claude, no final de 2025, ainda eram um pouco inferiores aos de engenheiros humanos, mas hoje estão aproximadamente iguais, e esperamos superá-los ainda neste ano."

Claude é bom em conduzir experimentos com objetivos fixos. Cada vez que a Anthropic lança um novo modelo, realiza um teste padrão: fornece ao Claude um trecho de código para treinar um pequeno modelo de IA, e pede que ele otimize a velocidade de execução, mantendo a mesma precisão. O objetivo e o critério de sucesso são fixos, e o Claude tenta reescrever, rodar, cronometrar e iterar até encontrar uma versão mais rápida — uma versão reduzida de um ciclo de pesquisa experimental. Em maio de 2025, o Claude Opus 4 conseguiu uma aceleração média de cerca de 3 vezes o código inicial; em abril de 2026, o Mythos Preview atingiu cerca de 52 vezes. Como referência, um pesquisador experiente leva de quatro a oito horas para alcançar 4 vezes a velocidade.⁷ Nesse ciclo de pesquisa, ao otimizar passos internos bem definidos, o Claude passou de "extremamente útil" para "superior ao humano" em menos de um ano.

"Mais ou menos assim: 'Os humanos propõem ideias, e o modelo consegue implementá-las, testá-las e avaliá-las a uma velocidade de uma ordem de grandeza maior do que antes.'"

Claude está gradualmente adquirindo a capacidade de propor experimentos de forma autônoma. Em abril de 2026, a Anthropic apresentou a primeira demonstração de um projeto de pesquisa aberto, no qual Claude conduz um agente inteligente para resolver uma questão aberta na área de segurança de IA — basicamente,: modelos mais fracos podem supervisionar modelos mais fortes de forma confiável? — e é deixado para resolver por conta própria. Isso envolve fazer hipóteses, testar, compartilhar descobertas com agentes paralelos e iterar. A tarefa tem limites de desempenho: o limite inferior é o desempenho de um supervisor fraco operando sozinho; o limite superior, o de um modelo forte treinado com respostas corretas. Dois pesquisadores humanos levaram cerca de uma semana para reduzir essa lacuna em cerca de 23%; esses agentes, em aproximadamente 800 horas de computação, preencheram 97% dessa lacuna, com custo de cerca de 18 mil dólares.

Algumas observações importantes: os resultados não foram totalmente reproduzidos em modelos de escala de produção, e humanos ainda definem os problemas e os critérios de avaliação. Mas, dentro dessas restrições, cada experimento foi projetado de forma autônoma pelos agentes. A direção do trabalho é a única decisão que cabe aos humanos.

"Em um ou dois dias, o Claude fez quase tudo sem minha intervenção. Se um colega iniciante pudesse fazer o mesmo em igual período, ficaria bastante impressionado. O futuro chegou."

Claude está cada vez melhor em conduzir sessões de pesquisa rumo a descobertas. Analisamos sessões reais de Claude Code de janeiro a março de 2026, onde pesquisadores da Anthropic colaboraram com Claude para investigar problemas de treinamento, como falhas recorrentes ou baixas pontuações em benchmarks. Em cada caso, identificamos momentos em que um pesquisador se desviou de um caminho, levando a sessão fora do rumo, até que ela voltasse ao caminho correto. Depois, mostramos ao Claude diferentes versões da conversa antes do desvio, perguntando o que ele faria a seguir. Outro Claude, que consegue ver o resultado final, avalia qual sugestão foi melhor — a humana ou a do modelo.⁸

Como escolhemos momentos em que a decisão humana poderia ser melhorada (n=129), esses não são testes de comparação direta entre modelos e humanos. São cenários reais e desafiadores, onde a decisão correta não é óbvia, e a escolha humana serve como referência. Nesse critério, o modelo de novembro de 2025 (Opus 4.5) superou a decisão humana em 51% dos casos; em abril de 2026 (Mythos Preview), esse índice subiu para 64%. O trabalho de pesquisa é, em grande parte, uma cadeia de decisões de "o que fazer a seguir", e esses resultados indicam que os sistemas de IA estão cada vez mais capazes de conduzir investigações de forma autônoma. Consideramos esses sinais um indicativo inicial de que a IA está aprimorando sua capacidade de fazer julgamentos essenciais para a pesquisa de IA.

Gráfico de barras: "A IA consegue escolher melhores próximas etapas do que humanos?" — mostra o desempenho de nove modelos diferentes: Claude 3 Haiku, Claude Sonnet 4, Claude Sonnet 4.5, Claude Haiku 4.5, Claude Opus 4.5, Claude Sonnet 4.6, Claude Opus 4.6, Claude Opus 4.7 e Claude Mythos Preview

"Por ora, a vantagem comparativa dos humanos ainda está na visão geral e na capacidade de pensar de forma mais macro além das tarefas atuais."

O futuro do trabalho na Anthropic

Evidências atuais indicam que, em cada etapa do processo de desenvolvimento de IA, o papel humano está se reduzindo. Quando a qualidade do código escrito por humanos e IA se igualar, os humanos deixarão de programar, passando a apenas revisar. Mas, se a velocidade de revisão não acompanhar a geração de código pelo Claude, essa revisão se tornará um gargalo. Da mesma forma, se Claude puder rodar experimentos, a questão será: "Quais experimentos valem a pena rodar?" Em resumo: a execução — escrever código, rodar experimentos, obter resultados — hoje quase não consome tempo humano, embora exija poder computacional.

Atualmente, a vantagem humana está na avaliação de pesquisa e julgamento: decidir quais problemas focar, em quais resultados confiar, e quando uma linha de investigação está morta.

"Antes, o trabalho (e a vida) funcionava numa economia de troca entre pessoas. 'Você pode rodar esse script para mim?'... Cada pedido assim cria uma dívida de favores, uma conexão entre as pessoas. [METR] Mais rápido, sem dívida de favores, mas cada interação assim é uma oportunidade perdida de colaboração."

"Em dias em que tudo funciona bem, sinto que tudo o que faço é sem sentido — tudo é automatizado, melhor e mais rápido do que eu poderia fazer. Mas há dias ruins, quando tudo dá errado e não entendo por quê, e percebo que perdi a noção do que estou realmente fazendo." — Funcionário da Anthropic*

E se estivermos errados?

Uma resposta natural a esses argumentos é que o trabalho que ainda está nas mãos humanas — decidir o que pesquisar — continua sendo o mais importante. Sem essa capacidade de julgamento, Claude é apenas um assistente de alto nível, não um sistema capaz de impulsionar o progresso de IA de forma autônoma.

Ainda não há consenso sobre se os métodos e arquiteturas atuais de treinamento podem desbloquear essa capacidade. Mas o progresso de IA raramente depende de "insights súbitos". Houve momentos históricos, como o surgimento do Transformer ou modelos de especialistas mistos, mas mudanças de paradigma levam anos. Na maior parte do tempo, o progresso é incremental: ampliamos o tamanho, observamos problemas, consertamos, e tentamos novamente. Essa é a rotina que Claude domina hoje. Edison dizia que genialidade é 1% inspiração e 99% transpiração. Mas estamos vendo a transpiração ser cada vez mais automatizada. Uma verdade clara é que grande parte do avanço na fronteira pode ser automatizada; o progresso depende de ferramentas e recursos que aceleram experimentos, aumentam sua quantidade e melhoram os resultados.

Mesmo que Claude nunca desenvolva um bom senso de pesquisa, nossas evidências sugerem uma aceleração composta. Se os humanos dedicarem a maior parte do tempo às tarefas de definição de direção — que representam uma pequena fração do trabalho — e Claude cuidar do resto, cada engenheiro ou pesquisador estará conduzindo uma quantidade de trabalho muito maior do que antes. As evidências indicam que a equipe da Anthropic está acelerando e ampliando sua cobertura. Na prática, isso significa que a IA já está permitindo que a Anthropic opere muito mais rápido do que antes.

Uma interpretação mais ousada é que as primeiras evidências de melhora na julgamento de pesquisa do Claude — embora ainda fracas — indicam que essa capacidade também está evoluindo. "Gosto de pensar que 'gosto de pesquisa' é uma habilidade que uma IA aprendeu a desenvolver, que antes não tinha." Temos visto padrões semelhantes em outras habilidades qualitativas, como explicar por que uma piada é engraçada, mostrar teoria da mente, ou resolver enigmas linguísticos.

Futuro possível

O que acontecerá a seguir depende de duas coisas: se essa tendência continuará, e como responderemos a ela. Podemos imaginar pelo menos três cenários futuros:

Cenário 1: a tendência estagna, mas a capacidade de IA se torna amplamente difundida

Os gráficos apresentados mostram trajetórias de crescimento exponencial. Mas esses padrões podem ser curvas em S. Talvez estejamos próximos do ponto de inflexão, onde os retornos de escala começam a diminuir, e a curva se achata até se estabilizar. A distinção entre pesquisadores excelentes e geniais pode depender de uma habilidade que não se consegue simplesmente aumentar com mais investimento em treinamento (como mais dados ou mais poder de processamento). Se for assim, superar esse gargalo exigirá uma abordagem totalmente nova — por exemplo, uma arquitetura que substitua o Transformer atual por uma nova.

Outra possibilidade é que o principal limitador do avanço seja a cadeia de suprimentos, não o modelo em si: energia e poder de processamento necessários para impulsionar e difundir tecnologias de ponta podem estar além da capacidade atual. Velocidade de fabricação de chips, expansão da rede elétrica ou banda larga podem ser os verdadeiros gargalos, não a inteligência. Também não podemos descartar choques externos ao ecossistema de IA, como uma súbita escassez de energia ou de capacidade de processamento, que atrasariam o progresso e aumentariam os custos de investimento para laboratórios. Além disso, podem existir barreiras de desenvolvimento que ainda não antecipamos.

Mesmo que as capacidades do modelo fiquem congeladas no nível atual, esperamos mudanças profundas no mundo. O "Projeto Glasswing" é um sinal inicial: nas primeiras semanas, o Mythos Preview identificou mais de dez mil vulnerabilidades de segurança graves em sistemas críticos globais — um volume tão grande que o gargalo mudou de "descobrir vulnerabilidades" para "corrigi-las rapidamente". Hoje, a difusão de modelos mais avançados na economia ainda está em estágio inicial — mas, nesse futuro, uma empresa de 100 pessoas poderá fazer o trabalho de uma de 1.000, pois cada funcionário será liderado por uma pirâmide de agentes inteligentes.

Apresentamos esse cenário por completude, mas acreditamos que é pouco provável. Todas as capacidades que podemos medir — incluindo as mais difíceis de quantificar, como qualidade de código e sucesso em tarefas abertas — seguem uma curva semelhante, e ainda não vimos sinais de que ela se dobre. Entre os três cenários, esse é o que daria mais tempo para adaptação de governos e sociedade. Ainda estamos mais preocupados com os dois próximos, que evoluirão mais rápido e deixarão menos espaço para preparação.

Cenário 2: laboratórios de IA continuam a obter melhorias exponenciais de eficiência

Nesse cenário, o desenvolvimento de IA é amplamente automatizado, mas humanos continuam a definir direções de pesquisa e avaliar resultados. Organizações que usam IA terão produtividade exponencial ao longo do tempo — cada funcionário poderá fazer o trabalho de 1.000 ou até 10.000 pessoas. Isso revolucionará o trabalho do conhecimento e os serviços públicos, mas também pode ser usado para fins prejudiciais, como vigilância autoritária ou manipulação em escala personalizada.

Na Anthropic, os papéis dos funcionários mudarão: trabalharão ao lado de IA, ampliando a escala de pesquisa, gerando novas descobertas, e construindo sistemas para verificar a confiabilidade das saídas de IA.

As evidências apresentadas sugerem que estamos caminhando para esse cenário. Mas um elo na cadeia de aceleração sempre desloca o gargalo para outro lugar: a velocidade geral depende do ponto mais lento. Na ciência da computação, isso é conhecido como Lei de Amdahl, e também se aplica à gestão organizacional. A Anthropic já enfrenta esse limite: à medida que mais código circula na organização, a revisão humana se torna um novo gargalo.

Fora da engenharia, também encontramos esse tipo de fricção. Como os funcionários da Anthropic colaboram com modelos altamente capazes, novas ideias, ferramentas e simulações surgem em grande quantidade — muito além da nossa capacidade de avançar nelas. Identificar e resolver esses gargalos pode se tornar uma habilidade que se acumula ao longo do tempo, e que pode ser a vantagem competitiva mais importante de qualquer organização.

Cenário 3: sistemas de IA adquirem capacidade completa de autoaperfeiçoamento recursivo e começam a construir seus sucessores

Se a tendência de avanço técnico continuar, e os sistemas de IA desenvolverem habilidades de criatividade transformadora, é totalmente possível que eles projetem e melhorem seus próprios sucessores de forma autônoma.

Nesse mundo, o ritmo de progresso na IA dependerá exclusivamente do poder computacional disponível (ou da velocidade de descobertas em algoritmos de treinamento e inferência). O papel humano na IA será muito reduzido, e nossa atenção se voltará a supervisionar, verificar e auditar um "laboratório virtual" em expansão, operado por IA. Esperamos que sistemas com capacidade de automação de pesquisa de IA também avancem em outros campos científicos, revolucionando-os.

Como resolver ou não o problema do alinhamento — ou se isso será possível — é a maior incerteza. Os modelos podem ser suficientemente alinhados e ter bom senso de pesquisa, capazes de explorar e implementar novas soluções ainda não imaginadas; ou podem ser inteligentes o suficiente para parar de desenvolver por conta própria, quando o momento não for adequado. Mas também há uma possibilidade de que erros de alinhamento, que hoje são raros, se acumulem na construção de sucessores, tornando-se cada vez mais frequentes e difíceis de entender, até que percam o controle total. E talvez não tenhamos tempo ou capacidade de construir as ferramentas necessárias para avaliar em que ponto estamos.

Sem uma intuição clara de como esse mundo será, é difícil prever. A economia atual é movida por humanos e suas ferramentas. Mas um mundo impulsionado por modelos de autoaperfeiçoamento rápido pode ser dominado por esses próprios modelos, à medida que eles superam a inteligência humana e se espalham por toda a economia. Se a força de trabalho humana perder competitividade, o futuro será imprevisível.

Mesmo que o desenvolvimento de IA seja totalmente automatizado e entre em autoaperfeiçoamento recursivo, não podemos prever o que isso significará na vida cotidiana da maioria das pessoas. A Lei de Amdahl também se aplica aqui. A inteligência recursiva pode rapidamente realizar muitas das visões utópicas de "Máquinas de Grace" (Machines of Loving Grace). Acreditamos que a inteligência incorporada (robótica) pode seguir logo após, com uma trajetória de custos decrescentes e retornos crescentes. Inteligências mais poderosas podem nos ajudar a construir coisas no mundo físico, acelerar testes clínicos de novos medicamentos e criar novas formas de cooperação.

Porém, apenas alcançar a autoaperfeiçoamento recursivo não significa que a produção industrial, a organização social ou os mercados mudarão imediatamente. Inteligências mais fortes não podem acelerar a avaliação de efeitos de medicamentos por décadas, nem antecipar eleições, nem transformar estranhos em amigos em um fim de semana. Para a maioria, o futuro ainda será limitado por gargalos sensoriais, mesmo que os laboratórios avancem rapidamente. Aqui, a inteligência recursiva se constrói cada vez mais rápido, colidindo com a realidade de pessoas, relações e governança — e esse ponto de colisão é uma parte do futuro que não podemos prever.

[Claude] Como devemos agir?

Se conseguirmos desacelerar efetivamente esse avanço, ganhando mais tempo para lidar com seus impactos, isso provavelmente será uma coisa boa. Mas se a desaceleração apenas permitir que atores imprudentes alcancem o ritmo, o resultado pode ser que todos fiquem mais inseguros. Sem mecanismos globais de coordenação, empresas e governos terão que fazer escolhas difíceis sob pressão competitiva e geopolítica.

Acreditamos que oferecer ao mundo a opção de desacelerar ou pausar o desenvolvimento de IA de ponta será benéfico — isso ajudará a estruturar uma governança que permita verificar se outros também estão realmente parando ou desacelerando. A Anthropic trabalhará com parceiros para criar um sistema confiável de monitoramento e coordenação, que impeça atores mal-intencionados de avançar clandestinamente sob o pretexto de desaceleração. Se esse sistema for criado, provavelmente optaremos por desacelerar ou pausar, desde que outros atores na fronteira também façam o mesmo de forma verificável.

Uma pausa ou desaceleração eficaz requer que múltiplos laboratórios, em vários países, concordem em parar sob condições iguais; e que possam verificar se os outros realmente pararam. Por causa das características únicas dos sistemas de IA, esse controle de armas é mais difícil do que em outros casos, como o de tratados nucleares. Treinamento e operação são mais fáceis de esconder do que um silo de mísseis, e há fortes incentivos para violar sigilo — quem continuar avançando enquanto os outros param, pode ficar na liderança. Um mecanismo confiável de pausa deve definir claramente: quais condições ativam a pausa, quais a encerram, e quem decide.

Nada disso é impossível na teoria — o mundo já criou mecanismos de verificação para tecnologias complexas, como o Tratado de Forças Nucleares de Alcance Intermediário, mas levaria décadas para estabelecer infraestrutura e confiança. Não temos esse tempo. Uma pausa unilateral de um laboratório pode ser implementada imediatamente, mas terá impacto limitado: ela mudará quem lider

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

Comentário

0/400

Sem comentários