Technology

Claude já escreve 80% do código da Anthropic e assusta a empresa

Em maio de 2026, mais de 80% do código integrado à base de produção da Anthropic foi escrito pelo Claude, segundo relatório publicado pelo Anthropic Institute na última quarta-feira (4). Haiku, Sonnet e Opus: quais as diferenças entre os modelos do Claude? Tudo sobre o Claude: conheça os modelos e recursos da IA da Anthropic O número subiu de dígitos simples desde o lançamento do Claude Code, em fevereiro de 2025, e é acompanhado de um alerta da própria empresa: o ritmo de evolução pode levar a sistemas que projetam seus próprios sucessores sem controle humano adequado. O documento, intitulado "When AI builds itself" (Quando a IA se constrói, em inglês), foi produzido por Marina Favaro e Jack Clark, do Anthropic Institute. Segundo os autores, o fenômeno descrito como "autoaperfeiçoamento recursivo" ainda não foi atingido, mas pode chegar antes do que as instituições esperam. - Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis. - Os números por trás da mudança A produtividade dos funcionários da Anthropic multiplicou de forma expressiva. No segundo trimestre de 2026, engenheiros entregaram oito vezes mais código por trimestre do que entre 2021 e 2025. Em uma pesquisa interna com 130 pesquisadores, a mediana das respostas apontou uma produção quatro vezes maior ao usar o modelo mais recente da empresa, o Mythos Preview, em comparação ao trabalho sem IA. Nas tarefas de engenharia mais complexas e menos especificadas, o Claude alcançou uma taxa de sucesso de 76% em maio de 2026, aumento de 50 pontos percentuais em seis meses. O relatório traz um exemplo prático: quando uma atualização comum travou milhares de tarefas que a IA estava executando, um engenheiro pediu ajuda ao Claude. Ele explicou o problema em poucas palavras e deu ao assistente acesso aos computadores da empresa. Em apenas duas horas, a IA encontrou uma configuração oculta que estava causando o erro, testou a falha e resolveu o problema, um trabalho que normalmente exigiria de dois a três dias de um profissional humano. A qualidade do código também acompanhou a curva. Segundo a Anthropic, o código gerado pelo Claude era "um pouco pior" que o humano no final de 2025, está em paridade atualmente e deve superá-lo ao longo deste ano. A Anthropic está em vias de fazer um IPO, e abrir seu capital ao mercado (Imagem: Marcelo Fischer/Canaltech) De codificador a pesquisador Em um experimento de abril de 2026, nove agentes paralelos foram colocados para trabalhar em um projeto de segurança de IA de ponta a ponta, sem supervisão contínua. Ao longo de cerca de 800 horas acumuladas e aproximadamente US$ 18 mil em computação, os agentes recuperaram 97% da lacuna de desempenho na tarefa. Dois pesquisadores humanos, trabalhando por uma semana, recuperaram 23%. Outro teste mediu se o Claude seria capaz de escolher o "próximo passo" mais adequado em sessões reais de pesquisa. Em novembro de 2025, o modelo acertou o julgamento do pesquisador humano em 51% das situações. Em abril de 2026, esse número chegou a 64%. Por que isso preocupa a Anthropic O ponto mais significativo do relatório não é a produtividade. É o alerta sobre para onde esse caminho pode levar. O documento descreve três cenários possíveis. No primeiro, a tendência desacelera, mas as capacidades atuais já reformulam a economia. No segundo, o desenvolvimento de IA se torna substancialmente automatizado enquanto humanos ainda definem a direção de pesquisa, o que permitiria que empresas de 100 pessoas façam o trabalho de organizações com 100 mil. No terceiro, os modelos atingem o autoaperfeiçoamento recursivo pleno e passam a projetar seus próprios sucessores. Sobre esse terceiro cenário, a Anthropic admite não ter "boas intuições". A preocupação central é com o desalinhamento. Falhas raras e controláveis hoje poderiam se acumular de geração em geração de modelos até que o controle se torne inviável. O relatório alerta que esse desalinhamento pode ficar "cada vez mais frequente, mas cada vez menos compreendido, até perdermos o controle". O número de usuários do Claude cresceu de forma expressiva no último ano (Imagem: Viviane França/Canaltech) Proposta de pausa global Para lidar com esse risco, o relatório propõe um mecanismo de pausa verificável e coordenado entre laboratórios de fronteira em diferentes países, com analogia explícita ao controle de armas nucleares. A Anthropic é clara sobre os limites da ideia. Uma pausa unilateral apenas mudaria quem lidera a corrida. O que se propõe é um acordo no qual múltiplos laboratórios concordariam em parar sob as mesmas condições e verificariam o cumprimento uns dos outros. O problema é que o treinamento de um modelo de IA é muito mais difícil de detectar do que testar um míssil, e o incentivo para descumprir o acordo silenciosamente é grande, especialmente em um mercado de IA para código que já movimenta dezenas de bilhões de dólares. "Se fosse possível desacelerar o desenvolvimento dessa tecnologia para nos dar mais tempo para lidar com suas imensas implicações, acreditamos que isso provavelmente seria uma coisa boa", diz o relatório. Vale notar que os dados apresentados são auto-reportados pela Anthropic e não foram auditados de forma independente. O relatório foi publicado dias depois de a empresa protocolar pedido de abertura de capital. Leia a matéria no Canaltech.

CA CanaltechUpdated 5h ago5 min read

🤖 AI AI Summary & AI Analysis

⟳ AI is analyzing this article…

Full article body is being fetched in the background. Refresh in a moment to see the complete paragraphs. For now this page shows a summary and AI analysis.