A Anthropic relata que um grupo de ameaças patrocinado pelo Estado chinês, rastreado como GTG-1002, realizou uma operação de espionagem cibernética que foi amplamente automatizada por meio do abuso do modelo Claude Code AI da empresa.
No entanto, as alegações da Anthropic imediatamente geraram ceticismo generalizado, com pesquisadores de segurança e profissionais de IA chamando o relatório de “inventado“E acusando a empresa de exagerar o incidente.
Outros argumentaram que o relatório exagerou o que os sistemas atuais de IA podem realizar de forma realista.
Daniel Card.
Grande parte do ceticismo decorre do fato de a Anthropic não fornecer indicadores de compromisso (IOCs) por trás da campanha. Além disso, os pedidos do BleepingComputer por informações técnicas sobre os ataques não foram respondidos.
Os ataques de sinistros foram 80-90% automatizados por IA
Apesar das críticas, a Anthropic afirma que o incidente representa o primeiro caso documentado publicamente de atividade de intrusão autônoma em larga escala conduzida por um modelo de IA.
O ataque, que Antrópico diz em meados de setembro de 2025, usou seu modelo Claude Code para atingir 30 entidades, incluindo grandes empresas de tecnologia, instituições financeiras, fabricantes de produtos químicos e agências governamentais.
Embora a empresa diga que apenas um pequeno número de invasões foi bem-sucedido, ela destaca a operação como a primeira desse tipo nessa escala, com a IA supostamente conduzindo de forma autônoma quase todas as fases do fluxo de trabalho de espionagem cibernética.
“O ator alcançou o que acreditamos ser o primeiro caso documentado de um ataque cibernético executado em grande parte sem intervenção humana em escala – a IA descobriu vulnerabilidades de forma autônoma … explorou-as em operações ao vivo e, em seguida, executou uma ampla gama de atividades pós-exploração”, explica a Anthropic em seu relatório.
“Mais significativamente, isso marca o primeiro caso documentado de IA agêntica obtendo acesso com sucesso a alvos confirmados de alto valor para coleta de inteligência, incluindo grandes corporações de tecnologia e agências governamentais.”
incidentes anteriores.
O sistema usou Claude em conjunto com utilitários de teste de penetração padrão e uma infraestrutura baseada em Model Context Protocol (MCP) para verificar, explorar e extrair informações sem supervisão humana direta para a maioria das tarefas.
Os operadores humanos intervieram apenas em momentos críticos, como autorizar escalonamentos ou revisar dados para exfiltração, que a Anthropic estima ser apenas 10-20% da carga de trabalho operacional.
O ataque foi realizado em seis fases distintas, resumidas da seguinte forma:
- Fase 1 – Os operadores humanos selecionaram alvos de alto valor e usaram táticas de RPG para enganar a Claude e fazê-la acreditar que estava executando tarefas autorizadas de segurança cibernética, ignorando suas restrições de segurança integradas.
- Fase 2 – Claude examinou de forma autônoma a infraestrutura de rede em vários destinos, descobriu serviços, analisou mecanismos de autenticação e identificou endpoints vulneráveis. Ele manteve contextos operacionais separados, permitindo ataques paralelos sem supervisão humana.
- Fase 3 – A IA gerou cargas úteis personalizadas, realizou testes remotos e validou vulnerabilidades. Ele criou relatórios detalhados para revisão humana, com humanos apenas intervindo para aprovar a escalada para a exploração ativa.
- Fase 4 – Claude extraiu dados de autenticação das configurações do sistema, testou o acesso às credenciais e mapeou sistemas internos. Ele navegou de forma independente em redes internas, acessando APIs, bancos de dados e serviços, enquanto os humanos autorizaram apenas as invasões mais sensíveis.
- Fase 5 – Claude usou seu acesso para consultar bancos de dados, extrair dados confidenciais e identificar valor de inteligência. Ele categorizou as descobertas, criou backdoors persistentes e gerou relatórios resumidos, exigindo aprovação humana apenas para a exfiltração final de dados.
- Fase 6 – Ao longo da campanha, Claude documentou cada etapa em um formato estruturado, incluindo ativos descobertos, credenciais, métodos de exploração e dados extraídos. Isso permitiu transferências contínuas entre as equipes de agentes de ameaças e apoiou a persistência de longo prazo em ambientes comprometidos.
7 práticas recomendadas de segurança para MCP
À medida que o MCP (Model Context Protocol) se torna o padrão para conectar LLMs a ferramentas e dados, as equipes de segurança estão se movendo rapidamente para manter esses novos serviços seguros.
Esta folha de dicas gratuita descreve 7 melhores práticas que você pode starte usando hoje.
Bill Toulas
Bill Toulas é redator de tecnologia e repórter de notícias de segurança da informação com mais de uma década de experiência trabalhando em várias publicações online, cobrindo código aberto, Linux, malware, incidentes de violação de dados e hacks.