Anthropic retém novo e poderoso modelo de IA para prevenir crise global de segurança cibernética

18

A Anthropic, desenvolvedora líder de IA, anunciou um avanço paradoxal: seu mais novo modelo de inteligência artificial, Claude Mythos, é tão eficiente na identificação e exploração de vulnerabilidades de software que a empresa o considerou perigoso demais para divulgação pública.

Em vez de um lançamento tradicional para o consumidor, a Anthropic está a orientar-se para uma estratégia defensiva, partilhando a ferramenta exclusivamente com os principais fornecedores de infraestruturas para os ajudar a corrigir as próprias falhas que a IA revela.

A “espada de dois gumes” de Claude Mythos

O surgimento de Claude Mythos representa uma mudança significativa na corrida armamentista da IA. Segundo a Anthropic, o modelo atingiu um nível de sofisticação de codificação que lhe permite superar quase todos os especialistas humanos na descoberta de brechas de segurança.

As implicações são profundas:
Descoberta sem precedentes: Em testes preliminares, a Mythos identificou milhares de vulnerabilidades graves em todos os principais sistemas operacionais e navegadores da web.
Escala e profundidade: Ao contrário das estruturas de segurança tradicionais, a Mythos pode realizar análises com uma velocidade e profundidade que as equipes humanas e o software legado simplesmente não conseguem igualar.
O risco da democratização: Embora a pesquisa de vulnerabilidades assistida por IA não seja um conceito novo, a preocupação aqui é o poder absoluto deste modelo específico. Se for divulgado ao público em geral, poderá fornecer aos agentes mal-intencionados uma “chave mestra” para a infraestrutura digital global.

Projeto Glasswing: uma coalizão defensiva

Para mitigar os riscos apresentados pela Mythos, a Anthropic lançou o Projeto Glasswing. Esta iniciativa foi concebida para transformar uma arma potencial num escudo defensivo, concedendo acesso a um enorme consórcio de gigantes da tecnologia e líderes de segurança.

A coalizão inclui pesos pesados da indústria, como:
Nuvem e infraestrutura: Amazon Web Services (AWS), Microsoft, Google e Nvidia.
Hardware e redes: Cisco, Broadcom e Palo Alto Networks.
Segurança e finanças: CrowdStrike, JPMorgan Chase e Linux Foundation.

A Anthropic está apoiando esse esforço com recursos significativos, comprometendo US$ 100 milhões em créditos de uso para o modelo Mythos e US$ 4 milhões em doações para organizações de segurança de código aberto. O objetivo é permitir que essas empresas usem a IA para “reforçar” as defesas antes que os hackers possam usar tecnologia semelhante para atacá-las.

Indústria e reações políticas

A resposta do setor tecnológico tem sido de urgência cautelosa. Os líderes da AWS e da Cisco descreveram o modelo como uma “mudança radical” no raciocínio, observando que já está a descobrir formas de fortalecer até os sistemas mais bem testados.

No entanto, os especialistas observam que isto faz parte de uma tendência acelerada. Michal Salát, diretor de inteligência de ameaças da Norton, salienta que, embora a investigação de vulnerabilidades orientada pela IA tenha existido em ambientes controlados (como os desafios da DARPA), a chegada de modelos especializados e altamente capazes traz a ameaça para o mundo real numa escala sem precedentes.

Este desenvolvimento também está a chamar a atenção dos decisores políticos. O senador norte-americano Mark Warner elogiou a abordagem proativa, observando que, à medida que a IA acelera a descoberta de falhas, a indústria deve agir com a mesma rapidez para priorizar a correção e a proteção de infraestruturas críticas.

“Os perigos de errar são óbvios, mas se acertarmos, há uma oportunidade real de criar uma Internet fundamentalmente mais segura… do que a que tínhamos antes do advento das capacidades cibernéticas alimentadas pela IA.” — Dario Amodei, CEO da Anthropic

Conclusão

A decisão da Anthropic de ocultar Claude Mythos do público destaca um ponto de viragem crítico no desenvolvimento da IA: o momento em que as capacidades de um modelo se tornam um risco sistémico de segurança. Através do Projeto Glasswing, a empresa está tentando estabelecer um precedente para a “IA defensiva”, priorizando o fortalecimento da infraestrutura digital global em vez da liberação comercial imediata.