Especialistas em Cibersegurança Protestam contra a Proibição dos EUA aos Modelos Fable e Mythos da Anthropic

Uma coalizão de 76 veteranos líderes em cibersegurança está dando o alerta contra uma recente ordem de controle de exportação do governo dos EUA que visa os modelos de IA mais avançados da Anthropic. O grupo argumenta que, ao restringir o acesso a essas ferramentas, o governo está, inadvertidamente, desarmando os defensores digitais enquanto os adversários continuam a avançar.

O Conflito: Segurança Nacional vs. Capacidade Defensiva

A tensão começou quando o governo dos EUA emitiu uma ordem de controle de exportação sobre os modelos Fable e Mythos da Anthropic, citando preocupações de segurança nacional não divulgadas. Em conformidade com a ordem, a Anthropic suspendeu o acesso mundial a esses modelos.

O modelo Mythos foi originalmente projetado com capacidades de alto nível para descoberta de vulnerabilidades, de tal forma que a Anthropic inicialmente limitou o acesso a um grupo selecionado de aproximadamente 150 organizações em 15 países. A versão voltada para o público, Fable, deveria incluir proteções rigorosas para evitar o uso indevido em biologia, química e cibersegurança. No entanto, a intervenção do governo interrompeu efetivamente a implementação dessas ferramentas poderosas para as próprias pessoas encarregadas de proteger a internet.

A Controvérsia do "Jailbreak" e o Artigo da Amazon

A Anthropic sugere que a ordem da Casa Branca pode derivar de preocupações relacionadas ao "jailbreaking" — métodos usados para contornar as proteções de segurança. Essa preocupação supostamente se origina de um artigo de pesquisa não público de pesquisadores da Amazon.

O artigo sugeria que os usuários poderiam contornar as restrições de segurança do Fable para acessar capacidades de nível Mythos. No entanto, especialistas em cibersegurança, incluindo Katie Moussouris (fundadora da Luta Security), argumentam que isso é um mal-entendido fundamental sobre a utilidade da IA. Moussouris sustenta que o "jailbreak" descrito foi simplesmente o modelo executando sua função pretendida: corrigir código de código aberto que contém vulnerabilidades conhecidas.

De acordo com Moussouris, pedir a uma IA para corrigir um bug, explicar o patch e escrever um teste não é uma violação de segurança; é o "ciclo de encontrar, corrigir e testar" que define a segurança defensiva moderna. Tentar bloquear esses comportamentos prejudicaria fundamentalmente a capacidade do modelo de proteger softwares.

Signatários de Alto Nível e Implicações para o Setor

A carta aberta é apoiada por pesos pesados da comunidade de segurança, incluindo o ex-chefe de segurança do Facebook Alex Stamos, o fundador da Bugcrowd Casey Ellis e o famoso criptógrafo Jon Callas. O argumento deles centra-se em um desequilíbrio crítico: se os defensores forem impedidos de acessar LLMs de última geração enquanto os adversários utilizam modelos sem restrições, a postura de segurança global enfraquece.

Os especialistas também apontaram que a vulnerabilidade percebida no Fable não é exclusiva da Anthropic. A carta sugere que "vulnerabilidades" semelhantes poderiam ser replicadas no GPT-5.5 da OpenAI, nos modelos Claude Opus 4.8 e Sonnet da própria Anthropic e até em modelos internacionais como o Kimi 2.7.

O grupo está pedindo um processo regulatório democrático e baseado na ciência, que se baseie em pesquisas transparentes em vez de proibições amplas e reacionárias que podem fazer mais mal do que bem.

Principais Conclusões