Expertos en ciberseguridad protestan contra la prohibición de EE. UU. a los modelos Fable y Mythos de Anthropic

Una coalición de 76 destacados veteranos de la ciberseguridad está dando la voz de alarma contra una reciente orden de control de exportaciones del gobierno de EE. UU. dirigida a los modelos de IA más avanzados de Anthropic. El grupo sostiene que, al restringir el acceso a estas herramientas, el gobierno está desarmando inadvertidamente a los defensores digitales mientras los adversarios continúan avanzando.

El conflicto: Seguridad nacional frente a capacidad defensiva

La tensión comenzó cuando el gobierno de EE. UU. emitió una orden de control de exportaciones sobre los modelos Fable y Mythos de Anthropic, citando preocupaciones de seguridad nacional no reveladas. En cumplimiento de la orden, Anthropic ha suspendido el acceso mundial a estos modelos.

El modelo Mythos fue diseñado originalmente con capacidades de tan alto nivel para el descubrimiento de vulnerabilidades que Anthropic limitó inicialmente el acceso a un grupo selecto de aproximadamente 150 organizaciones en 15 países. La versión orientada al público, Fable, estaba destinada a incluir estrictas salvaguardas para evitar el uso indebido en biología, química y ciberseguridad. Sin embargo, la intervención del gobierno ha detenido efectivamente el despliegue de estas potentes herramientas para las mismas personas encargadas de asegurar internet.

La controversia del "jailbreak" y el documento de Amazon

Anthropic sugiere que la orden de la Casa Blanca puede derivarse de preocupaciones relacionadas con el "jailbreaking" —métodos utilizados para eludir las salvaguardas de seguridad—. Según se informa, esta preocupación se origina en un documento de investigación no público de investigadores de Amazon.

El documento sugería que los usuarios podrían eludir las restricciones de seguridad de Fable para acceder a capacidades de nivel Mythos. Sin embargo, expertos en ciberseguridad, incluida Katie Moussouris (fundadora de Luta Security), argumentan que esto es un malentendido fundamental de la utilidad de la IA. Moussouris sostiene que el "jailbreak" descrito era simplemente el modelo realizando su función prevista: corregir código de código abierto que contiene vulnerabilidades conocidas.

Según Moussouris, pedirle a una IA que corrija un error, explique el parche y escriba una prueba no es una brecha de seguridad; es el "ciclo de encontrar, corregir y probar" que define la seguridad defensiva moderna. Intentar bloquear estos comportamientos paralizaría fundamentalmente la capacidad del modelo para proteger el software.

Firmantes de alto nivel e implicaciones para la industria

La carta abierta cuenta con el respaldo de pesos pesados de la comunidad de seguridad, incluidos el exjefe de seguridad de Facebook, Alex Stamos, el fundador de Bugcrowd, Casey Ellis, y el famoso criptógrafo Jon Callas. Su argumento se centra en un desequilibrio crítico: si se les niega el acceso a los LLM de vanguardia a los defensores mientras los adversarios utilizan modelos sin restricciones, la postura de seguridad global se debilita.

Los expertos también señalaron que la vulnerabilidad percibida en Fable no es exclusiva de Anthropic. La carta sugiere que "vulnerabilidades" similares podrían replicarse en GPT-5.5 de OpenAI, los modelos Claude Opus 4.8 y Sonnet de la propia Anthropic, e incluso en modelos internacionales como Kimi 2.7.

El grupo hace un llamado a un proceso regulatorio democrático y basado en la ciencia que se apoye en investigaciones transparentes en lugar de prohibiciones amplias y reactivas que podrían hacer más daño que bien.

Conclusiones clave