Expertos en ciberseguridad protestan contra la prohibición de EE. UU. a los modelos Fable y Mythos de Anthropic
Una coalición de 76 destacados veteranos de la ciberseguridad está dando la voz de alarma contra una reciente orden de control de exportaciones del gobierno de EE. UU. dirigida a los modelos de IA más avanzados de Anthropic. El grupo sostiene que, al restringir el acceso a estas herramientas, el gobierno está desarmando inadvertidamente a los defensores digitales mientras los adversarios continúan avanzando.
El conflicto: Seguridad nacional frente a capacidad defensiva
La tensión comenzó cuando el gobierno de EE. UU. emitió una orden de control de exportaciones sobre los modelos Fable y Mythos de Anthropic, citando preocupaciones de seguridad nacional no reveladas. En cumplimiento de la orden, Anthropic ha suspendido el acceso mundial a estos modelos.
El modelo Mythos fue diseñado originalmente con capacidades de tan alto nivel para el descubrimiento de vulnerabilidades que Anthropic limitó inicialmente el acceso a un grupo selecto de aproximadamente 150 organizaciones en 15 países. La versión orientada al público, Fable, estaba destinada a incluir estrictas salvaguardas para evitar el uso indebido en biología, química y ciberseguridad. Sin embargo, la intervención del gobierno ha detenido efectivamente el despliegue de estas potentes herramientas para las mismas personas encargadas de asegurar internet.
La controversia del "jailbreak" y el documento de Amazon
Anthropic sugiere que la orden de la Casa Blanca puede derivarse de preocupaciones relacionadas con el "jailbreaking" —métodos utilizados para eludir las salvaguardas de seguridad—. Según se informa, esta preocupación se origina en un documento de investigación no público de investigadores de Amazon.
El documento sugería que los usuarios podrían eludir las restricciones de seguridad de Fable para acceder a capacidades de nivel Mythos. Sin embargo, expertos en ciberseguridad, incluida Katie Moussouris (fundadora de Luta Security), argumentan que esto es un malentendido fundamental de la utilidad de la IA. Moussouris sostiene que el "jailbreak" descrito era simplemente el modelo realizando su función prevista: corregir código de código abierto que contiene vulnerabilidades conocidas.
Según Moussouris, pedirle a una IA que corrija un error, explique el parche y escriba una prueba no es una brecha de seguridad; es el "ciclo de encontrar, corregir y probar" que define la seguridad defensiva moderna. Intentar bloquear estos comportamientos paralizaría fundamentalmente la capacidad del modelo para proteger el software.
Firmantes de alto nivel e implicaciones para la industria
La carta abierta cuenta con el respaldo de pesos pesados de la comunidad de seguridad, incluidos el exjefe de seguridad de Facebook, Alex Stamos, el fundador de Bugcrowd, Casey Ellis, y el famoso criptógrafo Jon Callas. Su argumento se centra en un desequilibrio crítico: si se les niega el acceso a los LLM de vanguardia a los defensores mientras los adversarios utilizan modelos sin restricciones, la postura de seguridad global se debilita.
Los expertos también señalaron que la vulnerabilidad percibida en Fable no es exclusiva de Anthropic. La carta sugiere que "vulnerabilidades" similares podrían replicarse en GPT-5.5 de OpenAI, los modelos Claude Opus 4.8 y Sonnet de la propia Anthropic, e incluso en modelos internacionales como Kimi 2.7.
El grupo hace un llamado a un proceso regulatorio democrático y basado en la ciencia que se apoye en investigaciones transparentes en lugar de prohibiciones amplias y reactivas que podrían hacer más daño que bien.
Conclusiones clave
- Desarme defensivo: Los expertos en ciberseguridad advierten que prohibir los modelos Fable y Mythos de Anthropic priva a los defensores de las herramientas esenciales necesarias para encontrar y corregir vulnerabilidades de software.
- Funcionalidad frente a seguridad: Los críticos argumentan que las preocupaciones sobre el "jailbreaking" planteadas por los investigadores confunden las tareas legítimas de codificación defensiva con exploits maliciosos.
- Llamado a la transparencia: Los líderes de la industria exigen un proceso de creación de normas científico y democrático para los controles de exportación de IA, con el fin de garantizar que las regulaciones sean específicas y efectivas.