El Gobierno de EE. UU. frente a Anthropic: La demanda imposible de LLMs inhackeables

Ha surgido una creciente brecha entre el gobierno de los EE. UU. y Anthropic tras el lanzamiento del modelo Fable 5, lo que ha desencadenado un debate sobre la seguridad de la IA y la supervisión regulatoria. Mientras los funcionarios acusan al laboratorio de IA de eludir órdenes ejecutivas, está surgiendo una tensión técnica más profunda: la exigencia del gobierno de contar con modelos de frontera "inhackeables".

El conflicto sobre Fable 5 y las directivas cibernéticas

La tensión surge de la decisión de Anthropic de lanzar su modelo más reciente, Fable 5, antes de que una entidad de control gubernamental designada —mandatada por una reciente orden ejecutiva cibernética de la administración Trump— estuviera plenamente operativa. Aunque la orden pedía una supervisión voluntaria, los funcionarios del gobierno afirman que Anthropic ignoró el espíritu de la directiva, lo que ha dado lugar a acusaciones de que la empresa es un "actor malintencionado".

Las discusiones actuales que involucran al Departamento de Comercio, la CIA y al asesor científico Michael Kratsios resaltan una brecha de comunicación masiva. Los funcionarios han expresado su preocupación de que Anthropic procediera a pesar de saber que existía un riesgo de "jailbreak", un aviso que, según se informa, fue proporcionado por Amazon y otros socios de la industria tecnológica. Sin embargo, la fricción parece deberse tanto al cronograma regulatorio como a la seguridad técnica.

La realidad técnica: ¿Pueden los LLM ser alguna vez inhackeables?

El núcleo de la crítica del gobierno —que Anthropic "tomó el camino equivocado" al ignorar posibles jailbreaks— ignora una realidad fundamental de la arquitectura de los modelos de lenguaje extensos (LLM). En la industria de la IA, el consenso es que la seguridad absoluta es actualmente una imposibilidad. Incluso OpenAI ha reconocido que vulnerabilidades como la inyección de prompts (prompt injection) podrían no resolverse nunca por completo.

El CEO de Anthropic, Dario Amodei, ha señalado anteriormente que, si bien un jailbreak en campos sensibles como la biología o la tecnología podría ser una cuestión de "vida o muerte", la industria todavía está lidiando con la forma de mitigar estos riesgos. Al exigir que los modelos sean esencialmente inhackeables antes de su distribución internacional, el gobierno de los EE. UU. podría estar sentando un precedente que sofoque la innovación, ya que ningún modelo de frontera (incluidos GPT-5.5 o Kimi 2.7) posee un escudo de seguridad perfecto.

Reacción de la industria y el debate sobre el control de exportaciones

En respuesta a la creciente tensión, más de 100 expertos y ejecutivos de ciberseguridad —incluidos veteranos de la industria como Alex Stamos y Rachel Tobac— han emitido una carta abierta al Secretario de Comercio Lutnick y al Director Nacional de Ciberseguridad Cairncross. Hacen un llamado para que se levanten los controles de exportación sobre los modelos Fable y Mythos de Anthropic.

Los expertos argumentan que, si bien Fable es altamente capaz de identificar fallos de software, no es excepcionalmente peligroso en comparación con otros modelos como Opus o Sonnet. De manera crucial, advierten que los estrictos controles de exportación están, de hecho, perjudicando a los defensores occidentales. Al restringir el acceso a los modelos de primer nivel de EE. UU., el gobierno podría, inadvertidamente, otorgar una ventaja a los modelos chinos de pesos abiertos, los cuales, según se informa, se encuentran a solo meses de distancia de los principales modelos de frontera estadounidenses.

Conclusiones clave