Gobierno de EE. UU. vs. Anthropic: La demanda imposible de LLMs inhackeables

📅4 hours ago⏱3 min read

In this article

El Gobierno de EE. UU. frente a Anthropic: La demanda imposible de LLMs inhackeables

Ha surgido una creciente brecha entre el gobierno de los EE. UU. y Anthropic tras el lanzamiento del modelo Fable 5, lo que ha desencadenado un debate sobre la seguridad de la IA y la supervisión regulatoria. Mientras los funcionarios acusan al laboratorio de IA de eludir órdenes ejecutivas, está surgiendo una tensión técnica más profunda: la exigencia del gobierno de contar con modelos de frontera "inhackeables".

El conflicto sobre Fable 5 y las directivas cibernéticas

La tensión surge de la decisión de Anthropic de lanzar su modelo más reciente, Fable 5, antes de que una entidad de control gubernamental designada —mandatada por una reciente orden ejecutiva cibernética de la administración Trump— estuviera plenamente operativa. Aunque la orden pedía una supervisión voluntaria, los funcionarios del gobierno afirman que Anthropic ignoró el espíritu de la directiva, lo que ha dado lugar a acusaciones de que la empresa es un "actor malintencionado".

Las discusiones actuales que involucran al Departamento de Comercio, la CIA y al asesor científico Michael Kratsios resaltan una brecha de comunicación masiva. Los funcionarios han expresado su preocupación de que Anthropic procediera a pesar de saber que existía un riesgo de "jailbreak", un aviso que, según se informa, fue proporcionado por Amazon y otros socios de la industria tecnológica. Sin embargo, la fricción parece deberse tanto al cronograma regulatorio como a la seguridad técnica.

La realidad técnica: ¿Pueden los LLM ser alguna vez inhackeables?

El núcleo de la crítica del gobierno —que Anthropic "tomó el camino equivocado" al ignorar posibles jailbreaks— ignora una realidad fundamental de la arquitectura de los modelos de lenguaje extensos (LLM). En la industria de la IA, el consenso es que la seguridad absoluta es actualmente una imposibilidad. Incluso OpenAI ha reconocido que vulnerabilidades como la inyección de prompts (prompt injection) podrían no resolverse nunca por completo.

El CEO de Anthropic, Dario Amodei, ha señalado anteriormente que, si bien un jailbreak en campos sensibles como la biología o la tecnología podría ser una cuestión de "vida o muerte", la industria todavía está lidiando con la forma de mitigar estos riesgos. Al exigir que los modelos sean esencialmente inhackeables antes de su distribución internacional, el gobierno de los EE. UU. podría estar sentando un precedente que sofoque la innovación, ya que ningún modelo de frontera (incluidos GPT-5.5 o Kimi 2.7) posee un escudo de seguridad perfecto.

Reacción de la industria y el debate sobre el control de exportaciones

En respuesta a la creciente tensión, más de 100 expertos y ejecutivos de ciberseguridad —incluidos veteranos de la industria como Alex Stamos y Rachel Tobac— han emitido una carta abierta al Secretario de Comercio Lutnick y al Director Nacional de Ciberseguridad Cairncross. Hacen un llamado para que se levanten los controles de exportación sobre los modelos Fable y Mythos de Anthropic.

Los expertos argumentan que, si bien Fable es altamente capaz de identificar fallos de software, no es excepcionalmente peligroso en comparación con otros modelos como Opus o Sonnet. De manera crucial, advierten que los estrictos controles de exportación están, de hecho, perjudicando a los defensores occidentales. Al restringir el acceso a los modelos de primer nivel de EE. UU., el gobierno podría, inadvertidamente, otorgar una ventaja a los modelos chinos de pesos abiertos, los cuales, según se informa, se encuentran a solo meses de distancia de los principales modelos de frontera estadounidenses.

Conclusiones clave

Fricción regulatoria: Anthropic está bajo fuego por lanzar Fable 5 antes de que se estableciera la entidad de supervisión voluntaria del gobierno.
La paradoja de la seguridad: Las exigencias gubernamentales de una IA "inhackeable" chocan con la realidad técnica de que la inyección de prompts (prompt injection) y el jailbreaking son riesgos inherentes en las arquitecturas actuales de los LLM.
Riesgos geopolíticos: Los expertos de la industria advierten que los controles de exportación agresivos sobre modelos como Fable podrían debilitar la ciberdefensa de EE. UU. sin lograr detener el rápido avance de la IA china.

Gobierno de EE. UU. vs. Anthropic: La demanda imposible de LLMs inhackeables

El Gobierno de EE. UU. frente a Anthropic: La demanda imposible de LLMs inhackeables

El conflicto sobre Fable 5 y las directivas cibernéticas

La realidad técnica: ¿Pueden los LLM ser alguna vez inhackeables?

Reacción de la industria y el debate sobre el control de exportaciones

Conclusiones clave

Continue reading

𝗧𝗵𝗲 𝗨𝗦 𝗚𝗼𝘃𝗲𝗿𝗻𝗺𝗲𝗻𝘁 𝗥𝗲𝗰𝗮𝗹𝗹𝗲𝗱 𝗔𝗻 𝗔𝗜 𝗠𝗼𝗱𝗲𝗹

Expertos en ciberseguridad protestan contra la prohibición de EE. UU. de los modelos Fable y Mythos de Anthropic

𝗖𝗹𝗮𝘂𝗱𝗲 𝗙𝗮𝗯𝗹𝗲 𝟱 𝗦𝗵𝘂𝘁𝗱𝗼𝘄𝗻: 𝗪𝗵𝗮𝘁 𝗗𝗲𝘃𝗲𝗹𝗼𝗽𝗲𝗿𝘀 𝗡𝗲𝗲𝗱 𝘁𝗼 𝗞𝗻𝗼𝘄

La apuesta de alto riesgo de las grandes tecnológicas: vinculando la regulación preventiva de la IA con la seguridad infantil

Cómo el cierre de Anthropic impulsó la búsqueda global de una IA soberana