US Government vs Anthropic: The Impossible Demand for Unhackable LLMs
A growing rift has emerged between the U.S. government and Anthropic following the release of the Fable 5 model, sparking a debate over AI safety and regulatory oversight. As officials accuse the AI lab of bypassing executive orders, a deeper technical tension is surfacing: the government’s demand for "unhackable" frontier models.
The Conflict Over Fable 5 and Cyber Directives
The tension stems from Anthropic’s decision to release its latest model, Fable 5, before a designated government clearinghouse—mandated by a recent Trump administration cyber executive order—was fully operational. While the order called for voluntary oversight, government officials claim Anthropic ignored the spirit of the directive, leading to accusations that the company is a "bad actor."
Current discussions involving the Department of Commerce, the CIA, and science advisor Michael Kratsios highlight a massive communication gap. Officials have expressed concern that Anthropic proceeded despite knowing a "jailbreak" risk existed—a tip reportedly provided by Amazon and other tech industry partners. However, the friction appears to be as much about regulatory timing as it is about technical security.
The Technical Reality: Can LLMs Ever Be Unhackable?
The crux of the government's criticism—that Anthropic "took the wrong fork" by ignoring potential jailbreaks—ignores a fundamental reality of Large Language Model (LLM) architecture. In the AI industry, the consensus is that absolute security is currently an impossibility. Even OpenAI has acknowledged that vulnerabilities like prompt injection may never be fully solved.
Anthropic CEO Dario Amodei has previously noted that while a jailbreak in sensitive fields like biology or tech could be "life or death," the industry is still grappling with how to mitigate these risks. By demanding models be essentially unhackable before international shipping, the U.S. government may be setting a precedent that stifles innovation, as no frontier model (including GPT-5.5 or Kimi 2.7) possesses a perfect security shield.
Industry Backlash and the Export Control Debate
بڑھتی ہوئی کشیدگی کے جواب میں، 100 سے زائد سائبر سیکیورٹی ماہرین اور ایگزیکٹوز—جن میں الیکس اسٹیموس اور ریچل ٹوبیک جیسے صنعت کے تجربہ کار افراد شامل ہیں—نے ٹریڈ سیکرٹری لٹنک اور نیشنل سائبر ڈائریکٹر کیرن کراس کے نام ایک کھلا خط جاری کیا ہے۔ وہ Anthropic کے Fable اور Mythos ماڈلز پر برآمدی کنٹرول (export controls) ختم کرنے کا مطالبہ کر رہے ہیں۔
ماہرین کا استدلال ہے کہ اگرچہ Fable سافٹ ویئر کی خامیوں کی نشاندہی کرنے کی اعلیٰ صلاحیت رکھتا ہے، لیکن یہ Opus یا Sonnet جیسے دیگر ماڈلز کے مقابلے میں منفرد طور پر خطرناک نہیں ہے۔ اہم بات یہ ہے کہ وہ خبردار کرتے ہیں کہ سخت برآمدی کنٹرول درحقیقت مغربی دفاع کرنے والوں کو کمزور کر رہے ہیں۔ اعلیٰ درجے کے امریکی ماڈلز تک رسائی کو محدود کر کے، حکومت نادانستہ طور پر چینی اوپن ویٹ (open-weight) ماڈلز کو فائدہ پہنچا سکتی ہے، جو مبینہ طور پر صف اول کے امریکی فرنٹیر ماڈلز سے صرف چند ماہ پیچھے ہیں۔
اہم نکات
- ریگولیٹری رگڑ (Regulatory Friction): Anthropic کو حکومت کا رضاکارانہ نگرانی کرنے والا کلیئر ہاؤس قائم ہونے سے پہلے Fable 5 جاری کرنے پر تنقید کا سامنا ہے۔
- سیکیورٹی کا تضاد (The Security Paradox): "ناقابلِ ہیک" (unhackable) AI کے لیے حکومتی مطالبات اس تکنیکی حقیقت سے ٹکراتے ہیں کہ پرامپٹ انجیکشن (prompt injection) اور جیل بریکنگ (jailbreaking) موجودہ LLM آرکیٹیکچر میں فطری خطرات ہیں۔
- جیو پولیٹیکل خطرات (Geopolitical Risks): صنعت کے ماہرین خبردار کرتے ہیں کہ Fable جیسے ماڈلز پر جارحانہ برآمدی کنٹرول امریکی سائبر دفاع کو کمزور کر سکتا ہے جبکہ چینی AI کی تیز رفتار ترقی کو روکنے میں ناکام ہو سکتا ہے۔