Governo degli Stati Uniti vs Anthropic: L'impossibile richiesta di LLM inattaccabili
Un crescente attrito è emerso tra il governo degli Stati Uniti e Anthropic a seguito del rilascio del modello Fable 5, scatenando un dibattito sulla sicurezza dell'IA e sulla supervisione normativa. Mentre le autorità accusano il laboratorio di IA di aver aggirato gli ordini esecutivi, sta emergendo una tensione tecnica più profonda: la richiesta del governo di modelli "frontier" inattaccabili.
Il conflitto su Fable 5 e le direttive cyber
La tensione deriva dalla decisione di Anthropic di rilasciare il suo ultimo modello, Fable 5, prima che un organismo di controllo governativo designato — istituito da un recente ordine esecutivo sulla cyber-sicurezza dell'amministrazione Trump — fosse pienamente operativo. Sebbene l'ordine richiedesse una supervisione volontaria, i funzionari governativi sostengono che Anthropic abbia ignorato lo spirito della direttiva, portando ad accuse secondo cui l'azienda agirebbe come un "bad actor".
Le attuali discussioni che coinvolgono il Dipartimento del Commercio, la CIA e il consulente scientifico Michael Kratsios evidenziano un enorme divario comunicativo. Le autorità hanno espresso preoccupazione per il fatto che Anthropic abbia proceduto nonostante la consapevolezza dell'esistenza di un rischio di "jailbreak" — una segnalazione che, a quanto pare, è stata fornita da Amazon e altri partner del settore tecnologico. Tuttavia, l'attrito sembra riguardare tanto la tempistica normativa quanto la sicurezza tecnica.
La realtà tecnica: gli LLM potranno mai essere inattaccabili?
Il fulcro della critica del governo — ovvero che Anthropic abbia "preso la strada sbagliata" ignorando i potenziali jailbreak — ignora una realtà fondamentale dell'architettura dei Large Language Model (LLM). Nel settore dell'IA, il consenso è che la sicurezza assoluta sia attualmente un'impossibilità. Persino OpenAI ha ammesso che vulnerabilità come il prompt injection potrebbero non essere mai completamente risolte.
L'amministratore delegato di Anthropic, Dario Amodei, ha osservato in precedenza che, sebbene un jailbreak in settori sensibili come la biologia o la tecnologia possa rappresentare una questione di "vita o di morte", il settore sta ancora cercando il modo di mitigare tali rischi. Richiedendo che i modelli siano essenzialmente inattaccabili prima della distribuzione internazionale, il governo degli Stati Uniti potrebbe stabilire un precedente che soffoca l'innovazione, poiché nessun modello frontier (inclusi GPT-5.5 o Kimi 2.7) possiede uno scudo di sicurezza perfetto.
Reazione negativa del settore e dibattito sul controllo delle esportazioni
In risposta alla crescente tensione, oltre 100 esperti e dirigenti di cybersicurezza — tra cui veterani del settore come Alex Stamos e Rachel Tobac — hanno pubblicato una lettera aperta al Segretario al Commercio Lutnick e al Direttore Nazionale per la Cyber Security Cairncross. Chiedono l'eliminazione dei controlli sulle esportazioni per i modelli Fable e Mythos di Anthropic.
Gli esperti sostengono che, sebbene Fable sia altamente capace di identificare falle software, non sia unicamente pericoloso rispetto ad altri modelli come Opus o Sonnet. Fondamentalmente, avvertono che i rigidi controlli sulle esportazioni stanno in realtà penalizzando i difensori occidentali. Limitando l'accesso ai modelli statunitensi di alto livello, il governo potrebbe involontariamente favorire i modelli cinesi a pesi aperti, che secondo quanto riportato distano solo pochi mesi dai principali modelli di frontiera americani.
Punti chiave
- Attrito normativo: Anthropic è sotto accusa per aver rilasciato Fable 5 prima dell'istituzione del centro di supervisione volontaria del governo.
- Il paradosso della sicurezza: Le richieste governative di un'IA "non hackerabile" contrastano con la realtà tecnica secondo cui il prompt injection e il jailbreaking sono rischi inerenti alle attuali architetture LLM.
- Rischi geopolitici: Gli esperti del settore avvertono che controlli aggressivi sulle esportazioni di modelli come Fable potrebbero indebolire la difesa cibernetica degli Stati Uniti, senza però riuscire a fermare il rapido progresso dell'IA cinese.