Gli esperti di cybersicurezza protestano contro il divieto statunitense sui modelli Fable e Mythos di Anthropic

Una coalizione di 76 esperti di spicco nel campo della cybersicurezza sta lanciando l'allarme contro un recente ordine di controllo delle esportazioni del governo degli Stati Uniti che mira ai modelli di IA più avanzati di Anthropic. Il gruppo sostiene che, limitando l'accesso a questi strumenti, il governo stia involontariamente disarmando i difensori digitali mentre gli avversari continuano ad avanzare.

Il conflitto: Sicurezza nazionale contro capacità difensive

La tensione è iniziata quando il governo degli Stati Uniti ha emesso un ordine di controllo delle esportazioni sui modelli Fable e Mythos di Anthropic, citando preoccupazioni per la sicurezza nazionale non divulgate. In conformità con l'ordine, Anthropic ha sospeso l'accesso mondiale a questi modelli.

Il modello Mythos era stato originariamente progettato con capacità di rilevamento delle vulnerabilità così elevate che Anthropic ne ha inizialmente limitato l'accesso a un gruppo selezionato di circa 150 organizzazioni in 15 paesi. La versione destinata al pubblico, Fable, doveva includere rigide misure di sicurezza (guardrails) per prevenire utilizzi impropri in biologia, chimica e cybersicurezza. Tuttavia, l'intervento del governo ha di fatto bloccato l'impiego di questi potenti strumenti proprio per le persone incaricate di proteggere Internet.

La controversia sul "jailbreak" e il paper di Amazon

Anthropic suggerisce che l'ordine della Casa Bianca possa derivare da preoccupazioni riguardanti il "jailbreaking" — metodi utilizzati per aggirare le misure di sicurezza. Questa preoccupazione deriverebbe da un paper di ricerca non pubblico redatto da ricercatori di Amazon.

Il paper suggeriva che gli utenti potessero aggirare le restrizioni di sicurezza di Fable per accedere alle capacità di livello Mythos. Tuttavia, gli esperti di cybersicurezza, tra cui Katie Moussouris (fondatrice di Luta Security), sostengono che si tratti di un malinteso fondamentale sull'utilità dell'IA. Moussouris afferma che il "jailbreak" descritto era semplicemente il modello che svolgeva la sua funzione prevista: correggere codice open-source contenente vulnerabilità note.

Secondo Moussouris, chiedere a un'IA di correggere un bug, spiegare la patch e scrivere un test non costituisce una violazione della sicurezza; è il "ciclo di ricerca, correzione e test" (find, fix, and test loop) che definisce la moderna sicurezza difensiva. Tentare di bloccare questi comportamenti comprometterebbe fondamentalmente la capacità del modello di proteggere il software.

Firmatari di alto profilo e implicazioni per il settore

La lettera aperta è sostenuta da pesi massimi della comunità della sicurezza, tra cui l'ex responsabile della sicurezza di Facebook Alex Stamos, il fondatore di Bugcrowd Casey Ellis e il celebre crittografo Jon Callas. La loro argomentazione si concentra su un disequilibrio critico: se ai difensori viene negato l'accesso a LLM all'avanguardia mentre gli avversari utilizzano modelli senza restrizioni, la postura di sicurezza globale si indebolisce.

Gli esperti hanno inoltre sottolineato che la vulnerabilità percepita in Fable non è un caso esclusivo di Anthropic. La lettera suggerisce che "vulnerabilità" simili potrebbero essere replicate su GPT-5.5 di OpenAI, sui modelli Claude Opus 4.8 e Sonnet di Anthropic, e persino su modelli internazionali come Kimi 2.7.

Il gruppo chiede un processo normativo democratico e basato sulla scienza, che si affidi a una ricerca trasparente piuttosto che a divieti ampi e reattivi che potrebbero fare più danni che altro.

Punti chiave