Anthropic ripristina l'accesso a Claude Fable 5 dopo i negoziati con il governo
Dopo settimane di intensi negoziati con l'amministrazione Trump, Anthropic ha ufficialmente dato il via al ritorno del suo molto atteso modello Claude Fable 5. Questa mossa segue un periodo di rigidi controlli sulle esportazioni che ha messo ai margini uno dei modelli di IA rivolti al consumatore più significativi del settore.
Rimozione dei controlli sulle esportazioni e ripristino dell'accesso globale
Il Dipartimento del Commercio ha ufficialmente revocato le direttive di controllo sulle esportazioni che precedentemente limitavano l'accesso sia a Claude Fable 5 che alla sua tecnologia sottostante, Mythos 5. Questi controlli avevano creato un enorme ostacolo operativo, impedendo ai cittadini stranieri — inclusi molti dipendenti internazionali di Anthropic e membri non statunitensi di aziende clienti — di utilizzare i modelli.
Anthropic ha confermato che inizierà a ripristinare l'accesso a Fable 5 a livello globale sulle piattaforme Claude a partire da questo mercoledì. Sebbene non sia stata stabilita una cronologia specifica, l'azienda prevede di riabilitare il modello sulle principali infrastrutture cloud, tra cui AWS, Google Cloud e Microsoft Foundry, nel prossimo futuro.
Affrontare la vulnerabilità di "jailbreak"
L'intervento iniziale del governo è stato innescato dalle preoccupazioni riguardanti potenziali "jailbreak", in particolare a seguito di un rapporto dei ricercatori di Amazon che ha segnalato una vulnerabilità. In risposta, Anthropic ha implementato un'architettura di sicurezza più robusta.
L'azienda ha addestrato un classificatore di sicurezza migliorato, progettato per individuare e bloccare le tecniche specifiche identificate nel rapporto di Amazon, dichiarando un tasso di successo superiore al 99%. Per garantire che l'esperienza dell'utente rimanga fluida anche quando una richiesta viene bloccata, Anthropic ha integrato un meccanismo di fallback: se una richiesta a Fable 5 viene segnalata dal nuovo classificatore, verrà automaticamente reindirizzata al modello Opus 4.8.
Una nuova era di collaborazione tra governo e IA
Il ritorno di Fable 5 segnala un cambiamento fondamentale nel modo in cui i laboratori di IA di frontiera interagiscono con i regolatori federali. Anthropic ha delineato una strategia proattiva per lavorare a stretto contatto con l'amministrazione Trump, che include:
- Accesso governativo pre-rilascio: Consentire ai partner governativi di eseguire valutazioni indipendenti su modelli rilevanti per la sicurezza nazionale prima che raggiungano il pubblico.
- Condivisione rapida delle informazioni: Impegnarsi alla divulgazione immediata quando vengono identificati jailbreak significativi o modelli di uso improprio.
- Allocazione delle risorse: Istituire team dedicati e fornire una significativa allocazione di risorse di calcolo per supportare i test e la ricerca governativa.
Inoltre, Anthropic sta guidando uno sforzo a livello di settore attraverso il suo programma Project Glasswing — in collaborazione con Amazon, Microsoft e Google — per stabilire uno standard di sicurezza e valutazione volontario e condiviso. Questo quadro mira a categorizzare la gravità dei jailbreak in base al guadagno di capacità dell'attaccante, all'ampiezza del guadagno, alla facilità di armamento e alla scopribilità.
Perché questo è importante per l'industria dell'IA
Questo sviluppo rappresenta un momento di svolta per il panorama dell'IA, specialmente mentre aziende come OpenAI gestiscono rollout graduali simili per modelli come GPT-5. Man mano che il settore si sposta verso modelli più potenti con capacità avanzate di cybersecurity, la tensione tra innovazione rapida e sicurezza nazionale non farà che intensificarsi. La mossa di Anthropic di formalizzare i "test pre-rilascio" e gli "standard volontari" potrebbe benissimo diventare il modello di riferimento per il modo in cui i fornitori di modelli di frontiera mantengono la legittimità in un ambiente altamente regolamentato.
Punti chiave
- Ripristino globale: Claude Fable 5 tornerà sulle piattaforme Claude globali questo mercoledì, con l'accesso tramite i provider cloud (AWS, Google, Microsoft) in arrivo successivamente.
- Sicurezza potenziata: È stato implementato un nuovo classificatore di sicurezza, che blocca le tecniche di jailbreak identificate in oltre il 99% dei casi e reindirizza le query bloccate a Opus 4.8.
- Allineamento normativo: Anthropic si sta muovendo verso un modello collaborativo con il governo degli Stati Uniti, offrendo valutazioni pre-rilascio e una rapida condivisione delle informazioni sulle minacce alla sicurezza.
