Des experts en cybersécurité protestent contre l'interdiction américaine des modèles Fable et Mythos d'Anthropic

Une coalition de 76 vétérans de premier plan en cybersécurité tire la sonnette d'alarme contre une récente ordonnance de contrôle des exportations du gouvernement américain ciblant les modèles d'IA les plus avancés d'Anthropic. Le groupe soutient qu'en restreignant l'accès à ces outils, le gouvernement désarme par inadvertance les défenseurs du numérique alors que les adversaires continuent de progresser.

Le conflit : sécurité nationale contre capacité défensive

La tension a débuté lorsque le gouvernement américain a émis une ordonnance de contrôle des exportations sur les modèles Fable et Mythos d'Anthropic, invoquant des préoccupations de sécurité nationale non divulguées. En conformité avec cette ordonnance, Anthropic a suspendu l'accès mondial à ces modèles.

Le modèle Mythos a été conçu à l'origine avec des capacités de découverte de vulnérabilités si élevées qu'Anthropic en a initialement limité l'accès à un groupe restreint d'environ 150 organisations réparties dans 15 pays. La version destinée au public, Fable, devait inclure des garde-fous stricts pour empêcher toute utilisation abusive en biologie, en chimie et en cybersécurité. Cependant, l'intervention du gouvernement a effectivement interrompu le déploiement de ces outils puissants auprès de ceux-là mêmes qui sont chargés de sécuriser Internet.

La controverse du « jailbreak » et le rapport d'Amazon

Anthropic suggère que l'ordonnance de la Maison Blanche pourrait découler de préoccupations concernant le « jailbreak » — des méthodes utilisées pour contourner les garde-fous de sécurité. Cette inquiétude proviendrait d'un rapport de recherche non public rédigé par des chercheurs d'Amazon.

Le rapport suggérait que les utilisateurs pourraient contourner les restrictions de sécurité de Fable pour accéder aux capacités de niveau Mythos. Cependant, des experts en cybersécurité, dont Katie Moussouris (fondatrice de Luta Security), soutiennent qu'il s'agit d'une incompréhension fondamentale de l'utilité de l'IA. Moussouris affirme que le « jailbreak » décrit n'était en fait que le modèle remplissant sa fonction prévue : corriger du code open-source contenant des vulnérabilités connues.

Selon Moussouris, demander à une IA de corriger un bug, d'expliquer le correctif et d'écrire un test ne constitue pas une faille de sécurité ; c'est la « boucle de détection, correction et test » qui définit la sécurité défensive moderne. Tenter de bloquer ces comportements paralyserait fondamentalement la capacité du modèle à protéger les logiciels.

Signataires de haut niveau et implications pour l'industrie

La lettre ouverte est soutenue par des poids lourds de la communauté de la sécurité, notamment l'ancien responsable de la sécurité de Facebook Alex Stamos, le fondateur de Bugcrowd Casey Ellis et le célèbre cryptographe Jon Callas. Leur argument repose sur un déséquilibre critique : si l'accès aux LLM de pointe est refusé aux défenseurs alors que les adversaires utilisent des modèles sans restriction, la posture de sécurité mondiale s'en trouve affaiblie.

Les experts ont également souligné que la vulnérabilité perçue dans Fable n'est pas propre à Anthropic. La lettre suggère que des « vulnérabilités » similaires pourraient être reproduites sur le GPT-5.5 d'OpenAI, les modèles Claude Opus 4.8 et Sonnet d'Anthropic, et même sur des modèles internationaux comme Kimi 2.7.

Le groupe appelle à un processus réglementaire démocratique et fondé sur la science, qui s'appuie sur une recherche transparente plutôt que sur des interdictions larges et réactionnaires qui pourraient faire plus de mal que de bien.

Points clés