Amerikaanse overheid vs Anthropic: De onmogelijke eis voor onhackbare LLM's

Er is een groeiende kloof ontstaan tussen de Amerikaanse overheid en Anthropic na de release van het Fable 5-model, wat een debat heeft ontketend over AI-veiligheid en toezicht door regelgevers. Terwijl functionarissen het AI-lab ervan beschuldigen uitvoerende bevelen te omzeilen, komt er een diepere technische spanning naar boven: de eis van de overheid voor "onhackbare" frontier-modellen.

Het conflict over Fable 5 en cyberrichtlijnen

De spanning komt voort uit de beslissing van Anthropic om zijn nieuwste model, Fable 5, vrij te geven voordat een aangewezen overheidsinstantie — voorgeschreven door een recent cyber-executive order van de regering-Trump — volledig operationeel was. Hoewel het bevel vroeg om vrijwillig toezicht, beweren overheidsfunctionarissen dat Anthropic de geest van de richtlijn heeft genegeerd, wat heeft geleid tot beschuldigingen dat het bedrijf een "bad actor" is.

Lopende discussies met betrokkenheid van het Department of Commerce, de CIA en wetenschappelijk adviseur Michael Kratsios benadrukken een enorme communicatiekloof. Functionarissen hebben hun zorgen geuit dat Anthropic door is gegaan ondanks de wetenschap dat er een "jailbreak"-risico bestond — een tip die naar verluidt werd verstrekt door Amazon en andere partners uit de techsector. De wrijving lijkt echter evenzeer over de timing van regelgeving te gaan als over technische beveiliging.

De technische realiteit: Kunnen LLM's ooit onhackbaar zijn?

De kern van de kritiek van de overheid — dat Anthropic "de verkeerde afslag nam" door potentiële jailbreaks te negeren — negeert een fundamentele realiteit van de architectuur van Large Language Models (LLM's). In de AI-industrie is de consensus dat absolute beveiliging momenteel een onmogelijkheid is. Zelfs OpenAI heeft erkend dat kwetsbaarheden zoals prompt injection mogelijk nooit volledig worden opgelost.

Anthropic-CEO Dario Amodei heeft eerder opgemerkt dat hoewel een jailbreak in gevoelige gebieden zoals biologie of technologie "leven of dood" kan betekenen, de industrie nog steeds worstelt met de vraag hoe deze risico's te beperken. Door te eisen dat modellen in essentie onhackbaar zijn voordat ze internationaal worden gedistribueerd, stelt de Amerikaanse overheid mogelijk een precedent dat innovatie verstikt, aangezien geen enkel frontier-model (inclusief GPT-5.5 of Kimi 2.7) over een perfect beveiligingsschild beschikt.

Reacties vanuit de industrie en het debat over exportcontrole

Als reactie op de oplopende spanningen hebben meer dan 100 cybersecurity-experts en bestuurders — waaronder veteranen uit de sector zoals Alex Stamos en Rachel Tobac — een open brief gericht aan handelssecretaris Lutnick en National Cyber Director Cairncross. Ze pleiten voor het opheffen van de exportcontroles op de Fable- en Mythos-modellen van Anthropic.

De experts stellen dat hoewel Fable zeer bekwaam is in het identificeren van softwarefouten, het niet uniek gevaarlijk is in vergelijking met andere modellen zoals Opus of Sonnet. Cruciaal is hun waarschuwing dat strikte exportcontroles de westerse verdedigers feitelijk benadelen. Door de toegang tot Amerikaanse topmodellen te beperken, kan de overheid onbedoeld een voordeel geven aan Chinese open-weight modellen, die naar verluidt slechts maanden achterlopen op de leidende Amerikaanse frontier-modellen.

Kernpunten