Amerikaanse overheid vs Anthropic: De onmogelijke eis voor onhackbare LLM's

📅4 hours ago⏱3 min read

In this article

Amerikaanse overheid vs Anthropic: De onmogelijke eis voor onhackbare LLM's

Er is een groeiende kloof ontstaan tussen de Amerikaanse overheid en Anthropic na de release van het Fable 5-model, wat een debat heeft ontketend over AI-veiligheid en toezicht door regelgevers. Terwijl functionarissen het AI-lab ervan beschuldigen uitvoerende bevelen te omzeilen, komt er een diepere technische spanning naar boven: de eis van de overheid voor "onhackbare" frontier-modellen.

Het conflict over Fable 5 en cyberrichtlijnen

De spanning komt voort uit de beslissing van Anthropic om zijn nieuwste model, Fable 5, vrij te geven voordat een aangewezen overheidsinstantie — voorgeschreven door een recent cyber-executive order van de regering-Trump — volledig operationeel was. Hoewel het bevel vroeg om vrijwillig toezicht, beweren overheidsfunctionarissen dat Anthropic de geest van de richtlijn heeft genegeerd, wat heeft geleid tot beschuldigingen dat het bedrijf een "bad actor" is.

Lopende discussies met betrokkenheid van het Department of Commerce, de CIA en wetenschappelijk adviseur Michael Kratsios benadrukken een enorme communicatiekloof. Functionarissen hebben hun zorgen geuit dat Anthropic door is gegaan ondanks de wetenschap dat er een "jailbreak"-risico bestond — een tip die naar verluidt werd verstrekt door Amazon en andere partners uit de techsector. De wrijving lijkt echter evenzeer over de timing van regelgeving te gaan als over technische beveiliging.

De technische realiteit: Kunnen LLM's ooit onhackbaar zijn?

De kern van de kritiek van de overheid — dat Anthropic "de verkeerde afslag nam" door potentiële jailbreaks te negeren — negeert een fundamentele realiteit van de architectuur van Large Language Models (LLM's). In de AI-industrie is de consensus dat absolute beveiliging momenteel een onmogelijkheid is. Zelfs OpenAI heeft erkend dat kwetsbaarheden zoals prompt injection mogelijk nooit volledig worden opgelost.

Anthropic-CEO Dario Amodei heeft eerder opgemerkt dat hoewel een jailbreak in gevoelige gebieden zoals biologie of technologie "leven of dood" kan betekenen, de industrie nog steeds worstelt met de vraag hoe deze risico's te beperken. Door te eisen dat modellen in essentie onhackbaar zijn voordat ze internationaal worden gedistribueerd, stelt de Amerikaanse overheid mogelijk een precedent dat innovatie verstikt, aangezien geen enkel frontier-model (inclusief GPT-5.5 of Kimi 2.7) over een perfect beveiligingsschild beschikt.

Reacties vanuit de industrie en het debat over exportcontrole

Als reactie op de oplopende spanningen hebben meer dan 100 cybersecurity-experts en bestuurders — waaronder veteranen uit de sector zoals Alex Stamos en Rachel Tobac — een open brief gericht aan handelssecretaris Lutnick en National Cyber Director Cairncross. Ze pleiten voor het opheffen van de exportcontroles op de Fable- en Mythos-modellen van Anthropic.

De experts stellen dat hoewel Fable zeer bekwaam is in het identificeren van softwarefouten, het niet uniek gevaarlijk is in vergelijking met andere modellen zoals Opus of Sonnet. Cruciaal is hun waarschuwing dat strikte exportcontroles de westerse verdedigers feitelijk benadelen. Door de toegang tot Amerikaanse topmodellen te beperken, kan de overheid onbedoeld een voordeel geven aan Chinese open-weight modellen, die naar verluidt slechts maanden achterlopen op de leidende Amerikaanse frontier-modellen.

Kernpunten

Regelgevende frictie: Anthropic ligt onder vuur vanwege de release van Fable 5 voordat de vrijwillige toezichthoudende instantie van de overheid was opgericht.
De beveiligingsparadox: De eisen van de overheid voor "onhackbare" AI botsen met de technische realiteit dat prompt injection en jailbreaking inherente risico's zijn in de huidige LLM-architecturen.
Geopolitieke risico's: Experts uit de sector waarschuwen dat agressieve exportcontroles op modellen zoals Fable de Amerikaanse cyberdefensie kunnen verzwakken, terwijl ze er niet in slagen de snelle vooruitgang van Chinese AI te stoppen.

Amerikaanse overheid vs Anthropic: De onmogelijke eis voor onhackbare LLM's

Amerikaanse overheid vs Anthropic: De onmogelijke eis voor onhackbare LLM's

Het conflict over Fable 5 en cyberrichtlijnen

De technische realiteit: Kunnen LLM's ooit onhackbaar zijn?

Reacties vanuit de industrie en het debat over exportcontrole

Kernpunten

Continue reading

De Amerikaanse overheid heeft een AI-model teruggeroepen

Cybersecurity-experts protesteren tegen Amerikaans verbod op de Fable- en Mythos-modellen van Anthropic

𝗖𝗹𝗮𝘂𝗱𝗲 𝗙𝗮𝗯𝗹𝗲 𝟱 𝗦𝗵𝘂𝘁𝗱𝗼𝘄𝗻: 𝗪𝗵𝗮𝘁 𝗗𝗲𝘃𝗲𝗹𝗼𝗽𝗲𝗿𝘀 𝗡𝗲𝗲𝗱 𝘁𝗼 𝗞𝗻𝗼𝘄

Big Tech’s High Stakes Gamble: Linking AI Preemption to Child Safety

Hoe de Anthropic-shutdown de wereldwijde drang naar soevereine AI aanwakkerde