Anthropic herstelt toegang tot Claude Fable 5 na onderhandelingen met de overheid

Na weken van intensieve onderhandelingen met de regering-Trump heeft Anthropic officieel groen licht gegeven voor de terugkeer van het zeer verwachte Claude Fable 5-model. Deze stap volgt op een periode van strikte exportcontroles die een van de meest belangrijke consumentgerichte AI-modellen van de sector opzij had gezet.

Opheffen van exportcontroles en herstel van wereldwijde toegang

Het Department of Commerce heeft officieel de exportcontrole-richtlijnen opgeheven die voorheen de toegang tot zowel Claude Fable 5 als de onderliggende technologie, Mythos 5, beperkten. Deze controles hadden een enorme operationele hindernis gecreëerd, waardoor buitenlandse staatsburgers — waaronder veel van de eigen internationale werknemers van Anthropic en niet-Amerikaanse leden van zakelijke klanten — het gebruik van de modellen verboden was.

Anthropic heeft bevestigd dat het aanstaande woensdag zal beginnen met het wereldwijd herstellen van de toegang tot Fable 5 op de Claude-platforms. Hoewel er nog geen specifieke tijdlijn is vastgesteld, is het bedrijf van plan om het model binnenkort opnieuw beschikbaar te stellen op grote cloudinfrastructuur, waaronder AWS, Google Cloud en Microsoft Foundry.

Aanpak van de jailbreak-kwetsbaarheid

De initiële interventie van de overheid werd getriggerd door zorgen over mogelijke "jailbreaks", specifiek naar aanleiding van een rapport van Amazon-onderzoekers waarin een kwetsbaarheid werd gemeld. Als reactie hierop heeft Anthropic een robuustere veiligheidsarchitectuur geïmplementeerd.

Het bedrijf heeft een verbeterde safety classifier getraind die is ontworpen om de specifieke technieken die in het Amazon-rapport werden geïdentificeerd te targeten en te blokkeren, met een geclaimde succesratio van meer dan 99%. Om ervoor te zorgen dat de gebruikerservaring naadloos blijft, zelfs wanneer een verzoek wordt geblokkeerd, heeft Anthropic een fallback-mechanisme geïntegreerd: als een verzoek aan Fable 5 wordt gemarkeerd door de nieuwe classifier, wordt het automatisch omgeleid naar het Opus 4.8-model.

Een nieuw tijdperk van samenwerking tussen overheid en AI

De terugkeer van Fable 5 signaleert een fundamentele verschuiving in de manier waarop frontier AI-labs omgaan met federale toezichthouders. Anthropic heeft een proactieve strategie geschetst om nauw samen te werken met de regering-Trump, die het volgende omvat:

  • Overheidstoegang vóór release: Het toestaan van overheidspartners om onafhankelijke evaluaties uit te voeren op modellen die relevant zijn voor de nationale veiligheid voordat ze publiek worden gemaakt.
  • Snelle informatie-uitwisseling: De toezegging om onmiddellijk openheid te geven wanneer er significante jailbreaks of patronen van misbruik worden geïdentificeerd.
  • Toewijzing van middelen: Het opzetten van toegewijde teams en het verstrekken van aanzienlijke rekenkracht (compute allocation) om overheids-testen en onderzoek te ondersteunen.

Bovendien leidt Anthropic een sectorbrede inspanning via zijn Project Glasswing-programma — in samenwerking met Amazon, Microsoft en Google — om een vrijwillige, gedeelde veiligheids- en evaluatiestandaard vast te stellen. Dit kader beoogt de ernst van jailbreaks te categoriseren op basis van de winst in capaciteit van de aanvaller, de reikwijdte van de winst, de mate van wapenbaarheid en de ontdekkingsbaarheid.

Waarom dit belangrijk is voor de AI-sector

Deze ontwikkeling is een cruciaal moment voor het AI-landschap, vooral nu bedrijven als OpenAI vergelijkbare gefaseerde uitroltrajecten doorlopen voor modellen zoals GPT-5. Naarmate de sector beweegt naar krachtigere modellen met geavanceerde cybersecurity-mogelijkheden, zal de spanning tussen snelle innovatie en nationale veiligheid alleen maar toenemen. De stap van Anthropic om "pre-release testing" en "vrijwillige standaarden" te formaliseren, zou wel eens het blauwdruk kunnen worden voor hoe aanbieders van frontier-modellen hun legitimiteit behouden in een sterk gereguleerde omgeving.

Belangrijkste punten

  • Wereldwijde herstel: Claude Fable 5 keert aanstaande woensdag terug op de wereldwijde Claude-platforms, waarbij toegang via cloudproviders (AWS, Google, Microsoft) zal volgen.
  • Verbeterde veiligheid: Er is een nieuwe safety classifier ingezet die geïdentificeerde jailbreak-technieken in meer dan 99% van de gevallen blokkeert en geblokkeerde zoekopdrachten omleidt naar Opus 4.8.
  • Regulatoire afstemming: Anthropic beweegt naar een samenwerkingsmodel met de Amerikaanse overheid, waarbij pre-release evaluaties en snelle informatie-uitwisseling over beveiligingsdreigingen worden aangeboden.