Anthropic przywraca dostęp do Claude Fable 5 po negocjacjach z rządem

Po tygodniach intensywnych negocjacji z administracją Trumpa, Anthropic oficjalnie dało zielone światło dla powrotu swojego wyczekiwanego modelu Claude Fable 5. Ruch ten następuje po okresie surowych kontroli eksportowych, które wykluczyły jeden z najważniejszych modeli AI skierowanych do konsumentów w branży.

Zniesienie kontroli eksportowych i przywrócenie globalnego dostępu

Departament Handlu oficjalnie zniosło dyrektywy kontroli eksportu, które wcześniej ograniczały dostęp zarówno do Claude Fable 5, jak i do jego technologii bazowej, Mythos 5. Kontrole te stworzyły ogromną przeszkodę operacyjną, uniemożliwiając korzystanie z modeli obcokrajowcom – w tym wielu międzynarodowym pracownikom samego Anthropic oraz członkom firm klientów korporacyjnych spoza USA.

Anthropic potwierdziło, że od najbliższej środy rozpocznie przywracanie dostępu do Fable 5 na platformach Claude na całym świecie. Choć nie ustalono jeszcze konkretnego harmonogramu, firma planuje w najbliższej przyszłości ponownie udostępnić model w głównych infrastrukturach chmurowych, w tym AWS, Google Cloud oraz Microsoft Foundry.

Rozwiązanie problemu podatności na jailbreaking

Początkowa interwencja rządu została wywołana obawami dotyczącymi potencjalnych „jailbreaków” (złamań zabezpieczeń), a konkretnie w następstwie raportu badaczy z Amazon, który wskazał na lukę w zabezpieczeniach. W odpowiedzi Anthropic wdrożyło bardziej solidną architekturę bezpieczeństwa.

Firma przeszkoliła ulepszony klasyfikator bezpieczeństwa, zaprojektowany w celu wykrywania i blokowania konkretnych technik zidentyfikowanych w raporcie Amazon, deklarując skuteczność przekraczającą 99%. Aby zapewnić użytkownikom płynne doświadczenia nawet w przypadku zablokowania zapytania, Anthropic zintegrowało mechanizm awaryjny: jeśli zapytanie do Fable 5 zostanie oznaczone przez nowy klasyfikator, zostanie ono automatycznie przekierowane do modelu Opus 4.8.

Nowa era współpracy rządu z AI

Powrót Fable 5 sygnalizuje fundamentalną zmianę w sposobie, w jaki laboratoria AI typu frontier wchodzą w interakcje z federalnymi organami regulacyjnymi. Anthropic nakreśliło proaktywną strategię bliskiej współpracy z administracją Trumpa, która obejmuje:

  • Dostęp rządowy przed premierą: Umożliwienie partnerom rządowym przeprowadzania niezależnych ocen modeli istotnych dla bezpieczeństwa narodowego, zanim trafią one do opinii publicznej.
  • Szybka wymiana informacji: Zobowiązanie do natychmiastowego ujawniania informacji w przypadku zidentyfikowania znaczących jailbreaków lub wzorców nadużyć.
  • Alokacja zasobów: Powołanie dedykowanych zespołów i zapewnienie znacznej mocy obliczeniowej na potrzeby rządowych testów i badań.

Co więcej, Anthropic przewodzi ogólnobranżowym staraniom w ramach programu Project Glasswing – we współpracy z Amazon, Microsoft i Google – mającym na celu ustanowienie dobrowolnego, wspólnego standardu bezpieczeństwa i ewaluacji. Ramy te mają na celu kategoryzację stopnia dotkliwości jailbreaku na podstawie zysku w możliwościach atakującego, zakresu tego zysku, łatwości wykorzystania do celów ofensywnych oraz wykrywalności.

Dlaczego ma to znaczenie dla branży AI

To wydarzenie jest przełomowym momentem dla krajobrazu AI, zwłaszcza w obliczu sytuacji, gdy firmy takie jak OpenAI realizują podobne, etapowe wdrażanie modeli takich jak GPT-5. W miarę jak branża zmierza w stronę potężniejszych modeli z zaawansowanymi możliwościami cyberbezpieczeństwa, napięcie między szybką innowacją a bezpieczeństwem narodowym będzie tylko narastać. Działanie Anthropic polegające na sformalizowaniu „testów przedpremierowych” i „dobrowolnych standardów” może stać się wzorcem dla dostawców modeli typu frontier w kwestii utrzymywania legitymacji w wysoce regulowanym środowisku.

Kluczowe wnioski

  • Globalne przywrócenie: Claude Fable 5 powraca na globalne platformy Claude w najbliższą środę, a wkrótce nastąpi udostępnienie przez dostawców chmury (AWS, Google, Microsoft).
  • Zwiększone bezpieczeństwo: Wdrożono nowy klasyfikator bezpieczeństwa, który blokuje zidentyfikowane techniki jailbreaku w ponad 99% przypadków i przekierowuje zablokowane zapytania do modelu Opus 4.8.
  • Zgodność regulacyjna: Anthropic zmierza w stronę modelu współpracy z rządem USA, oferując oceny przedpremierowe oraz szybką wymianę informacji o zagrożeniach bezpieczeństwa.