Rząd USA kontra Anthropic: Niemożliwe żądanie niezhakowalnych modeli LLM
Między rządem USA a firmą Anthropic narasta konflikt po wydaniu modelu Fable 5, co wywołało debatę na temat bezpieczeństwa AI i nadzoru regulacyjnego. Podczas gdy urzędnicy oskarżają laboratorium AI o omijanie rozporządzeń wykonawczych, na jaw wychodzi głębsze napięcie techniczne: żądanie rządu dotyczące „niezhakowalnych” modeli typu frontier.
Konflikt wokół Fable 5 i dyrektyw cybernetycznych
Napięcie wynika z decyzji Anthropic o wydaniu swojego najnowszego modelu, Fable 5, zanim w pełni zaczęła działać wyznaczona rządowa instytucja weryfikacyjna (clearinghouse) – wymagana przez niedawne rozporządzenie wykonawcze administracji Trumpa w sprawie cyberbezpieczeństwa. Choć rozporządzenie wzywało do dobrowolnego nadzoru, urzędnicy rządowi twierdzą, że Anthropic zignorowało ducha dyrektywy, co doprowadziło do oskarżeń, że firma jest „złym aktorem” (bad actor).
Obecne dyskusje z udziałem Departamentu Handlu, CIA oraz doradcy ds. nauki Michaela Kratsiosa uwypuklają ogromną lukę komunikacyjną. Urzędnicy wyrazili obawę, że Anthropic kontynuowało działania mimo świadomości istnienia ryzyka „jailbreaku” – informacji, którą rzekomo przekazały Amazon i inni partnerzy z branży technologicznej. Wydaje się jednak, że tarcie wynika w równym stopniu z kwestii czasu regulacyjnego, co z bezpieczeństwa technicznego.
Rzeczywistość techniczna: Czy modele LLM mogą kiedykolwiek być niezhakowalne?
Sedno krytyki rządu – twierdzenie, że Anthropic „wybrało złą ścieżkę”, ignorując potencjalne jailbreaki – pomija fundamentalną rzeczywistość architektury dużych modeli językowych (LLM). W branży AI panuje konsensus, że absolutne bezpieczeństwo jest obecnie niemożliwe. Nawet OpenAI przyznało, że podatności takie jak prompt injection mogą nigdy nie zostać w pełni wyeliminowane.
Dyrektor generalny Anthropic, Dario Amodei, zauważył wcześniej, że choć jailbreak w tak wrażliwych dziedzinach jak biologia czy technologia może mieć znaczenie „życia lub śmierci”, branża wciąż zmaga się z tym, jak łagodzić te ryzyka. Żądając, aby modele były w zasadzie niezhakowalne przed rozpoczęciem międzynarodowej dystrybucji, rząd USA może tworzyć precedens tłumiący innowacje, ponieważ żaden model typu frontier (w tym GPT-5.5 czy Kimi 2.7) nie posiada idealnej tarczy bezpieczeństwa.
Reakcja branży i debata o kontroli eksportu
W odpowiedzi na narastające napięcie, ponad 100 ekspertów i menedżerów ds. cyberbezpieczeństwa — w tym weteranów branży, takich jak Alex Stamos i Rachel Tobac — wystosowało otwarty list do sekretarza handlu Lutnicka oraz krajowego dyrektora ds. cyberbezpieczeństwa Cairncrossa. Wzywają oni do zniesienia kontroli eksportu modeli Fable i Mythos firmy Anthropic.
Eksperci argumentują, że choć Fable wykazuje wysoką zdolność do identyfikowania luk w oprogramowaniu, nie jest on wyjątkowo niebezpieczny w porównaniu z innymi modelami, takimi jak Opus czy Sonnet. Co kluczowe, ostrzegają oni, że surowe kontrole eksportowe w rzeczywistości osłabiają zachodnich obrońców. Poprzez ograniczanie dostępu do czołowych amerykańskich modeli, rząd może nieumyślnie dać przewagę chińskim modelom typu open-weight, które – jak się podaje – są obecnie zaledwie o kilka miesięcy zapóźnione względem wiodących amerykańskich modeli typu frontier.
Kluczowe wnioski
- Napięcia regulacyjne: Anthropic znajduje się pod ostrzałem za wydanie Fable 5 przed ustanowieniem rządowego organu ds. dobrowolnego nadzoru.
- Paradoks bezpieczeństwa: Rządowe żądania dotyczące „niezhakowalnej” sztucznej inteligencji kolidują z techniczną rzeczywistością, w której prompt injection i jailbreaking są nieodłącznymi ryzykami w obecnych architekturach LLM.
- Ryzyka geopolityczne: Eksperci branżowi ostrzegają, że agresywne kontrole eksportu modeli takich jak Fable mogą osłabić amerykańską cyberobronę, nie powstrzymując jednocześnie szybkiego postępu chińskiej sztucznej inteligencji.