Уряд США проти Anthropic: неможлива вимога щодо незламних LLM
Між урядом США та Anthropic виникли розбіжності після випуску моделі Fable 5, що спровокувало дискусію щодо безпеки ШІ та регуляторного нагляду. Оскільки посадовці звинувачують лабораторію ШІ в ігноруванні виконавчих розпоряджень, виринає глибша технічна напруженість: вимога уряду щодо створення «незламних» передових моделей.
Конфлікт навколо Fable 5 та кібердиректив
Напруженість зумовлена рішенням Anthropic випустити свою останню модель, Fable 5, до того, як спеціально призначений урядовий орган — передбачений нещодавнім виконавчим розпорядженням адміністрації Трампа щодо кібербезпеки — почав повноцінно функціонувати. Хоча розпорядження передбачало добровільний нагляд, урядовці стверджують, що Anthropic проігнорувала дух директиви, що призвело до звинувачень компанії у «недобросовісній поведінці».
Поточні дискусії за участю Міністерства торгівлі, ЦРУ та радника з питань науки Майкла Краціоса підкреслюють величезний розрив у комунікації. Посадовці висловили занепокоєння тим, що Anthropic продовжила роботу, попри обізнаність про ризик «джейлбрейку» (jailbreak) — інформацію, яку, за повідомленнями, надали Amazon та інші партнери по технологічній галузі. Проте, схоже, що тертя пов'язане не лише з технічною безпекою, а й із термінами регулювання.
Технічна реальність: чи можуть LLM коли-небудь стати незламними?
Суть критики уряду — те, що Anthropic «обрала хибний шлях», ігноруючи потенційні джейлбрейки — ігнорує фундаментальну реальність архітектури великих мовних моделей (LLM). В індустрії ШІ панує консенсус щодо того, що абсолютна безпека наразі є неможливою. Навіть OpenAI визнала, що такі вразливості, як ін'єкція промптів (prompt injection), можливо, ніколи не будуть повністю усунені.
Генеральний директор Anthropic Даріо Амодеї раніше зазначав, що хоча джейлбрейк у таких чутливих сферах, як біологія чи технології, може мати «життєво важливе значення», галузь усе ще намагається зрозуміти, як пом'якшити ці ризики. Вимагаючи, щоб моделі були фактично незламними перед міжнародним експортом, уряд США може створити прецедент, який пригнічуватиме інновації, оскільки жодна передова модель (включаючи GPT-5.5 або Kimi 2.7) не має ідеального захисного щита.
Реакція галузі та дебати щодо експортного контролю
У відповідь на зростання напруженості понад 100 експертів та керівників у сфері кібербезпеки — зокрема таких ветеранів галузі, як Алекс Стамос та Рейчел Тобак — надіслали відкритий лист міністру торгівлі Латніку та національному кібердиректору Кернкроссу. Вони закликають скасувати експортний контроль щодо моделей Fable та Mythos від Anthropic.
Експерти стверджують, що хоча Fable має високу здатність виявляти програмні вразливості, вона не є унікально небезпечною порівняно з іншими моделями, такими як Opus або Sonnet. Що важливо, вони попереджають, що суворий експортний контроль фактично обмежує можливості західних захисників. Обмежуючи доступ до передових американських моделей, уряд може ненавмисно надати перевагу китайським моделям з відкритими вагами, які, за наявними даними, відстають від провідних американських фронтирних моделей лише на кілька місяців.
Основні висновки
- Регуляторні тертя: Anthropic опинилася під критикою за випуск Fable 5 до створення урядового органу добровільного нагляду.
- Парадокс безпеки: Вимоги уряду щодо створення «незламного» ШІ суперечать технічній реальності, згідно з якою ін'єкції промптів (prompt injection) та джейлбрейкінг (jailbreaking) є невід'ємними ризиками в сучасних архітектурах LLM.
- Геополітичні ризики: Експерти галузі попереджають, що агресивний експортний контроль над такими моделями, як Fable, може послабити кіберзахист США, водночас не зупинивши стрімкий прогрес китайського ШІ.