Правительство США против Anthropic: невыполнимое требование создания невзламываемых LLM

Между правительством США и Anthropic наметился растущий разрыв после выпуска модели Fable 5, что спровоцировало дискуссию о безопасности ИИ и регуляторном надзоре. Пока официальные лица обвиняют лабораторию ИИ в обходе исполнительных указов, проявляется более глубокое техническое напряжение: требование правительства создавать «невзламываемые» передовые модели.

Конфликт вокруг Fable 5 и кибердиректив

Напряженность вызвана решением Anthropic выпустить свою последнюю модель, Fable 5, до того, как начал полноценно функционировать назначенный правительственный контрольный орган — предусмотренный недавним кибер-указом администрации Трампа. Хотя указ призывал к добровольному надзору, правительственные чиновники утверждают, что Anthropic проигнорировала сам дух директивы, что привело к обвинениям компании в «недобросовестном поведении».

Текущие обсуждения с участием Министерства торговли, ЦРУ и научного советника Майкла Крациоса указывают на огромный коммуникационный разрыв. Официальные лица выразили обеспокоенность тем, что Anthropic продолжила работу, зная о риске «джейлбрейка» — информация об этом, по сообщениям, была предоставлена Amazon и другими партнерами по технологической отрасли. Однако трения, похоже, связаны не только с технической безопасностью, но и с вопросами соблюдения регуляторных сроков.

Техническая реальность: могут ли LLM когда-либо стать невзламываемыми?

Суть критики правительства — утверждение, что Anthropic «выбрала неверный путь», проигнорировав потенциальные джейлбрейки, — игнорирует фундаментальную реальность архитектуры больших языковых моделей (LLM). В индустрии ИИ существует консенсус: абсолютная безопасность на данный момент невозможна. Даже OpenAI признала, что такие уязвимости, как инъекция промптов (prompt injection), возможно, никогда не будут полностью устранены.

Генеральный директор Anthropic Дарио Амодеи ранее отмечал, что, хотя джейлбрейк в таких чувствительных областях, как биология или технологии, может иметь «жизненно важное значение», индустрия все еще пытается найти способы минимизации этих рисков. Требуя, чтобы модели были по сути невзламываемыми перед началом международного экспорта, правительство США может создать прецедент, подавляющий инновации, поскольку ни одна передовая модель (включая GPT-5.5 или Kimi 2.7) не обладает идеальным защитным щитом.

Реакция отрасли и дебаты об экспортном контроле

В ответ на растущую напряженность более 100 экспертов по кибербезопасности и руководителей компаний — включая таких ветеранов отрасли, как Алекс Стамос и Рэйчел Тобак — направили открытое письмо министру торговли Латнику и национальному кибердиректору Кэрнкроссу. Они призывают отменить экспортный контроль над моделями Fable и Mythos от Anthropic.

Эксперты утверждают, что, хотя Fable обладает высокими способностями к выявлению программных уязвимостей, она не представляет собой уникальную опасность по сравнению с другими моделями, такими как Opus или Sonnet. Что крайне важно, они предупреждают, что жесткий экспортный контроль на самом деле ограничивает возможности западных защитников. Ограничивая доступ к передовым американским моделям, правительство может непреднамеренно дать преимущество китайским моделям с открытыми весами, которые, по имеющимся данным, отстают от ведущих американских передовых моделей всего на несколько месяцев.

Основные выводы