Anthropic восстанавливает доступ к Claude Fable 5 после переговоров с правительством
После нескольких недель интенсивных переговоров с администрацией Трампа компания Anthropic официально дала зеленый свет возвращению своей долгожданной модели Claude Fable 5. Этот шаг последовал за периодом строгих экспортных ограничений, которые вывели из строя одну из самых значимых потребительских моделей ИИ в индустрии.
Снятие экспортного контроля и восстановление глобального доступа
Министерство торговли официально отменило директивы по экспортному контролю, которые ранее ограничивали доступ как к Claude Fable 5, так и к лежащей в ее основе технологии Mythos 5. Эти ограничения создали серьезные операционные препятствия, запрещая иностранным гражданам — включая многих собственных международных сотрудников Anthropic и не являющихся гражданами США членов компаний-клиентов — использовать эти модели.
Anthropic подтвердила, что начнет восстановление глобального доступа к Fable 5 на платформах Claude начиная с этой среды. Хотя конкретные сроки не установлены, компания планирует в ближайшем будущем возобновить работу модели на крупнейших облачных инфраструктурах, включая AWS, Google Cloud и Microsoft Foundry.
Решение проблемы уязвимости к джейлбрейкам
Первоначальное вмешательство правительства было вызвано опасениями по поводу потенциальных «джейлбрейков» (jailbreaks), в частности, после отчета исследователей Amazon, в котором была отмечена уязвимость. В ответ на это Anthropic внедрила более надежную архитектуру безопасности.
Компания обучила улучшенный классификатор безопасности, предназначенный для выявления и блокировки конкретных методов, описанных в отчете Amazon, заявляя о показателе успеха более 99%. Чтобы обеспечить бесперебойную работу пользователей даже в случае блокировки запроса, Anthropic интегрировала механизм отката: если запрос к Fable 5 будет помечен новым классификатором, он будет автоматически перенаправлен на модель Opus 4.8.
Новая эра сотрудничества между правительством и разработчиками ИИ
Возвращение Fable 5 знаменует собой фундаментальный сдвиг в том, как передовые лаборатории ИИ взаимодействуют с федеральными регуляторами. Anthropic изложила стратегию активного сотрудничества с администрацией Трампа, которая включает:
- Доступ правительства перед релизом: Предоставление государственным партнерам возможности проводить независимую оценку моделей, имеющих значение для национальной безопасности, до их выхода в широкий доступ.
- Оперативный обмен информацией: Обязательство немедленно раскрывать информацию при выявлении значимых джейлбрейков или паттернов нецелевого использования.
- Распределение ресурсов: Создание специализированных команд и выделение значительных вычислительных мощностей для поддержки государственных испытаний и исследований.
Кроме того, Anthropic возглавляет общеотраслевую инициативу в рамках своей программы Project Glasswing — в партнерстве с Amazon, Microsoft и Google — по созданию добровольного общего стандарта безопасности и оценки. Эта структура призвана классифицировать серьезность джейлбрейков на основе прироста возможностей злоумышленника, масштаба этого прироста, простоты превращения в оружие и возможности обнаружения.
Почему это важно для индустрии ИИ
Это событие является переломным моментом для ландшафта ИИ, особенно на фоне того, как такие компании, как OpenAI, проводят аналогичные поэтапные внедрения моделей вроде GPT-5. По мере того как индустрия движется к более мощным моделям с продвинутыми возможностями кибербезопасности, напряженность между стремительными инновациями и национальной безопасностью будет только расти. Шаг Anthropic по формализации «предрелизного тестирования» и «добровольных стандартов» вполне может стать образцом того, как поставщики передовых моделей будут поддерживать свою легитимность в условиях жесткого регулирования.
Основные выводы
- Глобальное восстановление: Claude Fable 5 возвращается на глобальные платформы Claude в эту среду, после чего последует доступ через облачных провайдеров (AWS, Google, Microsoft).
- Улучшенная безопасность: Развернут новый классификатор безопасности, блокирующий выявленные методы джейлбрейка в более чем 99% случаев и перенаправляющий заблокированные запросы на Opus 4.8.
- Согласованность с регуляторами: Anthropic переходит к модели сотрудничества с правительством США, предлагая предрелизную оценку и оперативный обмен информацией об угрозах безопасности.
