Експерти з кібербезпеки протестують проти заборони США на моделі Fable та Mythos від Anthropic
Коаліція з 76 провідних ветеранів кібербезпеки б'є на сполох через нещодавній наказ уряду США про експортний контроль, спрямований проти найдосконаліших моделей ШІ від Anthropic. Група стверджує, що, обмежуючи доступ до цих інструментів, уряд ненавмисно позбавляє зброї цифрових захисників, тоді як противники продовжують просуватися вперед.
Конфлікт: національна безпека проти оборонного потенціалу
Напруженість виникла, коли уряд США видав наказ про експортний контроль щодо моделей Fable та Mythos від Anthropic, посилаючись на нерозголошені занепокоєння щодо національної безпеки. Виконуючи наказ, Anthropic призупинила доступ до цих моделей по всьому світу.
Модель Mythos була спочатку розроблена з такими високими можливостями для виявлення вразливостей, що Anthropic на початковому етапі обмежила доступ до неї вибірковою групою з приблизно 150 організацій у 15 країнах. Публічна версія, Fable, мала містити суворі захисні механізми для запобігання зловживанням у сферах біології, хімії та кібербезпеки. Однак втручання уряду фактично зупинило впровадження цих потужних інструментів саме для тих людей, перед якими стоїть завдання захистити інтернет.
Суперечка щодо «джейлбрейку» та звіт Amazon
Anthropic припускає, що наказ Білого дому може бути зумовлений занепокоєнням щодо «джейлбрейку» (jailbreaking) — методів, що використовуються для обходу захисних обмежень. Повідомляється, що це занепокоєння походить із неопублікованої наукової роботи дослідників Amazon.
У роботі припускалося, що користувачі можуть обійти обмеження безпеки Fable, щоб отримати доступ до можливостей рівня Mythos. Однак експерти з кібербезпеки, зокрема Katie Moussouris (засновниця Luta Security), стверджують, що це фундаментальне неправильне розуміння корисності ШІ. Moussouris зазначає, що описаний «джейлбрейк» був просто виконанням передбаченої функції моделі: виправленням коду з відкритим вихідним кодом, що містить відомі вразливості.
За словами Moussouris, прохання до ШІ виправити помилку, пояснити патч і написати тест не є порушенням безпеки; це «цикл знаходження, виправлення та тестування» (find, fix, and test loop), який визначає сучасну оборонну безпеку. Спроби заблокувати таку поведінку фундаментально підірвуть здатність моделі захищати програмне забезпечення.
Підписанти з високими ставками та наслідки для галузі
Цей відкритий лист підтриманий важковаговиками в спільноті безпеки, зокрема колишнім керівником служби безпеки Facebook Alex Stamos, засновником Bugcrowd Casey Ellis та відомим криптографом Jon Callas. Їхній аргумент зосереджений на критичному дисбалансі: якщо захисникам відмовляють у доступі до передових LLM, тоді як зловмисники використовують необмежені моделі, глобальний стан безпеки послаблюється.
Експерти також зазначили, що уявна вразливість у Fable не є унікальною для Anthropic. У листі припускається, що подібні «вразливості» можуть бути відтворені в OpenAI’s GPT-5.5, власних моделях Anthropic — Claude Opus 4.8 та Sonnet, і навіть у міжнародних моделях, таких як Kimi 2.7.
Група закликає до демократичного, науково обґрунтованого процесу регулювання, який спирається на прозорі дослідження, а не на широкі реактивні заборони, що можуть завдати більше шкоди, ніж користі.
Основні висновки
- Роззброєння захисників: Експерти з кібербезпеки попереджають, що заборона моделей Fable та Mythos від Anthropic позбавляє захисників необхідних інструментів, потрібних для пошуку та усунення вразливостей у програмному забезпеченні.
- Функціональність проти безпеки: Критики стверджують, що занепокоєння щодо «jailbreaking», висловлені дослідниками, змішують легітимні завдання захисного кодування зі зловмисними експлойтами.
- Заклик до прозорості: Лідери галузі вимагають наукового, демократичного процесу розробки правил експортного контролю ШІ, щоб гарантувати, що регулювання будуть цілеспрямованими та ефективними.