Утечка в Novo Nordisk обнажает риски, связанные с ИИ
На этой неделе компания Novo Nordisk подтвердила факт кибератаки. Компания, стоящая за Ozempic и Wegovy, потеряла внутренние ИТ-данные. Злоумышленники похитили псевдонимизированные данные пациентов, полученные в ходе клинических исследований.
Украденная информация о пациентах включает:
- ID пациентов и пол
- Год рождения
- Биомаркеры и данные о состоянии здоровья
- Факторы образа жизни, такие как ИМТ и статус курения
Они также похитили данные медицинских работников, такие как имена, адреса электронной почты и номера телефонов.
Группа под названием Dragonfly утверждает, что украла не только записи пациентов. По их словам, были похищены:
- Обученная модель ИИ размером 16,7 ГБ под названием NovoPert
- Проприетарный биологический набор данных для обучения объемом 407 МБ
- Полный исходный код конвейера обучения
- Внутренние карты инфраструктуры и HPC-кластеров
- Более 53 ГБ образов контейнеров
- Личные данные разработчиков и приватные URL-адреса GitHub
Novo Nordisk не подтвердила эти заявления относительно ИИ. Программы-вымогатели обнаружены не были.
Если эти утверждения верны, то активы ИИ представляют большую ценность, чем данные пациентов. Эти модели — результат многолетних исследований. Конкуренты или хакеры могут использовать эти данные для получения огромной выгоды.
Эта утечка выявляет две основные проблемы для компаний, разрабатывающих ИИ:
Инфраструктура ИИ — это огромная поверхность атаки. Утекшие образы контейнеров часто содержат учетные данные и карты сети. Это дает злоумышленникам чертеж всей вашей системы.
Личные данные разработчиков ведут к атакам на цепочку поставок. Когда хакеры знают, какие разработчики работают над какими репозиториями, они могут наносить точечные удары. Фишинг становится гораздо проще, когда цель известна.
Утечки данных пациентов — это серьезно. Но если заявления о краже ИИ соответствуют действительности, это знаменует смену тактики хакеров. Теперь они напрямую нацелены на интеллектуальную собственность в моделях ИИ.
Как ваша команда защищает инфраструктуру обучения ИИ? Рассматриваете ли вы её как исследовательскую зону или как высокозащищенный актив?
Optional learning community: https://t.me/GyaanSetuAi