La brecha de Novo Nordisk expone los riesgos de la IA
Novo Nordisk confirmó un ciberataque esta semana. La empresa detrás de Ozempic y Wegovy perdió datos informáticos internos. Los atacantes sustrajeron datos seudonimizados de pacientes de ensayos clínicos.
La información robada de los pacientes incluye:
- IDs de pacientes y sexo
- Año de nacimiento
- Biomarcadores y datos de salud
- Factores de estilo de vida como el IMC y el estado de tabaquismo
También sustrajeron datos de profesionales de la salud, como nombres, correos electrónicos y números de teléfono.
Un grupo llamado Dragonfly afirma haber robado algo más que simples registros de pacientes. Afirman haber tomado:
- Un modelo de IA entrenado de 16,7 GB llamado NovoPert
- Un conjunto de datos de entrenamiento biológico propietario de 407 MB
- El código fuente completo del pipeline de entrenamiento
- Mapas internos de infraestructura y clústeres de HPC
- Más de 53 GB de imágenes de contenedores
- Identidades de desarrolladores y URLs privadas de GitHub
Novo Nordisk no ha confirmado estas afirmaciones sobre la IA. No se encontró ransomware.
Si estas afirmaciones son ciertas, los activos de IA son más valiosos que los datos de los pacientes. Estos modelos representan años de investigación. Los competidores o los hackers podrían utilizar estos datos para obtener grandes beneficios.
Esta brecha muestra dos problemas importantes para las empresas que desarrollan IA:
La infraestructura de IA es una superficie de ataque masiva. Las imágenes de contenedores filtradas suelen contener credenciales y mapas de red. Esto proporciona a los atacantes un plano de todo su sistema.
Las identidades de los desarrolladores conducen a ataques a la cadena de suministro. Cuando los atacantes saben qué desarrolladores trabajan en qué repositorios, pueden dirigirse a ellos con precisión. El phishing se vuelve mucho más fácil cuando el objetivo es conocido.
Las brechas de datos de pacientes son graves. Pero si las afirmaciones sobre el robo de IA son reales, esto representa un cambio en la forma en que operan los hackers. Ahora están atacando directamente la propiedad intelectual de los modelos de IA.
¿Cómo asegura su equipo la infraestructura de entrenamiento de IA? ¿La tratan como una zona de investigación o como un activo de alta seguridad?
Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi