La violation de données de Novo Nordisk expose les risques liés à l'IA
Novo Nordisk a confirmé avoir subi une cyberattaque cette semaine. L'entreprise derrière Ozempic et Wegovy a perdu des données informatiques internes. Des attaquants ont dérobé des données patient pseudonymisées issues d'essais cliniques.
Les informations patient volées incluent :
- Identifiants et sexe des patients
- Année de naissance
- Biomarqueurs et données de santé
- Facteurs de mode de vie tels que l'IMC et le statut tabagique
Ils ont également dérobé des données de professionnels de santé telles que des noms, des adresses e-mail et des numéros de téléphone.
Un groupe nommé Dragonfly affirme avoir volé bien plus que de simples dossiers de patients. Ils prétendent avoir récupéré :
- Un modèle d'IA entraîné de 16,7 Go nommé NovoPert
- Un ensemble de données d'entraînement biologique propriétaire de 407 Mo
- Le code source complet du pipeline d'entraînement
- Des cartes internes de l'infrastructure et des clusters HPC
- Plus de 53 Go d'images de conteneurs
- L'identité des développeurs et des URL GitHub privées
Novo Nordisk n'a pas confirmé ces affirmations concernant l'IA. Aucun ransomware n'a été détecté.
Si ces affirmations sont vraies, les actifs d'IA sont plus précieux que les données des patients. Ces modèles représentent des années de recherche. Des concurrents ou des pirates pourraient utiliser ces données pour réaliser des gains colossaux.
Cette violation met en lumière deux problèmes majeurs pour les entreprises développant l'IA :
L'infrastructure d'IA constitue une surface d'attaque massive. Les images de conteneurs fuitées contiennent souvent des identifiants et des cartes réseau. Cela donne aux attaquants un plan détaillé de l'ensemble de votre système.
L'identité des développeurs mène à des attaques de la chaîne d'approvisionnement. Lorsque les attaquants savent quels développeurs travaillent sur quels dépôts, ils peuvent les cibler avec précision. Le phishing devient beaucoup plus facile lorsque la cible est connue.
Les violations de données de patients sont graves. Mais si les affirmations concernant le vol d'IA sont réelles, cela marque un changement dans le mode opératoire des pirates. Ils ciblent désormais directement la propriété intellectuelle contenue dans les modèles d'IA.
Comment votre équipe sécurise-t-elle l'infrastructure d'entraînement de l'IA ? La considérez-vous comme une zone de recherche ou comme un actif de haute sécurité ?
Communauté d'apprentissage optionnelle : https://t.me/GyaanSetuAi