Novo Nordisk च्या डेटा चोरीमुळे AI च्या जोखमींचा उलगडा झाला
Novo Nordisk ने या आठवड्यात सायबर हल्ल्याची पुष्टी केली आहे. Ozempic आणि Wegovy बनवणारी ही कंपनी आपला अंतर्गत IT डेटा गमावून बसली आहे. हल्लेखोरांनी क्लिनिकल ट्रायल्समधून छद्मनाविकृत (pseudonymized) रुग्ण डेटा चोरला आहे.
चोरीला गेलेल्या रुग्ण माहितीमध्ये खालील गोष्टींचा समावेश आहे:
- रुग्ण ID आणि लिंग
- जन्माचे वर्ष
- बायोमार्कर आणि आरोग्य डेटा
- BMI आणि धूम्रपानाची स्थिती यांसारखे जीवनशैली घटक
त्यांनी आरोग्य सेवा व्यावसायिकांची नावे, ईमेल आणि फोन नंबर यांसारखा डेटा देखील चोरला आहे.
Dragonfly नावाच्या एका गटाचा दावा आहे की त्यांनी केवळ रुग्ण रेकॉर्ड्सच नाही, तर त्यापेक्षाही जास्त गोष्टी चोरल्या आहेत. त्यांच्या दाव्यानुसार त्यांनी खालील गोष्टी घेतल्या आहेत:
- NovoPert नावाचे 16.7 GB चे प्रशिक्षित AI मॉडेल
- 407 MB चा मालकी हक्क असलेला (proprietary) जैविक प्रशिक्षण डेटासेट
- ट्रेनिंग पाइपलाइनचा संपूर्ण सोर्स कोड
- इन्फ्रास्ट्रक्चर आणि HPC क्लस्टर्सचे अंतर्गत नकाशे
- 53 GB पेक्षा जास्त कंटेनर इमेजेस (container images)
- डेव्हलपरची ओळख आणि खाजगी GitHub URLs
Novo Nordisk ने या AI संबंधित दाव्यांची पुष्टी केलेली नाही. कोणताही रॅन्समवेअर (ransomware) आढळलेला नाही.
जर हे दावे खरे असतील, तर AI मालमत्ता (assets) रुग्ण डेटापेक्षा अधिक मौल्यवान आहे. ही मॉडेल्स अनेक वर्षांच्या संशोधनाचे प्रतीक आहेत. स्पर्धक किंवा हॅकर्स या डेटाचा वापर मोठ्या फायद्यासाठी करू शकतात.
ही डेटा चोरी AI विकसित करणाऱ्या कंपन्यांसाठी दोन मोठ्या समस्या दर्शवते:
AI इन्फ्रास्ट्रक्चर हे हल्ल्यासाठी एक मोठे क्षेत्र (attack surface) आहे. गळती झालेल्या कंटेनर इमेजेसमध्ये अनेकदा क्रेडेंशियल्स (credentials) आणि नेटवर्क नकाशे असतात. यामुळे हल्लेखोरांना तुमच्या संपूर्ण सिस्टमचा आराखडा (blueprint) मिळतो.
डेव्हलपरची ओळख सप्लाय चेन हल्ल्यांना (supply chain attacks) निमंत्रण देते. जेव्हा हल्लेखोरांना कोणत्या डेव्हलपरवर कोणत्या रिपॉझिटरीज (repos) वर काम केले जाते हे समजते, तेव्हा ते अचूकपणे त्यांना लक्ष्य करू शकतात. लक्ष्य माहित असल्यास फिशिंग (phishing) करणे खूप सोपे होते.
रुग्ण डेटाची चोरी गंभीर आहे. परंतु जर AI चोरीचे दावे खरे असतील, तर हे हॅकर्सच्या कार्यपद्धतीमधील एक मोठे बदल दर्शवते. ते आता थेट AI मॉडेल्समधील बौद्धिक संपदेला (intellectual property) लक्ष्य करत आहेत.
तुमची टीम AI ट्रेनिंग इन्फ्रास्ट्रक्चर सुरक्षित करण्यासाठी काय करते? तुम्ही याला संशोधन क्षेत्र मानता की उच्च-सुरक्षा मालमत्ता (high-security asset)?
Optional learning community: https://t.me/GyaanSetuAi