Novo Nordisk ਡਾਟਾ ਚੋਰੀ ਨੇ AI ਦੇ ਖ਼ਤਰਿਆਂ ਨੂੰ ਉਜਾਗਰ ਕੀਤਾ
Novo Nordisk ਨੇ ਇਸ ਹਫ਼ਤੇ ਇੱਕ ਸਾਈਬਰ ਹਮਲੇ ਦੀ ਪੁਸ਼ਟੀ ਕੀਤੀ ਹੈ। Ozempic ਅਤੇ Wegovy ਵਾਲੀ ਕੰਪਨੀ ਨੇ ਆਪਣਾ ਅੰਦਰੂਨੀ IT ਡਾਟਾ ਗੁਆ ਦਿੱਤਾ ਹੈ। ਹਮਲਾਵਰਾਂ ਨੇ ਕਲੀਨਿਕਲ ਟਰਾਇਲਜ਼ ਤੋਂ ਪਛਾਣ-ਰਹਿਤ (pseudonymized) ਮਰੀਜ਼ਾਂ ਦਾ ਡਾਟਾ ਚੋਰੀ ਕਰ ਲਿਆ।
ਚੋਰੀ ਹੋਈ ਮਰੀਜ਼ਾਂ ਦੀ ਜਾਣਕਾਰੀ ਵਿੱਚ ਸ਼ਾਮਲ ਹੈ:
- ਮਰੀਜ਼ਾਂ ਦੀਆਂ ID ਅਤੇ ਲਿੰਗ (sex)
- ਜਨਮ ਦਾ ਸਾਲ
- ਬਾਇਓਮਾਰਕਰ (Biomarkers) ਅਤੇ ਸਿਹਤ ਡਾਟਾ
- ਜੀਵਨ ਸ਼ੈਲੀ ਦੇ ਕਾਰਕ ਜਿਵੇਂ ਕਿ BMI ਅਤੇ ਸਿਗਰਟਨੋਸ਼ੀ ਦੀ ਸਥਿਤੀ
ਉਨ੍ਹਾਂ ਨੇ ਸਿਹਤ ਸੰਭਾਲ ਪੇਸ਼ੇਵਰਾਂ (healthcare professionals) ਦਾ ਡਾਟਾ ਜਿਵੇਂ ਕਿ ਨਾਮ, ਈਮੇਲ ਅਤੇ ਫ਼ੋਨ ਨੰਬਰ ਵੀ ਚੋਰੀ ਕਰ ਲਏ।
Dragonfly ਨਾਮਕ ਇੱਕ ਸਮੂਹ ਦਾ ਦਾਅਵਾ ਹੈ ਕਿ ਉਨ੍ਹਾਂ ਨੇ ਸਿਰਫ਼ ਮਰੀਜ਼ਾਂ ਦੇ ਰਿਕਾਰਡ ਹੀ ਨਹੀਂ, ਸਗੋਂ ਇਸ ਤੋਂ ਵੀ ਵੱਧ ਚੋਰੀ ਕੀਤਾ ਹੈ। ਉਨ੍ਹਾਂ ਦਾ ਦਾਅਵਾ ਹੈ ਕਿ ਉਨ੍ਹਾਂ ਨੇ ਇਹ ਚੀਜ਼ਾਂ ਲਈਆਂ ਹਨ:
- NovoPert ਨਾਮਕ ਇੱਕ 16.7 GB ਦਾ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ (trained) AI ਮਾਡਲ
- ਇੱਕ 407 MB ਦਾ ਮਲਕੀਅਤ ਵਾਲਾ (proprietary) ਜੈਵਿਕ ਟ੍ਰੇਨਿੰਗ ਡੇਟਾਸੈੱਟ
- ਟ੍ਰੇਨਿੰਗ ਪਾਈਪਲਾਈਨ ਲਈ ਪੂਰਾ ਸੋਰਸ ਕੋਡ (source code)
- ਇਨਫਰਾਸਟ੍ਰਕਚਰ ਅਤੇ HPC ਕਲਸਟਰਾਂ ਦੇ ਅੰਦਰੂਨੀ ਨਕਸ਼ੇ
- 53 GB ਤੋਂ ਵੱਧ ਕੰਟੇਨਰ ਇਮੇਜਿਸ (container images)
- ਡਿਵੈਲਪਰਾਂ ਦੀ ਪਛਾਣ ਅਤੇ ਪ੍ਰਾਈਵੇਟ GitHub URLs
Novo Nordisk ਨੇ AI ਨਾਲ ਸਬੰਧਤ ਇਹਨਾਂ ਦਾਵਿਆਂ ਦੀ ਪੁਸ਼ਟੀ ਨਹੀਂ ਕੀਤੀ ਹੈ। ਕੋਈ ਰੈਨਸਮਵੇਅਰ (ransomware) ਨਹੀਂ ਮਿਲਿਆ।
ਜੇਕਰ ਇਹ ਦਾਅਵੇ ਸੱਚ ਹਨ, ਤਾਂ AI ਸੰਪਤੀਆਂ (assets) ਮਰੀਜ਼ਾਂ ਦੇ ਡਾਟਾ ਨਾਲੋਂ ਕਿਤੇ ਜ਼ਿਆਦਾ ਕੀਮਤੀ ਹਨ। ਇਹ ਮਾਡਲ ਸਾਲਾਂ ਦੀ ਖੋਜ ਦਾ ਨਤੀਜਾ ਹਨ। ਮੁਕਾਬਲੇਬਾਜ਼ ਜਾਂ ਹੈਕਰ ਇਸ ਡਾਟੇ ਦੀ ਵਰਤੋਂ ਵੱਡੇ ਫਾਇਦੇ ਲਈ ਕਰ ਸਕਦੇ ਹਨ।
ਇਹ ਡਾਟਾ ਚੋਰੀ AI ਬਣਾਉਣ ਵਾਲੀਆਂ ਕੰਪਨੀਆਂ ਲਈ ਦੋ ਵੱਡੀਆਂ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਦਰਸਾਉਂਦੀ ਹੈ:
AI ਇਨਫਰਾਸਟ੍ਰਕਚਰ ਹਮਲੇ ਲਈ ਇੱਕ ਵਿਸ਼ਾਲ ਖੇਤਰ (attack surface) ਹੈ। ਲੀਕ ਹੋਈਆਂ ਕੰਟੇਨਰ ਇਮੇਜਿਸ ਵਿੱਚ ਅਕਸਰ ਕ੍ਰੈਡੈਂਸ਼ੀਅਲਜ਼ (credentials) ਅਤੇ ਨੈੱਟਵਰਕ ਨਕਸ਼ੇ ਹੁੰਦੇ ਹਨ। ਇਹ ਹੈਕਰਾਂ ਨੂੰ ਤੁਹਾਡੇ ਪੂਰੇ ਸਿਸਟਮ ਦਾ ਇੱਕ ਬਲੂਪ੍ਰਿੰਟ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।
ਡਿਵੈਲਪਰਾਂ ਦੀ ਪਛਾਣ ਸਪਲਾਈ ਚੇਨ ਹਮਲਿਆਂ (supply chain attacks) ਦਾ ਕਾਰਨ ਬਣਦੀ ਹੈ। ਜਦੋਂ ਹੈਕਰਾਂ ਨੂੰ ਪਤਾ ਹੁੰਦਾ ਹੈ ਕਿ ਕਿਹੜੇ ਡਿਵੈਲਪਰ ਕਿਹੜੇ ਰੈਪੋਜ਼ (repos) 'ਤੇ ਕੰਮ ਕਰਦੇ ਹਨ, ਤਾਂ ਉਹ ਬਹੁਤ ਸਹੀ ਤਰੀਕੇ ਨਾਲ ਉਨ੍ਹਾਂ ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾ ਸਕਦੇ ਹਨ। ਜਦੋਂ ਨਿਸ਼ਾਨਾ ਪਤਾ ਹੋਵੇ ਤਾਂ ਫਿਸ਼ਿੰਗ (phishing) ਬਹੁਤ ਆਸਾਨ ਹੋ ਜਾਂਦੀ ਹੈ।
ਮਰੀਜ਼ਾਂ ਦੇ ਡਾਟਾ ਦੀ ਚੋਰੀ ਗੰਭੀਰ ਹੈ। ਪਰ ਜੇਕਰ AI ਚੋਰੀ ਦੇ ਦਾਅਵੇ ਸੱਚ ਹਨ, ਤਾਂ ਇਹ ਹੈਕਰਾਂ ਦੇ ਕੰਮ ਕਰਨ ਦੇ ਤਰੀਕੇ ਵਿੱਚ ਇੱਕ ਵੱਡਾ ਬਦਲਾਅ ਹੈ। ਉਹ ਹੁਣ ਸਿੱਧੇ ਤੌਰ 'ਤੇ AI ਮਾਡਲਾਂ ਵਿੱਚ ਬੌਧਿਕ ਸੰਪੱਤੀ (intellectual property) ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾ ਰਹੇ ਹਨ।
ਤੁਹਾਡੀ ਟੀਮ AI ਟ੍ਰੇਨਿੰਗ ਇਨਫਰਾਸਟ੍ਰਕਚਰ ਨੂੰ ਕਿਵੇਂ ਸੁਰੱਖਿਅਤ ਕਰਦੀ ਹੈ? ਕੀ ਤੁਸੀਂ ਇਸਨੂੰ ਇੱਕ ਖੋਜ ਖੇਤਰ (research zone) ਵਜੋਂ ਮੰਨਦੇ ਹੋ ਜਾਂ ਇੱਕ ਉੱਚ-ਸੁਰੱਖਿਆ ਸੰਪਤੀ (high-security asset) ਵਜੋਂ?
ਵਿਕਲਪਿਕ ਸਿੱਖਣ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi