노보 노디스크(Novo Nordisk) 침해 사고로 드러난 AI 리스크
노보 노디스크(Novo Nordisk)는 이번 주 사이버 공격을 받았음을 확인했습니다. Ozempic과 Wegovy를 개발한 이 회사는 내부 IT 데이터를 유실했습니다. 공격자들은 임상 시험에서 가명 처리된 환자 데이터를 탈취했습니다.
탈취된 환자 정보에는 다음이 포함됩니다:
- 환자 ID 및 성별
- 출생 연도
- 바이오마커 및 건강 데이터
- BMI 및 흡연 여부와 같은 생활 방식 요인
또한 이름, 이메일, 전화번호와 같은 의료 전문가 데이터도 탈취되었습니다.
Dragonfly라는 그룹은 환자 기록 이상의 것을 훔쳤다고 주장합니다. 그들이 탈취했다고 주장하는 항목은 다음과 같습니다:
- NovoPert라는 이름의 16.7 GB 규모의 학습된 AI 모델
- 407 MB 규모의 독점 생물학적 학습 데이터셋
- 학습 파이프라인의 전체 소스 코드
- 인프라 및 HPC 클러스터의 내부 지도
- 53 GB 이상의 컨테이너 이미지
- 개발자 신원 및 개인 GitHub URL
노보 노디스크는 이러한 AI 관련 주장들을 확인해주지 않았습니다. 랜섬웨어는 발견되지 않았습니다.
만약 이 주장들이 사실이라면, AI 자산은 환자 데이터보다 더 가치가 높습니다. 이러한 모델들은 수년간의 연구를 상징합니다. 경쟁사나 해커들이 막대한 이득을 위해 이 데이터를 사용할 수 있습니다.
이번 침해 사고는 AI를 구축하는 기업들이 직면한 두 가지 주요 문제를 보여줍니다:
AI 인프라는 거대한 공격 표면(attack surface)입니다. 유출된 컨테이너 이미지에는 종종 자격 증명(credentials)과 네트워크 지도가 포함되어 있습니다. 이는 공격자에게 전체 시스템의 설계도를 제공하는 것과 같습니다.
개발자 신원은 공급망 공격(supply chain attacks)으로 이어집니다. 공격자가 어떤 개발자가 어떤 저장소(repo)에서 작업하는지 알게 되면, 정밀하게 타겟팅할 수 있습니다. 타겟이 알려져 있으면 피싱 공격이 훨씬 쉬워집니다.
환자 데이터 유출은 심각한 문제입니다. 하지만 AI 탈취 주장이 사실이라면, 이는 해커들의 운영 방식이 변화하고 있음을 의미합니다. 이제 그들은 AI 모델의 지적 재산을 직접적으로 노리고 있습니다.
귀하의 팀은 AI 학습 인프라를 어떻게 보호하고 있습니까? 이를 연구 구역으로 취급하나요, 아니면 고보안 자산으로 취급하나요?
Optional learning community: https://t.me/GyaanSetuAi