Novo Nordiskのデータ流出がAIのリスクを露呈
Novo Nordiskは今週、サイバー攻撃を受けたことを認めました。OzempicやWegovyを展開する同社は、内部のITデータを紛失しました。攻撃者は、臨床試験から仮名化された患者データを奪取しました。
盗まれた患者情報は以下の通りです:
- 患者IDおよび性別
- 出生年
- バイオマーカーおよび健康データ
- BMIや喫煙状況などのライフスタイル要因
また、医療従事者の氏名、メールアドレス、電話番号などのデータも奪われました。
Dragonflyと呼ばれるグループは、患者の記録だけでなく、それ以上のものを盗み出したと主張しています。彼らの主張によれば、以下のものが奪われました:
- NovoPertという名称の16.7 GBの学習済みAIモデル
- 407 MBの独自の生物学的トレーニングデータセット
- トレーニングパイプラインの完全なソースコード
- インフラストラクチャおよびHPCクラスターの内部マップ
- 53 GBを超えるコンテナイメージ
- 開発者の身元およびプライベートなGitHub URL
Novo Nordiskは、これらのAIに関する主張を認めていません。ランサムウェアは発見されていません。
もしこれらの主張が事実であれば、AI資産は患者データよりも価値が高いものとなります。これらのモデルは何年にもわたる研究の成果です。競合他社やハッカーが、このデータを莫大な利益のために利用する可能性があります。
この流出事件は、AIを構築している企業にとっての2つの大きな問題を示しています:
AIインフラストラクチャは巨大な攻撃対象領域(アタックサーフェス)である。 流出したコンテナイメージには、認証情報やネットワークマップが含まれていることがよくあります。これにより、攻撃者はシステム全体の設計図を手に入れることになります。
開発者の身元がサプライチェーン攻撃につながる。 攻撃者がどの開発者がどのリポジトリを担当しているかを知ると、ピンポイントで標的にすることができます。ターゲットが特定されていると、フィッシング詐欺は格段に容易になります。
患者データの流出は深刻な問題です。しかし、もしAI窃盗の主張が事実であれば、これはハッカーの活動様式の変化を意味します。彼らは今、AIモデルに含まれる知的財産を直接の標的にしているのです。
あなたのチームは、どのようにAIトレーニングインフラを保護していますか? それを研究ゾーンとして扱っていますか、それとも高セキュリティ資産として扱っていますか?
オプションの学習コミュニティ: https://t.me/GyaanSetuAi