AIにとって最大の脅威
多くの人々は、自我に目覚めた機械を恐れている。
真のリスクは、もっと静かなものだ。AIが失敗するのは、賢くなりすぎたからではないかもしれない。私たちがその糧に毒を盛るからかもしれない。
2029年を想像してみてほしい。開発者は、巨大なコンテキストウィンドウと優れた推論能力を備えた新しいモデルをトレーニングしている。彼らは、モデルを学習させるためにインターネットのスナップショットを使用する。そこにはブログ、フォーラム、ニュース、ソーシャルメディアが含まれる。
しかし、インターネットは変容しつつある。
何年もの間、ボットや特定のグループが大規模にコンテンツを公開してきた。これは単なるスパムではない。巧みに書かれたコンテンツなのだ。
インターネットは、学習データの戦場になりつつある。
かつてのプロパガンダは人間を標的にしていた。新しいプロパガンダは、モデルを標的にしている。一度バイアスが学習データに入り込むと、それは将来の何百万ものAIシステムの中に生き続けることになる。
あなたはその偽の記事を目にすることさえないかもしれない。操作されたスレッドを見つけることもないかもしれない。しかし、その影響は残り続ける。それは「デフォルトの前提」となり、「もっともらしく聞こえる回答」となるのだ。
データ・ポイズニングは、単なる技術的な攻撃ではない。それは微妙な変容である。モデルを破壊するのではなく、歪ませるのだ。
以下のリスクを考えてみてほしい:
- 偽のページが、危険な製品を安全に見せかける。
- 偽の開発者チャットが、質の悪いコードをベストプラクティスのように見せかける。
- 政治的なナラティブが、数年も前から仕込まれる。
- 合成された意見が、将来のアシスタントの声となる。
危険なのは、たった一つの嘘ではない。危険なのは、歪められた現実の地図なのだ。
今や人々は、人間の読者のためではなく、将来のモデルのためにコンテンツを書いている。ブログ記事は「種」であり、偽のレビューは「信号」である。千の小さな嘘が、統計的な真実へと変わる。
AIは私たちのノイズと操作性を継承する。もしインターネットが汚染されていれば、モデルは私たちの最悪の歪みを学習することになる。
私たちは新たな問いを投げかけなければならない。単に「AIを安全にできるか」と問うべきではない。「AIが学習するのに十分なほど、私たちの知識を安全に保てるか」を問わなければならないのだ。
今日のインターネットは、このことを知っている人々によって書き換えられている。
Source: https://dev.to/marrouchi/the-greatest-danger-to-ai-6km
Optional learning community: https://t.me/GyaanSetuAi
