AIにとって最大の脅威

多くの人は、意識を持つようになった機械を恐れている。

真の脅威は、もっと静かなものだ。

AIが失敗するのは、賢くなりすぎるからではない。学習データが汚染されるからだ。

2029年までに、モデルはより大規模になり、推論能力も向上し、より多くのエージェントを備えるようになるだろう。企業はそれらをより信頼するようになる。

これらのモデルはインターネット上で学習を行う。ブログ、フォーラム、ソーシャルメディア、研究論文などを読み込むのだ。

しかし、インターネットは変容している。

ボット、企業、政治団体が、今や大規模にコンテンツを公開している。彼らが投稿するのは単なるスパムではない。巧みに書かれた、信憑性のあるコンテンツだ。

インターネットは、学習データセットを巡る戦場になりつつある。

従来のプロパガンダは人間を標的にする。しかし、AIの世界では、標的はモデルそのものだ。

もし嘘や偏見が学習データに入り込めば、それはAIの一部となる。それは単なる引用として留まるのではない。デフォルトの前提となり、「正解らしく聞こえる回答」へと変貌するのだ。

これは単なる技術的な攻撃ではない。巧妙な変化なのだ。

目的はモデルを壊すことではない。モデルを「歪める」ことにある。

次のようなリスクを考えてみてほしい:

  • 何千もの偽ページによって、ある製品が安全であるかのように見せかける。
  • 開発者の偽のチャットによって、安全でないコードをベストプラクティスのように見せかける。
  • 選挙の数年も前から、政治的なストーリーが仕込まれる。
  • 合成された意見が、将来のアシスタントの声となる。

脅威は、たった一つの嘘ではない。脅威は、歪められた現実の地図なのだ。

インターネットはコミュニケーションと商業のために作られたものであり、クリーンなデータセットとして作られたわけではない。

人々は今、人間の読者のためではなく、将来のモデルのために書いている。

  • ブログ記事が「種」となる。
  • 偽のレビューが「学習シグナル」となる。
  • 技術記事が「振る舞いの示唆」となる。

千の小さな嘘が、統計的な真実となる。

AIは私たちの文書、ノイズ、そして操作を継承する。もしインターネットが汚染されたままなら、モデルは私たちの歪みを学習することになる。

問題は単に「どうすればAIを安全にできるか?」ではない。

真の問いは、「AIが学習するための知識を、いかにして安全に保つか?」だ。

明日のモデルは、今日のインターネットから学ぶ。そして人々は、すでにそれらのモデルに向けて書いているのだ。

Source: https://dev.to/marrouchi/the-greatest-danger-to-ai-6km