ディープラーニングのビッグバン

あらゆる分野には、転換点が存在します。ディープラーニングにとって、その年は2012年です。

2012年以前、コンピュータビジョンは苦戦していました。研究者たちは、システムのテストにImageNetと呼ばれるデータベースを使用していました。その目的は、画像を1,000の異なるカテゴリに分類することでした。

何年もの間、エラー率は25%前後で停滞していました。進歩は止まり、どうすれば前進できるのか誰も分からなくなっていました。

そんな中、Alex Krizhevsky率いるチームがゲームのルールを変えました。彼らは畳み込みニューラルネットワーク(CNN)を使用したのです。

人間が「画像がどう見えるか」というルールを記述する代わりに、ネットワークはピクセルから直接学習しました。

その結果は驚異的なものでした。わずか1年で、エラー率をほぼ半分にまで削減したのです。

この転換がすべてを変えました。AIを研究室から現実世界へと解き放ったのです。

その影響は急速に広がりました:

  • Netflixは、より優れたレコメンデーションのために活用しました。
  • SiemensとGEは、医療用画像診断に活用しました。
  • 自動車メーカーは、自動運転に活用しました。
  • GoogleやAppleといったテック巨人は、あらゆる製品にこれを組み込みました。

この成功はハードウェアに支えられていました。これらのネットワークの学習には膨大な数学的計算が必要です。もともとビデオゲーム用に作られたGPUが、この計算に最適であることが証明されました。これがNVIDIAの台頭を後押ししたのです。

しかし、市場のトレンドは複雑であることを忘れないでください。NVIDIAの成長は、暗号資産マイニングのブームとも結びついていました。市場の変化に対して、単一の原因のみを想定してはいけません。

ディープラーニングはゲームの世界も征服しました。

チェスは総当たり(ブルートフォース)で解かれました。しかし、囲碁は異なります。囲碁の可能な指し手の数は、いかなるコンピュータでも数えきれないほど膨大です。2016年、AlphaGoは、ディープラーニングが人間の助けなしに戦略を学習できることを証明しました。それは、自分自身と対局することで学習したのです。

教訓は単純です。

従来の手法が失敗したのは、人間がルールを手動でコーディングしなければならなかったからです。私たちは限界に突き当たっていました。ディープラーニングはその限界を打ち破りました。なぜなら、システムが生のデータから独自のパターンを学習できるようになったからです。

このシリーズでは、私のディープラーニング講座のノートを詳しく解説していきます。これらのネットワークが実際にどのように機能するのかを見ていきましょう。

次回は、ネットワークが学習する際に内部で何が起きているのかを説明します。

Source: https://dev.to/fahimu10/the-big-bang-of-deep-learning-how-2012-changed-everything-3lb3

Optional learning community: https://t.me/GyaanSetuAi