ディープラーニングのビッグバン
あらゆる分野には、転換点が存在します。ディープラーニングにとって、その年は2012年です。
2012年以前、コンピュータビジョンは苦戦していました。研究者たちは、システムのテストにImageNetと呼ばれるデータベースを使用していました。その目的は、画像を1,000の異なるカテゴリに分類することでした。
何年もの間、エラー率は25%前後で停滞していました。進歩は止まり、どうすれば前進できるのか誰も分からなくなっていました。
そんな中、Alex Krizhevsky率いるチームがゲームのルールを変えました。彼らは畳み込みニューラルネットワーク(CNN)を使用したのです。
人間が「画像がどう見えるか」というルールを記述する代わりに、ネットワークはピクセルから直接学習しました。
その結果は驚異的なものでした。わずか1年で、エラー率をほぼ半分にまで削減したのです。
この転換がすべてを変えました。AIを研究室から現実世界へと解き放ったのです。
その影響は急速に広がりました:
- Netflixは、より優れたレコメンデーションのために活用しました。
- SiemensとGEは、医療用画像診断に活用しました。
- 自動車メーカーは、自動運転に活用しました。
- GoogleやAppleといったテック巨人は、あらゆる製品にこれを組み込みました。
この成功はハードウェアに支えられていました。これらのネットワークの学習には膨大な数学的計算が必要です。もともとビデオゲーム用に作られたGPUが、この計算に最適であることが証明されました。これがNVIDIAの台頭を後押ししたのです。
しかし、市場のトレンドは複雑であることを忘れないでください。NVIDIAの成長は、暗号資産マイニングのブームとも結びついていました。市場の変化に対して、単一の原因のみを想定してはいけません。
ディープラーニングはゲームの世界も征服しました。
チェスは総当たり(ブルートフォース)で解かれました。しかし、囲碁は異なります。囲碁の可能な指し手の数は、いかなるコンピュータでも数えきれないほど膨大です。2016年、AlphaGoは、ディープラーニングが人間の助けなしに戦略を学習できることを証明しました。それは、自分自身と対局することで学習したのです。
教訓は単純です。
従来の手法が失敗したのは、人間がルールを手動でコーディングしなければならなかったからです。私たちは限界に突き当たっていました。ディープラーニングはその限界を打ち破りました。なぜなら、システムが生のデータから独自のパターンを学習できるようになったからです。
このシリーズでは、私のディープラーニング講座のノートを詳しく解説していきます。これらのネットワークが実際にどのように機能するのかを見ていきましょう。
次回は、ネットワークが学習する際に内部で何が起きているのかを説明します。
Source: https://dev.to/fahimu10/the-big-bang-of-deep-learning-how-2012-changed-everything-3lb3
Optional learning community: https://t.me/GyaanSetuAi
