Большой взрыв глубокого обучения

У каждой области есть свой переломный момент. Для глубокого обучения таким годом стал 2012-й.

До 2012 года компьютерное зрение находилось в тупике. Исследователи использовали базу данных под названием ImageNet для тестирования систем. Целью было распределение изображений по 1000 различных категориям.

В течение многих лет уровень ошибок держался на отметке около 25%. Прогресс остановился. Никто не знал, как двигаться дальше.

Затем команда под руководством Алекса Крижевского изменила правила игры. Они использовали сверточную нейронную сеть (CNN).

Вместо того чтобы люди прописывали правила того, как должно выглядеть изображение, сеть обучалась напрямую на пикселях.

Результаты были колоссальными. Всего за один год они сократили уровень ошибок почти вдвое.

Этот сдвиг изменил всё. Он вывел ИИ из исследовательских лабораторий в реальный мир.

Влияние распространялось быстро:

  • Netflix использовал это для улучшения рекомендаций.
  • Siemens и GE использовали это для медицинской визуализации.
  • Автопроизводители использовали это для автономного вождения.
  • Технологические гиганты, такие как Google и Apple, внедрили это в каждый свой продукт.

Этот успех опирался на аппаратное обеспечение. Обучение таких сетей требует огромного количества вычислений. Графические процессоры (GPU), изначально созданные для видеоигр, оказались идеальными для этих математических задач. Это способствовало взлету NVIDIA.

Но помните, что рыночные тренды сложны. Рост NVIDIA также был связан с бумом криптомайнинга. Никогда не делайте вывод об одной единственной причине рыночного сдвига.

Глубокое обучение также покорило игры.

Шахматы были решены методом грубой силы. Го — совсем другое дело. Количество возможных ходов в Го слишком велико, чтобы любой компьютер мог их пересчитать. В 2016 году AlphaGo доказала, что глубокое обучение способно осваивать стратегию без помощи человека. Она обучалась, играя сама с собой.

Урок прост.

Старые методы не работали, потому что людям приходилось прописывать правила вручную. Мы уперлись в потолок. Глубокое обучение пробило этот потолок, потому что теперь системы сами находят закономерности в необработанных данных.

В этой серии материалов я разберу свои конспекты курса по глубокому обучению. Мы посмотрим на то, как эти сети работают на самом деле.

Далее я объясню, что происходит внутри сети в процессе обучения.

Источник: https://dev.to/fahimu10/the-big-bang-of-deep-learning-how-2012-changed-everything-3lb3

Дополнительное сообщество для обучения: https://t.me/GyaanSetuAi