深度学习的大爆炸
每个领域都有一个分水岭。对于深度学习而言,那一年是 2012 年。
在 2012 年之前,计算机视觉领域举步维艰。研究人员使用一个名为 ImageNet 的数据库来测试系统。目标是将图像分为 1,000 个不同的类别。
多年来,错误率一直维持在 25% 左右。进展停滞不前。没人知道该如何继续前进。
随后,由 Alex Krizhevsky 领导的一个团队改变了游戏规则。他们使用了卷积神经网络 (CNN)。
网络不再是由人类编写规则来定义图像的样子,而是直接从像素中学习。
结果是巨大的。他们在一年内将错误率降低了近一半。
这一转变改变了一切。它将人工智能从研究实验室带入了现实世界。
影响迅速扩散:
- Netflix 用它来提供更好的推荐。
- 西门子 (Siemens) 和通用电气 (GE) 将其用于医学影像。
- 汽车制造商将其用于自动驾驶。
- Google 和 Apple 等科技巨头将其融入到每一件产品中。
这一成功依赖于硬件。训练这些网络需要进行海量的数学运算。最初为视频游戏设计的 GPU 被证明非常适合这种数学运算。这推动了 NVIDIA 的崛起。
但请记住,市场趋势是复杂的。NVIDIA 的增长也与加密货币挖矿热潮有关。永远不要假设市场转变只有一个单一原因。
深度学习也征服了游戏。
国际象棋可以通过暴力破解来解决。围棋则不同。围棋中可能的走法多到任何计算机都无法计数。2016 年,AlphaGo 证明了深度学习可以在没有人类帮助的情况下学习策略。它是通过自我对弈来学习的。
道理很简单。
旧方法之所以失败,是因为人类必须手动编写规则。我们遇到了瓶颈。深度学习打破了这一瓶颈,因为系统现在可以从原始数据中学习自身的模式。
在这个系列中,我将拆解我的深度学习课程笔记。我们将探讨这些网络究竟是如何工作的。
接下来,我将解释网络在学习时内部发生了什么。
Source: https://dev.to/fahimu10/the-big-bang-of-deep-learning-how-2012-changed-everything-3lb3
Optional learning community: https://t.me/GyaanSetuAi
