딥러닝의 빅뱅
모든 분야에는 분기점이 있습니다. 딥러닝의 경우, 그 해는 바로 2012년입니다.
2012년 이전에는 컴퓨터 비전 분야가 난항을 겪었습니다. 연구자들은 시스템을 테스트하기 위해 ImageNet이라는 데이터베이스를 사용했습니다. 목표는 이미지를 1,000개의 서로 다른 카테고리로 분류하는 것이었습니다.
수년 동안 오류율은 25% 내외에 머물렀습니다. 발전은 멈췄고, 아무도 어떻게 앞으로 나아가야 할지 알지 못했습니다.
그러던 중, Alex Krizhevsky가 이끄는 팀이 판도를 바꿨습니다. 그들은 합성곱 신경망(Convolutional Neural Network, CNN)을 사용했습니다.
사람이 이미지의 특징에 대한 규칙을 직접 작성하는 대신, 네트워크가 픽셀로부터 직접 학습했습니다.
결과는 엄청났습니다. 단 1년 만에 오류율을 거의 절반으로 줄였습니다.
이러한 변화는 모든 것을 바꾸어 놓았습니다. AI를 연구실에서 현실 세계로 끌어냈습니다.
영향은 빠르게 확산되었습니다:
- Netflix는 더 나은 추천 서비스를 위해 이를 활용했습니다.
- Siemens와 GE는 의료 영상 분야에 이를 사용했습니다.
- 자동차 제조사들은 자율 주행을 위해 이를 활용했습니다.
- Google과 Apple 같은 빅테크 기업들은 모든 제품에 이를 탑재했습니다.
이 성공은 하드웨어에 의존했습니다. 이러한 네트워크를 학습시키려면 방대한 양의 수학 연산이 필요합니다. 원래 비디오 게임용으로 만들어졌던 GPU가 이러한 수학 연산에 완벽하다는 것이 증명되었습니다. 이는 NVIDIA의 급성장을 이끌었습니다.
하지만 시장 트렌드는 복잡하다는 점을 기억해야 합니다. NVIDIA의 성장은 암호화폐 채굴 붐과도 맞물려 있었습니다. 시장의 변화를 단 하나의 원인으로만 단정 지어서는 안 됩니다.
딥러닝은 게임 분야도 정복했습니다.
체스는 무차별 대입(brute force) 방식으로 해결되었습니다. 하지만 바둑은 다릅니다. 바둑의 가능한 수는 어떤 컴퓨터로도 다 셀 수 없을 만큼 방대합니다. 2016년, AlphaGo는 딥러닝이 인간의 도움 없이도 전략을 학습할 수 있음을 증명했습니다. AlphaGo는 스스로와 대국하며 학습했습니다.
교훈은 간단합니다.
기존 방식은 사람이 규칙을 직접 코딩해야 했기 때문에 한계에 부딪혔습니다. 우리는 벽에 막혀 있었습니다. 딥러닝은 시스템이 원시 데이터(raw data)로부터 스스로 패턴을 학습하기 때문에 그 한계를 깨뜨렸습니다.
이 시리즈를 통해 저의 딥러닝 강의 노트를 하나씩 풀어보겠습니다. 이러한 네트워크가 실제로 어떻게 작동하는지 살펴볼 것입니다.
다음으로, 네트워크가 학습할 때 내부에서 어떤 일이 일어나는지 설명하겠습니다.
Source: https://dev.to/fahimu10/the-big-bang-of-deep-learning-how-2012-changed-everything-3lb3
Optional learning community: https://t.me/GyaanSetuAi
