จุดเริ่มต้นครั้งยิ่งใหญ่ของ Deep Learning
ทุกสาขาวิชามีจุดเปลี่ยนสำคัญ สำหรับ Deep Learning ปีนั้นคือปี 2012
ก่อนปี 2012 เทคโนโลยี Computer Vision ยังคงประสบปัญหา นักวิจัยใช้ฐานข้อมูลที่ชื่อว่า ImageNet ในการทดสอบระบบ โดยมีเป้าหมายเพื่อจำแนกรูปภาพออกเป็น 1,000 หมวดหมู่ที่แตกต่างกัน
เป็นเวลาหลายปีที่อัตราความผิดพลาด (error rate) คงอยู่ที่ประมาณ 25% ความก้าวหน้าหยุดชะงัก และไม่มีใครรู้ว่าจะก้าวต่อไปอย่างไร
จนกระทั่งทีมที่นำโดย Alex Krizhevsky ได้เข้ามาเปลี่ยนเกม พวกเขาใช้ Convolutional Neural Network (CNN)
แทนที่จะให้มนุษย์เขียนกฎเกณฑ์ว่ารูปภาพควรมีลักษณะอย่างไร เครือข่ายนี้กลับเรียนรู้โดยตรงจากพิกเซล (pixels)
ผลลัพธ์ที่ได้นั้นมหาศาล พวกเขาสามารถลดอัตราความผิดพลาดลงได้เกือบครึ่งหนึ่งภายในปีเดียว
การเปลี่ยนแปลงนี้เปลี่ยนทุกอย่าง มันทำให้ AI ย้ายจากห้องวิจัยเข้าสู่โลกแห่งความเป็นจริง
ผลกระทบนั้นแพร่กระจายไปอย่างรวดเร็ว:
- Netflix นำไปใช้เพื่อการแนะนำ (recommendations) ที่ดียิ่งขึ้น
- Siemens และ GE นำไปใช้ในด้านการสร้างภาพทางการแพทย์ (medical imaging)
- ผู้ผลิตรถยนต์นำไปใช้สำหรับการขับขี่อัตโนมัติ (autonomous driving)
- ยักษ์ใหญ่ทางเทคโนโลยีอย่าง Google และ Apple ได้นำมันไปใส่ไว้ในทุกผลิตภัณฑ์
ความสำเร็จนี้ต้องพึ่งพาฮาร์ดแวร์ การฝึกฝนเครือข่ายเหล่านี้ต้องใช้การคำนวณทางคณิตศาสตร์มหาศาล ซึ่ง GPU ที่เดิมทีสร้างขึ้นเพื่อเล่นวิดีโอเกม กลับพิสูจน์แล้วว่าเหมาะอย่างยิ่งสำหรับการคำนวณนี้ และนี่คือสิ่งที่ขับเคลื่อนการเติบโตของ NVIDIA
แต่โปรดจำไว้ว่า แนวโน้มของตลาดนั้นมีความซับซ้อน การเติบโตของ NVIDIA ยังเชื่อมโยงกับยุคทองของการขุดคริปโต (crypto mining) ด้วย อย่าด่วนสรุปว่าการเปลี่ยนแปลงของตลาดเกิดจากสาเหตุเพียงอย่างเดียว
Deep Learning ยังพิชิตโลกของเกมอีกด้วย
หมากรุก (Chess) ถูกแก้โจทย์ได้ด้วยวิธี brute force แต่เกม Go นั้นแตกต่างกัน เพราะจำนวนตาเดินที่เป็นไปได้ในเกม Go นั้นมีมากเกินกว่าที่คอมพิวเตอร์เครื่องใดจะนับได้ ในปี 2016 AlphaGo ได้พิสูจน์ให้เห็นว่า Deep Learning สามารถเรียนรู้กลยุทธ์ได้โดยไม่ต้องพึ่งพามนุษย์ โดยมันเรียนรู้จากการเล่นกับตัวเอง
บทเรียนนี้เรียบง่ายมาก
วิธีการแบบเก่าล้มเหลวเพราะมนุษย์ต้องเขียนโค้ดกฎเกณฑ์ขึ้นมาเอง เราจึงติดเพดานจำกัด แต่ Deep Learning ได้ทำลายเพดานนั้นลง เพราะปัจจุบันระบบสามารถเรียนรู้รูปแบบ (patterns) ของตัวเองได้จากข้อมูลดิบ (raw data)
ในซีรีส์นี้ ผมจะนำสรุปเนื้อหาจากคอร์ส Deep Learning ของผมมาถ่ายทอด เราจะมาดูกันว่าเครือข่ายเหล่านี้ทำงานอย่างไรในความเป็นจริง
ลำดับถัดไป ผมจะอธิบายว่าเกิดอะไรขึ้นภายในเครือข่ายในขณะที่มันกำลังเรียนรู้
Source: https://dev.to/fahimu10/the-big-bang-of-deep-learning-how-2012-changed-everything-3lb3
Optional learning community: https://t.me/GyaanSetuAi
