ডিপ লার্নিংয়ের মহাবিস্ফোরণ
প্রতিটি ক্ষেত্রেরই একটি বিভাজন বিন্দু থাকে। ডিপ লার্নিংয়ের ক্ষেত্রে সেই বছরটি হলো ২০১২।
২০১২ সালের আগে, কম্পিউটার ভিশন (computer vision) বেশ বেগ পেতেছিল। গবেষকরা সিস্টেমগুলো পরীক্ষা করার জন্য ImageNet নামক একটি ডাটাবেস ব্যবহার করতেন। লক্ষ্য ছিল ছবিগুলোকে ১,০০০টি ভিন্ন ভিন্ন শ্রেণিতে বিন্যস্ত করা।
বছরের পর বছর ধরে ত্রুটির হার (error rate) প্রায় ২৫% এর আশেপাশে ছিল। অগ্রগতি থেমে গিয়েছিল। কীভাবে সামনে এগোতে হবে তা কেউ জানত না।
তারপর, Alex Krizhevsky-এর নেতৃত্বে একটি দল পুরো খেলার মোড় ঘুরিয়ে দেয়। তারা একটি Convolutional Neural Network (CNN) ব্যবহার করেছিল।
একটি ছবি দেখতে কেমন হবে তার জন্য মানুষের নিয়ম লিখে দেওয়ার পরিবর্তে, নেটওয়ার্কটি সরাসরি পিক্সেল থেকে শিখতে শুরু করে।
ফলাফল ছিল বিশাল। তারা মাত্র এক বছরে ত্রুটির হার প্রায় অর্ধেক করে ফেলেছিল।
এই পরিবর্তন সবকিছু বদলে দিয়েছিল। এটি AI-কে গবেষণা গবেষণাগার থেকে বাস্তব জগতে নিয়ে আসে।
এর প্রভাব দ্রুত ছড়িয়ে পড়ে:
- Netflix এটি ব্যবহার করেছিল আরও উন্নত রিকমেন্ডেশনের জন্য।
- Siemens এবং GE এটি ব্যবহার করেছিল মেডিকেল ইমেজিংয়ের জন্য।
- গাড়ি নির্মাতারা এটি ব্যবহার করেছিল স্বয়ংক্রিয় ড্রাইভিংয়ের (autonomous driving) জন্য।
- Google এবং Apple-এর মতো প্রযুক্তি জায়ান্টরা তাদের প্রতিটি পণ্যে এটি যুক্ত করেছে।
এই সাফল্য হার্ডওয়্যারের ওপর নির্ভরশীল ছিল। এই নেটওয়ার্কগুলো প্রশিক্ষণের জন্য প্রচুর গাণিতিক হিসাবের প্রয়োজন হয়। GPU, যা মূলত ভিডিও গেমের জন্য তৈরি করা হয়েছিল, এই গাণিতিক কাজের জন্য উপযুক্ত প্রমাণিত হয়। এটি NVIDIA-এর উত্থান ত্বরান্বিত করেছিল।
তবে মনে রাখবেন, বাজারের প্রবণতাগুলো জটিল। NVIDIA-এর প্রবৃদ্ধি ক্রিপ্টো মাইনিং বুমের সাথেও যুক্ত ছিল। বাজারের পরিবর্তনের জন্য কখনোই একটি মাত্র কারণ ধরে নেবেন না।
ডিপ লার্নিং গেমের জগতেও জয়লাভ করেছে।
দাবা (Chess) ব্রুট ফোর্স (brute force) দিয়ে সমাধান করা সম্ভব ছিল। কিন্তু Go খেলাটি ভিন্ন। Go-তে সম্ভাব্য চালের সংখ্যা এত বেশি যে কোনো কম্পিউটারের পক্ষে তা গণনা করা অসম্ভব। ২০১৬ সালে, AlphaGo প্রমাণ করেছিল যে ডিপ লার্নিং মানুষের সাহায্য ছাড়াই কৌশল শিখতে পারে। এটি নিজের সাথেই খেলে শিখতে পেরেছিল।
শিক্ষাটি সহজ।
পুরনো পদ্ধতিগুলো ব্যর্থ হয়েছিল কারণ মানুষকে নিয়মগুলো হাতে কোড করে দিতে হতো। আমরা একটি সীমাবদ্ধতার মুখে পড়েছিলাম। ডিপ লার্নিং সেই সীমাবদ্ধতা ভেঙে ফেলেছে কারণ সিস্টেমগুলো এখন র ডেটা (raw data) থেকে নিজস্ব প্যাটার্ন শিখতে পারে।
এই সিরিজে, আমি আমার ডিপ লার্নিং কোর্সের নোটগুলো বিস্তারিতভাবে ব্যাখ্যা করব। আমরা দেখব কীভাবে এই নেটওয়ার্কগুলো আসলে কাজ করে।
এরপর, আমি ব্যাখ্যা করব একটি নেটওয়ার্ক যখন শেখে তখন তার ভেতরে কী ঘটে।
