𝗧𝗵𝗿𝗲𝗲 𝗜𝗱𝗲𝗮𝘀 𝗧𝗵𝗮𝘁 𝗠𝗮𝗱𝗲 𝗠𝗼𝗱𝗲𝗿𝗻 𝗔𝗜 𝗣𝗼𝘀𝘀𝗶𝗯𝗹𝗲

আধুনিক AI দেখতে জাদুর মতো মনে হয়। আপনি একটি বাক্য লিখলেন আর একটি মেশিন তার উত্তর লিখে দিল। এটি অদ্ভুত বা বিজাতীয় মনে হতে পারে। কিন্তু আসলে তা নয়।

প্রায় প্রতিটি মডেলের পেছনের আর্কিটেকচার মূলত সাধারণ কিছু ইঞ্জিনিয়ারিং সমাধানের ওপর দাঁড়িয়ে আছে। এই সমাধানগুলো নির্দিষ্ট কিছু সমস্যার সমাধান করেছে। এখানে কোনো গোপন রহস্য নেই। আছে শুধু তিনটি মূল সমাধান।

১. Skip Connections

২০১৪ সালের দিকে ইঞ্জিনিয়াররা নিউরাল নেটওয়ার্কগুলোকে আরও গভীর (deeper) করার চেষ্টা করেছিলেন। তারা ভেবেছিলেন যত বেশি লেয়ার হবে, ফলাফল তত ভালো হবে। কিন্তু তারা ভুল ছিলেন। গভীর নেটওয়ার্কগুলো প্রায়ই খারাপ পারফর্ম করত কারণ এরর সিগন্যাল (error signal) শুরুর দিকের লেয়ারগুলোতে পৌঁছাতে পারত না। সিগন্যালটি হয় একদম কমে শূন্য হয়ে যেত অথবা মাত্রাতিরিক্ত বেড়ে যেত।

Skip connections এই সমস্যার সমাধান করেছে। প্রতিটি লেয়ারকে ইনপুট পরিবর্তন করতে বাধ্য না করে, আপনি ইনপুটকে সরাসরি পরের ধাপে চলে যেতে দেন। আপনি মূল ইনপুটটিকে আউটপুটের সাথে পুনরায় যোগ করে দেন।

এটি দুটি কাজ করে:

  • এটি "কিছু না করা"-কে সহজ করে তোলে। যদি কোনো লেয়ার কোনো বাড়তি ভ্যালু যোগ না করে, তবে ইনপুটটি অপরিবর্তিত অবস্থায় প্রবাহিত হয়।
  • এটি এরর সিগন্যালের জন্য একটি সরাসরি পথ তৈরি করে। সিগন্যালটি শুরুর দিকের লেয়ারগুলোতে পৌঁছানোর জন্য একটি এক্সপ্রেস লেন পায়।

২. Normalization

যখন ডেটা একটি নেটওয়ার্কের মধ্য দিয়ে প্রবাহিত হয়, তখন সংখ্যাগুলোর স্কেল বা মান পরিবর্তিত হতে থাকে। একটি লেয়ার হয়তো ০.০১ তৈরি করতে পারে, আবার পরেরটি হয়তো ৫০০০ তৈরি করতে পারে। যখন সংখ্যাগুলো এই চরম পর্যায়ে পৌঁছায়, তখন শেখার প্রক্রিয়া (learning) থেমে যায়।

Normalization এই মানগুলোকে সামঞ্জস্যপূর্ণ করে তোলে। এটি সংখ্যাগুলোকে শূন্যের আশেপাশে পুনরায় কেন্দ্র করে এবং একটি নির্দিষ্ট স্কেলে রাখে। এটি আপনাকে উচ্চতর লার্নিং রেট ব্যবহার করতে এবং অনেক দ্রুত প্রশিক্ষণ দিতে সাহায্য করে। এটি গাণিতিক প্রক্রিয়াকে সচল রাখে।

৩. Attention

পুরনো মডেলগুলো টেক্সট একবারে একটি করে শব্দ পড়ে। এটি ছিল ধীরগতির এবং ভুলে যাওয়ার প্রবণতা সম্পন্ন। প্রথম শব্দের সাথে শেষ শব্দকে যুক্ত করতে হলে তথ্যকে মাঝখানের প্রতিটি শব্দের মধ্য দিয়ে যেতে হতো। ফলে শেষ নাগাদ শুরুর দিকের তথ্য হারিয়ে যেত।

Attention এই বিষয়টি বদলে দেয়। ক্রমানুসারে পড়ার পরিবর্তে, প্রতিটি শব্দ বাক্যের অন্যান্য প্রতিটি শব্দের দিকে একসাথে নজর দেয়। "it" শব্দটি তার সংশ্লিষ্ট noun-টির দিকে সরাসরি তাকাতে পারে, তা সে যত দূরেই থাকুক না কেন।

যেহেতু কোনো কিছু নির্দিষ্ট ক্রমের ওপর নির্ভর করে না, তাই আপনি সবকিছু একসাথে প্রসেস করতে পারেন। এটি প্রশিক্ষণকে দ্রুত এবং দক্ষ করে তোলে।

Transformer হলো এই তিনটি ধারণার সমন্বয়ে তৈরি একটি কাঠামো। এটি skip connections-এর মাধ্যমে ঘেরা attention blocks ব্যবহার করে এবং এর মাঝে normalization থাকে।

AI কোনো জাদু নয়। এটি হলো কোনো কিছু ত্রুটিপূর্ণ দেখে তা সাধারণ গণিতের মাধ্যমে ঠিক করার একটি ফলাফল।

উৎস: https://dev.to/karthi_raman_02ec8161bda/three-ideas-made-modern-ai-possible-none-of-them-are-magic-ida

ঐচ্ছিক লার্নিং কমিউনিটি: https://t.me/GyaanSetuAi