তিনটি ধারণা যা আধুনিক এআই-কে সম্ভব করে তুলেছে

Translated for your language. Read the original.

AI-assisted draft.

𝗧𝗵𝗿𝗲𝗲 𝗜𝗱𝗲𝗮𝘀 𝗧𝗵𝗮𝘁 𝗠𝗮𝗱𝗲 𝗠𝗼𝗱𝗲𝗿𝗻 𝗔𝗜 𝗣𝗼𝘀𝘀𝗶𝗯𝗹𝗲

আধুনিক AI দেখতে জাদুর মতো মনে হয়। আপনি একটি বাক্য লিখলেন আর একটি মেশিন তার উত্তর লিখে দিল। এটি অদ্ভুত বা বিজাতীয় মনে হতে পারে। কিন্তু আসলে তা নয়।

প্রায় প্রতিটি মডেলের পেছনের আর্কিটেকচার মূলত সাধারণ কিছু ইঞ্জিনিয়ারিং সমাধানের ওপর দাঁড়িয়ে আছে। এই সমাধানগুলো নির্দিষ্ট কিছু সমস্যার সমাধান করেছে। এখানে কোনো গোপন রহস্য নেই। আছে শুধু তিনটি মূল সমাধান।

১. Skip Connections

২০১৪ সালের দিকে ইঞ্জিনিয়াররা নিউরাল নেটওয়ার্কগুলোকে আরও গভীর (deeper) করার চেষ্টা করেছিলেন। তারা ভেবেছিলেন যত বেশি লেয়ার হবে, ফলাফল তত ভালো হবে। কিন্তু তারা ভুল ছিলেন। গভীর নেটওয়ার্কগুলো প্রায়ই খারাপ পারফর্ম করত কারণ এরর সিগন্যাল (error signal) শুরুর দিকের লেয়ারগুলোতে পৌঁছাতে পারত না। সিগন্যালটি হয় একদম কমে শূন্য হয়ে যেত অথবা মাত্রাতিরিক্ত বেড়ে যেত।

Skip connections এই সমস্যার সমাধান করেছে। প্রতিটি লেয়ারকে ইনপুট পরিবর্তন করতে বাধ্য না করে, আপনি ইনপুটকে সরাসরি পরের ধাপে চলে যেতে দেন। আপনি মূল ইনপুটটিকে আউটপুটের সাথে পুনরায় যোগ করে দেন।

এটি দুটি কাজ করে:

এটি "কিছু না করা"-কে সহজ করে তোলে। যদি কোনো লেয়ার কোনো বাড়তি ভ্যালু যোগ না করে, তবে ইনপুটটি অপরিবর্তিত অবস্থায় প্রবাহিত হয়।
এটি এরর সিগন্যালের জন্য একটি সরাসরি পথ তৈরি করে। সিগন্যালটি শুরুর দিকের লেয়ারগুলোতে পৌঁছানোর জন্য একটি এক্সপ্রেস লেন পায়।

২. Normalization

যখন ডেটা একটি নেটওয়ার্কের মধ্য দিয়ে প্রবাহিত হয়, তখন সংখ্যাগুলোর স্কেল বা মান পরিবর্তিত হতে থাকে। একটি লেয়ার হয়তো ০.০১ তৈরি করতে পারে, আবার পরেরটি হয়তো ৫০০০ তৈরি করতে পারে। যখন সংখ্যাগুলো এই চরম পর্যায়ে পৌঁছায়, তখন শেখার প্রক্রিয়া (learning) থেমে যায়।

Normalization এই মানগুলোকে সামঞ্জস্যপূর্ণ করে তোলে। এটি সংখ্যাগুলোকে শূন্যের আশেপাশে পুনরায় কেন্দ্র করে এবং একটি নির্দিষ্ট স্কেলে রাখে। এটি আপনাকে উচ্চতর লার্নিং রেট ব্যবহার করতে এবং অনেক দ্রুত প্রশিক্ষণ দিতে সাহায্য করে। এটি গাণিতিক প্রক্রিয়াকে সচল রাখে।

৩. Attention

পুরনো মডেলগুলো টেক্সট একবারে একটি করে শব্দ পড়ে। এটি ছিল ধীরগতির এবং ভুলে যাওয়ার প্রবণতা সম্পন্ন। প্রথম শব্দের সাথে শেষ শব্দকে যুক্ত করতে হলে তথ্যকে মাঝখানের প্রতিটি শব্দের মধ্য দিয়ে যেতে হতো। ফলে শেষ নাগাদ শুরুর দিকের তথ্য হারিয়ে যেত।

Attention এই বিষয়টি বদলে দেয়। ক্রমানুসারে পড়ার পরিবর্তে, প্রতিটি শব্দ বাক্যের অন্যান্য প্রতিটি শব্দের দিকে একসাথে নজর দেয়। "it" শব্দটি তার সংশ্লিষ্ট noun-টির দিকে সরাসরি তাকাতে পারে, তা সে যত দূরেই থাকুক না কেন।

যেহেতু কোনো কিছু নির্দিষ্ট ক্রমের ওপর নির্ভর করে না, তাই আপনি সবকিছু একসাথে প্রসেস করতে পারেন। এটি প্রশিক্ষণকে দ্রুত এবং দক্ষ করে তোলে।

Transformer হলো এই তিনটি ধারণার সমন্বয়ে তৈরি একটি কাঠামো। এটি skip connections-এর মাধ্যমে ঘেরা attention blocks ব্যবহার করে এবং এর মাঝে normalization থাকে।

AI কোনো জাদু নয়। এটি হলো কোনো কিছু ত্রুটিপূর্ণ দেখে তা সাধারণ গণিতের মাধ্যমে ঠিক করার একটি ফলাফল।

উৎস: https://dev.to/karthi_raman_02ec8161bda/three-ideas-made-modern-ai-possible-none-of-them-are-magic-ida

ঐচ্ছিক লার্নিং কমিউনিটি: https://t.me/GyaanSetuAi

তিনটি ধারণা যা আধুনিক এআই-কে সম্ভব করে তুলেছে

Continue reading

এআই চিন্তাশক্তিকে প্রতিস্থাপন করে না, বরং এটি আরও বাড়িয়ে তোলে।

তিনটি ধারণা যা এআই-কে সম্ভব করে তুলেছে

𝗦𝘁𝗼𝗽 𝗧𝗲𝗹𝗹𝗶𝗻𝗴 𝗬𝗼𝘂𝗿 𝗔𝗜 𝘁𝗼 𝗯𝗲 𝗰𝗮𝗿𝗲𝗳𝘂𝗹