এআই (AI) মডেলগুলো আসলে কীভাবে কাজ করে
আপনি ইমেল লিখতে বা কোড ঠিক করতে AI ব্যবহার করেন। বেশিরভাগ মানুষ একে একটি অ্যালগরিদম বলে ডাকেন। তারা জানেন না এটি কীভাবে কাজ করে। গণিত জটিল হলেও এর প্রক্রিয়াটি বোঝা সহজ।
এর মূল ধারণা হলো প্রেডিকশন (Prediction)।
আপনি যদি টাইপ করেন "The cat sat on the," মডেলটি পরবর্তী শব্দটি প্রেডিক্ট করে। এটি "mat" শব্দটি বেছে নেয় কারণ এই শব্দটির সম্ভাবনা (probability) অনেক বেশি। একটি পূর্ণাঙ্গ বাক্য তৈরি করতে এটি শব্দে শব্দে এই লুপটি পুনরাবৃত্তি করে। শব্দগুলো সঠিকভাবে প্রেডিক্ট করার জন্য মডেলটি ব্যাকরণ, তথ্য এবং যুক্তি শেখে।
এখানে চারটি ধাপ দেওয়া হলো:
টোকেনস (Tokens) মডেলগুলো শব্দ পড়ে না। তারা সংখ্যা পড়ে। তারা টেক্সটকে ছোট ছোট অংশে বিভক্ত করে যাকে টোকেন বলা হয়। প্রতিটি টোকেন সংখ্যার একটি তালিকায় পরিণত হয়। প্রতিটি কথোপকথনের গভীরে বিশাল পরিসরে গণিত কাজ করে।
ট্রেনিং (Training) ট্রেনিং হলো একটি মডেল কীভাবে শেখে তার প্রক্রিয়া। আপনি একে বই এবং ওয়েবসাইট থেকে বিলিয়ন বিলিয়ন পৃষ্ঠা দেখান। মডেলটি একটি টোকেন প্রেডিক্ট করে এবং উত্তরটি যাচাই করে। যদি এটি ভুল হয়, সিস্টেমটি তার অভ্যন্তরীণ সেটিংস সমন্বয় করে। এটি ট্রিলিয়ন ট্রিলিয়ন বার করে। কোনো মানুষ এর জন্য নিয়ম লিখে দেয় না। মডেলটি নিজেই প্যাটার্ন খুঁজে নেয়।
অ্যাটেনশন (Attention) এটি মডেলটিকে প্রেক্ষাপট (context) বুঝতে সাহায্য করে। "The trophy did not fit in the suitcase because it was too big" বাক্যটিতে "it" শব্দটি ট্রফিকে নির্দেশ করছে। অ্যাটেনশন মডেলটিকে বলে দেয় কোন পূর্ববর্তী শব্দগুলো সবচেয়ে বেশি গুরুত্বপূর্ণ। এটি মডেলটিকে দীর্ঘ অনুচ্ছেদের মধ্যেও অর্থ বজায় রাখতে সাহায্য করে।
ফাইন-টিউনিং (Fine-tuning) র (Raw) মডেলগুলো কেবল প্রেডিকশন ইঞ্জিন মাত্র। ফাইন-টিউনিং তাদের সহকারী হিসেবে কাজ করতে শেখায়। মানুষ উত্তরগুলোর রেটিং দেয়। এই রেটিংয়ের ওপর ভিত্তি করে মডেলটি সাহায্যকারী এবং নিরাপদ উত্তর প্রদান করতে শেখে।
আপনি যখন সেন্ড (send) বাটনে চাপ দেন তখন কী ঘটে?
আপনার টেক্সট সংখ্যায় রূপান্তরিত হয়। সেই সংখ্যাগুলো গণিতের বিভিন্ন স্তরের মধ্য দিয়ে প্রবাহিত হয়। মডেলটি পরবর্তী টোকেনের জন্য সম্ভাবনা (probability) গণনা করে। এটি একটি টোকেন বেছে নেয় এবং উত্তরটি শেষ না হওয়া পর্যন্ত এই প্রক্রিয়াটি পুনরাবৃত্তি করে। এটি কয়েক সেকেন্ডের মধ্যেই ঘটে যায়।
AI কোনো জাদু নয়। এটি বিশাল পরিসরে করা একটি প্রেডিকশন। এটি জানলে আপনি এই টুলের আরও দক্ষ ব্যবহারকারী হতে পারবেন।
Source: https://dev.to/rameshkumarramu/ai-models-how-do-they-actually-work-2kmm
Optional learning community: https://t.me/GyaanSetuAi