Python Beginners-দের জন্য Gen AI-এর পরিচিতি
বেশিরভাগ ডেভেলপার নির্দিষ্ট নিয়ম ব্যবহার করে কোড লেখেন। আপনি ইনপুট নেন, if/else স্টেটমেন্ট বা লুপ প্রয়োগ করেন এবং একটি অনুমেয় (predictable) ফলাফল প্রদান করেন। JSON বা CSV-এর মতো স্ট্রাকচার্ড ডেটার ক্ষেত্রে এটি কার্যকর।
কিন্তু অগোছালো বা জটিল কাজের ক্ষেত্রে কী হবে?
- ১০০টি সাপোর্ট টিকিট সামারি করা।
- একটি ফিচার লিস্টকে ইমেইলে রূপান্তর করা।
- ব্লগ পোস্ট থেকে ভালো ও মন্দ দিকগুলো (pros and cons) তুলনা করা।
আপনি regex বা জটিল টেমপ্লেট ব্যবহার করতে পারেন, কিন্তু সেগুলো খুব একটা টেকসই (fragile) নয়। Generative AI এই ধরণের অস্পষ্ট কাজগুলো সহজেই সামলাতে পারে।
এটি কীভাবে কাজ করে
একটি জেনারেটিভ মডেল একটি সহজ লুপ অনুসরণ করে:
- এটি আপনার প্রম্পট এবং পূর্ববর্তী টেক্সট দেখে।
- এটি টেক্সটের পরবর্তী ছোট অংশটি অনুমান (predict) করে।
- এটি সেই অংশটি টেক্সটের সাথে যুক্ত করে।
- কাজটি শেষ না হওয়া পর্যন্ত এটি পুনরাবৃত্তি করতে থাকে।
Large Language Models (LLMs) 'transformer' নামক একটি আর্কিটেকচার ব্যবহার করে। বাম থেকে ডানে পড়ার পরিবর্তে, মডেলটি আপনার ইনপুটের সমস্ত অংশ একসাথে দেখে। পরবর্তী অনুমানের জন্য কোন শব্দগুলো সবচেয়ে বেশি গুরুত্বপূর্ণ তা এটি নির্ধারণ করে।
Python ডেভেলপারদের জন্য দুটি বিষয় গুরুত্বপূর্ণ: tokens এবং context windows।
Tokens মডেলগুলো সরাসরি raw string পড়ে না। তারা টেক্সটকে tokens-এ বিভক্ত করে। একটি token হলো একটি শব্দের ছোট অংশ। API-এর প্রাইসিং এবং লিমিট নির্ধারণে characters-এর পরিবর্তে tokens ব্যবহার করা হয়।
Context Window এটি হলো মডেলটি একবারে যে পরিমাণ টেক্সট দেখতে পায়। এর মধ্যে আপনার প্রম্পট, চ্যাট হিস্ট্রি এবং মডেলের আউটপুট অন্তর্ভুক্ত থাকে। আপনি যদি এই সীমা অতিক্রম করেন, তবে মডেলটি কথোপকথনের সবচেয়ে পুরনো অংশগুলো ভুলে যায়।
প্রম্পট থেকে এজেন্টে উত্তরণ (Moving from prompts to agents)
একটি মডেলকে একটি মাত্র প্রম্পট পাঠানো হলো শুরুর ধাপ। আপনি টেক্সট সামারি করতে পারেন বা এরর (error) ব্যাখ্যা করতে পারেন। তবে, একটি সাধারণ LLM-এর কিছু সীমাবদ্ধতা রয়েছে:
- এটি আপনার ডাটাবেস বা API কল করতে পারে না।
- এটি রিকোয়েস্টগুলোর মধ্যে তথ্য মনে রাখতে পারে না।
- এটি কাল্পনিক তথ্য তৈরি করতে পারে।
প্রকৃত প্রোডাক্ট তৈরি করতে আপনার এজেন্ট (agent) প্রয়োজন। একটি এজেন্ট LLM-এর সাথে তিনটি জিনিস যোগ করে:
- Tools: ওয়েব সার্চ বা ক্যালকুলেটরের মতো ফাংশন।
- Memory: পূর্ববর্তী কথোপকথন এবং ইউজার ডেটা সংরক্ষণের জন্য স্টোরেজ।
- Orchestration: কোন টুলটি কখন ব্যবহার করতে হবে এবং কখন থামতে হবে তা সিদ্ধান্ত নেওয়ার লজিক।
একটি সাধারণ LLM কেবল একটি উত্তর দেয়। একটি এজেন্ট একটি লক্ষ্য গ্রহণ করে এবং নির্ভরযোগ্য ফলাফলে পৌঁছানোর জন্য টুলস এবং মেমরি ব্যবহার করে।
Optional learning community: https://t.me/GyaanSetuAi