𝗪𝗵𝗮𝘁 𝗔𝗿𝗲 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀? -> AI এজেন্ট কী?

আমি একবার ChatGPT-কে ইস্তাম্বুল ভ্রমণের একটি পরিকল্পনা করতে বলেছিলাম। এটি আমাকে একটি চমৎকার পরিকল্পনা দিয়েছিল। কিন্তু এটি ফ্লাইট বুক করতে পারেনি। এটি হোটেলের দাম যাচাই করতে পারেনি। এটি কোনো ইমেল পাঠাতে পারেনি।

মডেলটি বুদ্ধিমান ছিল, কিন্তু এর কোনো হাত ছিল না। এটি চিন্তা করতে পারত, কিন্তু কাজ করতে পারত না।

AI এজেন্ট এই সমস্যার সমাধান করে।

সাধারণ LLM (Large Language Models) একজন সুশিক্ষিত সহকারীর মতো কাজ করে। আপনি একটি প্রম্পট পাঠান এবং মডেলটি একটি উত্তর দেয়। এটি একটি মাত্র রাউন্ড ট্রিপ। মডেলটি ওয়েব ব্রাউজ করতে পারে না, আপনার ক্যালেন্ডার চেক করতে পারে না বা বাস্তব জগতে কোনো পদক্ষেপ নিতে পারে না।

একটি AI এজেন্ট ভিন্ন। একটি এজেন্ট একটি লক্ষ্য অর্জনের জন্য কীভাবে টুলস ব্যবহার করতে হবে তা সিদ্ধান্ত নিতে একটি ল্যাঙ্গুয়েজ মডেল ব্যবহার করে।

একটি এজেন্ট পারে:

  • ওয়েব সার্চ করা
  • কোড চালানো
  • ডাটাবেস কুয়েরি করা
  • ইমেল পাঠানো
  • এক্সটার্নাল API ব্যবহার করা

প্রধান পার্থক্য হলো স্বায়ত্তশাসন (autonomy)। আপনি একটি এজেন্টকে একটি লক্ষ্য দেন এবং এটি নিজেই ধাপগুলো ঠিক করে নেয়।

তুলনা: • সাধারণ LLM: প্রশ্নের উত্তর দেয়, একক রেসপন্স, কোনো টুল নেই, প্রতিক্রিয়াশীল (reactive)। • AI Agent: পদক্ষেপ নেয়, মাল্টি-স্টেপ রিজনিং (multi-step reasoning), টুলস ব্যবহার করে, লক্ষ্য-চালিত (goal-driven)।

বেশিরভাগ এজেন্ট ReAct (Reason and Act) নামক একটি প্যাটার্ন ব্যবহার করে। এটি একটি সহজ লুপ অনুসরণ করে:

  1. Thought: আমার পরবর্তী পদক্ষেপ কী হওয়া উচিত?
  2. Action: একটি টুল ব্যবহার করা।
  3. Observe: ফলাফলটি দেখা।
  4. Repeat: লক্ষ্য পূরণ না হওয়া পর্যন্ত চলতে থাকা।

এই লুপগুলো তৈরি করা কঠিন। আপনাকে এরর (error) হ্যান্ডেল করতে হবে, মেমরি ম্যানেজ করতে হবে এবং টুলসগুলোকে সংযুক্ত করতে হবে।

এই কারণেই LangChain-এর মতো ফ্রেমওয়ার্কগুলোর অস্তিত্ব রয়েছে। LangChain প্রয়োজনীয় অবকাঠামো (plumbing) প্রদান করে। এটি আপনাকে প্রি-বিল্ট টুলস, মেমরি এবং মডেলগুলোকে বাস্তব জগতের সাথে সংযুক্ত করার উপায় দেয়।

আপনার কাজের ধারা (workflow) যদি জটিল হয়, তবে আপনি LangGraph ব্যবহার করবেন। LangGraph আপনাকে এমন এজেন্ট তৈরি করতে সাহায্য করে যা বিভিন্ন পথে বিভক্ত হতে পারে, সমান্তরালভাবে কাজ চালাতে পারে বা পূর্ববর্তী ধাপগুলোতে ফিরে যেতে পারে।

সারসংক্ষেপ:

  • LLM টেক্সটের উত্তর দেয়।
  • এজেন্ট কাজ সম্পন্ন করতে টুলস ব্যবহার করে।
  • ReAct লুপ এজেন্টের লজিক পরিচালনা করে।
  • LangChain মডেল এবং টুলসের মধ্যে সংযোগ পরিচালনা করে।
  • LangGraph জটিল এবং শাখা-প্রশাখাযুক্ত ওয়ার্কফ্লো পরিচালনা করে।

আমার পরবর্তী পোস্টে, আমি আপনাদের দেখাব কীভাবে আপনার এনভায়রনমেন্ট সেটআপ করতে হয় এবং আপনার প্রথম এজেন্ট চালাতে হয়।

Source: https://dev.to/ikram_khan/what-are-ai-agents-a-plain-english-introduction-56nd

Optional learning community: https://t.me/GyaanSetuAi