AI এজেন্টের কঠিন অংশ কাজ করা নয়, বরং পরিকল্পনা করা
কাজ সম্পাদন করতে পারে এমন একটি AI এজেন্ট তৈরি করা সহজ। কিন্তু সঠিকভাবে পরিকল্পনা করতে পারে এমন একটি এজেন্ট তৈরি করা কঠিন।
আমি একটি CLI তৈরি করেছি যেখানে আপনি একটি বাক্য লিখলে একটি LLM আপনার আসল অ্যাকাউন্টে কাজ সম্পাদন করে। আমি দুটি মোড ব্যবহার করি: Direct mode এবং Plan mode।
Direct mode হলো গতির জন্য। Plan mode হলো নিরাপত্তার জন্য। Plan mode-এ, এজেন্ট আপনার ডেটা স্পর্শ করার আগে আপনাকে প্রতিটি ধাপ দেখায়।
আমি কীভাবে একটি নির্ভরযোগ্য প্ল্যানার তৈরি করেছি তা নিচে দেওয়া হলো:
• মস্তিষ্ককে বিভক্ত করুন একটি এজেন্ট একই সাথে পরিকল্পনা এবং কাজ সম্পাদন করতে পারে না। একটি প্ল্যানিং এজেন্ট চিন্তা করতে চায়। একটি এক্সিকিউশন এজেন্ট কাজ করতে চায়। আমি তাদের দুটি ভিন্ন সিস্টেম প্রম্পটসহ দুটি আলাদা এজেন্টে বিভক্ত করেছি। এটি তাদের একে অপরের সাথে সংঘর্ষ এড়াতে সাহায্য করে।
• এজেন্টকে চোখ দিন অনুমানের ওপর ভিত্তি করে কাজ করা একটি প্ল্যানার বিপজ্জনক। আমার প্রথম ভার্সনটি অনুমানের ওপর ভিত্তি করে পরিকল্পনা তৈরি করত। এখন, প্ল্যানারটি প্রথমে আপনার ডেটা রিসার্চ করার জন্য read-only টুল ব্যবহার করে। একটি ধাপ লেখার আগেই এটি আপনার আসল Salesforce ফিল্ডগুলো দেখে নেয়।
• উত্তরগুলো আগে থেকেই পূরণ করে রাখুন এজেন্টরা প্রায়ই ভুল প্রশ্ন করে। তারা যদি অনেক বেশি প্রশ্ন করে, তবে শেষ পর্যন্ত আপনাকে তাদের হয়ে কাজ করে দিতে হয়। আমি এটি পরিবর্তন করেছি। প্ল্যানারটি এখনও প্রশ্ন করে, তবে এটি একটি প্রস্তাবিত উত্তর প্রদান করে। আপনাকে শুধু সেটি নিশ্চিত করতে হয় বা সামান্য পরিবর্তন করতে হয়। এটি ম্যানুয়াল ডেটা এন্ট্রি ছাড়াই পরিকল্পনাটিকে নির্ভুল রাখে।
• শুধু তালিকা নয়, প্রেক্ষাপট প্রদান করুন আপনি যদি একজন এক্সিকিউটরকে কেবল ধাপের একটি তালিকা দেন, তবে সে তার পেছনের যুক্তি হারিয়ে ফেলে। আমি প্ল্যানারকে এমনভাবে তৈরি করেছি যাতে সে ধাপগুলোর সাথে সাথে অনুমান এবং ঝুঁকিগুলোও পাঠিয়ে দেয়। এখন এক্সিকিউটর প্রতিটি কাজের পেছনের "কেন" বা কারণটি জানে।
• বিপদ চিহ্নিত করুন একটি পরিকল্পনা তখনই নিরাপদ যখন আপনি ঝুঁকিগুলো দেখতে পান। আমার সিস্টেম মুছে ফেলা বা নাম পরিবর্তন করার মতো ধ্বংসাত্মক (destructive) কাজগুলোকে চিহ্নিত করে। যখন এজেন্ট কোনো ধ্বংসাত্মক ধাপে পৌঁছায়, তখন এটি থেমে যায় এবং আপনাকে জিজ্ঞাসা করে।
• ডেটাকে সিদ্ধান্ত নিতে সাহায্য করুন যদি একটি এজেন্ট মনে করে যে একটি ধাপ ব্যর্থ হয়েছে এবং আপনি তাকে পুনরায় চেষ্টা করতে বলেন, তবে সে অন্ধভাবে তা মেনে নেয় না। এটি আসল প্ল্যাটফর্ম ডেটা পরীক্ষা করে দেখে। যদি ডেটা দেখায় যে কাজটি ইতিমধ্যে সম্পন্ন হয়েছে, তবে এজেন্ট আপনার দাবির চেয়ে ডেটাকেই বেশি বিশ্বাস করে।
নিরাপত্তা সম্পর্কে সত্যতা: Plan mode প্রম্পট ইনজেকশন (prompt injection) বা কোনো ব্যবহারকারী না দেখে "approve" ক্লিক করে ফেললে তা আটকাতে পারে না। এটি দায়িত্বকে "মডেলকে বিশ্বাস করা" থেকে সরিয়ে "মানুষের পর্যালোচনার ওপর বিশ্বাস করা"-তে নিয়ে আসে।
কাঠামোটি সুরক্ষা কবচ (guardrails) প্রদান করে, কিন্তু আপনার পর্যালোচনা চূড়ান্ত নিরাপত্তা নিশ্চিত করে।
Optional learning community: https://t.me/GyaanSetuAi
