AI ایجنٹس کا مشکل حصہ کام کرنا نہیں، بلکہ منصوبہ بندی کرنا ہے
ایسا AI ایجنٹ بنانا جو کام انجام دے، آسان ہے۔ لیکن ایسا ایجنٹ بنانا جو ان کاموں کی صحیح منصوبہ بندی کرے، مشکل ہے۔
میں نے ایک CLI بنایا ہے جہاں آپ ایک جملہ لکھتے ہیں اور ایک LLM آپ کے اصل اکاؤنٹس پر ایکشنز چلاتا ہے۔ میں دو موڈز استعمال کرتا ہوں: Direct mode اور Plan mode۔
Direct mode رفتار کے لیے ہے۔ Plan mode حفاظت کے لیے ہے۔ Plan mode میں، ایجنٹ آپ کے ڈیٹا کو چھونے سے پہلے آپ کو ہر قدم دکھاتا ہے۔
میں نے ایک قابلِ اعتماد پلانر اس طرح بنایا ہے:
• دماغ کو تقسیم کریں ایک ایجنٹ منصوبہ بندی اور عمل درآمد (execution) دونوں نہیں کر سکتا۔ ایک پلاننگ ایجنٹ سوچنا چاہتا ہے۔ ایک ایکزیکیوشن ایجنٹ عمل کرنا چاہتا ہے۔ میں نے انہیں دو مختلف system prompts کے ساتھ دو الگ ایجنٹس میں تقسیم کر دیا۔ اس سے وہ ایک دوسرے کے کام میں مداخلت نہیں کرتے۔
• ایجنٹ کو آنکھیں دیں ایک ایسا پلانر جو اندازے لگاتا ہے، خطرناک ہوتا ہے۔ میرے پہلے ورژن میں منصوبہ بندی محض مفروضوں پر مبنی تھی۔ اب، پلانر آپ کے ڈیٹا کی تحقیق کے لیے پہلے read-only ٹولز کا استعمال کرتا ہے۔ یہ ایک بھی قدم لکھنے سے پہلے آپ کے اصل Salesforce فیلڈز کو دیکھتا ہے۔
• جوابات پہلے سے بھر دیں (Prefill) ایجنٹس اکثر غلط سوالات پوچھتے ہیں۔ اگر وہ بہت زیادہ سوالات پوچھیں، تو آخر کار آپ کو ان کے لیے کام کرنا پڑتا ہے۔ میں نے اسے بدل دیا۔ پلانر اب بھی سوالات پوچھتا ہے، لیکن وہ ایک تجویز کردہ جواب بھی فراہم کرتا ہے۔ آپ کو بس اسے کنفرم کرنا ہوتا ہے یا تھوڑا سا درست کرنا ہوتا ہے۔ اس سے دستی ڈیٹا انٹری کے بغیر منصوبہ درست رہتا ہے۔
• صرف فہرست نہیں، بلکہ سیاق و سباق (context) بھی فراہم کریں اگر آپ ایک ایگزیکیوٹر کو صرف اقدامات کی فہرست دیتے ہیں، تو وہ منطق کھو دیتا ہے۔ میں نے پلانر کو یہ ہدایت دی کہ وہ اقدامات کے ساتھ ساتھ مفروضے اور خطرات بھی فراہم کرے۔ اب ایگزیکیوٹر کو ہر ایکشن کے پیچھے کی "وجہ" معلوم ہوتی ہے۔
• خطرے کی نشاندہی کریں منصوبہ صرف تب ہی محفوظ ہے جب آپ خطرات کو دیکھ سکیں۔ میرا سسٹم تباہ کن (destructive) اقدامات جیسے کہ ڈیلیٹ کرنا یا نام بدلنا، نشان زد کرتا ہے۔ جب ایجنٹ کسی تباہ کن قدم پر پہنچتا ہے، تو وہ رک جاتا ہے اور آپ سے پوچھتا ہے۔
• ڈیٹا کو فیصلہ کن بنائیں اگر ایجنٹ کو لگتا ہے کہ کوئی قدم ناکام ہو گیا ہے اور آپ اسے دوبارہ کوشش کرنے کو کہتے ہیں، تو وہ اندھا دھند حکم نہیں مانتا۔ وہ اصل پلیٹ فارم ڈیٹا کو چیک کرتا ہے۔ اگر ڈیٹا ظاہر کرتا ہے کہ کام پہلے ہی ہو چکا ہے، تو ایجنٹ آپ کے دعوے کے بجائے ڈیٹا پر بھروسہ کرتا ہے۔
حفاظت کے بارے میں حقیقت: Plan mode prompt injection یا ایسے صارف کو نہیں روک سکتا جو دیکھے بغیر "approve" پر کلک کر دے۔ یہ ذمہ داری کو "ماڈل پر بھروسہ کرنے" سے ہٹا کر "انسانی نظرِ ثانی پر بھروسہ کرنے" پر منتقل کر دیتا ہے۔
ڈھانچہ حفاظتی حدود (guardrails) فراہم کرتا ہے، لیکن آپ کا جائزہ ہی حتمی حفاظت فراہم کرتا ہے۔
Optional learning community: https://t.me/GyaanSetuAi
