وہ ایجنٹس جو حقیقت میں لانچ ہوتے ہیں

ایجنٹ ہائپ سائیکل کا ایک واضح جواب ہے۔ وہ ٹیمیں جو پروڈکشن ایجنٹس کے ساتھ کامیابی حاصل کر رہی ہیں، وہ خود مختار گروہ (autonomous swarms) نہیں بناتی ہیں۔ وہ سادہ اور بورنگ سسٹمز بناتی ہیں۔

میں نے ایک ماہ تک دیکھا کہ پروڈکشن میں کیا کام کرتا ہے۔ پیٹرن بالکل واضح ہے۔ وہ ایجنٹس جو پیسہ کماتے ہیں یا وقت بچاتے ہیں، ان میں لامتناہی لوپس (endless loops) نہیں ہوتے۔ وہ قابلِ مشاہدہ (observable) ہوتے ہیں۔ وہ محدود (bounded) ہوتے ہیں۔ ضرورت پڑنے پر وہ انسانی مدد مانگتے ہیں۔

یہ ایجنٹ پلیٹ فارمز کے آپ کے اندازِ ارزیابی کو بدل دیتا ہے۔

پروڈکشن میں ایجنٹس استعمال کرنے والی ٹیمیں ان چیزوں پر بھروسہ کرتی ہیں:

  • دستی پرامپٹ سازی (Manual prompt construction)
  • دستیاب ماڈلز (Off-the-shelf models)
  • انسانی مداخلت سے پہلے 10 یا اس سے کم اقدامات کے ساتھ محدود عمل (Bounded execution)

یہ انجینئرنگ کا نظم و ضبط ہے۔

ڈیمو مکمل خود مختاری کے ساتھ خود کو درست کرنے والے ایجنٹس دکھاتے ہیں۔ لیکن جو ایجنٹس حقیقت میں لانچ ہوتے ہیں، وہ مختلف نظر آتے ہیں۔ وہ واضح گیٹس (explicit gates) کا استعمال کرتے ہیں۔

ایک کسٹمر سروس ایجنٹ 5 اقدامات سنبھالتا ہے اور پھر معاملہ آگے بڑھا دیتا ہے۔ ایک کوڈنگ ایجنٹ ٹیسٹ چلاتا ہے لیکن ریویو کے بغیر کوڈ مرج (merge) نہیں کرتا۔ ایک ڈیٹا ایجنٹ کوئری چلانے سے پہلے منظوری مانگتا ہے۔ یہ وہ آرکیٹیکچرل انتخاب ہیں جو کام کرتے ہیں۔

کامیاب ایجنٹس محدود اور بار بار ہونے والے مسائل حل کرتے ہیں۔ وہ واپسی (returns) سنبھالتے ہیں، ٹکٹس کی درجہ بندی (triage) کرتے ہیں، یا تعمیل (compliance) کے مسائل کی نشاندہی کرتے ہیں۔ محدود دائرہ کار کا مطلب ہے قابلِ پیش گوئی ناکامیاں اور آسان ڈی بگنگ (debugging)۔

ایجنٹس کو لانچ کرنے کا مشکل ترین حصہ انہیں زیادہ ذہین بنانا نہیں ہے۔ بلکہ انہیں قابلِ مشاہدہ اور قابلِ حکمرانی (governable) بنانا ہے۔

ٹیمیں اکثر اس لیے ناکام ہو جاتی ہیں کیونکہ:

  • وہ وضاحت نہیں کر سکتے کہ ایجنٹ کے ناکام ہونے پر اس نے کیا کیا
  • وہ کسی برے نتیجے کا سراغ نہیں لگا سکتے
  • وہ لاگت کی حدود مقرر نہیں کر سکتے
  • وہ ٹول کی منظوریوں کو نافذ نہیں کر سکتے
  • وہ کسی فیصلے کو سمجھنے کے لیے سیشن کو دوبارہ نہیں چلا سکتے

یہ انفراسٹرکچر کے مسائل ہیں۔

اگر آپ کوئی پلیٹ فارم منتخب کرتے ہیں، تو اپنے سوالات بدل لیں۔

  • رفتار کے بارے میں نہ پوچھیں۔ یہ پوچھیں کہ کیا آپ ہر فیصلے اور سراغ (trace) کو دیکھ سکتے ہیں۔
  • ماڈل سپورٹ کے بارے میں نہ پوچھیں۔ یہ پوچھیں کہ کیا آپ ایک ہی جگہ سے متعدد رن ٹائمز (runtimes) کو کنٹرول کر سکتے ہیں۔
  • خود مختاری کے بارے میں نہ پوچھیں۔ یہ پوچھیں کہ انسانی گیٹس (human gates) شامل کرنا کتنا آسان ہے۔

کامیاب انفراسٹرکچر مشاہدہ، حکمرانی اور محدود خود مختاری فراہم کرتا ہے۔ یہ ایک کنٹرول پلین (control plane) ہے۔ یہ قابلِ اعتماد ایجنٹس کو ان ایجنٹس سے الگ کرتا ہے جو رات کے 3 بجے پروڈکشن کو تباہ کر دیتے ہیں۔

پروڈکشن ٹیمیں اب یہ نہیں پوچھتیں کہ کیا وہ ایجنٹس بنا سکتے ہیں۔ وہ یہ پوچھتی ہیں کہ انہیں قابلِ اعتماد طریقے سے کیسے چلایا جائے۔

سادہ اور بورنگ انفراسٹرکچر ہی جیتتا ہے۔

ماخذ: https://dev.to/paultwist/the-agents-that-actually-ship-why-boring-beats-autonomous-49li

اختیاری لرننگ کمیونٹی: https://t.me/GyaanSetuAi