ایجنٹ میموری کو پرامپٹ میں بھرنا بند کریں
زیادہ تر ڈویلپرز ایجنٹ لوپس (agent loops) اس طرح بناتے ہیں کہ وہ ہر چیز کو اگلے پرامپٹ کے ساتھ جوڑتے چلے جاتے ہیں۔
آپ پچھلے مشاہدات، ٹول کالز (tool calls)، اور استدلال کے نشانات (reasoning traces) شامل کرتے ہیں۔ آپ ڈیٹا اس وقت تک شامل کرتے رہتے ہیں جب تک کہ پرامپٹ ایک کباڑ خانے کی طرح نہ بن جائے۔ ماڈل زیادہ چیزیں دیکھتا تو ہے، لیکن آپ کا کنٹرول ختم ہو جاتا ہے۔ آپ کو یہ معلوم نہیں رہتا کہ میموری کے کس حصے کی وجہ سے کوئی خاص فیصلہ ہوا تھا۔
AgenticSTS نامی ایک نیا مقالہ ایک مختلف راستہ تجویز کرتا ہے۔ یہ میموری کو سب سے بڑے کانٹیکسٹ ونڈو (context window) کے مقابلے کے بجائے ایک انٹرفیس کے طور پر استعمال کرتا ہے۔
یہ مقالہ Slay the Spire 2 گیم کو بطور ٹیسٹ بیڈ استعمال کرتا ہے۔ اس ماحول میں سینکڑوں اسٹریٹجک فیصلوں کی ضرورت ہوتی ہے۔ یہ کوئی سادہ چیٹ بوٹ نہیں ہے۔
بنیادی تصور یہ ہے: میموری ایک معاہدہ ہے کہ مستقبل کے فیصلے کو کیا دیکھنے کی اجازت ہے۔
خام ٹرانسکرپٹس (raw transcripts) کے بجائے، مصنفین پانچ مخصوص تہوں (layers) کا استعمال کرتے ہوئے نئے پرامپٹس تیار کرتے ہیں:
- مقررہ پروٹوکول ہدایات
- موجودہ حالت اور ایکشن اسکیمائیں (action schemas)
- حاصل کردہ گیم کے قوانین
- پچھلے رنز کے خلاصے
- ٹریگر شدہ اسٹریٹجک مہارتیں
یہ ڈھانچہ سب کچھ بدل دیتا ہے۔ آپ ہر تہہ کا معائنہ کر سکتے ہیں، اسے منجمد (freeze) کر سکتے ہیں، یا اسے غیر فعال (disable) کر سکتے ہیں۔ آپ میموری کو ڈیٹا کے ڈھیر سے بدل کر منتخب کردہ شواہد میں تبدیل کر دیتے ہیں۔
پروڈکشن ایجنٹس کی بہت سی ناکامیاں ماڈل کی ناکامی نہیں ہوتیں۔ وہ کانٹیکسٹ (context) کی ناکامیاں ہوتی ہیں۔ ایجنٹ پرانی حالت کو نئی حالت کے ساتھ ملا دیتا ہے یا پرانی سوچ (outdated reflections) کو آگے لے جاتا ہے۔ اگر آپ کی واحد پالیسی مزید متن شامل کرنا ہے، تو ڈیبگنگ (debugging) آثار قدیمہ کی کھدائی کرنے جیسی محسوس ہوتی ہے۔
ایک ٹائپ شدہ میموری انٹرفیس آپ کو موازنہ کرنے کے لیے کچھ فراہم کرتا ہے۔
طویل عرصے تک چلنے والے ایجنٹس کے لیے، ایک بہت بڑا کانٹیکسٹ ونڈو ایک جال ہے۔ یہ حقائق، پرانے حقائق اور ناکام کوششوں کا مجموعہ بن جاتا ہے۔ ونڈو جتنی بڑی ہوگی، تہہ جمے ہوئے کچرے (sediment) کو میموری سمجھنے کا خطرہ اتنا ہی زیادہ ہوگا۔
بہتر ایجنٹس بنانے کے لیے، ان پیٹرنز پر عمل کریں:
- مستحکم ہدایات کو موجودہ حالت سے الگ رکھیں
- قوانین کو ریٹریول لیئر (retrieval layer) میں رکھیں
- تجربے کو واضح ریکارڈز کے طور پر محفوظ کریں، نہ کہ چیٹ کے فضلے کے طور پر
- بار بار ہونے والی اصلاحات کو ٹریگر شدہ مہارتوں میں تبدیل کریں
- ٹیسٹنگ کے لیے ہر میموری لیئر کو قابلِ واپسی (removable) بنائیں
اگر آپ میموری کی کسی تہہ کو بند نہیں کر سکتے، تو آپ کو معلوم نہیں ہوگا کہ آیا وہ واقعی مدد کر رہی ہے یا نہیں۔ آپ کو صرف یہ معلوم ہوگا کہ پورا ڈھیر کبھی کبھار کام کر جاتا ہے۔
ایجنٹ میموری کو محض ایک "وائبز لیئر" (vibes layer) سمجھنا بند کریں۔ ایک ایسے نظام کی طرف بڑھیں جہاں آپ کو معلوم ہو کہ اگلے فیصلے میں کیا شامل ہو رہا ہے، وہ کہاں سے آیا ہے، اور اسے کیسے غیر فعال کیا جائے۔
اگر آپ کا ایجنٹ یہ وضاحت نہیں کر سکتا کہ اسے کیا یاد رکھنے کی اجازت تھی، تو اس کے پاس میموری نہیں ہے۔ اس کے پاس صرف ایک ایسا پرامپٹ ہے جس کا تہہ خانہ (basement) ہے۔
Source: https://dev.to/komo/stop-dumping-agent-memory-into-the-prompt-58ka
Optional learning community: https://t.me/GyaanSetuAi
