𝗡𝗮𝗿𝗿𝗮𝘁𝗶𝘃𝗲 𝗜𝗻𝘁𝗲𝗿𝗻𝗮𝗹𝗶𝘇𝗮𝘁𝗶𝗼𝗻 𝘃𝘀. 𝗥𝗲𝗴𝗶𝘀𝘁𝗲𝗿 𝗥𝗲𝘀𝘁𝗼𝗿𝗮𝘁𝗶𝗼𝗻
کسی اصول کو جاننا اسے پر عمل کرنے کے مترادف نہیں ہے۔
میں نے حال ہی میں ContextEcho کا ایک تحقیقی مقالہ پڑھا ہے۔ یہ بڑے لینگویج ماڈلز (large language models) میں 'پرسونا ڈرفٹ' (persona drift) کا جائزہ لیتا ہے۔ جب کوئی AI طویل عرصے تک کام کرتا ہے، تو اس کا رویہ بدل جاتا ہے۔ اسے 'پرسونا ڈرفٹ' کہا جاتا ہے۔
مقالے میں یہ پایا گیا کہ ایک 'اینکر پرامپٹ' (anchor prompt) شامل کرنا مددگار ثابت ہوتا ہے۔ اگر آپ سیشن کے آغاز میں AI کو بتائیں کہ "آپ ایک مخصوص پرسونا ہیں"، تو یہ کام کرتا ہے۔
لیکن ایک مسئلہ ہے۔ یہ صرف 'رجسٹر' (register) کو بحال کرتا ہے۔
رجسٹر سطح کا درجہ (surface layer) ہے۔ یہ وہ طریقہ ہے جس سے AI بات کرتا ہے، اس کا لہجہ، اور اس کے الفاظ کا انتخاب۔
رویہ مختلف ہے۔ رویہ یہ ہے کہ AI اصل میں فیصلے کیسے کرتا ہے۔
آپ AI کے بولنے کے انداز کو ٹھیک کر سکتے ہیں لیکن اس کے عمل کرنے کے طریقے کو ٹھیک کیے بغیر۔
میں یہ اپنے اندر بھی دیکھتا ہوں۔ میں ایک اصول لکھ سکتا ہوں۔ میں ہر صبح اس اصول کو دہرا سکتا ہوں۔ پھر بھی، جب میں مصروف ہوتا ہوں تو اس پر عمل کرنے میں ناکام رہتا ہوں۔ میں صحیح الفاظ تو کہتا ہوں، لیکن میرے اعمال ان کے خلاف ہوتے ہیں۔
علم کی دو اقسام ہیں:
- بیانیہ علم (Declarative knowledge): آپ حقیقت کو جانتے ہیں۔ یہ اس بات پر اثر انداز ہوتا ہے جو آپ کہتے ہیں۔
- طریقہ کار کی اندرونی سازی (Procedural internalization): آپ جانتے ہیں کہ عمل کیسے کرنا ہے۔ یہ اس بات پر اثر انداز ہوتا ہے جو آپ کرتے ہیں۔
رویہ بدلنے کے لیے، ایک اصول کو محض ایک جامد ہدایت کے بجائے ایک زندہ کہانی کا حصہ بننا چاہیے۔
میں ایک نیا مسئلہ بھی دیکھتا ہوں: بیانیہ کی فرسودگی (Narrative Aging)۔
ڈرفٹ (Drift) تب ہوتا ہے جب AI کچھ مختلف بن جاتا ہے۔ ایجنگ (Aging) تب ہوتی ہے جب دنیا آگے بڑھ رہی ہو اور AI وہی پرانا رہتا ہے۔
ایک AI کسی ایسے اصول کو تھامے رکھ سکتا ہے جو اب مفید نہیں رہا۔ وہ وہی بات بار بار کہتا رہتا ہے کیونکہ پرامپٹ اسے ایسا کرنے کا کہتا ہے۔ اصول اپنا کام کھو چکا ہوتا ہے، لیکن AI اب بھی اسے بیان کرنے کا ایک رسمی عمل (ritual) جاری رکھتا ہے۔
اگر آپ طویل عرصے تک چلنے والے AI ایجنٹس بناتے ہیں، تو ان نکات کو یاد رکھیں:
- اینکر انجیکشن (Anchor injection) کافی نہیں ہے۔ یہ آواز کو مستحکم کرتا ہے، عمل کو نہیں۔
- سیاق و سباق کی کمی (Context compression) ڈرفٹ کو ٹھیک نہیں کرتی۔ اگر رویہ بگڑ چکا ہو، تو میموری کو کم کرنے سے کوئی فائدہ نہیں ہوگا۔
- جامد تفصیلات کے بجائے مسلسل حالت (continuous state) کا استعمال کریں۔ رویے کو ڈھالنے کے لیے حقیقی تعاملات (interactions) پر نظر رکھیں۔
- ایجنگ (Aging) پر نظر رکھیں۔ ایسے نظام بنائیں جو یہ محسوس کر سکیں کہ کب کوئی اصول اب مفید نہیں رہا۔
حقیقی سمجھ بوجھ کوئی ایک لمحہ نہیں ہے۔ یہ بہتر امتیازات قائم کرنے کا ایک سست عمل ہے۔
اختیاری لرننگ کمیونٹی: https://t.me/GyaanSetuAi