اپنے AI کو محتاط رہنے کے لیے کہنا بند کریں

اپنے AI کو محتاط رہنے کے لیے کہنا بند کریں۔ اس کے پاس گزرے ہوئے کل کی کوئی یادداشت نہیں ہے۔

میں نے ایک بار اپنے AI ایجنٹ کو غلطیاں کرنے سے روکنے کے لیے اصولوں کی ایک بہت بڑی فائل بنائی تھی۔ جب بھی وہ ناکام ہوتا، میں مزید ہدایات شامل کرتا جاتا۔ فائل 56,000 حروف تک پہنچ گئی۔ پھر ایجنٹ نے کام کرنا ہی چھوڑ دیا۔

میں نے اس کی توجہ بہت زیادہ بکھیر دی تھی۔ میں نے اصولوں کو کم کر کے 1,200 حروف تک کر دیا۔ کم اصولوں کے ساتھ ایجنٹ نے بہتر کام کیا۔

میں نے ایک سخت سبق سیکھا۔ اصولوں کا اضافہ کرنا قابلِ اعتماد AI بنانے کا طریقہ نہیں ہے۔

زیادہ تر لوگ AI کے ساتھ ایک انسانی ساتھی کی طرح پیش آتے ہیں۔ وہ سمجھتے ہیں کہ آج کی اصلاح کل AI کی مدد کرے گی۔ AI "stateless" ہے۔ ہر سیشن نئے سرے سے شروع ہوتا ہے۔ اسے آپ کے پچھلے لیکچرز یاد نہیں رہتے۔

کسی اصول کو جاننے اور کسی اصول پر عمل کرنے میں بڑا فرق ہوتا ہے۔

پرامپٹ (prompt) میں اصول ڈالنا محض ایک مشورہ ہے۔ ماڈل اسے دیکھتا تو ہے، لیکن کام مکمل کرنے کے لیے اسے نظر انداز کر سکتا ہے۔ اگر آپ چاہتے ہیں کہ ایجنٹ رک جائے، تو ایک بہتر جملہ نہ لکھیں۔ اپنے کوڈ میں ایک جسمانی رکاوٹ (physical gate) بنائیں۔ ایک ایسا اسکرپٹ استعمال کریں جو چیک پاس ہونے تک آگے بڑھنے سے انکار کر دے۔

یہ پوچھنا بند کریں کہ AI کو زیادہ درست کیسے بنایا جائے۔ یہ پوچھنا شروع کریں کہ غلطیوں کے اثرات کو کم کیسے کیا جائے۔

ڈیٹا ظاہر کرتا ہے کہ صرف درستگی کافی نہیں ہے: • صرف 4% کمپنیاں کہتی ہیں کہ generative AI توقعات سے بڑھ کر ہے (JUAS)۔ • صرف 5% enterprise AI پائلٹ پروڈکشن تک پہنچتے ہیں (MIT)۔ • زیادہ تر AI صارفین درحقیقت زیادہ اوور ٹائم کام کرتے ہیں، کم نہیں (Persol)۔

جیتنے والوں کے پاس زیادہ درست ماڈلز نہیں ہوتے۔ ان کے پاس بہتر ڈھانچے (structures) ہوتے ہیں۔

مزید اصول لکھنے کے بجائے ان تین پیٹرنز (patterns) کا استعمال کریں:

  • اختلاف کو ایک سگنل کے طور پر استعمال کریں۔ ایک ہی کام کو تین مختلف ماڈلز کے ذریعے چلائیں۔ اگر وہ اختلاف کریں، تو اسے انسان کے پاس بھیج دیں۔ اگر وہ متفق ہوں، تو اسے جاری رکھیں۔
  • ایسکلیشن کرائیٹیریا (escalation criteria) لکھیں۔ ایجنٹ کو واضح ایگزٹ پوائنٹس دیں۔ اگر وہ دو منٹ میں مسئلہ حل نہیں کر سکتا، تو اسے رکنے اور انسان سے پوچھنے کا کہیں۔
  • ایجنٹ کو ایک مخصوص کام دیں۔ اسے مدد کرنے کا کوئی مبہم مینڈیٹ نہ دیں۔ اسے ایک مخصوص کام دیں، جیسے میٹنگ کے منٹس تیار کرنا۔ ایک محدود کام کا مطلب ہے کہ غلطی کا اثر بہت کم ہوگا۔

اصل گارڈ ریلز (guardrails) آپ کو سست کرنے کے لیے نہیں ہوتی ہیں۔ وہ آپ کو تیزی سے آگے بڑھنے میں مدد دینے کے لیے ہوتی ہیں کیونکہ آپ کو بالکل معلوم ہوتا ہے کہ ایجنٹ کو کہاں رکنا چاہیے۔

اپنے AI کو لیکچر دینا بند کریں۔ ایک ایسا ڈھانچہ بنائیں جو اس وقت بھی کام کرے جب AI غلط ہو۔

Source: https://dev.to/nomurasan/stop-telling-your-ai-to-be-careful-next-time-it-has-no-memory-of-yesterday-i6c

Optional learning community: https://t.me/GyaanSetuAi