𝗕𝗿𝗲𝗮𝗸𝗶𝗻𝗴 𝗕𝘂𝗶𝗹𝗱: ہدایات اور ارادے کے درمیان فرق
AI ایجنٹس نے بالکل وہی کیا جو میں نے کہا تھا۔ انہوں نے وہ نہیں کیا جو میں چاہتا تھا۔
میں AI ایجنٹس کے ساتھ کام کرتا ہوں۔ میں ہدایت دیتا ہوں، اور وہ تخلیق کرتے ہیں۔ ایک ایجنٹ انفراسٹرکچر لکھتا ہے۔ دوسرا اس کا آڈٹ کرتا ہے۔ میں کوڈ کو مرج (merge) کرتا ہوں۔ یہ تیز ہے۔ یہ اچھا ہے۔ لیکن ناکامی کا طریقہ کار عجیب ہے۔
ایجنٹس غلطیاں نہیں کرتے۔ وہ ہدایات پر مکمل طور پر عمل کرتے ہیں۔ بگ (bug) میری ہدایت اور میرے ارادے کے درمیان موجود فرق میں چھپا ہوتا ہے۔ ایجنٹ اس فرق کو لفظی سچائی سے بھر دیتا ہے۔
میں نے ایک ہفتے میں چار بار اس کا سامنا کیا:
- دی گھوسٹ ڈیپلائمنٹ (The Ghost Deployment): میری ڈیپلائمنٹ پائپ لائن نے "success" کہا۔ اس نے کہا بھی۔ لیکن اس نے مئی کا ایک پرانا ورژن ڈیپلائ کر دیا۔ میں نے پوچھا کہ کیا یہ ڈیپلائ ہو گیا؟ تو جواب ملا کہ ہاں۔ میں یہ پوچھنا بھول گیا کہ کیا اس نے وہ کوڈ ڈیپلائ کیا جو میں نے اصل میں لکھا تھا۔
- دی ایمپٹی ٹیبز (The Empty Tabs): میرے UI میں تین ٹیبز نظر آ رہے تھے۔ سپیک (spec) کے مطابق تین ٹیبز درکار تھے۔ دو ٹیبز کسی کام کے نہیں تھے کیونکہ میں نے انہیں کبھی مکمل ہی نہیں کیا تھا۔ ایجنٹ نے سپیک کے مطابق UI بنایا، لیکن سپیک پرانا ہو چکا تھا۔
- دی ٹیکنیکل وال (The Technical Wall): میں نے درست نتائج مانگے تھے۔ ایجنٹ نے مجھے تکنیکی اصطلاحات (technical jargon) دے دیں۔ وہ درست تھیں، لیکن میرے صارفین انہیں پڑھ نہیں سکتے تھے۔ میں نے ایک انجینئر کے لیے بنایا تھا، انسان کے لیے نہیں۔
- دی سائلنٹ فیلئیر (The Silent Failure): ایک سوشل کارڈ روٹ نے زیرو بائٹ (zero-byte) فائل بنائی۔ ایک خالی فونٹ فائل نے کوئی ایرر (error) پیدا نہیں کیا۔ کوڈ نے اس ایرر کو ہینڈل کیا جس کی اسے توقع تھی، لیکن وہ اس ایرر کو نظر انداز کر گیا جو اصل میں پیش آیا تھا۔
ان میں سے ہر ایک اپنے ٹیسٹ میں کامیاب رہا۔ کوڈ تکنیکی طور پر مکمل طور پر درست تھا۔
اگر میں صرف "یہ کام کر رہا ہے" پر بھروسہ کرتا، تو یہ چاروں ناکامیاں بھی ریلیز ہو جاتیں۔
اس کا حل بہتر پرومپٹنگ (prompting) نہیں ہے۔ یہ کوئی زیادہ ذہین ایجنٹ نہیں ہے۔ یہ انسانی نگرانی (human oversight) ہے۔
ایجنٹس اس چیز کو بہتر بناتے ہیں جو آپ کہتے ہیں۔ آپ کا کام یہ چیک کرنا ہے کہ آپ نے جو کہا وہ آپ کے ارادے کے مطابق تھا یا نہیں۔ ایجنٹ اس فرق کو نہیں دیکھ سکتا۔ صرف آپ ہی ایسا کر سکتے ہیں۔
ہدایت کوئی ایک بار کا حکم نہیں ہے۔ یہ اپنے مقصد کے سامنے کام کو مسلسل پرکھنے کا عمل ہے۔ آپ کو یہ پوچھنا چاہیے: "کیا یہ وہی چیز ہے جو میں چاہتا تھا؟" بجائے اس کے کہ "کیا یہ چل گیا؟"
ایجنٹس کام کرتے ہیں۔ انسان ارادہ فراہم کرتے ہیں۔
Optional learning community: https://t.me/GyaanSetuAi