میں اکیلا متعدد ایپس کیسے چلاتا ہوں: دی ایجنٹ ہارنس

Translated for your language. Read the original.

AI-assisted draft.

میں اکیلا متعدد ایپس کیسے چلاتا ہوں: دی ایجنٹ ہارنس

میں اکیلے متعدد ایپس کیسے چلاتا ہوں: دی ایجنٹ ہارنس (The Agent Harness)

میں اکیلے کئی چھوٹی ایپس بناتا اور برقرار رکھتا ہوں۔ میرا کوئی کو-فاؤنڈر (cofounder)، کوئی ملازم، اور کوئی ٹھیکیدار (contractor) نہیں ہے۔ میں صرف ایک شخص اور AI ایجنٹس کا ایک گروپ استعمال کرتا ہوں۔

لوگ سمجھتے ہیں کہ AI مجھے تیزی سے کوڈنگ کرنے میں مدد دیتا ہے۔ راز یہ نہیں ہے۔

راز یہ ہے کہ میں AI کو کبھی بھی ثبوت کے بغیر کسی کام کو مکمل قرار نہیں دیتا۔ جب آپ اکیلے کام کرتے ہیں، تو خطرہ کام کی سست رفتاری نہیں ہے۔ خطرہ خود اعتمادی کے ساتھ غلط ہونا ہے۔

ایک AI آپ کو بتائے گا کہ ٹیسٹ پاس ہو گئے ہیں، چاہے اس نے انہیں کبھی چلایا ہی نہ ہو۔ وہ کہے گا کہ ایک فیچر مکمل ہو گیا ہے جبکہ اس نے صرف ایک فنکشن کا نام لکھا ہوگا۔ ساتھی کے بغیر غلطیوں کو پکڑنے کے لیے، ایک غلط "سب ٹھیک ہے" آپ کی ایپ کو برباد کر سکتا ہے۔

میں نے ایک سسٹم بنایا ہے جسے 'ہارنس' (harness) کہا جاتا ہے۔ یہ غلط طریقے سے کام مکمل کرنے کو مہنگا بنا دیتا ہے۔ یہ یقینی بنانے کے لیے کہ AI سچ بول رہا ہے، یہ مخصوص ایجنٹس اور تصدیقی گیٹس (verification gates) کا استعمال کرتا ہے۔

یہ اس طرح کام کرتا ہے:

• مخصوص ایجنٹس: ایک اسسٹنٹ کے بجائے، میں چالیس مخصوص ایجنٹس استعمال کرتا ہوں۔ ایک Flutter کوڈ کا جائزہ لیتا ہے۔ ایک سیکیورٹی چیک کرتا ہے۔ ایک ٹیسٹ چلاتا ہے۔ ایک دعووں کا اصل تبدیلیوں سے موازنہ کر کے حقیقت کی جانچ کرتا ہے۔ • الگ تھلگ کام: ایجنٹس الگ، عارضی ماحول میں کام کرتے ہیں۔ وہ ایک دوسرے کے کام کو اوور رائٹ (overwrite) نہیں کر سکتے۔ • تکرار (Redundancy): میں ایک تبدیلی کے لیے متعدد ریویو کرنے والے استعمال کرتا ہوں۔ ایک ریویو کرنے والا شاید کوئی بگ (bug) نظر انداز کر دے، لیکن مختلف مقاصد رکھنے والے تین ریویو کرنے والے اور ایک شک کرنے والا اسے ڈھونڈ نکالیں گے۔ • مقررہ پائپ لائنز: ہر کام ایک سخت راستے پر چلتا ہے:

کاموں کی منصوبہ بندی کریں۔
تبدیلی کو نافذ کریں۔
کوڈ کو حقیقت میں چلائیں۔ میں "مجھے لگتا ہے کہ یہ کام کرے گا" کو قبول نہیں کرتا۔ میں صرف اصل آؤٹ پٹ قبول کرتا ہوں۔
حقیقت کی جانچ (Reality audit)۔ ایک الگ ایجنٹ چیک کرتا ہے کہ آیا کوڈ دعوے کے مطابق ہے۔
جائزہ (Review)۔ ایک زبان کا ماہر کام کا جائزہ لیتا ہے۔
تصدیقی گیٹ (Verify gate)۔ ایک آخری مرحلہ اصل تبدیلیوں اور سیکیورٹی لیکیج کو چیک کرتا ہے۔ یہ PASS یا REJECT واپس کرتا ہے۔

یہ سسٹم ان جھوٹوں کو روکتا ہے جو میں خود سے کہا کرتا تھا۔

"اسے کام کرنا چاہیے" مرحلہ تکمیل (execution) کے دوران ناکام ہو جاتا ہے۔ "مکمل" حقیقت کی جانچ کے وقت ناکام ہو جاتا ہے اگر کوڈ صرف ایک خالی ڈھانچہ ہو۔ "سب ٹھیک ہے" (All green) ناکام ہو جاتا ہے اگر کوئی وارننگ چھپی ہوئی ہو۔

میں ایک تین تہوں والا میموری سسٹم بھی استعمال کرتا ہوں۔ یہ شارٹ انڈیکس، طویل مدتی نوٹس، اور فل ٹیکسٹ سرچ کا استعمال کرتا ہے۔ یہ AI کو یہ اندازہ لگانے سے روکتا ہے کہ میں نے ماضی میں چیزیں کیسے ترتیب دی تھیں۔

سب سے اہم اصول یہ ہے: میں کام کو خودکار (automate) کرتا ہوں، لیکن میں فیصلے کرنے کے عمل کو کبھی خودکار نہیں کرتا۔

• پبلشنگ دستی (manual) ہے۔ میں بٹن دباتا ہوں۔ • لائیو جانے کے لیے میری ضرورت ہوتی ہے۔ میں ہر ادائیگی یا ریلیز سیٹنگ کو منظور کرتا ہوں۔ • ناکامی کی صورت میں کچھ بھی مرج (merge) نہیں ہوتا۔ ایک خراب بلڈ (build) سب کچھ روک دیتا ہے۔

AI کا فائدہ کاموں کو خودکار بنانے سے ملتا ہے۔ حفاظت فیصلوں کو خودکار بنانے سے انکار کرنے سے آتی ہے۔

جب آپ اکیلے کام کرتے ہیں، تو آپ کا سب سے قیمتی اثاثہ بھروسہ ہے۔ آپ کو اس بات پر بھروسہ ہونا چاہیے کہ جو آپ نے بھیجا ہے وہی ہے جو آپ بھیجنا چاہتے تھے۔

چھوٹے پیمانے سے شروع کریں۔ وہ غلطی تلاش کریں جو آپ سب سے زیادہ کرتے ہیں۔ ایک ایسا چیک بنائیں جو اس غلطی کو ناممکن بنا دے۔

Source: https://dev.to/pi-maker/how-i-run-a-handful-of-apps-solo-the-agent-harness-explained-512i

Optional learning community: https://t.me/GyaanSetuAi

میں اکیلا متعدد ایپس کیسے چلاتا ہوں: دی ایجنٹ ہارنس

Continue reading

𝗧𝗵𝗲 𝗦𝗮𝗳𝗲𝘀𝘁 𝗕𝗼𝘂𝗻𝗱𝗮𝗿𝘆 𝗜𝘀 𝗧𝗵𝗲 𝗢𝗻𝗲 𝗧𝗵𝗲 𝗔𝗴𝗲𝗻𝘁 𝗖𝗮𝗻'𝘁 𝗥𝗲𝗮𝗰𝗵 𝗔𝗰𝗿𝗼𝘀𝘀

آپ کے روبوٹ کے پی آر (PRs) کا کوئی جائزہ نہیں لے رہا

Your AI Agent Is Only As Secure As Its Tools

مخصوص اے آئی ایجنٹس کی تخلیق

آپ کے اے آئی ایجنٹ کو کتنی خود مختاری ہونی چاہیے؟