मैं अकेले कई ऐप्स कैसे चलाता हूँ: द एजेंट हार्नेस
मैं अकेले कई छोटे ऐप्स बनाता और बनाए रखता हूँ। मेरा कोई को-फाउंडर, कोई कर्मचारी और कोई कॉन्ट्रैक्टर नहीं है। मैं एक व्यक्ति और AI एजेंट्स के एक समूह का उपयोग करता हूँ।
लोग सोचते हैं कि AI मुझे तेज़ी से कोड करने में मदद करता है। वह रहस्य नहीं है।
रहस्य यह है कि मैं AI को बिना सबूत के किसी काम को पूरा (done) नहीं होने देता। जब आप अकेले काम करते हैं, तो खतरा काम की धीमी गति नहीं है। खतरा आत्मविश्वास के साथ गलत होना है।
एक AI आपसे कहेगा कि टेस्ट पास हो गए हैं, भले ही उसने उन्हें कभी चलाया ही न हो। वह कहेगा कि एक फीचर पूरा हो गया है, जबकि उसने केवल एक फंक्शन का नाम लिखा होगा। गलतियों को पकड़ने के लिए किसी सहकर्मी के बिना, एक गलत "looks good" आपके ऐप को बर्बाद कर सकता है।
मैंने 'द हार्नेस' (the harness) नामक एक सिस्टम बनाया है। यह गलत तरीके से काम पूरा करने की प्रक्रिया को महंगा बना देता है। यह यह सुनिश्चित करने के लिए विशेष एजेंट्स और वेरिफिकेशन गेट्स (verification gates) का उपयोग करता है कि AI सच बोल रहा है।
यह इस प्रकार काम करता है:
• विशेष एजेंट (Specialized Agents): एक असिस्टेंट के बजाय, मैं चालीस विशेष एजेंटों का उपयोग करता हूँ। एक Flutter कोड की समीक्षा करता है। एक सुरक्षा (security) की जाँच करता है। एक टेस्ट चलाता है। एक दावों की वास्तविक परिवर्तनों के साथ तुलना करके वास्तविकता का ऑडिट करता है। • अलग-थलग काम (Isolated Work): एजेंट अलग-अलग, अस्थायी वातावरण में काम करते हैं। वे एक-दूसरे के काम को ओवरराइट नहीं कर सकते। • अतिरेक (Redundancy): मैं एक बदलाव के लिए कई समीक्षकों का उपयोग करता हूँ। एक समीक्षक से बग छूट सकता है। अलग-अलग लक्ष्यों वाले तीन समीक्षक और एक संशयवादी (skeptic) उसे ढूंढ लेंगे। • निश्चित पाइपलाइन (Fixed Pipelines): प्रत्येक कार्य एक सख्त मार्ग का पालन करता है:
- कार्यों की योजना बनाना।
- बदलाव को लागू करना।
- कोड को वास्तव में चलाना। मैं "मुझे लगता है कि यह काम करता है" स्वीकार नहीं करता। मैं केवल वास्तविक आउटपुट स्वीकार करता हूँ।
- वास्तविकता ऑडिट (Reality audit)। एक अलग एजेंट जाँचता है कि क्या कोड दावे से मेल खाता है।
- समीक्षा (Review)। एक भाषा विशेषज्ञ काम की जाँच करता है।
- वेरिफिकेशन गेट (Verify gate)। एक अंतिम पास वास्तविक परिवर्तनों और सुरक्षा लीक की जाँच करता है। यह PASS या REJECT देता है।
यह सिस्टम उन झूठों को रोकता है जो मैं खुद से कहा करता था।
"इसे काम करना चाहिए" निष्पादन (execution) चरण में विफल हो जाता है। "हो गया" वास्तविकता ऑडिट में विफल हो जाता है यदि कोड केवल एक खाली ढांचा है। "सब ठीक है" (All green) विफल हो जाता है यदि कोई चेतावनी छिपी हुई है।
मैं एक तीन-स्तरीय मेमोरी सिस्टम का भी उपयोग करता हूँ। यह एक शॉर्ट इंडेक्स, लॉन्ग-टर्म नोट्स और फुल-टेक्स्ट सर्च का उपयोग करता है। यह AI को यह अनुमान लगाने से रोकता है कि मैंने अतीत में चीजों को कैसे सेट किया था।
सबसे महत्वपूर्ण नियम यह है: मैं काम को ऑटोमेट (automate) करता हूँ, लेकिन मैं निर्णय (judgment) को कभी ऑटोमेट नहीं करता।
• पब्लिशिंग मैन्युअल है। मैं बटन दबाता हूँ। • लाइव जाने के लिए मेरी आवश्यकता होती है। मैं प्रत्येक भुगतान या रिलीज़ सेटिंग को मंजूरी देता हूँ। • विफलता होने पर कुछ भी मर्ज नहीं होता है। एक टूटा हुआ बिल्ड (broken build) सब कुछ रोक देता है।
AI का लाभ कार्यों को ऑटोमेट करने से मिलता है। सुरक्षा निर्णयों को ऑटोमेट करने से इनकार करने से आती है।
जब आप अकेले काम करते हैं, तो आपका सबसे कीमती संसाधन विश्वास है। आपको इस बात पर भरोसा होना चाहिए कि जो आपने शिप (ship) किया है, वही है जो आप शिप करना चाहते थे।
छोटी शुरुआत करें। उस गलती को खोजें जो आप सबसे अधिक करते हैं। एक ऐसा चेक बनाएँ जो उस गलती को असंभव बना दे।
Source: https://dev.to/pi-maker/how-i-run-a-handful-of-apps-solo-the-agent-harness-explained-512i
Optional learning community: https://t.me/GyaanSetuAi
