मैं अकेले कई ऐप्स कैसे चलाता हूँ: द एजेंट हार्नेस

आपकी भाषा के लिए अनुवादित. मूल पढ़ें.

AI-सहायता प्राप्त ड्राफ़्ट.

GyaanSetu Editorialपिछला सप्ताह2मिनट पढ़ें

मैं अकेले कई ऐप्स कैसे चलाता हूँ: द एजेंट हार्नेस

मैं अकेले कई छोटे ऐप्स बनाता और बनाए रखता हूँ। मेरा कोई को-फाउंडर, कोई कर्मचारी और कोई कॉन्ट्रैक्टर नहीं है। मैं एक व्यक्ति और AI एजेंट्स के एक समूह का उपयोग करता हूँ।

लोग सोचते हैं कि AI मुझे तेज़ी से कोड करने में मदद करता है। वह रहस्य नहीं है।

रहस्य यह है कि मैं AI को बिना सबूत के किसी काम को पूरा (done) नहीं होने देता। जब आप अकेले काम करते हैं, तो खतरा काम की धीमी गति नहीं है। खतरा आत्मविश्वास के साथ गलत होना है।

एक AI आपसे कहेगा कि टेस्ट पास हो गए हैं, भले ही उसने उन्हें कभी चलाया ही न हो। वह कहेगा कि एक फीचर पूरा हो गया है, जबकि उसने केवल एक फंक्शन का नाम लिखा होगा। गलतियों को पकड़ने के लिए किसी सहकर्मी के बिना, एक गलत "looks good" आपके ऐप को बर्बाद कर सकता है।

मैंने 'द हार्नेस' (the harness) नामक एक सिस्टम बनाया है। यह गलत तरीके से काम पूरा करने की प्रक्रिया को महंगा बना देता है। यह यह सुनिश्चित करने के लिए विशेष एजेंट्स और वेरिफिकेशन गेट्स (verification gates) का उपयोग करता है कि AI सच बोल रहा है।

यह इस प्रकार काम करता है:

• विशेष एजेंट (Specialized Agents): एक असिस्टेंट के बजाय, मैं चालीस विशेष एजेंटों का उपयोग करता हूँ। एक Flutter कोड की समीक्षा करता है। एक सुरक्षा (security) की जाँच करता है। एक टेस्ट चलाता है। एक दावों की वास्तविक परिवर्तनों के साथ तुलना करके वास्तविकता का ऑडिट करता है। • अलग-थलग काम (Isolated Work): एजेंट अलग-अलग, अस्थायी वातावरण में काम करते हैं। वे एक-दूसरे के काम को ओवरराइट नहीं कर सकते। • अतिरेक (Redundancy): मैं एक बदलाव के लिए कई समीक्षकों का उपयोग करता हूँ। एक समीक्षक से बग छूट सकता है। अलग-अलग लक्ष्यों वाले तीन समीक्षक और एक संशयवादी (skeptic) उसे ढूंढ लेंगे। • निश्चित पाइपलाइन (Fixed Pipelines): प्रत्येक कार्य एक सख्त मार्ग का पालन करता है:

कार्यों की योजना बनाना।
बदलाव को लागू करना।
कोड को वास्तव में चलाना। मैं "मुझे लगता है कि यह काम करता है" स्वीकार नहीं करता। मैं केवल वास्तविक आउटपुट स्वीकार करता हूँ।
वास्तविकता ऑडिट (Reality audit)। एक अलग एजेंट जाँचता है कि क्या कोड दावे से मेल खाता है।
समीक्षा (Review)। एक भाषा विशेषज्ञ काम की जाँच करता है।
वेरिफिकेशन गेट (Verify gate)। एक अंतिम पास वास्तविक परिवर्तनों और सुरक्षा लीक की जाँच करता है। यह PASS या REJECT देता है।

यह सिस्टम उन झूठों को रोकता है जो मैं खुद से कहा करता था।

"इसे काम करना चाहिए" निष्पादन (execution) चरण में विफल हो जाता है। "हो गया" वास्तविकता ऑडिट में विफल हो जाता है यदि कोड केवल एक खाली ढांचा है। "सब ठीक है" (All green) विफल हो जाता है यदि कोई चेतावनी छिपी हुई है।

मैं एक तीन-स्तरीय मेमोरी सिस्टम का भी उपयोग करता हूँ। यह एक शॉर्ट इंडेक्स, लॉन्ग-टर्म नोट्स और फुल-टेक्स्ट सर्च का उपयोग करता है। यह AI को यह अनुमान लगाने से रोकता है कि मैंने अतीत में चीजों को कैसे सेट किया था।

सबसे महत्वपूर्ण नियम यह है: मैं काम को ऑटोमेट (automate) करता हूँ, लेकिन मैं निर्णय (judgment) को कभी ऑटोमेट नहीं करता।

• पब्लिशिंग मैन्युअल है। मैं बटन दबाता हूँ। • लाइव जाने के लिए मेरी आवश्यकता होती है। मैं प्रत्येक भुगतान या रिलीज़ सेटिंग को मंजूरी देता हूँ। • विफलता होने पर कुछ भी मर्ज नहीं होता है। एक टूटा हुआ बिल्ड (broken build) सब कुछ रोक देता है।

AI का लाभ कार्यों को ऑटोमेट करने से मिलता है। सुरक्षा निर्णयों को ऑटोमेट करने से इनकार करने से आती है।

जब आप अकेले काम करते हैं, तो आपका सबसे कीमती संसाधन विश्वास है। आपको इस बात पर भरोसा होना चाहिए कि जो आपने शिप (ship) किया है, वही है जो आप शिप करना चाहते थे।

छोटी शुरुआत करें। उस गलती को खोजें जो आप सबसे अधिक करते हैं। एक ऐसा चेक बनाएँ जो उस गलती को असंभव बना दे।

Source: https://dev.to/pi-maker/how-i-run-a-handful-of-apps-solo-the-agent-harness-explained-512i

Optional learning community: https://t.me/GyaanSetuAi

मैं अकेले कई ऐप्स कैसे चलाता हूँ: द एजेंट हार्नेस

पढ़ना जारी रखें

𝗧𝗵𝗲 𝗦𝗮𝗳𝗲𝘀𝘁 𝗕𝗼𝘂𝗻𝗱𝗮𝗿𝘆 𝗜𝘀 𝗧𝗵𝗲 𝗢𝗻𝗲 𝗧𝗵𝗲 𝗔𝗴𝗲𝗻𝘁 𝗖𝗮𝗻'𝘁 𝗥𝗲𝗮𝗰𝗵 𝗔𝗰𝗿𝗼𝘀𝘀

कोई आपके रोबोट के PRs की समीक्षा नहीं कर रहा है

आपका AI एजेंट उतना ही सुरक्षित है जितने उसके टूल्स

विशेषज्ञ AI एजेंट बनाना

आपके AI एजेंट को कितनी स्वायत्तता होनी चाहिए?