मी एकटाच अनेक ॲप्स कसे चालवतो: द एजंट हार्नेस (The Agent Harness)
मी स्वतः अनेक लहान ॲप्स बनवतो आणि त्यांचे व्यवस्थापन करतो. माझा कोणताही सह-संस्थापक (cofounder), कर्मचारी किंवा कंत्राटदार नाही. मी फक्त एक व्यक्ती आणि AI एजंट्सचा एक समूह वापरतो.
लोकांना वाटते की AI मुळे मी वेगाने कोडिंग करू शकतो. पण ते गुपित नाही.
गुपित हे आहे की, मी AI ला पुराव्याशिवाय कोणतेही काम पूर्ण झाल्याचे म्हणू देत नाही. जेव्हा तुम्ही एकटे काम करता, तेव्हा धोका संथ कामाचा नसतो; धोका 'आत्मविश्वासाने चुकीचे असण्याचा' असतो.
AI ने टेस्ट रन केल्या नसतील तरीही ते तुम्हाला सांगेल की टेस्ट पास झाल्या आहेत. एखादे फीचर पूर्ण झाले आहे असे ते तेव्हाही म्हणेल जेव्हा त्याने फक्त फंक्शनचे नाव लिहिले असेल. चुका पकडण्यासाठी सोबत कोणताही सहकारी नसल्यामुळे, एक चुकीचा "looks good" तुमचा संपूर्ण ॲप खराब करू शकतो.
मी 'द हार्नेस' (the harness) नावाचे एक सिस्टम तयार केले आहे. हे खोटे काम पूर्ण झाल्याचे भासवणे महागडे ठरवते. AI सत्य सांगत आहे याची खात्री करण्यासाठी हे स्पेशलाइज्ड एजंट्स आणि व्हेरिफिकेशन गेट्सचा वापर करते.
ते कसे काम करते ते खालीलप्रमाणे आहे:
• स्पेशलाइज्ड एजंट्स (Specialized Agents): एका असिस्टंटऐवजी, मी चाळीस स्पेशलाइज्ड एजंट्स वापरतो. एक Flutter कोड रिव्ह्यू करतो. एक सुरक्षा (security) तपासतो. एक टेस्ट रन करतो. एक प्रत्यक्ष बदलांशी तुलना करून दाव्यांची सत्यता तपासतो (audits reality). • आयसोलेटेड वर्क (Isolated Work): एजंट्स स्वतंत्र आणि तात्पुरत्या वातावरणात (environments) काम करतात. ते एकमेकांच्या कामावर ओव्हरराईट करू शकत नाहीत. • रिडंडन्सी (Redundancy): मी एका बदलासाठी अनेक रिव्ह्यूअर्स वापरतो. एक रिव्ह्यूअर कदाचित एखादी बग (bug) मिस करू शकतो. पण वेगवेगळ्या उद्दिष्टे असलेले तीन रिव्ह्यूअर्स आणि एक संशयवादी (skeptic) व्यक्ती ती चूक नक्कीच शोधून काढतील. • फिक्स्ड पाइपलाइन्स (Fixed Pipelines): प्रत्येक कार्य एका कडक मार्गाचे अनुसरण करते:
- कामांचे नियोजन करणे.
- बदल लागू करणे (Implement).
- कोड प्रत्यक्ष रन करणे. मी "मला वाटते की हे काम करेल" असे स्वीकारत नाही. मी फक्त प्रत्यक्ष आउटपुट स्वीकारतो.
- रिअॅलिटी ऑडिट (Reality audit). एक वेगळा एजंट कोड दाव्यांशी जुळतो की नाही हे तपासतो.
- रिव्ह्यू (Review). एक भाषा तज्ज्ञ कामाची तपासणी करतो.
- व्हेरिफाय गेट (Verify gate). अंतिम तपासणी प्रत्यक्ष बदल आणि सुरक्षा त्रुटी (security leaks) तपासते. हे PASS किंवा REJECT रिझल्ट देते.
ही सिस्टम मी स्वतःला सांगत असलेल्या खोट्या गोष्टींना थांबवते.
"हे काम करायला हवे" हे वाक्य एक्झिक्यूशन स्टेजला अपयशी ठरते. जर कोड फक्त एक रिकामी रचना असेल, तर "पूर्ण झाले" हे वाक्य रिअॅलिटी ऑडिटमध्ये अपयशी ठरते. जर एखादी वॉर्निंग (warning) लपलेली असेल, तर "ऑल ग्रीन" (All green) अपयशी ठरते.
मी तीन-स्तरीय मेमरी सिस्टम देखील वापरतो. यामध्ये शॉर्ट इंडेक्स, लाँग-टर्म नोट्स आणि फुल-टेक्स्ट सर्चचा वापर केला जातो. यामुळे AI ने मी भूतकाळात गोष्टी कशा सेट केल्या होत्या याचा अंदाज लावणे टाळले जाते.
सर्वात महत्त्वाचा नियम हा आहे: मी काम ऑटोमेट करतो, पण निर्णय घेण्याची प्रक्रिया (judgment) कधीही ऑटोमेट करत नाही.
• पब्लिशिंग मॅन्युअल आहे. मी स्वतः बटण दाबतो. • लाईव्ह जाण्यासाठी माझी गरज असते. मी प्रत्येक पेमेंट किंवा रिलीज सेटिंगला मंजुरी देतो. • अपयशाच्या स्थितीत काहीही मर्ज (merge) होत नाही. एखादी बिघडलेली बिल्ड (broken build) सर्व काही थांबवते.
AI चा फायदा (leverage) टास्क ऑटोमेट करण्यापासून मिळतो. सुरक्षितता निर्णय ऑटोमेट करण्यास नकार देण्यापासून मिळते.
जेव्हा तुम्ही एकटे काम करता, तेव्हा तुमचा सर्वात मौल्यवान स्त्रोत म्हणजे 'विश्वास' असतो. तुम्ही जे पाठवले (shipped) आहे, ते तुम्ही जे पाठवणार होतात, तेच आहे यावर तुमचा विश्वास असणे आवश्यक आहे.
लहान सुरुवात करा. तुम्ही वारंवार करत असलेल्या चुकीचा शोध घ्या. अशी एक तपासणी (check) तयार करा ज्यामुळे ती चूक करणे अशक्य होईल.
Source: https://dev.to/pi-maker/how-i-run-a-handful-of-apps-solo-the-agent-harness-explained-512i
Optional learning community: https://t.me/GyaanSetuAi
