मी एकटाच अनेक ॲप्स कसे चालवतो: द एजंट हार्नेस

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialमागील आठवडा2min read

मी एकटाच अनेक ॲप्स कसे चालवतो: द एजंट हार्नेस (The Agent Harness)

मी स्वतः अनेक लहान ॲप्स बनवतो आणि त्यांचे व्यवस्थापन करतो. माझा कोणताही सह-संस्थापक (cofounder), कर्मचारी किंवा कंत्राटदार नाही. मी फक्त एक व्यक्ती आणि AI एजंट्सचा एक समूह वापरतो.

लोकांना वाटते की AI मुळे मी वेगाने कोडिंग करू शकतो. पण ते गुपित नाही.

गुपित हे आहे की, मी AI ला पुराव्याशिवाय कोणतेही काम पूर्ण झाल्याचे म्हणू देत नाही. जेव्हा तुम्ही एकटे काम करता, तेव्हा धोका संथ कामाचा नसतो; धोका 'आत्मविश्वासाने चुकीचे असण्याचा' असतो.

AI ने टेस्ट रन केल्या नसतील तरीही ते तुम्हाला सांगेल की टेस्ट पास झाल्या आहेत. एखादे फीचर पूर्ण झाले आहे असे ते तेव्हाही म्हणेल जेव्हा त्याने फक्त फंक्शनचे नाव लिहिले असेल. चुका पकडण्यासाठी सोबत कोणताही सहकारी नसल्यामुळे, एक चुकीचा "looks good" तुमचा संपूर्ण ॲप खराब करू शकतो.

मी 'द हार्नेस' (the harness) नावाचे एक सिस्टम तयार केले आहे. हे खोटे काम पूर्ण झाल्याचे भासवणे महागडे ठरवते. AI सत्य सांगत आहे याची खात्री करण्यासाठी हे स्पेशलाइज्ड एजंट्स आणि व्हेरिफिकेशन गेट्सचा वापर करते.

ते कसे काम करते ते खालीलप्रमाणे आहे:

• स्पेशलाइज्ड एजंट्स (Specialized Agents): एका असिस्टंटऐवजी, मी चाळीस स्पेशलाइज्ड एजंट्स वापरतो. एक Flutter कोड रिव्ह्यू करतो. एक सुरक्षा (security) तपासतो. एक टेस्ट रन करतो. एक प्रत्यक्ष बदलांशी तुलना करून दाव्यांची सत्यता तपासतो (audits reality). • आयसोलेटेड वर्क (Isolated Work): एजंट्स स्वतंत्र आणि तात्पुरत्या वातावरणात (environments) काम करतात. ते एकमेकांच्या कामावर ओव्हरराईट करू शकत नाहीत. • रिडंडन्सी (Redundancy): मी एका बदलासाठी अनेक रिव्ह्यूअर्स वापरतो. एक रिव्ह्यूअर कदाचित एखादी बग (bug) मिस करू शकतो. पण वेगवेगळ्या उद्दिष्टे असलेले तीन रिव्ह्यूअर्स आणि एक संशयवादी (skeptic) व्यक्ती ती चूक नक्कीच शोधून काढतील. • फिक्स्ड पाइपलाइन्स (Fixed Pipelines): प्रत्येक कार्य एका कडक मार्गाचे अनुसरण करते:

कामांचे नियोजन करणे.
बदल लागू करणे (Implement).
कोड प्रत्यक्ष रन करणे. मी "मला वाटते की हे काम करेल" असे स्वीकारत नाही. मी फक्त प्रत्यक्ष आउटपुट स्वीकारतो.
रिअॅलिटी ऑडिट (Reality audit). एक वेगळा एजंट कोड दाव्यांशी जुळतो की नाही हे तपासतो.
रिव्ह्यू (Review). एक भाषा तज्ज्ञ कामाची तपासणी करतो.
व्हेरिफाय गेट (Verify gate). अंतिम तपासणी प्रत्यक्ष बदल आणि सुरक्षा त्रुटी (security leaks) तपासते. हे PASS किंवा REJECT रिझल्ट देते.

ही सिस्टम मी स्वतःला सांगत असलेल्या खोट्या गोष्टींना थांबवते.

"हे काम करायला हवे" हे वाक्य एक्झिक्यूशन स्टेजला अपयशी ठरते. जर कोड फक्त एक रिकामी रचना असेल, तर "पूर्ण झाले" हे वाक्य रिअॅलिटी ऑडिटमध्ये अपयशी ठरते. जर एखादी वॉर्निंग (warning) लपलेली असेल, तर "ऑल ग्रीन" (All green) अपयशी ठरते.

मी तीन-स्तरीय मेमरी सिस्टम देखील वापरतो. यामध्ये शॉर्ट इंडेक्स, लाँग-टर्म नोट्स आणि फुल-टेक्स्ट सर्चचा वापर केला जातो. यामुळे AI ने मी भूतकाळात गोष्टी कशा सेट केल्या होत्या याचा अंदाज लावणे टाळले जाते.

सर्वात महत्त्वाचा नियम हा आहे: मी काम ऑटोमेट करतो, पण निर्णय घेण्याची प्रक्रिया (judgment) कधीही ऑटोमेट करत नाही.

• पब्लिशिंग मॅन्युअल आहे. मी स्वतः बटण दाबतो. • लाईव्ह जाण्यासाठी माझी गरज असते. मी प्रत्येक पेमेंट किंवा रिलीज सेटिंगला मंजुरी देतो. • अपयशाच्या स्थितीत काहीही मर्ज (merge) होत नाही. एखादी बिघडलेली बिल्ड (broken build) सर्व काही थांबवते.

AI चा फायदा (leverage) टास्क ऑटोमेट करण्यापासून मिळतो. सुरक्षितता निर्णय ऑटोमेट करण्यास नकार देण्यापासून मिळते.

जेव्हा तुम्ही एकटे काम करता, तेव्हा तुमचा सर्वात मौल्यवान स्त्रोत म्हणजे 'विश्वास' असतो. तुम्ही जे पाठवले (shipped) आहे, ते तुम्ही जे पाठवणार होतात, तेच आहे यावर तुमचा विश्वास असणे आवश्यक आहे.

लहान सुरुवात करा. तुम्ही वारंवार करत असलेल्या चुकीचा शोध घ्या. अशी एक तपासणी (check) तयार करा ज्यामुळे ती चूक करणे अशक्य होईल.

Source: https://dev.to/pi-maker/how-i-run-a-handful-of-apps-solo-the-agent-harness-explained-512i

Optional learning community: https://t.me/GyaanSetuAi

मी एकटाच अनेक ॲप्स कसे चालवतो: द एजंट हार्नेस

Continue reading

सर्वात सुरक्षित सीमा ती आहे जिथे एजंट पोहोचू शकत नाही

तुमच्या रोबोटच्या PRs कोणीही तपासत नाहीये

तुमचा AI एजंट त्याच्या साधनांइतकाच सुरक्षित असतो

विशेषीकृत एआय एजंट्स तयार करणे

तुमच्या AI एजंटमध्ये किती स्वायत्तता असावी?