एजेंट ने बिल्कुल वही किया जो मैंने कहा था और यही समस्या थी

2024 में AI कोडिंग एजेंट्स ने सब कुछ बदल दिया।

वे आपके कोडबेस को पढ़ते हैं। वे आपके नेमिंग पैटर्न का पालन करते हैं। वे आपके डोमेन को समझते हैं।

मुझे लगा कि इसका मतलब है कि दो सप्ताह का काम दो दिनों में हो जाएगा। मैं गलत था।

मैंने एक एजेंट को एक बड़ा काम दिया: एक React Native ऐप के लिए ग्लोबल इवेंट मैकेनिज्म बनाना। मैंने एक योजना बनाई। मैंने उस योजना को मंजूरी दी।

एजेंट ने योजना का पूरी तरह से पालन किया। यही समस्या थी।

योजना में महत्वपूर्ण विवरण छूट गए थे। इसमें कंडीशनल रूप से लोड होने वाले कंपोनेंट्स का ध्यान नहीं रखा गया था। इसने पूरे सिस्टम पर पड़ने वाले प्रभाव का आकलन नहीं किया था।

एजेंट ने दिखाई देने वाली समस्याओं को तो हल कर दिया, लेकिन अदृश्य समस्याओं को पीछे छोड़ दिया।

यहाँ बताया गया है कि क्या हुआ:

• UI उन क्षेत्रों में टूट गया जिन्हें योजना में अनदेखा कर दिया गया था। • एजेंट ने डुप्लिकेट इवेंट हैंडलर्स जोड़ दिए। • एजेंट ने Context और Redux का उपयोग करके नए पैटर्न बना दिए जो मैंने नहीं मांगे थे।

एजेंट खराब कोड के कारण विफल नहीं हुआ। वह सीमाओं (constraints) की कमी के कारण विफल हुआ।

जब आप कोई नियम निर्धारित नहीं करते हैं, तो AI अनुमान लगाता है। उसका अनुमान अक्सर गलत होता है।

मैंने चैट के माध्यम से इसे ठीक करने की कोशिश की। मैंने कोड के ऊपर कोड जोड़ता गया। चैट थ्रेड बहुत लंबा हो गया। मैंने नई चैट शुरू की। यह चक्र दोहराता रहा।

तीसरे दिन तक, कोड 75% पूरा हो चुका था लेकिन वह बहुत नाजुक था। इस बात का कोई रिकॉर्ड नहीं था कि क्या काम कर रहा था और क्या विफल हो गया था।

मुझे एहसास हुआ कि समस्या टूल में नहीं थी। समस्या भूमिका (role) में थी।

एक AI कोड लिख सकता है। वह यह तय नहीं कर सकता कि काम वास्तव में क्या है।

मानवीय समीक्षा गलतियाँ होने के बाद उन्हें पकड़ती है। लेकिन काम शुरू होने से पहले मानवीय निर्णय को काम को परिभाषित करना चाहिए।

आपको बेहतर टूल की आवश्यकता नहीं है। आपको एक अनुबंध (contract) की आवश्यकता है।

मैंने सात चरणों वाला एक वर्कफ़्लो बनाया। अगला चरण शुरू होने से पहले एक इंसान को हर हैंडऑफ (handoff) को मंजूरी देनी होगी। यह सुनिश्चित करता है कि काम निर्धारित सीमाओं के भीतर रहे।

Source: https://dev.to/jeelvankhede/the-agent-did-exactly-what-i-asked-and-that-was-the-problem-1hek

Optional learning community: https://t.me/GyaanSetuAi