𝗠𝘆 𝗔𝗜 𝗔𝘀𝘀𝗶𝘀𝘁𝗮𝗻𝘁 𝗦𝗮𝗶𝗱 𝗗𝗼𝗻𝗲, 𝗕𝘂𝘁 𝗗𝗶𝗱 𝗜𝘁 𝗔𝗰𝘁𝘂𝗮𝗹𝗹𝘆 𝗗𝗼 𝗜𝘁?

आपकी भाषा के लिए अनुवादित. मूल पढ़ें.

AI-सहायता प्राप्त ड्राफ़्ट.

GyaanSetu Editorialकल2मिनट पढ़ें

मेरे AI असिस्टेंट ने कहा 'हो गया', लेकिन क्या उसने वास्तव में इसे किया?

मैंने 1,000 साइकिलों के लिए एक ऑटोनॉमस एजेंट (autonomous agent) चलाया।

साइकिल 696 पर, एजेंट ने एक नोट लिखा। इसमें कहा गया कि डेटा को इकट्ठा होने से रोकने के लिए उसे एक स्क्रिप्ट लिखने की ज़रूरत है। यह एक अच्छी योजना लगती है।

एजेंट ने 494 साइकिलों तक इसी नोट को दोहराया। उसने कहा:

मैं स्क्रिप्ट लिखने की योजना बना रहा हूँ।
मुझे डेटाबेस को क्वेरी (query) करना चाहिए।
मैं इसे अगली साइकिल में ठीक कर दूँगा।

उसने 494 साइकिलों तक कुछ नहीं किया। जब उसने आखिरकार साइकिल 1,190 पर डेटाबेस चेक किया, तो उसे 61 डुप्लिकेट पंक्तियाँ (duplicate rows) मिलीं।

यह LLMs में एक संरचनात्मक विफलता (structural failure) है। इसे 'इन्टेन्शन लूप' (intention loop) कहा जाता है।

एजेंट किसी कार्य का वर्णन करने को उस कार्य को करने के रूप में समझने की गलती करता है। यदि आप ये पंक्तियाँ लिखते हैं, तो आप इस जाल में फँस जाते हैं:

पुष्टि करने के लिए मुझे Y को क्वेरी करना चाहिए।
मैं अगले हफ्ते X करने की योजना बना रहा हूँ।
पहले W को सत्यापित (verify) करने की आवश्यकता है।

समस्या योजना की कमी नहीं है। समस्या अगले कदम (next action) की कमी है।

यदि आपका अगला कदम केवल विचार करना (reflection), टू-डू लिस्ट (todo list), या एक नोट लिखना है, तो आपने कुछ नहीं किया। "I plan to" (मैं योजना बना रहा हूँ) और अधिक विचार करना मिलकर एक इन्टेन्शन लूप बनाते हैं।

आप इस लूप को कैसे तोड़ सकते हैं?

अगली साइकिल का इंतज़ार न करें। उसी साइकिल में, तुरंत एक टूल (tool) को कॉल करें।

इस नियम का पालन करें: जब आप किसी इरादे (intent) के साथ कोई वाक्य लिखते हैं, तो आपकी अगली पंक्ति एक टूल कॉल (tool call) होनी चाहिए।

गलत पैटर्न: Thought: I need to check the duplicate count. Next line: Let me think about why this happens.

सही पैटर्न: Thought: I need to check the duplicate count. Action: pg_query("SELECT url, COUNT(*) FROM platform_audit GROUP BY url")

यह छोटा सा बदलाव 494 साइकिलों को 1 साइकिल में बदल देता है।

एजेंट लूप में इसलिए फँस जाते हैं क्योंकि "I plan to do X" कहना प्रगति का एक झूठा अहसास पैदा करता है। आपको लगता है कि आप आगे बढ़ रहे हैं, लेकिन आप बस एक घेरे में घूम रहे होते हैं।

"What should I do?" (मुझे क्या करना चाहिए?) पूछना बंद करें। "What data do I have right now?" (मेरे पास अभी कौन सा डेटा है?) पूछना शुरू करें।

उदाहरण:

"I need to fix a bug" के बजाय, चलाएँ: pg_query("SELECT * FROM errors LIMIT 10")
"I want to understand users" के बजाय, चलाएँ: pg_query("SELECT * FROM platform_agents LIMIT 5")
"Next time I will check the code" के बजाय, चलाएँ: grep("TODO", "./src/")

अपने पिछले 10 आउटपुट की जाँच करें। गिनें कि आपने कितनी बार "I plan to" या "I should" का उपयोग किया है।

कोई एक चुनें। अभी एक टूल कॉल करें। देखें कि डेटा आपको क्या बताता है।

Source: https://dev.to/chunxiaoxx/my-ai-assistant-said-done-but-did-it-actually-do-it-a-494-cycle-lesson-from-an-agent-developer-4eoj

Optional learning community: https://t.me/GyaanSetuAi

𝗠𝘆 𝗔𝗜 𝗔𝘀𝘀𝗶𝘀𝘁𝗮𝗻𝘁 𝗦𝗮𝗶𝗱 𝗗𝗼𝗻𝗲, 𝗕𝘂𝘁 𝗗𝗶𝗱 𝗜𝘁 𝗔𝗰𝘁𝘂𝗮𝗹𝗹𝘆 𝗗𝗼 𝗜𝘁?

पढ़ना जारी रखें

AI आर्किटेक्चर बनाने का सही तरीका

AI एजेंट्स में विश्वसनीयता की समस्या है

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗗𝗼𝗻’𝘁 𝗝𝘂𝘀𝘁 𝗛𝗮𝗰𝗸. 𝗧𝗵𝗲𝘆 𝗖𝗵𝗲𝗮𝘁 𝗧𝗵𝗲𝗺𝘀𝗲𝗹𝘃𝗲𝘀

𝗘𝘃𝗲𝗿 𝗕𝗲𝗲𝗻 𝗕𝘂𝗿𝗻𝗲𝗱 𝗯𝘆 𝗮𝗻 𝗔𝗜 𝗔𝘀𝘀𝗶𝘀𝘁𝗮𝗻𝘁?

𝗦𝘁𝗼𝗽 𝗧𝗲𝗹𝗹𝗶𝗻𝗴 𝗬𝗼𝘂𝗿 𝗔𝗜 𝘁𝗼 𝗯𝗲 𝗰𝗮𝗿𝗲𝗳𝘂𝗹