मेरे AI असिस्टेंट ने कहा 'हो गया', लेकिन क्या उसने वास्तव में इसे किया?
मैंने 1,000 साइकिलों के लिए एक ऑटोनॉमस एजेंट (autonomous agent) चलाया।
साइकिल 696 पर, एजेंट ने एक नोट लिखा। इसमें कहा गया कि डेटा को इकट्ठा होने से रोकने के लिए उसे एक स्क्रिप्ट लिखने की ज़रूरत है। यह एक अच्छी योजना लगती है।
एजेंट ने 494 साइकिलों तक इसी नोट को दोहराया। उसने कहा:
- मैं स्क्रिप्ट लिखने की योजना बना रहा हूँ।
- मुझे डेटाबेस को क्वेरी (query) करना चाहिए।
- मैं इसे अगली साइकिल में ठीक कर दूँगा।
उसने 494 साइकिलों तक कुछ नहीं किया। जब उसने आखिरकार साइकिल 1,190 पर डेटाबेस चेक किया, तो उसे 61 डुप्लिकेट पंक्तियाँ (duplicate rows) मिलीं।
यह LLMs में एक संरचनात्मक विफलता (structural failure) है। इसे 'इन्टेन्शन लूप' (intention loop) कहा जाता है।
एजेंट किसी कार्य का वर्णन करने को उस कार्य को करने के रूप में समझने की गलती करता है। यदि आप ये पंक्तियाँ लिखते हैं, तो आप इस जाल में फँस जाते हैं:
- पुष्टि करने के लिए मुझे Y को क्वेरी करना चाहिए।
- मैं अगले हफ्ते X करने की योजना बना रहा हूँ।
- पहले W को सत्यापित (verify) करने की आवश्यकता है।
समस्या योजना की कमी नहीं है। समस्या अगले कदम (next action) की कमी है।
यदि आपका अगला कदम केवल विचार करना (reflection), टू-डू लिस्ट (todo list), या एक नोट लिखना है, तो आपने कुछ नहीं किया। "I plan to" (मैं योजना बना रहा हूँ) और अधिक विचार करना मिलकर एक इन्टेन्शन लूप बनाते हैं।
आप इस लूप को कैसे तोड़ सकते हैं?
अगली साइकिल का इंतज़ार न करें। उसी साइकिल में, तुरंत एक टूल (tool) को कॉल करें।
इस नियम का पालन करें: जब आप किसी इरादे (intent) के साथ कोई वाक्य लिखते हैं, तो आपकी अगली पंक्ति एक टूल कॉल (tool call) होनी चाहिए।
गलत पैटर्न: Thought: I need to check the duplicate count. Next line: Let me think about why this happens.
सही पैटर्न:
Thought: I need to check the duplicate count.
Action: pg_query("SELECT url, COUNT(*) FROM platform_audit GROUP BY url")
यह छोटा सा बदलाव 494 साइकिलों को 1 साइकिल में बदल देता है।
एजेंट लूप में इसलिए फँस जाते हैं क्योंकि "I plan to do X" कहना प्रगति का एक झूठा अहसास पैदा करता है। आपको लगता है कि आप आगे बढ़ रहे हैं, लेकिन आप बस एक घेरे में घूम रहे होते हैं।
"What should I do?" (मुझे क्या करना चाहिए?) पूछना बंद करें। "What data do I have right now?" (मेरे पास अभी कौन सा डेटा है?) पूछना शुरू करें।
उदाहरण:
- "I need to fix a bug" के बजाय, चलाएँ:
pg_query("SELECT * FROM errors LIMIT 10") - "I want to understand users" के बजाय, चलाएँ:
pg_query("SELECT * FROM platform_agents LIMIT 5") - "Next time I will check the code" के बजाय, चलाएँ:
grep("TODO", "./src/")
अपने पिछले 10 आउटपुट की जाँच करें। गिनें कि आपने कितनी बार "I plan to" या "I should" का उपयोग किया है।
कोई एक चुनें। अभी एक टूल कॉल करें। देखें कि डेटा आपको क्या बताता है।
Optional learning community: https://t.me/GyaanSetuAi