चैटबॉट्स से परे: AI को केवल उत्तर देने से हटकर कार्य निष्पादित करने की ओर क्यों बढ़ना चाहिए
रिएक्टिव (reactive) AI का युग समाप्त हो रहा है। हम उन Large Language Models (LLMs) से आगे बढ़ रहे हैं जो केवल विश्वसनीय टेक्स्ट जनरेट करते हैं, और अब हम उन ऑटोनॉमस एजेंट्स (autonomous agents) की ओर बढ़ रहे हैं जो निरंतर डिजिटल वातावरण (persistent digital environments) में जटिल, बहु-चरणीय वर्कफ़्लो (multi-step workflows) को निष्पादित करने में सक्षम हैं।
तेज़ अंतर्ज्ञान से धीमी तर्कशक्ति तक
AI का वर्तमान विकास कंप्यूटेशनल लॉजिक में एक मौलिक बदलाव से परिभाषित है। पारंपरिक चैटबॉट्स "System 1" सोच पर काम करते थे—जो सांख्यिकीय संभावना (statistical probability) के आधार पर तेज़, सहज और टोकन-दर-टोकन जनरेशन पर आधारित थी। ये मॉडल तत्काल उत्तर तो प्रदान करते थे, लेकिन उनमें अपने स्वयं के तर्क को सत्यापित करने या बीच में ही त्रुटियों को सुधारने की क्षमता की कमी थी।
OpenAI के o1 और DeepSeek-R1 जैसे मॉडल्स के नेतृत्व में "thinking LLMs" के उदय ने "System 2" रीजनिंग (तर्कशक्ति) को पेश किया है। इन्फरेंस टाइम (inference time) पर अधिक कंप्यूट का निवेश करके, ये मॉडल रीइन्फोर्समेंट लर्निंग का उपयोग करके विचारों की लंबी श्रृंखला (chains of thought) जनरेट करते हैं। वे समाधान के रास्तों की खोज करते हैं, मध्यवर्ती चरणों को सत्यापित करते हैं, और स्वयं को सुधारते हैं, जिससे यह सुनिश्चित होता है कि केवल सत्यापन योग्य रूप से सही समाधान ही प्रस्तुत किए जाएं। यह बदलाव एक मॉडल को सर्च इंजन के विकल्प से बदलकर एक रीजनिंग इंजन बनाने की दिशा में पहला कदम है।
OpenClaw युग: वर्कस्पेस और स्किल इंटीग्रेशन
हालांकि रीजनिंग महत्वपूर्ण है, लेकिन केवल रीजनिंग से काम पूरा नहीं होता है। शोधकर्ताओं का तर्क है कि अगली बड़ी छलांग—"OpenClaw" युग—के लिए नाजुक, एक बार के टूल कॉल्स (one-off tool calls) से हटकर निरंतर और सुरक्षित वर्कस्पेस (workspaces) की ओर संक्रमण की आवश्यकता है।
यह सफलता Workspace और Skill के संयोजन में निहित है:
- The Workspace: एक निरंतर वातावरण जिसमें फ़ाइलें, टर्मिनल, लॉग और ब्राउज़र शामिल होते हैं। शुरुआती एजेंट्स के विपरीत, जो चरणों के बीच संदर्भ (context) खो देते थे, एक वर्कस्पेस "स्टेट" (state) प्रदान करता है, जिसका अर्थ है कि AI एक स्थिर वातावरण के साथ इंटरैक्ट कर सकता है जहाँ कार्यों के स्थायी परिणाम होते हैं।
- Skills: साधारण प्रॉम्प्ट्स से आगे बढ़ते हुए, "skills" परिचालन ज्ञान (operational knowledge) के मॉड्यूलर और पुन: प्रयोज्य (reusable) बंडल हैं। उदाहरण के लिए, Anthropic के Agent Skills, निर्देशों और स्क्रिप्ट को पैकेज करने के लिए
SKILL.mdफ़ाइलों का उपयोग करते हैं। यह संगठनों को हर प्रॉम्प्ट के साथ वर्कफ़्लो को फिर से बनाने के बजाय संस्थागत विशेषज्ञता (institutional know-how) को एक पोर्टेबल प्रारूप में सहेजने की अनुमति देता है।
सफलता को फिर से परिभाषित करना: टास्क क्लोजर बनाम उत्तर की सटीकता
जैसे-जैसे AI वर्कस्पेस में प्रवेश कर रहा है, "बुद्धिमत्ता" (intelligence) के मापदंडों को बदलना होगा। चैटबॉट युग में, मॉडल्स को उनके उत्तरों की सटीकता के आधार पर ग्रेड दिया जाता था। एजेंटिक युग (agentic era) में, सफलता को task closure से मापा जाता है: यानी किसी लक्षित वातावरण को सत्यापन योग्य अंतिम स्थिति (verifiable end state) तक लाने की क्षमता।
इस बदलाव का प्रमाण आधुनिक बेंचमार्क की जटिलता से मिलता है। जबकि GPT-4 टेक्स्ट में उत्कृष्ट है, इसने शुरुआत में WebArena बेंचमार्क में केवल 14% कार्य पूरे किए थे, जो वास्तविक दुनिया के वेब वातावरण का अनुकरण (simulate) करता है। अब सफलता के लिए केवल अंतिम आउटपुट को पढ़ने के बजाय "state-action-observation trajectories" का विश्लेषण करना आवश्यक है—यानी यह देखना कि एक एजेंट सिस्टम के माध्यम से कैसे आगे बढ़ता है।
सुरक्षा और गवर्नेंस की नई सीमा
बढ़ती स्वायत्तता (autonomy) के साथ बढ़ता जोखिम भी आता है। क्योंकि वर्कस्पेस-आधारित एजेंट्स के पास क्रेडेंशियल्स, आइडेंटिटी टोकन और संवेदनशील रिपॉजिटरी तक पहुंच होती है, वे AI अटैक सरफेस (attack surface) को बढ़ा देते हैं। OpenClaw PRISM और ClawGuard जैसे उभरते फ्रेमवर्क ऐसे "harnesses" बनाने पर ध्यान केंद्रित कर रहे हैं जिनमें अनुमति नियंत्रण (permission controls), प्रोवेनेंस ट्रैकिंग (provenance tracking) और सैंडबॉक्सिंग (sandboxing) शामिल हैं। AI को एक सच्चा सहकर्मी बनाने के लिए, डेवलपर्स को रोलबैक, डेटा संप्रभुता (data sovereignty) और वर्कस्पेस हाइजीन की समस्याओं को हल करना होगा ताकि यह सुनिश्चित हो सके कि एजेंट की गलती कोई स्थायी आर्किटेक्चरल खामी न बन जाए।
मुख्य बातें
- Reasoning Shift: AI "System 1" (तेज़, रिएक्टिव) से "System 2" (धीमी, विचारशील) रीजनिंग की ओर बढ़ रहा है, जो स्वयं को सुधारने के लिए इन्फरेंस टाइम पर अतिरिक्त कंप्यूट का उपयोग करता है।
- Workspace + Skill: वास्तविक स्वायत्तता के लिए एक निरंतर डिजिटल वर्कस्पेस और उसके साथ मॉड्यूलर, पुन: प्रयोज्य "skills" की आवश्यकता होती है ताकि यह सुनिश्चित हो सके कि वर्कफ़्लो दोहराने योग्य और स्केलेबल हों।
- New Evaluation Metrics: सफलता अब टेक्स्ट रिस्पॉन्स की विश्वसनीयता के बारे में नहीं है, बल्कि "task closure" के बारे में है—यानी एक जटिल वातावरण के भीतर वर्कफ़्लो को सत्यापन योग्य रूप से पूरा करना।
