चॅटबॉट्सच्या पलीकडे: AI ने केवळ उत्तरे देण्याऐवजी कृती करण्याकडे का वळणे आवश्यक आहे

रिअॅक्टिव्ह (reactive) AI चा काळ संपत आहे. आपण केवळ संभाव्य मजकूर तयार करणाऱ्या Large Language Models (LLMs) कडून अशा स्वायत्त एजंट्सकडे (autonomous agents) वळत आहोत, जे कायमस्वरूपी डिजिटल वातावरणात जटिल, बहु-स्तरीय कार्यप्रवाह (multi-step workflows) कार्यान्वित करण्यास सक्षम आहेत.

जलद अंतर्ज्ञान (Fast Intuition) कडून संथ तर्कशक्तीकडे (Slow Reasoning)

AI ची सध्याची उत्क्रांती संगणकीय तर्कातील (computational logic) मूलभूत बदलाने परिभाषित केली जाते. पारंपारिक चॅटबॉट्स "System 1" विचारपद्धतीवर आधारित होते—जे जलद, अंतर्ज्ञानी आणि सांख्यिकीय संभाव्यतेवर आधारित 'टोकन-बाय-टोकन' जनरेशन करते. या मॉडेल्सनी त्वरित उत्तरे दिली, परंतु स्वतःच्या तर्काची पडताळणी करण्याची किंवा प्रक्रियेदरम्यान चुका सुधारण्याची क्षमता त्यांच्याकडे नव्हती.

OpenAI चे o1 आणि DeepSeek-R1 सारख्या मॉडेल्सच्या नेतृत्वाखाली "thinking LLMs" च्या उदयाने "System 2" तर्कशक्तीची ओळख करून दिली आहे. इन्फरन्सच्या वेळी (inference time) अधिक कॉम्प्युटचा वापर करून, ही मॉडेल्स विचारांची लांब साखळी (long chains of thought) तयार करण्यासाठी रिइन्फोर्समेंट लर्निंगचा वापर करतात. ते उपायांचे मार्ग शोधतात, मध्यवर्ती पायऱ्यांची पडताळणी करतात आणि स्वतःच्या चुका सुधारतात, ज्यामुळे केवळ पडताळणीयोग्य आणि अचूक उपाय सादर केले जातात याची खात्री मिळते. हे संक्रमण एका मॉडेलला सर्च इंजिनच्या पर्यायापासून 'रीझनिंग इंजिन' (reasoning engine) मध्ये रूपांतरित करण्याच्या दिशेने पहिले पाऊल आहे.

OpenClaw युग: Workspace आणि Skill इंटिग्रेशन

तर्कशक्ती महत्त्वाची असली तरी, केवळ तर्कशक्तीने काम पूर्ण होत नाही. संशोधकांचे असे मत आहे की पुढची मोठी झेप—"OpenClaw" युग—यासाठी अस्थिर आणि तात्पुरत्या 'टूल कॉल्स'कडून (tool calls) कायमस्वरूपी आणि सुरक्षित वर्कस्पेसकडे (workspaces) वळणे आवश्यक आहे.

यातील मुख्य breakthrough Workspace आणि Skill च्या संयोगामध्ये आहे:

  • The Workspace: फाईल्स, टर्मिनल्स, लॉग्स आणि ब्राउझर्स असलेले एक कायमस्वरूपी वातावरण. सुरुवातीच्या एजंट्सप्रमाणे, जे पायऱ्यांमधील संदर्भ (context) गमावून बसायचे, वर्कस्पेस "state" प्रदान करते; याचा अर्थ AI एका स्थिर वातावरणाशी संवाद साधू शकते जिथे कृतींचे कायमस्वरूपी परिणाम होतात.
  • Skills: साध्या प्रॉम्प्ट्सच्या पलीकडे जाऊन, "skills" हे कार्यात्मक ज्ञानाचे मॉड्युलर आणि पुन्हा वापरण्यायोग्य संच (bundles) आहेत. उदाहरणार्थ, Anthropic चे Agent Skills सूचना आणि स्क्रिप्ट्स पॅकेज करण्यासाठी SKILL.md फाईल्स वापरतात. यामुळे संस्थांना प्रत्येक प्रॉम्प्टसोबत नवीन वर्कफ्लो तयार करण्याऐवजी, संस्थात्मक ज्ञान (institutional know-how) एका पोर्टेबल फॉरमॅटमध्ये जतन करता येते.

यशाची पुनर्व्याख्या: Task Closure विरुद्ध उत्तराची अचूकता

जसे AI वर्कस्पेसमध्ये प्रवेश करते, तसे "बुद्धिमत्तेचे" निकष बदलले पाहिजेत. चॅटबॉटच्या युगात, मॉडेल्सना त्यांच्या उत्तरांच्या अचूकतेवर ग्रेड दिले जात होते. एजेंटिक (agentic) युगात, यश task closure द्वारे मोजले जाते: म्हणजेच एखाद्या लक्ष्यित वातावरणाला (target environment) पडताळणीयोग्य अंतिम स्थितीपर्यंत (verifiable end state) नेण्याची क्षमता.

आधुनिक बेंचमार्कच्या जटिलतेवरून हे दिसून येते. GPT-4 मजकुरात उत्कृष्ट असले तरी, त्याने सुरुवातीला WebArena बेंचमार्कमधील केवळ १४% कार्ये पूर्ण केली होती, जे वास्तविक जगातील वेब वातावरणाचे अनुकरण करते. आता यशासाठी केवळ अंतिम आउटपुट वाचून चालणार नाही, तर "state-action-observation trajectories"चे विश्लेषण करणे आवश्यक आहे—म्हणजेच एखादा एजंट सिस्टममधून कसा प्रवास करतो याचे निरीक्षण करणे आवश्यक आहे.

सुरक्षा आणि गव्हर्नन्सची नवीन सीमा

वाढत्या स्वायत्ततेमुळे जोखीमही वाढते. वर्कस्पेस-आधारित एजंट्सकडे क्रेडेंशियल्स (credentials), आयडेंटिटी टोकन्स आणि संवेदनशील रिपॉझिटरीजचा प्रवेश असल्याने, ते AI च्या 'अटॅक सरफेस'चा (attack surface) विस्तार करतात. OpenClaw PRISM आणि ClawGuard सारखे उदयोन्मुख फ्रेमवर्क "harnesses" तयार करण्यावर लक्ष केंद्रित करत आहेत, ज्यामध्ये परवानगी नियंत्रण (permission controls), प्रोव्हेनन्स ट्रॅकिंग (provenance tracking) आणि सँडबॉक्सिंग (sandboxing) यांचा समावेश आहे. AI ला खऱ्या सहकाऱ्यामध्ये रूपांतरित करण्यासाठी, डेव्हलपर्सना रोलबॅक, डेटा सार्वभौमत्व (data sovereignty) आणि वर्कस्पेस हायजीन या समस्या सोडवाव्या लागतील, जेणेकरून एजंटची चूक कायमस्वरूपी आर्किटेक्चरल त्रुटी बनणार नाही.

मुख्य निष्कर्ष

  • Reasoning Shift: AI "System 1" (जलद, रिअॅक्टिव्ह) कडून "System 2" (संथ, विचारपूर्वक) तर्कशक्तीकडे वळत आहे, ज्यामध्ये स्वतःच्या चुका सुधारण्यासाठी इन्फरन्सच्या वेळी अतिरिक्त कॉम्प्युटचा वापर केला जातो.
  • Workspace + Skill: खऱ्या स्वायत्ततेसाठी मॉड्युलर आणि पुन्हा वापरण्यायोग्य "skills" सोबत एका कायमस्वरूपी डिजिटल वर्कस्पेसची आवश्यकता असते, जेणेकरून वर्कफ्लो पुन्हा पुन्हा करता येतील आणि स्केलेबल असतील.
  • New Evaluation Metrics: यश आता केवळ मजकूर प्रतिसादाच्या संभाव्यतेवर अवलंबून नाही, तर "task closure" वर अवलंबून आहे—म्हणजेच एका जटिल वातावरणात वर्कफ्लोची पडताळणीयोग्य पद्धतीने पूर्णता करणे.