जटिल वर्कफ्लो स्वयंचलित करण्यासाठी OpenAI Codex ने 'Record & Replay' सादर केले
OpenAI ने macOS वरील आपल्या Codex ॲपसाठी एक परिवर्तनात्मक "Record & Replay" वैशिष्ट्य सादर केले आहे, जे स्वायत्त एजंटच्या (autonomous agent) क्षमतेमध्ये एक महत्त्वपूर्ण झेप आहे. वापरकर्त्याला एखादी मॅन्युअल प्रक्रिया करताना पाहून, AI आता मानवी कृतींचे कायमस्वरूपी आणि पुन्हा वापरण्यायोग्य डिजिटल कौशल्यांमध्ये रूपांतर करू शकते.
निरीक्षणापासून ऑटोमेशनपर्यंत: Record & Replay कसे कार्य करते
नवीनतम Codex अपडेटमधील मुख्य नाविन्य म्हणजे सिंगल-सेशन वर्कफ्लोचे पुन्हा पुन्हा करता येण्याजोग्या ऑटोमेशनमध्ये रूपांतर करण्याची क्षमता. एखादी प्रक्रिया वर्णन करण्यासाठी जटिल स्क्रिप्ट्स किंवा प्रॉम्प्ट्स लिहिण्याऐवजी, वापरकर्ते केवळ AI एजंटला विशिष्ट कार्याद्वारे "मार्गदर्शन" (walk) करू शकतात. उदाहरणार्थ, वापरकर्ता YouTube व्हिडिओ अपलोड करण्याची संपूर्ण प्रक्रिया दाखवू शकतो—ज्यामध्ये मेटाडेटा जोडणे, थंबनेल निवडणे आणि सबटायटल्स अपलोड करणे यांसारख्या गोष्टींचा समावेश असेल.
एकदा प्रात्यक्षिक पूर्ण झाले की, Codex या कृतींचे एका "skill" मध्ये रूपांतर करते. त्यानंतर एजंट भविष्यात ही संपूर्ण प्रक्रिया स्वतंत्रपणे कार्यान्वित करू शकतो. यामुळे AI संवाद केवळ साध्या चॅट-आधारित सूचनांकडून खऱ्या "Computer Use" कडे वळतो, जिथे मॉडेल मानवाप्रमाणेच ऑपरेटिंग सिस्टम आणि ॲप्लिकेशन इंटरफेससोबत संवाद साधते.
तांत्रिक सुधारणा आणि व्हर्जन 26.616 अपडेट्स
Record & Replay वैशिष्ट्याव्यतिरिक्त, व्हर्जन 26.616 मध्ये व्यावसायिक पॉवर युजर्स आणि डेव्हलपर्ससाठी डिझाइन केलेले महत्त्वपूर्ण इन्फ्रास्ट्रक्चर अपडेट्स सादर करण्यात आले आहेत. Automations हिस्ट्रीसाठी नवीन 'बल्क ॲक्शन्स' (bulk actions) पूर्वी रेकॉर्ड केलेल्या कामांचे अधिक चांगल्या प्रकारे व्यवस्थापन करण्यास मदत करतात, तर एक प्रगत "hand-off" क्षमता लागू करण्यात आली आहे. यामुळे वापरकर्त्यांना लोकल मशीन आणि रिमोट होस्ट दरम्यान सक्रिय थ्रेड्स ट्रान्सफर करणे शक्य होते, ज्यामुळे कनेक्टेड हार्डवेअरवर जटिल कार्ये अखंडपणे सुरू ठेवता येतात.
ही प्रगत ऑटोमेशन वैशिष्ट्ये वापरण्यासाठी, वापरकर्त्यांकडे "Computer Use" सक्षम असणे आवश्यक आहे. Codex डाउनलोड करण्यासाठी मोफत असले तरी, हे वर्कफ्लो कार्यान्वित करण्यासाठी आवश्यक असलेल्या उच्च-स्तरीय तर्कासाठी (high-level reasoning) सशुल्क ChatGPT खाते असणे आवश्यक आहे.
प्रादेशिक उपलब्धता आणि व्यापक AI परिदृश्य
या वैशिष्ट्यांच्या रोलआउटला काही भौगोलिक मर्यादांचा सामना करावा लागत आहे. सध्या, UK, स्वित्झर्लंड आणि EU मध्ये Record & Replay उपलब्ध नाही. तथापि, मूलभूत "Computer Use" क्षमता 16 जूनपासून EU मध्ये उपलब्ध आहे, ज्यामुळे भविष्यातील वैशिष्ट्य समानता (feature parity) प्रस्थापित होण्यास मदत होईल.
ही प्रगती AI उद्योगासाठी एक निर्णायक क्षण आहे. आपण LLMs केवळ "knowledge engines" कडून "action engines" मध्ये रूपांतरित होताना पाहत आहोत. GUI-आधारित कार्ये निरीक्षण करण्याची आणि त्यांची नक्कल करण्याची क्षमता आत्मसात करून, Codex हे OpenAI ला व्हाईट-कॉलर वर्क ऑटोमेशनच्या क्षेत्रात वर्चस्व मिळवण्यासाठी सज्ज करत आहे, ज्यामुळे डेस्कटॉप ऑपरेटिंग सिस्टमचे रूपांतर मॅन्युअल क्लिक्सऐवजी इंटेलिजेंट एजंट्सद्वारे नियंत्रित वातावरणात प्रभावीपणे होत आहे.
मुख्य निष्कर्ष
- Behavioral Mimicry: नवीन Record & Replay फीचरमुळे Codex ला एका मॅन्युअल प्रात्यक्षिकाचे रूपांतर पुन्हा वापरण्यायोग्य ऑटोमेशन स्किलमध्ये करता येते.
- Advanced Workflow Management: व्हर्जन 26.616 मध्ये लोकल आणि रिमोट होस्ट्समधील thread hand-offs आणि ऑटोमेशन हिस्ट्रीसाठी सुधारित bulk management सुविधा देण्यात आली आहे.
- Agentic Evolution: ही हालचाल टेक्स्ट-आधारित AI सहाय्यक कडून जटिल सॉफ्टवेअर इंटरफेस हाताळण्यास सक्षम असलेल्या स्वायत्त 'Computer Use' एजंट्सकडे होणाऱ्या संक्रमणाचे प्रतीक आहे.