ऑर्केस्ट्रेशन कोलॅप्स (Orchestration Collapse) आता समोर आला आहे
Google ने AI एजंट्स तयार करण्याचे नियम नुकतेच बदलले आहेत.
Gemini मॉडेल्ससाठी नवीन Interactions API आता लाइव्ह झाला आहे. हे केवळ एक छोटे अपडेट नाही. हा एक संरचनात्मक बदल (structural shift) आहे, ज्यामुळे अनेक सध्याचे फ्रेमवर्क्स अनावश्यक ठरतील.
अनेक वर्षांपासून, डेव्हलपर्स AI व्यवस्थापित करण्यासाठी मोठे मिडलवेअर लेयर्स (middleware layers) तयार करत होते. तुम्हाला स्वतःचे सेशन डेटाबेस, कॉन्टेक्स्ट प्रूनिंग सर्व्हिसेस आणि मेमरी मॅनेजमेंट टूल्स बनवावे लागत होते. जर तुम्ही Gemini साठी LangGraph किंवा AutoGen वापरत असाल, तर या "प्लंबिंग" (plumbing) कामासाठी तुमचे अनेक महिने खर्च होत असत.
Interactions API हे सर्व काम स्वतः हाताळतो.
काय बदलले?
• सर्व्हर-साइड स्टेट (Server-side state): Google आता त्यांच्या इन्फ्रास्ट्रक्चरवर संभाषणाचा इतिहास आणि मेमरी व्यवस्थापित करते. वापरकर्त्याने काय म्हटले होते हे लक्षात ठेवण्यासाठी तुम्हाला आता Redis स्टोअरची गरज नाही. • बॅकग्राउंड एक्झिक्यूशन (Background execution): तुम्ही दीर्घकाळ चालणाऱ्या कामांसाठी (long tasks) फक्त एक फ्लॅग सेट करू शकता. आता कस्टम जॉब क्यू (job queues) किंवा Celery क्लस्टर्सची गरज नाही. • मॅनेज्ड एजंट्स (Managed Agents): Google एक सुरक्षित Linux सँडबॉक्स प्रदान करते. तुमचे एजंट्स आता कोड रन करू शकतात, वेब ब्राउझ करू शकतात आणि फाईल्स नेटिव्हली मॅनेज करू शकतात. • युनिफाइड एंडपॉइंट (Unified Endpoint): आता एकच URL विखुरलेल्या Chat आणि Generate Content APIs ची जागा घेते.
मी स्वतः याची चाचणी केली. मी एक LangGraph वर्कफ्लो Interactions API वर हलवला. माझा सेशन-स्टेट कोड ४०० ओळींवरून केवळ एका सिंगल पॅरामीटरवर आला.
हेच आहे 'ऑर्केस्ट्रेशन कोलॅप्स' (Orchestration Collapse). जेव्हा व्हेंडर (vendor) स्टेट, टूल्स आणि असिंक एक्झिक्यूशन (async execution) नेटिव्हली प्रदान करतो, तेव्हा तुमचा कस्टम फ्रेमवर्क ही गरज राहत नाही; तो केवळ एक पर्याय बनतो.
तुम्ही स्थलांतरित (migrate) झाले पाहिजे का?
जर खालील गोष्टी लागू होत असतील तर स्थलांतरित व्हा:
- तुमचा वर्कफ्लो फक्त Gemini वर चालतो.
- तुम्ही सेशन स्टेट किंवा डेटाबेस व्यवस्थापित करण्यात खूप वेळ घालवता.
- तुम्हाला तुमचा इंजिनिअरिंग ओव्हरहेड (engineering overhead) कमी करायचा आहे.
जर खालील गोष्टी लागू होत असतील तर तुमच्या सध्याच्या फ्रेमवर्कसोबतच राहा:
- तुम्हाला क्रॉस-मॉडेल ऑर्केस्ट्रेशनची गरज आहे (उदा. Claude आणि GPT दोन्ही वापरणे).
- तुम्हाला जटिल 'ह्युमन-इन-द-लूप' (human-in-the-loop) अप्रूव्हल वर्कफ्लोची आवश्यकता आहे.
इंजिनिअरिंगचे काम तुमच्या इन्फ्रास्ट्रक्चरकडून Google कडे वळत आहे. यामुळे कस्टम मिडलवेअर इंजिनिअरिंगमध्ये ४०% ते ६०% पर्यंत घट होऊ शकते.
याचा तोटा म्हणजे 'लॉक-इन' (lock-in). तुमचा स्टेट आता Google च्या सर्व्हरवर असेल. नंतर दुसऱ्या प्रोव्हायडरकडे जाण्यासाठी तुम्हाला पुन्हा सर्व काही रिबिल्ड करावे लागेल. बहुतेक टीम्ससाठी, वेग आणि खर्चात होणारी बचत यामुळे हा एक फायदेशीर सौदा ठरतो.
Optional learning community: https://t.me/GyaanSetuAi
