Gemini Interactions API: क्या एजेंट मिडलवेयर का अंत हो रहा है?
Google ने अभी-अभी AI एजेंट बनाने के आपके तरीके को बदल दिया है।
Interactions API अब सामान्य रूप से उपलब्ध (generally available) है। यह Gemini मॉडल्स और एजेंटों के साथ काम करने का नया प्राथमिक तरीका है। यह अपडेट सरल कार्यों के लिए LangGraph या CrewAI जैसे अधिकांश ऑर्केस्ट्रेशन फ्रेमवर्क को अनावश्यक बना देता है।
पहले, आपको चार चीजों को आपस में जोड़ना पड़ता था:
- Model calls
- Tool execution
- Conversation state
- Agent lifecycle
अब, Google इन सभी को एक एकल सर्वर-साइड कॉन्ट्रैक्ट में समाहित कर देता है।
इसका आपके लिए क्या अर्थ है:
• Unified Execution अब आपको "प्लंबिंग" (plumbing) को मैनेज करने की आवश्यकता नहीं है। एक ही API कॉल इन्फरेंस, टूल्स और स्टेट को संभाल लेती है।
• Server-Side State
आपको शॉर्ट-टर्म मेमोरी के लिए Redis या वेक्टर डेटाबेस में हिस्ट्री मैनेज करने की आवश्यकता नहीं है। Google session_id के माध्यम से सेशन को संभालता है। इससे जटिल कॉन्टेक्स्ट विंडो मैनेजमेंट की आवश्यकता समाप्त हो जाती है।
• Managed Agents आप रिमोट Linux सैंडबॉक्स को ट्रिगर करने के लिए "antigravity" जैसे एजेंट ID को कॉल कर सकते हैं। यह एजेंट बिना किसी इंफ्रास्ट्रक्चर सेटअप के तर्क (reasoning) कर सकता है, कोड चला सकता है और वेब ब्राउज़ कर सकता है।
• Background Execution
लंबे समय तक चलने वाले कार्यों के लिए background=True सेट करें। सर्वर काम को एसिंक्रोनसली (asynchronously) चलाता है। अब आपको अपनी खुद की जॉब क्यू (job queues) या पोलिंग लूप बनाने की आवश्यकता नहीं है।
The Trade-off: Portability vs. Convenience
मुख्य समस्या 'लॉक-इन' (lock-in) है। क्योंकि आपकी कन्वर्सेशन स्टेट Google के सर्वर पर रहती है, इसलिए आप उस स्टेट को आसानी से OpenAI या Anthropic पर नहीं ले जा सकते। आप गति और कम बॉयलरप्लेट (boilerplate) प्राप्त करते हैं, लेकिन आप आसानी से प्रोवाइडर बदलने की क्षमता खो देते हैं।
बिल्डर्स के लिए मेरी सलाह:
- लीनियर (linear) और स्टेटफुल (stateful) एजेंट पाथ के लिए Interactions API का उपयोग करें।
- जटिल, ब्रांचिंग या साइक्लिक वर्कफ़्लो के लिए LangGraph का उपयोग जारी रखें।
- पोर्टेबल बने रहने के लिए अपने दीर्घकालिक ज्ञान (long-term knowledge) को अपने स्वयं के वेक्टर डेटाबेस में रखें।
- सैंडबॉक्स कंप्यूट लागत की बारीकी से निगरानी करें, क्योंकि वे टोकन से अलग बिल किए जाते हैं।
भारी मात्रा में "ग्लू कोड" (glue code) बनाने का युग समाप्त हो रहा है। Google ऑर्केस्ट्रेशन लेयर को आपके कोड से हटाकर अपने सर्वर पर ले जा रहा है।
Optional learning community: https://t.me/GyaanSetuAi
