Gemini Interactions API: ஏஜென்ட் மிட்லவேரின் (Agent Middleware) முடிவு?

Google இப்போது நீங்கள் AI ஏஜென்ட்களை உருவாக்கும் முறையை மாற்றியுள்ளது.

Interactions API இப்போது பொதுவான பயன்பாட்டிற்கு (generally available) வந்துவிட்டது. Gemini மாடல்கள் மற்றும் ஏஜென்ட்களுடன் பணியாற்றுவதற்கான புதிய முதன்மை வழி இதுவாகும். இந்தத் திருத்தம், எளிமையான பணிகளுக்கு LangGraph அல்லது CrewAI போன்ற பெரும்பாலான orchestration frameworks-களைத் தேவையில்லாததாக ஆக்குகிறது.

இதற்கு முன்பு, நீங்கள் நான்கு விஷயங்களை ஒன்றாக இணைக்க வேண்டியிருந்தது:

  • Model calls
  • Tool execution
  • Conversation state
  • Agent lifecycle

இப்போது, Google இவை அனைத்தையும் ஒரே சர்வர்-சைடு ஒப்பந்தமாக (server-side contract) ஒருங்கிணைக்கிறது.

இது உங்களுக்கு எதைக் குறிக்கிறது:

• ஒருங்கிணைந்த இயக்கம் (Unified Execution) நீங்கள் இனி "plumbing" எனப்படும் பின்னணி கட்டமைப்புகளை நிர்வகிக்க வேண்டிய அவசியமில்லை. ஒரே ஒரு API அழைப்பு மூலம் inference, கருவிகள் மற்றும் நிலையை (state) கையாள முடியும்.

• சர்வர்-சைடு நிலை (Server-Side State) குறுகிய கால நினைவகத்திற்காக (short-term memory) Redis அல்லது ஒரு vector database-இல் வரலாற்றை நீங்கள் நிர்வகிக்க வேண்டியதில்லை. Google ஒரு session_id மூலம் இந்தச் சessனை (session) கையாளுகிறது. இது சிக்கலான context window நிர்வாகத்தின் தேவையைக் குறைக்கிறது.

• நிர்வகிக்கப்படும் ஏஜென்ட்கள் (Managed Agents) ஒரு தொலைதூர Linux sandbox-ஐத் தூண்டுவதற்கு "antigravity" போன்ற ஒரு agent ID-ஐ நீங்கள் அழைக்கலாம். நீங்கள் எந்த உள்கட்டமைப்பையும் (infrastructure) அமைக்காமலேயே, இந்த ஏஜென்ட் சிந்திக்கும் திறன், குறியீட்டை இயக்கும் திறன் மற்றும் இணையத்தைப் browsing செய்யும் திறன் ஆகியவற்றைக் கொண்டுள்ளது.

• பின்னணி இயக்கம் (Background Execution) நீண்ட நேரம் எடுக்கும் பணிகளுக்கு background=True என்று அமைக்கவும். சர்வர் அந்த வேலையை asynchronous முறையில் இயக்கும். நீங்கள் இனி உங்களுக்கென தனிப்பயனாக்கப்பட்ட job queues அல்லது polling loops-களை உருவாக்க வேண்டியதில்லை.

சவால்கள்: இடமாற்றத் திறன் (Portability) vs வசதி (Convenience)

இதில் உள்ள பெரிய சிக்கல் 'lock-in' ஆகும். உங்கள் உரையாடல் நிலை Google-இன் சர்வர்களில் இருப்பதால், அந்த நிலையை எளிதாக OpenAI அல்லது Anthropic-க்கு மாற்ற முடியாது. நீங்கள் வேகத்தையும் குறைந்த boilerplate குறியீட்டையும் பெறுகிறீர்கள், ஆனால் சேவை வழங்குநர்களை (providers) எளிதாக மாற்றும் திறனை இழக்கிறீர்கள்.

உருவாக்குபவர்களுக்கான எனது அறிவுரை:

  • நேரியல் மற்றும் நிலைத்தன்மை கொண்ட (linear, stateful) ஏஜென்ட் பாதைகளுக்கு Interactions API-ஐப் பயன்படுத்தவும்.
  • சிக்கலான, கிளைகளாகப் பிரியும் அல்லது சுழற்சி முறையிலான (branching, or cyclic) பணிப்பாய்வுகளுக்கு (workflows) LangGraph-ஐத் தொடரவும்.
  • இடமாற்றத் திறனைத் தக்கவைக்க, உங்கள் நீண்ட கால அறிவை (long-term knowledge) சொந்த vector database-இல் வைத்திருக்கவும்.
  • sandbox கணக்கீட்டுச் செலவுகளை (compute costs) உன்னிப்பாகக் கவனிக்கவும், ஏனெனில் அவை டோக்கன்களிலிருந்து (tokens) தனித்தனியாகக் கட்டணம் வசூலிக்கப்படுகின்றன.

அதிகப்படியான "glue code"-களை உருவாக்கும் காலம் முடிவுக்கு வருகிறது. Google orchestration அடுக்கை (orchestration layer) உங்கள் குறியீட்டிலிருந்து தனது சர்வருக்கு மாற்றுகிறது.

ஆதாரம்: https://dev.to/aarhamforensics_eb3c024eb/interactions-api-gemini-models-agents-the-complete-ga-guide-32mb

விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi