Gemini Interactions API: ਕੀ Agent Middleware ਦਾ ਅੰਤ ਹੋ ਰਿਹਾ ਹੈ?

Google ਨੇ ਹੁਣੇ ਹੀ AI agents ਬਣਾਉਣ ਦੇ ਤਰੀਕੇ ਨੂੰ ਬਦਲ ਦਿੱਤਾ ਹੈ।

Interactions API ਹੁਣ ਆਮ ਤੌਰ 'ਤੇ ਉਪਲਬਧ (generally available) ਹੈ। ਇਹ Gemini models ਅਤੇ agents ਨਾਲ ਕੰਮ ਕਰਨ ਦਾ ਨਵਾਂ ਮੁੱਖ ਤਰੀਕਾ ਹੈ। ਇਹ ਅਪਡੇਟ ਸਾਧਾਰਨ ਕੰਮਾਂ ਲਈ LangGraph ਜਾਂ CrewAI ਵਰਗੇ ਜ਼ਿਆਦਾਤਰ orchestration frameworks ਨੂੰ ਗੈਰ-ਜ਼ਰੂਰੀ ਬਣਾ ਦਿੰਦਾ ਹੈ।

ਪਹਿਲਾਂ, ਤੁਹਾਨੂੰ ਚਾਰ ਚੀਜ਼ਾਂ ਨੂੰ ਆਪਸ ਵਿੱਚ ਜੋੜਨਾ ਪੈਂਦਾ ਸੀ:

  • Model calls
  • Tool execution
  • Conversation state
  • Agent lifecycle

ਹੁਣ, Google ਇਹਨਾਂ ਸਾਰੀਆਂ ਚੀਜ਼ਾਂ ਨੂੰ ਇੱਕ ਸਿੰਗਲ ਸਰਵਰ-ਸਾਈਡ ਕੰਟਰੈਕਟ (server-side contract) ਵਿੱਚ ਸਮੇਟ ਦਿੰਦਾ ਹੈ।

ਤੁਹਾਡੇ ਲਈ ਇਸਦਾ ਕੀ ਮਤਲਬ ਹੈ:

• ਇਕਸਾਰ ਐਗਜ਼ੀਕਿਊਸ਼ਨ (Unified Execution) ਤੁਹਾਨੂੰ ਹੁਣ "plumbing" (ਅੰਦਰੂਨੀ ਪ੍ਰਬੰਧਨ) ਨੂੰ ਸੰਭਾਲਣ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਇੱਕ API ਕਾਲ inference, tools, ਅਤੇ state ਨੂੰ ਸੰਭਾਲ ਲੈਂਦੀ ਹੈ।

• ਸਰਵਰ-ਸਾਈਡ ਸਟੇਟ (Server-Side State) ਤੁਹਾਨੂੰ ਥੋੜ੍ਹੇ ਸਮੇਂ ਦੀ ਯਾਦਦਾਸ਼ਤ (short-term memory) ਲਈ Redis ਜਾਂ vector database ਵਿੱਚ ਹਿਸਟਰੀ ਨੂੰ ਸੰਭਾਲਣ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। Google session_id ਰਾਹੀਂ ਸੈਸ਼ਨ ਨੂੰ ਸੰਭਾਲਦਾ ਹੈ। ਇਹ ਗੁੰਝਲਦਾਰ context window ਪ੍ਰਬੰਧਨ ਦੀ ਲੋੜ ਨੂੰ ਖਤਮ ਕਰ ਦਿੰਦਾ ਹੈ।

• ਮੈਨੇਜਡ ਏਜੰਟਸ (Managed Agents) ਤੁਸੀਂ ਇੱਕ ਰੀਮੋਟ Linux sandbox ਨੂੰ ਚਲਾਉਣ ਲਈ "antigravity" ਵਰਗੀ agent ID ਨੂੰ ਕਾਲ ਕਰ ਸਕਦੇ ਹੋ। ਇਹ ਏਜੰਟ ਤੁਹਾਡੇ ਦੁਆਰਾ ਕੋਈ ਇਨਫਰਾਸਟ੍ਰਕਚਰ ਸੈੱਟ ਕੀਤੇ ਬਿਨਾਂ ਤਰਕ ਕਰ ਸਕਦਾ ਹੈ, ਕੋਡ ਚਲਾ ਸਕਦਾ ਹੈ ਅਤੇ ਵੈੱਬ ਸਰੋਤਾਂ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦਾ ਹੈ।

• ਬੈਕਗ੍ਰਾਊਂਡ ਐਗਜ਼ੀਕਿਊਸ਼ਨ (Background Execution) ਲੰਬੇ ਸਮੇਂ ਤੱਕ ਚੱਲਣ ਵਾਲੇ ਕੰਮਾਂ ਲਈ background=True ਸੈੱਟ ਕਰੋ। ਸਰਵਰ ਕੰਮ ਨੂੰ asynchronously ਚਲਾਉਂਦਾ ਹੈ। ਤੁਹਾਨੂੰ ਹੁਣ ਆਪਣੇ ਖੁਦ ਦੇ job queues ਜਾਂ polling loops ਬਣਾਉਣ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ।

ਸਮਝੌਤਾ (Trade-off): ਪੋਰਟੇਬਿਲਟੀ ਬਨਾਮ ਸਹੂਲਤ

ਵੱਡੀ ਮੁਸ਼ਕਲ "lock-in" ਹੈ। ਕਿਉਂਕਿ ਤੁਹਾਡੀ ਕਨਵਰਸੇਸ਼ਨ ਸਟੇਟ Google ਦੇ ਸਰਵਰਾਂ 'ਤੇ ਹੁੰਦੀ ਹੈ, ਤੁਸੀਂ ਉਸ ਸਟੇਟ ਨੂੰ ਆਸਾਨੀ ਨਾਲ OpenAI ਜਾਂ Anthropic 'ਤੇ ਨਹੀਂ ਲੈ ਜਾ ਸਕਦੇ। ਤੁਹਾਨੂੰ ਰਫਤਾਰ ਅਤੇ ਘੱਟ boilerplate ਮਿਲਦਾ ਹੈ, ਪਰ ਤੁਸੀਂ ਆਸਾਨੀ ਨਾਲ ਪ੍ਰੋਵਾਈਡਰ ਬਦਲਣ ਦੀ ਸਮਰੱਥਾ ਗੁਆ ਦਿੰਦੇ ਹੋ।

ਬਿਲਡਰਾਂ ਲਈ ਮੇਰੀ ਸਲਾਹ:

  • ਲੀਨੀਅਰ (linear) ਅਤੇ ਸਟੇਟਫੁੱਲ (stateful) ਏਜੰਟ ਪਾਥਾਂ ਲਈ Interactions API ਦੀ ਵਰਤੋਂ ਕਰੋ।
  • ਗੁੰਝਲਦਾਰ, ਬ੍ਰਾਂਚਿੰਗ, ਜਾਂ ਸਾਈਕਲਿਕ ਵਰਕਫਲੋਜ਼ ਲਈ LangGraph ਦੀ ਵਰਤੋਂ ਜਾਰੀ ਰੱਖੋ।
  • ਪੋਰਟੇਬਲ ਰਹਿਣ ਲਈ ਆਪਣਾ ਲੰਬੇ ਸਮੇਂ ਦਾ ਗਿਆਨ ਆਪਣੇ ਖੁਦ ਦੇ vector database ਵਿੱਚ ਰੱਖੋ।
  • Sandbox ਕੰਪਿਊਟ ਲਾਗਤਾਂ 'ਤੇ ਨੇੜਿਓਂ ਨਜ਼ਰ ਰੱਖੋ, ਕਿਉਂਕਿ ਇਹ ਟੋਕਨਾਂ ਤੋਂ ਵੱਖਰੇ ਤੌਰ 'ਤੇ ਬਿੱਲ ਕੀਤੇ ਜਾਂਦੇ ਹਨ।

ਭਾਰੀ ਮਾਤਰਾ ਵਿੱਚ "glue code" ਬਣਾਉਣ ਦਾ ਯੁੱਗ ਖਤਮ ਹੋ ਰਿਹਾ ਹੈ। Google orchestration ਲੇਅਰ ਨੂੰ ਤੁਹਾਡੇ ਕੋਡ ਤੋਂ ਆਪਣੇ ਸਰਵਰ 'ਤੇ ਲੈ ਜਾ ਰਿਹਾ ਹੈ।

ਸਰੋਤ: https://dev.to/aarhamforensics_eb3c024eb/interactions-api-gemini-models-agents-the-complete-ga-guide-32mb

ਵਿਕਲਪਿਕ ਸਿੱਖਣ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi