API de Interacciones de Gemini: ¿El fin del middleware de agentes?
Google acaba de cambiar la forma en que construyes agentes de IA.
La API de Interacciones ya está disponible de forma general. Es la nueva forma principal de trabajar con los modelos y agentes de Gemini. Esta actualización hace que la mayoría de los frameworks de orquestación, como LangGraph o CrewAI, resulten redundantes para tareas sencillas.
Anteriormente, tenías que unir cuatro elementos:
- Llamadas al modelo
- Ejecución de herramientas
- Estado de la conversación
- Ciclo de vida del agente
Ahora, Google integra todo esto en un único contrato en el lado del servidor.
Qué significa esto para ti:
• Ejecución unificada Ya no necesitas gestionar la "fontanería" (plumbing). Una sola llamada a la API se encarga de la inferencia, las herramientas y el estado.
• Estado en el lado del servidor
No necesitas gestionar el historial en Redis o en una base de datos vectorial para la memoria a corto plazo. Google gestiona la sesión mediante un session_id. Esto elimina la necesidad de una gestión compleja de la ventana de contexto.
• Agentes gestionados Puedes llamar a un ID de agente como "antigravity" para activar un sandbox de Linux remoto. Este agente puede razonar, ejecutar código y navegar por la web sin que tengas que configurar ninguna infraestructura.
• Ejecución en segundo plano
Establece background=True para tareas de larga duración. El servidor ejecuta el trabajo de forma asíncrona. Ya no necesitas construir tus propias colas de trabajos o bucles de sondeo (polling loops).
El compromiso: Portabilidad frente a conveniencia
El gran inconveniente es el lock-in. Debido a que el estado de tu conversación reside en los servidores de Google, no puedes trasladar fácilmente ese estado a OpenAI o Anthropic. Ganas velocidad y reduces el código repetitivo (boilerplate), pero pierdes la capacidad de cambiar de proveedor fácilmente.
Mi consejo para los desarrolladores:
- Usa la API de Interacciones para rutas de agentes lineales y con estado.
- Mantén LangGraph para flujos de trabajo complejos, ramificados o cíclicos.
- Mantén tu conocimiento a largo plazo en tu propia base de datos vectorial para mantener la portabilidad.
- Supervisa de cerca los costes de computación del sandbox, ya que se facturan por separado de los tokens.
La era de construir cantidades masivas de "glue code" (código de unión) está llegando a su fin. Google está trasladando la capa de orquestación de tu código a su servidor.
Optional learning community: https://t.me/GyaanSetuAi
