Google convierte la Interactions API en la forma predeterminada de desarrollar con agentes de Gemini
Google está cambiando la forma en que desarrollas con Gemini.
La Interactions API ya está disponible de forma general. Ahora es la forma principal de trabajar con modelos y agentes de Gemini.
Este es un cambio importante para los desarrolladores. Google se está moviendo hacia un enfoque centrado en agentes (agent-first). Aunque la antigua API generateContent sigue funcionando, las nuevas funciones de agentes llegarán primero a la Interactions API.
Características clave de la Interactions API:
• Un único endpoint para todo. Usa un ID de modelo para tareas sencillas o un ID de agente para tareas largas.
• Managed Agents. Una sola llamada a la API configura un sandbox de Linux. El agente puede ejecutar código, navegar por la web y gestionar archivos.
• Tareas en segundo plano. Establece background=True para ejecutar tareas largas sin tener que esperar.
• Combinación de herramientas. Combina Google Search y Google Maps con tus propias funciones en una sola solicitud.
• Deep Research. Obtén mayor velocidad y profundidad con gráficos nativos y soporte multimodal para imágenes y PDFs.
• Generación de medios. Accede a herramientas de imagen, música y texto a voz (text-to-speech).
• Controles de costos. Utiliza los niveles Flex o Priority. El nivel Flex ofrece costos un 50% más bajos.
• Retención de estado. Los usuarios de pago pueden acceder a interacciones pasadas durante 55 días.
La arquitectura también está cambiando. Google se está alejando de los antiguos formatos de mensajes. Cada paso es ahora una acción tipada, como una entrada de usuario, un pensamiento o una llamada a una función.
¿Qué deberías hacer?
Si inicias un nuevo proyecto de Gemini, utiliza la Interactions API.
Si tienes una aplicación existente, mantenla funcionando. Pero audita tus flujos de trabajo. Comprueba si necesitas ejecución en segundo plano o Managed Agents.
Revisa tus SDKs. Google es compatible con socios como LiteLLM, Eigent y Agno.
Vigila tus costos. Prueba el nivel Flex para cargas de trabajo donde la velocidad importa menos que el precio.
Ten en cuenta que los Managed Agents se ejecutan en el lado de Google. Revisa el comportamiento del sandbox y los controles de datos si manejas información sensible.
Google no va a desactivar la antigua API. Te están mostrando el futuro. Si desarrollas siguiendo el camino antiguo, podrías perderte las mejores funciones nuevas.
Optional learning community: https://t.me/GyaanSetuAi
