Gemini Interactions API: конец эпохи middleware для агентов?
Google только что изменил способ создания ИИ-агентов.
Interactions API теперь доступен в общем доступе (GA). Это новый основной способ работы с моделями и агентами Gemini. Это обновление делает большинство фреймворков оркестрации, таких как LangGraph или CrewAI, избыточными для простых задач.
Раньше вам приходилось «склеивать» четыре вещи:
- Вызовы моделей
- Выполнение инструментов
- Состояние диалога
- Жизненный цикл агента
Теперь Google объединяет всё это в единый серверный контракт.
Что это значит для вас:
• Unified Execution Вам больше не нужно заниматься «инфраструктурной обвязкой» (plumbing). Один вызов API обрабатывает инференс, инструменты и состояние.
• Server-Side State
Вам не нужно управлять историей в Redis или векторной базе данных для краткосрочной памяти. Google управляет сессией через session_id. Это избавляет от необходимости сложного управления контекстным окном.
• Managed Agents Вы можете вызвать ID агента, например «antigravity», чтобы запустить удаленную песочницу Linux. Этот агент может рассуждать, запускать код и просматривать веб-страницы без необходимости настройки какой-либо инфраструктуры.
• Background Execution
Установите background=True для длительных задач. Сервер выполняет работу асинхронно. Вам больше не нужно создавать собственные очереди задач или циклы опроса (polling loops).
Компромисс: переносимость против удобства
Главный подвох — привязка к вендору (lock-in). Поскольку состояние вашего диалога хранится на серверах Google, вы не сможете легко перенести его в OpenAI или Anthropic. Вы выигрываете в скорости и уменьшаете объем шаблонного кода (boilerplate), но теряете возможность легко сменить провайдера.
Мой совет разработчикам:
- Используйте Interactions API для линейных, сохраняющих состояние путей агентов.
- Оставьте LangGraph для сложных, разветвленных или циклических рабочих процессов.
- Храните свои долгосрочные знания в собственной векторной базе данных, чтобы сохранить переносимость.
- Внимательно следите за расходами на вычисления в песочнице, так как они тарифицируются отдельно от токенов.
Эра написания огромного количества «склеивающего кода» (glue code) подходит к концу. Google переносит уровень оркестрации из вашего кода на свои серверы.
Дополнительное обучающее сообщество: https://t.me/GyaanSetuAi
