Gemini Interactions API: конец эпохи middleware для агентов?

Google только что изменил способ создания ИИ-агентов.

Interactions API теперь доступен в общем доступе (GA). Это новый основной способ работы с моделями и агентами Gemini. Это обновление делает большинство фреймворков оркестрации, таких как LangGraph или CrewAI, избыточными для простых задач.

Раньше вам приходилось «склеивать» четыре вещи:

  • Вызовы моделей
  • Выполнение инструментов
  • Состояние диалога
  • Жизненный цикл агента

Теперь Google объединяет всё это в единый серверный контракт.

Что это значит для вас:

• Unified Execution Вам больше не нужно заниматься «инфраструктурной обвязкой» (plumbing). Один вызов API обрабатывает инференс, инструменты и состояние.

• Server-Side State Вам не нужно управлять историей в Redis или векторной базе данных для краткосрочной памяти. Google управляет сессией через session_id. Это избавляет от необходимости сложного управления контекстным окном.

• Managed Agents Вы можете вызвать ID агента, например «antigravity», чтобы запустить удаленную песочницу Linux. Этот агент может рассуждать, запускать код и просматривать веб-страницы без необходимости настройки какой-либо инфраструктуры.

• Background Execution Установите background=True для длительных задач. Сервер выполняет работу асинхронно. Вам больше не нужно создавать собственные очереди задач или циклы опроса (polling loops).

Компромисс: переносимость против удобства

Главный подвох — привязка к вендору (lock-in). Поскольку состояние вашего диалога хранится на серверах Google, вы не сможете легко перенести его в OpenAI или Anthropic. Вы выигрываете в скорости и уменьшаете объем шаблонного кода (boilerplate), но теряете возможность легко сменить провайдера.

Мой совет разработчикам:

  • Используйте Interactions API для линейных, сохраняющих состояние путей агентов.
  • Оставьте LangGraph для сложных, разветвленных или циклических рабочих процессов.
  • Храните свои долгосрочные знания в собственной векторной базе данных, чтобы сохранить переносимость.
  • Внимательно следите за расходами на вычисления в песочнице, так как они тарифицируются отдельно от токенов.

Эра написания огромного количества «склеивающего кода» (glue code) подходит к концу. Google переносит уровень оркестрации из вашего кода на свои серверы.

Источник: https://dev.to/aarhamforensics_eb3c024eb/interactions-api-gemini-models-agents-the-complete-ga-guide-32mb

Дополнительное обучающее сообщество: https://t.me/GyaanSetuAi