Коллапс оркестрации уже здесь

Google только что изменил правила создания ИИ-агентов.

Новый Interactions API для моделей Gemini уже запущен. Это не просто небольшое обновление. Это структурный сдвиг, который делает многие существующие фреймворки избыточными.

Годами разработчики создавали массивные слои промежуточного ПО для управления ИИ. Вам приходилось самостоятельно создавать базы данных сессий, сервисы очистки контекста и инструменты управления памятью. Если вы использовали LangGraph или AutoGen для Gemini, вы тратили месяцы на настройку этой «инфраструктурной обвязки».

Interactions API поглощает всё это.

Что изменилось?

• Состояние на стороне сервера: Google теперь управляет историей диалогов и памятью на своей инфраструктуре. Вам больше не нужно хранилище Redis, чтобы помнить, что сказал пользователь. • Фоновое выполнение: Вы можете установить один флаг для запуска длительных задач. Больше никаких кастомных очередей задач или кластеров Celery. • Управляемые агенты: Google предоставляет безопасную песочницу Linux. Теперь ваши агенты могут нативно запускать код, просматривать веб-страницы и управлять файлами. • Единая конечная точка: Один URL теперь заменяет разрозненные API Chat и Generate Content.

Я протестировал это лично. Я перенес рабочий процесс LangGraph на Interactions API. Мой код управления состоянием сессии сократился с 400 строк до одного единственного параметра.

Это и есть коллапс оркестрации. Когда вендор нативно предоставляет состояние, инструменты и асинхронное выполнение, ваш кастомный фреймворк перестает быть необходимостью. Он становится вопросом выбора.

Стоит ли переходить?

Переходите, если:

  • Ваш рабочий процесс работает только на Gemini.
  • Вы тратите слишком много времени на управление состоянием сессий или базами данных.
  • Вы хотите снизить инженерные расходы.

Оставайтесь на текущем фреймворке, если:

  • Вам нужна кросс-модельная оркестрация (например, использование и Claude, и GPT).
  • Вам требуются сложные рабочие процессы с участием человека (human-in-the-loop) для подтверждения действий.

Инженерная работа переносится с вашей инфраструктуры на инфраструктуру Google. Это может сократить разработку кастомного промежуточного ПО на 40–60%.

Обратная сторона — привязка к вендору (lock-in). Теперь ваше состояние хранится на серверах Google. Переход к другому провайдеру в будущем потребует переработки системы. Для большинства команд экономия времени и средств делает этот обмен выгодным.

Источник: https://dev.to/aarhamforensics_eb3c024eb/interactions-api-gemini-models-agents-the-orchestration-collapse-explained-2940

Дополнительное обучающее сообщество: https://t.me/GyaanSetuAi