Gemini Interactions API:2026 年智能体指南

Google 刚刚改变了你构建 AI 智能体的方式。

Interactions API 已于 2026 年 6 月 23 日正式发布。这不仅仅是一个小更新,而是 Gemini 工作方式的一次彻底变革。

如果你还在使用旧的 GenerateContent 端点,你的架构可能已经过时了。

旧方式:

  • 你使用的是无状态 API。
  • 每一轮对话你都需要重新发送完整的聊天历史。
  • 你的应用承担了全部的记忆负担。
  • 随着对话变长,Token 成本也随之增长。

新方式:

  • 状态存储在服务器端。
  • 你只需引用一个会话 ID(session ID)。
  • Gemini 会记住历史记录、工具和结果。
  • 你只需发送对话的新部分。

这对你的预算影响巨大。在我们的 RAG 流水线测试中,切换到服务端状态后,在每日 10,000 个会话的规模下,输入 Token 的支出减少了 34%。在一次 10 轮对话的测试中,我们观察到输入 Token 减少了高达 82%。

本次发布有哪些新特性?

• 托管式智能体 (Managed Agents):Google 提供了一个远程 Linux 沙箱。你的智能体可以运行代码、搜索网络并管理文件,而无需你管理任何服务器。 • 后台执行 (Background Execution):对于耗时任务,请使用 background=True。你不再需要保持连接开启并与超时问题作斗争。 • MCP 支持:该 API 兼容 Model Context Protocol。你可以轻松地将 Google 工具与你自己的自定义工具结合使用。

你应该何时进行迁移?

不要全盘迁移。

如果满足以下情况,请使用 GenerateContent

  • 你需要简单的单次任务。
  • 你正在进行基础的分类或摘要工作。
  • 你不需要记忆功能。

如果满足以下情况,请使用 Interactions API:

  • 你有 3 个或更多的工具调用。
  • 你需要持久化的对话状态。
  • 你正在运行耗时较长的后台任务。

一个警告:服务端状态会带来供应商锁定 (vendor lock-in)。如果你的历史记录存储在 Google 的云端,想要迁移就会变得很困难。请务必在第一天就建立好导出到你自己数据库的路径。

无状态 AI 的时代正在终结。是时候构建能够真正采取行动的智能体了。

来源:https://blog.google/innovation-and-ai/technology/developers-tools/interactions-api-general-availability/

可选学习社区:https://t.me/GyaanSetuAi