Gemini Interactions API:2026 年智能体指南
Google 刚刚改变了你构建 AI 智能体的方式。
Interactions API 已于 2026 年 6 月 23 日正式发布。这不仅仅是一个小更新,而是 Gemini 工作方式的一次彻底变革。
如果你还在使用旧的 GenerateContent 端点,你的架构可能已经过时了。
旧方式:
- 你使用的是无状态 API。
- 每一轮对话你都需要重新发送完整的聊天历史。
- 你的应用承担了全部的记忆负担。
- 随着对话变长,Token 成本也随之增长。
新方式:
- 状态存储在服务器端。
- 你只需引用一个会话 ID(session ID)。
- Gemini 会记住历史记录、工具和结果。
- 你只需发送对话的新部分。
这对你的预算影响巨大。在我们的 RAG 流水线测试中,切换到服务端状态后,在每日 10,000 个会话的规模下,输入 Token 的支出减少了 34%。在一次 10 轮对话的测试中,我们观察到输入 Token 减少了高达 82%。
本次发布有哪些新特性?
• 托管式智能体 (Managed Agents):Google 提供了一个远程 Linux 沙箱。你的智能体可以运行代码、搜索网络并管理文件,而无需你管理任何服务器。
• 后台执行 (Background Execution):对于耗时任务,请使用 background=True。你不再需要保持连接开启并与超时问题作斗争。
• MCP 支持:该 API 兼容 Model Context Protocol。你可以轻松地将 Google 工具与你自己的自定义工具结合使用。
你应该何时进行迁移?
不要全盘迁移。
如果满足以下情况,请使用 GenerateContent:
- 你需要简单的单次任务。
- 你正在进行基础的分类或摘要工作。
- 你不需要记忆功能。
如果满足以下情况,请使用 Interactions API:
- 你有 3 个或更多的工具调用。
- 你需要持久化的对话状态。
- 你正在运行耗时较长的后台任务。
一个警告:服务端状态会带来供应商锁定 (vendor lock-in)。如果你的历史记录存储在 Google 的云端,想要迁移就会变得很困难。请务必在第一天就建立好导出到你自己数据库的路径。
无状态 AI 的时代正在终结。是时候构建能够真正采取行动的智能体了。
可选学习社区:https://t.me/GyaanSetuAi
