Gemini Interactions API: Hướng dẫn về Agent năm 2026

Google vừa thay đổi cách bạn xây dựng các AI agent.

Interactions API đã chính thức khả dụng rộng rãi (general availability) vào ngày 23 tháng 6 năm 2026. Đây không phải là một bản cập nhật nhỏ. Đây là một sự thay đổi hoàn toàn trong cách thức hoạt động của Gemini.

Nếu bạn đang sử dụng endpoint GenerateContent cũ, kiến trúc của bạn có khả năng đã lỗi thời.

Cách cũ:

  • Bạn sử dụng một API không lưu trạng thái (stateless).
  • Bạn phải gửi lại toàn bộ lịch sử trò chuyện trong mỗi lượt.
  • Ứng dụng của bạn phải gánh toàn bộ trách nhiệm về bộ nhớ.
  • Chi phí token tăng lên khi cuộc hội thoại kéo dài hơn.

Cách mới:

  • Trạng thái (state) được lưu trữ trên máy chủ.
  • Bạn chỉ cần tham chiếu đến một session ID.
  • Gemini ghi nhớ lịch sử, các công cụ và kết quả.
  • Bạn chỉ cần gửi phần mới của cuộc hội thoại.

Tác động lên ngân sách của bạn là cực kỳ lớn. Trong các thử nghiệm của chúng tôi với một pipeline RAG, việc chuyển sang lưu trạng thái phía máy chủ (server-side state) đã giúp giảm 34% chi phí input-token qua 10.000 phiên làm việc hàng ngày. Trong một thử nghiệm 10 lượt, chúng tôi thấy lượng input token giảm tới 82%.

Có gì mới trong bản phát hành này?

• Managed Agents: Google cung cấp một sandbox Linux từ xa. Agent của bạn có thể chạy mã, tìm kiếm web và quản lý tệp mà bạn không cần phải quản lý bất kỳ máy chủ nào. • Background Execution: Sử dụng background=True cho các tác vụ dài. Bạn không còn cần phải duy trì một kết nối mở và đối mặt với tình trạng hết thời gian chờ (timeout). • Hỗ trợ MCP: API này tương thích với Model Context Protocol. Bạn có thể kết hợp các công cụ của Google với các công cụ tùy chỉnh của riêng mình một cách dễ dàng.

Khi nào bạn nên chuyển đổi (migrate)?

Đừng chuyển đổi tất cả mọi thứ.

Sử dụng GenerateContent nếu:

  • Bạn cần các tác vụ đơn giản, một lần (one-shot).
  • Bạn đang thực hiện phân loại hoặc tóm tắt cơ bản.
  • Bạn không cần bộ nhớ.

Sử dụng Interactions API nếu:

  • Bạn có từ 3 lần gọi công cụ (tool calls) trở lên.
  • Bạn cần trạng thái hội thoại liên tục (persistent).
  • Bạn đang chạy các tác vụ nền dài.

Một cảnh báo: Trạng thái phía máy chủ tạo ra sự phụ thuộc vào nhà cung cấp (vendor lock-in). Nếu lịch sử của bạn nằm trên đám mây của Google, sẽ rất khó để rời đi. Hãy xây dựng một lộ trình xuất dữ liệu (export path) sang cơ sở dữ liệu của riêng bạn ngay từ ngày đầu tiên.

Kỷ nguyên của AI không lưu trạng thái (stateless AI) đang dần kết thúc. Đã đến lúc xây dựng những agent thực sự có khả năng hành động.

Nguồn: https://blog.google/innovation-and-ai/technology/developers-tools/interactions-api-general-availability/

Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi