Google biến Interactions API thành cách mặc định để xây dựng với Gemini Agents

Google đang thay đổi cách bạn xây dựng với Gemini.

Interactions API hiện đã khả dụng rộng rãi. Đây hiện là cách chính để làm việc với các mô hình và agent của Gemini.

Đây là một sự chuyển dịch lớn đối với các nhà phát triển. Google đang hướng tới cách tiếp cận ưu tiên agent (agent-first). Mặc dù API generateContent cũ vẫn hoạt động, nhưng các tính năng agent mới sẽ được triển khai trên Interactions API trước tiên.

Các tính năng chính của Interactions API:

• Một endpoint cho mọi thứ. Sử dụng model ID cho các tác vụ đơn giản hoặc agent ID cho các tác vụ dài. • Managed Agents. Chỉ với một lệnh gọi API, một sandbox Linux sẽ được thiết lập. Agent có thể chạy mã, duyệt web và quản lý tệp. • Các tác vụ chạy nền. Đặt background=True để chạy các tác vụ dài mà không cần chờ đợi. • Kết hợp công cụ. Kết hợp Google Search và Google Maps với các hàm riêng của bạn trong cùng một yêu cầu. • Deep Research. Đạt được tốc độ và độ sâu tốt hơn với các biểu đồ gốc và hỗ trợ đa phương thức cho hình ảnh và PDF. • Tạo phương tiện. Truy cập các công cụ hình ảnh, âm nhạc và chuyển văn bản thành giọng nói (text-to-speech). • Kiểm soát chi phí. Sử dụng các gói Flex hoặc Priority. Gói Flex giúp giảm 50% chi phí. • Lưu giữ trạng thái. Người dùng trả phí có thể truy cập các tương tác trước đó trong vòng 55 ngày.

Kiến trúc cũng đang thay đổi. Google đang dần chuyển đổi khỏi các định dạng tin nhắn cũ. Mỗi bước hiện là một hành động được định kiểu như đầu vào của người dùng, suy nghĩ, hoặc gọi hàm.

Bạn nên làm gì?

Nếu bạn bắt