Gemini Interactions API: راهنمای عامل‌ها در سال ۲۰۲۶

گوگل به‌تازگی روش ساخت عامل‌های هوش مصنوعی را تغییر داده است.

Interactions API در تاریخ ۲۳ ژوئن ۲۰۲۶ به مرحله دسترسی عمومی رسید. این یک به‌روزرسانی کوچک نیست؛ بلکه یک تغییر بنیادین در نحوه عملکرد Gemini است.

اگر از اندپوینت قدیمی GenerateContent استفاده می‌کنید، احتمالاً معماری شما قدیمی شده است.

روش قدیمی:

  • از یک API بدون وضعیت (stateless) استفاده می‌کنید.
  • در هر مرحله، کل تاریخچه چت را دوباره ارسال می‌کنید.
  • بار کامل مدیریت حافظه بر دوش اپلیکیشن شماست.
  • با طولانی‌تر شدن مکالمه، هزینه‌های توکن افزایش می‌یابد.

روش جدید:

  • وضعیت (State) روی سرور ذخیره می‌شود.
  • شما تنها به یک شناسه نشست (session ID) ارجاع می‌دهید.
  • Gemini تاریخچه، ابزارها و نتایج را به خاطر می‌سپارد.
  • شما فقط بخش جدید مکالمه را ارسال می‌کنید.

تأثیر این تغییر بر بودجه شما بسیار زیاد است. در آزمایش‌های ما با یک خط لوله RAG، تغییر به وضعیت سمت سرور (server-side state)، هزینه توکن‌های ورودی را در ۱۰,۰۰۰ نشست روزانه تا ۳۴٪ کاهش داد. در یک آزمایش ۱۰ مرحله‌ای، شاهد کاهش تا ۸۲ درصدی در توکن‌های ورودی بودیم.

چه چیزهای جدیدی در این نسخه ارائه شده است؟

• Managed Agents: گوگل یک محیط ایزوله (sandbox) لینوکس از راه دور فراهم می‌کند. عامل شما می‌تواند بدون نیاز به مدیریت سرور توسط شما، کد اجرا کند، در وب جستجو کند و فایل‌ها را مدیریت نماید. • Background Execution: برای وظایف طولانی از background=True استفاده کنید. دیگر نیازی به باز نگه داشتن اتصال و درگیر شدن با اتمام زمان (timeout) ندارید. • MCP Support: این API با Model Context Protocol سازگار است. شما می‌توانید ابزارهای گوگل را به‌راحتی با ابزارهای سفارشی خود ترکیب کنید.

چه زمانی باید مهاجرت کنید؟

همه چیز را منتقل نکنید.

اگر شرایط زیر را دارید، از GenerateContent استفاده کنید:

  • به وظایف ساده و تک‌مرحله‌ای (one-shot) نیاز دارید.
  • در حال انجام طبقه‌بندی یا خلاصه‌سازی‌های پایه هستید.
  • به حافظه نیاز ندارید.

اگر شرایط زیر را دارید، از Interactions API استفاده کنید:

  • ۳ یا تعداد بیشتری فراخوانی ابزار (tool call) دارید.
  • به وضعیت مکالمه پایدار نیاز دارید.
  • در حال اجرای وظایف پس‌زمینه طولانی هستید.

یک هشدار: وضعیت سمت سرور باعث ایجاد وابستگی به فروشنده (vendor lock-in) می‌شود. اگر تاریخچه شما در ابر گوگل ذخیره شود، خروج از آن دشوار خواهد بود. از همان روز اول، یک مسیر برای خروجی گرفتن (export) به پایگاه داده خودتان ایجاد کنید.

عصر هوش مصنوعی بدون وضعیت (stateless) رو به پایان است. زمان آن رسیده که عامل‌هایی بسازید که واقعاً عمل می‌کنند.

منبع: https://blog.google/innovation-and-ai/technology/developers-tools/interactions-api-general-availability/

انجمن یادگیری اختیاری: https://t.me/GyaanSetuAi