فروپاشی ارکستراسیون فرا رسیده است

گوگل به‌تازگی قوانین ساخت عامل‌های هوش مصنوعی (AI agents) را تغییر داده است.

Interactions API جدید برای مدل‌های Gemini اکنون فعال شده است. این یک به‌روزرسانی کوچک نیست؛ بلکه یک تغییر ساختاری است که بسیاری از فریم‌ورک‌های موجود را بلااستفاده می‌کند.

سال‌ها بود که توسعه‌دهندگان لایه‌های میان‌افزار (middleware) عظیمی برای مدیریت هوش مصنوعی می‌ساختند. شما مجبور بودید پایگاه‌های داده نشست (session databases)، سرویس‌های هرس کردن متن (context pruning) و ابزارهای مدیریت حافظه خودتان را بسازید. اگر از LangGraph یا AutoGen برای Gemini استفاده می‌کردید، ماه‌ها وقت خود را صرف مدیریت این «لوله‌کشی‌ها» (plumbing) می‌کردید.

Interactions API تمام این موارد را در خود جذب می‌کند.

چه چیزی تغییر کرده است؟

وضعیت سمت سرور (Server-side state): گوگل اکنون تاریخچه گفتگو و حافظه را در زیرساخت خود مدیریت می‌کند. دیگر برای به خاطر سپردن آنچه کاربر گفته است، نیازی به یک ذخیره‌ساز Redis ندارید. • اجرای پس‌زمینه (Background execution): می‌توانید با تنظیم یک پرچم (flag) ساده، وظایف طولانی‌مدت را اجرا کنید. دیگر نیازی به صف‌های وظیفه (job queues) سفارشی یا خوشه‌های Celery نیست. • عامل‌های مدیریت‌شده (Managed Agents): گوگل یک محیط ایزوله (sandbox) امن لینوکسی فراهم می‌کند. عامل‌های شما اکنون می‌توانند به‌صورت بومی کد اجرا کنند، در وب جستجو کنند و فایل‌ها را مدیریت کنند. • نقطه پایانی یکپارچه (Unified Endpoint): اکنون یک URL جایگزین APIهای پراکنده Chat و Generate Content شده است.

من خودم این را آزمایش کردم. یک گردش کار (workflow) در LangGraph را به Interactions API منتقل کردم. کد مربوط به وضعیت نشست (session-state) من از ۴۰۰ خط به تنها یک پارامتر کاهش یافت.

این همان «فروپاشی ارکستراسیون» است. وقتی ارائه‌دهنده (vendor)، وضعیت، ابزارها و اجرای ناهمگام (async execution) را به‌صورت بومی ارائه می‌دهد، فریم‌ورک سفارشی شما دیگر یک ضرورت نیست، بلکه به یک انتخاب تبدیل می‌شود.

آیا باید مهاجرت کنید؟

مهاجرت کنید اگر:

  • گردش کار شما فقط روی Gemini اجرا می‌شود.
  • زمان زیادی را صرف مدیریت وضعیت نشست یا پایگاه‌های داده می‌کنید.
  • می‌خواهید هزینه‌های مهندسی خود را کاهش دهید.

با فریم‌ورک فعلی خود بمانید اگر:

  • به ارکستراسیون بین‌مدلی نیاز دارید (مثلاً استفاده هم‌زمان از Claude و GPT).
  • به گردش‌های کاری پیچیده برای تأیید توسط انسان (human-in-the-loop) نیاز دارید.

کارهای مهندسی از زیرساخت شما به زیرساخت گوگل منتقل می‌شود. این امر می‌تواند مهندسی میان‌افزار سفارشی را ۴۰٪ تا ۶۰٪ کاهش دهد.

هزینه این کار، وابستگی (lock-in) است. وضعیت شما اکنون در سرورهای گوگل قرار دارد. مهاجرت به یک ارائه‌دهنده دیگر در آینده مستلزم بازسازی سیستم خواهد بود. برای اکثر تیم‌ها، سرعت و صرفه‌جویی در هزینه‌ها، این معامله را به یک انتخاب پرسود تبدیل می‌کند.

Source: https://dev.to/aarhamforensics_eb3c024eb/interactions-api-gemini-models-agents-the-orchestration-collapse-explained-2940

Optional learning community: https://t.me/GyaanSetuAi