فروپاشی ارکستراسیون فرا رسیده است
گوگل بهتازگی قوانین ساخت عاملهای هوش مصنوعی (AI agents) را تغییر داده است.
Interactions API جدید برای مدلهای Gemini اکنون فعال شده است. این یک بهروزرسانی کوچک نیست؛ بلکه یک تغییر ساختاری است که بسیاری از فریمورکهای موجود را بلااستفاده میکند.
سالها بود که توسعهدهندگان لایههای میانافزار (middleware) عظیمی برای مدیریت هوش مصنوعی میساختند. شما مجبور بودید پایگاههای داده نشست (session databases)، سرویسهای هرس کردن متن (context pruning) و ابزارهای مدیریت حافظه خودتان را بسازید. اگر از LangGraph یا AutoGen برای Gemini استفاده میکردید، ماهها وقت خود را صرف مدیریت این «لولهکشیها» (plumbing) میکردید.
Interactions API تمام این موارد را در خود جذب میکند.
چه چیزی تغییر کرده است؟
• وضعیت سمت سرور (Server-side state): گوگل اکنون تاریخچه گفتگو و حافظه را در زیرساخت خود مدیریت میکند. دیگر برای به خاطر سپردن آنچه کاربر گفته است، نیازی به یک ذخیرهساز Redis ندارید. • اجرای پسزمینه (Background execution): میتوانید با تنظیم یک پرچم (flag) ساده، وظایف طولانیمدت را اجرا کنید. دیگر نیازی به صفهای وظیفه (job queues) سفارشی یا خوشههای Celery نیست. • عاملهای مدیریتشده (Managed Agents): گوگل یک محیط ایزوله (sandbox) امن لینوکسی فراهم میکند. عاملهای شما اکنون میتوانند بهصورت بومی کد اجرا کنند، در وب جستجو کنند و فایلها را مدیریت کنند. • نقطه پایانی یکپارچه (Unified Endpoint): اکنون یک URL جایگزین APIهای پراکنده Chat و Generate Content شده است.
من خودم این را آزمایش کردم. یک گردش کار (workflow) در LangGraph را به Interactions API منتقل کردم. کد مربوط به وضعیت نشست (session-state) من از ۴۰۰ خط به تنها یک پارامتر کاهش یافت.
این همان «فروپاشی ارکستراسیون» است. وقتی ارائهدهنده (vendor)، وضعیت، ابزارها و اجرای ناهمگام (async execution) را بهصورت بومی ارائه میدهد، فریمورک سفارشی شما دیگر یک ضرورت نیست، بلکه به یک انتخاب تبدیل میشود.
آیا باید مهاجرت کنید؟
مهاجرت کنید اگر:
- گردش کار شما فقط روی Gemini اجرا میشود.
- زمان زیادی را صرف مدیریت وضعیت نشست یا پایگاههای داده میکنید.
- میخواهید هزینههای مهندسی خود را کاهش دهید.
با فریمورک فعلی خود بمانید اگر:
- به ارکستراسیون بینمدلی نیاز دارید (مثلاً استفاده همزمان از Claude و GPT).
- به گردشهای کاری پیچیده برای تأیید توسط انسان (human-in-the-loop) نیاز دارید.
کارهای مهندسی از زیرساخت شما به زیرساخت گوگل منتقل میشود. این امر میتواند مهندسی میانافزار سفارشی را ۴۰٪ تا ۶۰٪ کاهش دهد.
هزینه این کار، وابستگی (lock-in) است. وضعیت شما اکنون در سرورهای گوگل قرار دارد. مهاجرت به یک ارائهدهنده دیگر در آینده مستلزم بازسازی سیستم خواهد بود. برای اکثر تیمها، سرعت و صرفهجویی در هزینهها، این معامله را به یک انتخاب پرسود تبدیل میکند.
Optional learning community: https://t.me/GyaanSetuAi
