𝗚𝗼𝗼𝗴𝗹𝗲 𝗦𝗼𝗹𝘃𝗲𝘀 𝗜𝗻𝗳𝗿𝗮𝘀𝘁𝗿𝘂𝗰𝘁𝘂𝗿𝗲, 𝗡𝗼𝘁 𝗚𝗼𝘃𝗲𝗿𝗻𝗮𝗻𝗰𝗲

Google I/O 2026 از Managed Agents در Gemini API رونمایی کرد. این ابزار به تیم‌های سازمانی یک محیط اجرای مدیریت‌شده (managed runtime) ارائه می‌دهد و وظایف مربوط به sandboxها، تزریق اعتبارنامه‌ها (credential injection) و وضعیت پایدار (persistent state) را بر عهده می‌گیرد.

این ابزار مشکل زیرساخت را حل می‌کند، اما مشکلی را که پروژه‌های عامل هوش مصنوعی (AI agent) را از پا در می‌آورد، حل نمی‌کند.

اکثر تیم‌ها روی چیز اشتباهی تمرکز می‌کنند. آن‌ها دموهای جذاب می‌سازند؛ مثلاً نشان می‌دهند که یک عامل (agent) یک پرواز را رزرو می‌کند یا به سوالی پاسخ می‌دهد. این دموها خوب به نظر می‌رسند اما در محیط عملیاتی (production) شکست می‌خورند.

جریان‌های کاری واقعی در سطح سازمانی به چیزی فراتر از یک رابط کاربری چت نیاز دارند. کار یک عامل پشتیبانی زمانی تمام نمی‌شود که به یک سوال پاسخ دهد؛ بلکه زمانی تمام می‌شود که یک تیکت را به‌روزرسانی کند، مبلغی را مسترد کند و به مشتری در سیستم‌های مختلفی مانند Salesforce یا ServiceNow اطلاع‌رسانی کند.

تنظیمات استاندارد RAG در اینجا شکست می‌خورند زیرا فاقد سه مورد هستند:

  • عدم وجود وضعیت (No state): هر گفتگو از ابتدا شروع می‌شود.
  • عدم دسترسی به نوشتن (No write access): آن‌ها می‌توانند داده‌ها را بخوانند اما نمی‌توانند رکوردها را به‌روزرسانی کنند.
  • عدم احراز صلاحیت (No authorization): راهی برای محدود کردن اقدامات حساس وجود ندارد.

گوگل موتور را با Managed Agents API خود ساخته است، اما ترمزها را نساخته است. این API اجرای کار را مدیریت می‌کند، اما شما باید مرزهای اعتماد (trust boundaries) را مدیریت کنید.

۱۲ ماه آینده در حوزه هوش مصنوعی سازمانی متعلق به تیم‌هایی خواهد بود که بر حاکمیت (governance) مسلط شوند. اگر با این موضوع مانند یک مشکل یکپارچه‌سازی بک‌اند (backend integration) برخورد کنید، شکست خواهید خورد. اما اگر آن را به عنوان یک مشکل حاکمیت سیستم‌ها در نظر بگیرید، محصول خود را عرضه خواهید کرد.

از این چارچوب ۷ لایه‌ای برای ساخت عامل‌های آماده‌ی تولید استفاده کنید:

  • Interface (رابط): رابط کاربری یا محرک (trigger).
  • Orchestrator (هماهنگ‌کننده): اهداف را به مراحل مختلف تقسیم کرده و دروازه‌های تأیید انسانی را مدیریت می‌کند.
  • Model (مدل): موتور استدلال در داخل sandbox.
  • Tool/API Layer (لایه ابزار/API): هر یکپارچه‌سازی با محدوده (scope) حداقلی و صریح.
  • Knowledge Layer (لایه دانش): RAG برای پشتیبانی از جریان کاری.
  • Sandbox (محیط ایزوله): محیط اجرای ایزوله شده.
  • Audit (حسابرسی): ثبت وقایع (logs) برای هر اقدام و مسیری برای بازگرداندن اشتباهات.

یک فروشنده را بر اساس آنچه عاملش می‌تواند انجام دهد انتخاب نکنید؛ بلکه بر اساس اینکه چگونه آنچه را که عامل مجاز به انجام آن است کنترل می‌کنند، انتخاب کنید.

این قوانین را برای پروژه‌های آزمایشی (pilots) خود دنبال کنید:

  • جریان‌های کاری را بر اساس سطح ریسک نقشه‌برداری کنید.
  • ابتدا برای سیستم‌های قدیمی (legacy systems)، پوشش‌های API نازک (thin API wrappers) بسازید.
  • سطوح ریسک را به اقدامات خاص اختصاص دهید، نه به کل جریان‌های کاری.
  • لحظه‌ای را که عامل باید کار را به انسان ارجاع دهد (escalate)، آزمایش کنید.
  • فراوانی تأییدها را برای یافتن نقاط اصطکاک (friction points) نظارت کنید.

زیرساخت اکنون یک کالای عمومی (commodity) است. اعتماد و کنترل، تمایزدهنده‌های جدید هستند.

Source: https://dev.to/haleyy/googles-managed-agents-api-solves-infrastructure-not-the-problem-that-actually-kills-agent-33e0

Optional learning community: https://t.me/GyaanSetuAi