فراتر از Sandboxها: ساخت عامل‌های هوش مصنوعی پایدار

Sandboxها برای عامل‌های هوش مصنوعی در محیط عملیاتی کافی نیستند.

اکثر توسعه‌دهندگان، عامل‌ها را به صورت یک حلقه ساده در حافظه می‌سازند. LLM مشاهده می‌کند، تصمیم می‌گیرد، عمل می‌کند و دوباره تکرار می‌کند. این روش در آزمایشگاه جواب می‌دهد، اما در دنیای واقعی شکست می‌خورد.

چرا حلقه مبتنی بر حافظه شکست می‌خورد؟

  • وظایف طولانی‌مدت: اگر یک عامل برای اتمام کار به چند روز زمان نیاز داشته باشد یا منتظر تایید یک انسان برای انجام وظیفه‌ای باشد، باز نگه داشتن یک فرآیند باعث هدر رفتن CPU و حافظه می‌شود.
  • عدم بازیابی پس از خرابی: اگر سیستم دچار کرش شود یا شبکه قطع شود، تمام وضعیت (state) را از دست می‌دهید. نمی‌توانید از همان جایی که متوقف شده بودید، کار را ادامه دهید.
  • پیچیدگی: تعامل چندین عامل با یکدیگر بدون نوشتن حجم عظیمی از کدهای اضافی، دشوار است.

ویرین بارایا (Virein Baraiya)، مدیر فناوری Orkes، روش بهتری را پیشنهاد می‌کند: دغدغه‌های خود را از هم جدا کنید.

فقط برای انجام اقدامات از sandbox استفاده کنید. از sandbox برای اجرای ایمن کدهای ابزارهای پرخطر استفاده کنید.

برای استدلال از یک runtime پایدار استفاده کنید. LLM برنامه را ارائه می‌دهد و سیستم runtime مسئولیت اجرا و مدیریت وضعیت را بر عهده می‌گیرد.

او دو ابزار برای حل این مشکل معرفی می‌کند:

  1. Netflix Conductor این یک موتور گردش کار (workflow engine) است. مانند یک دفتر کل عمل می‌کند و هر فراخوانی LLM و هر استفاده از ابزار را در یک پایگاه داده ثبت می‌کند.
  • از تعلیق در لحظه (on-demand suspension) پشتیبانی می‌کند. اگر عاملی منتظر یک انسان باشد، سیستم گردش کار را متوقف کرده و تمام حافظه را آزاد می‌کند.
  • می‌تواند ماه‌ها بعد برای تکمیل وظیفه، دوباره فعال شود.
  1. Agent Span این یک runtime است که بر پایه Conductor ساخته شده و مانند یک مترجم عمل می‌کند.
  • می‌توانید از ابزارهای موجود مانند LangGraph یا OpenAI SDK استفاده کنید.
  • Agent Span کد عامل شما را بدون نیاز به بازنویسی منطق تجاری (business logic)، به گردش‌های کار پایدار تبدیل می‌کند.

این معماری سه مزیت بزرگ به همراه دارد:

  • حفاظ‌ها (Guardrails): چارچوب (framework) قوانین را کنترل می‌کند، نه LLM. این کار از آسیب‌های ناشی از توهمات (hallucinations) جلوگیری می‌کند.
  • بازرسی کامل (Full Audit): می‌توانید دقیقاً متوجه شوید که چرا یک عامل ماه‌ها بعد از یک تصمیم خاص گرفته است. حتی می‌توانید فرآیند را بازپخش (replay) کنید.
  • تست بهتر: می‌توانید خروجی یک LLM را تغییر دهید و ببینید بقیه سیستم چه واکنشی نشان می‌دهد.

نکته نهایی برای سازندگان: بر بافت تجاری (business context) تمرکز کنید. مدل‌ها تغییر می‌کنند. چارچوب‌ها تغییر می‌کنند. اما روش خاصی که کسب‌وکار شما وظایف را اجرا می‌کند، مزیت رقابتی (moat) واقعی شماست.

Source: https://dev.to/cognitalk/chao-yue-sha-xiang-wei-ai-agent-gou-jian-chi-jiu-hua-yun-xing-shi-2i9i

Optional learning community: https://t.me/GyaanSetuAi