حلقه عاملمحور: یک راهنمای عملی میدانی
از پرامپتنویسی برای عاملها دست بکشید. طراحی حلقهها را شروع کنید.
بیشتر مردم از عاملهای هوش مصنوعی به عنوان چتبات استفاده میکنند. آنها یک پرامپت تایپ میکنند و منتظر نتیجه میمانند. این یک وظیفه تکمرحلهای است، نه یک عامل.
یک حلقه عاملمحور متفاوت است. این سیستمی است که کار را انجام میدهد، نتیجه را بررسی میکند و تصمیم میگیرد که آیا ادامه دهد یا خیر.
وظیفهای بدون بررسی، چیزی جز امیدواری نیست.
هنر مهندسی حلقه، تلاش شما را از تایپ کردن پرامپتها به سمت طراحی سیستمها سوق میدهد. به جای ورودی دستی، شما چرخهای میسازید که بر اساس یک زمانبندی یا در راستای یک هدف اجرا میشود.
نحوه عملکرد یک حلقه:
- مشاهده (Observe): عامل فایلها را میخواند یا یک تست را اجرا میکند.
- اقدام (Act): عامل یک تغییر کوچک و برگشتپذیر ایجاد میکند.
- بررسی (Check): عامل یک تست ثابت را اجرا میکند تا ببیند آیا کار کرده است یا خیر.
- تصمیمگیری (Decide): عامل تصمیم میگیرد که ادامه دهد، به دلیل موفقیت متوقف شود، یا به دلیل مسدود شدن متوقف شود.
مهمترین قانون: از یک مدل مجزا برای بررسی کار استفاده کنید. مدلی که کد را مینویسد، هنگام نمرهدهی به خودش بیش از حد سخاوتمند است. شما به تفکیک «سازنده-بررسیکننده» (maker-checker) نیاز دارید. یک عامل عمل میکند و عامل دیگری آن را تأیید میکند.
حلقههای خود را با این پنج بلوک بسازید:
- محرک (Trigger): حلقه چه زمانی شروع میشود؟
- ورودیها (Inputs): عامل چه وضعیت جدیدی را بررسی میکند؟
- اقدام (Action): چه تغییر واحد و محدودی ایجاد خواهد کرد؟
- بررسی (Check): چه تست ثابتی موفقیت را تعیین میکند؟
- توقف (Stop): چه زمانی به دلیل موفقیت، بودجه یا شکست متوقف میشود؟
اگر یک بلوک را فراموش کنید، حلقهی شما منحرف شده یا تا ابد اجرا میشود.
برای ایمن نگه داشتن حلقهها، باید سه توقف قطعی تعیین کنید:
- حداکثر تعداد تکرار (Max iteration count): سقفی برای تعداد دفعات اجرا.
- تشخیص عدم پیشرفت (No-progress detection): اگر عامل هیچ تغییر قابل اندازهگیری ایجاد نکرد، آن را متوقف کنید.
- سقف بودجه (Budget ceiling): محدودیتی قطعی برای توکنها یا دلارها.
گلوگاه در نرمافزار دیگر نوشتن کد نیست؛ بلکه مشخص کردن هدف و بررسی به قدری شفاف است که یک عامل بتواند بدون حضور شما اجرا شود.
حلقه را بسازید، اما مهندس باقی بمانید.
منبع: https://dev.to/truongpx396/the-agentic-loop-a-practical-field-guide-mnc
