Loopcraft چیست؟
دنیای هوش مصنوعی با اصطلاح جدیدی روبرو شده است: Loopcraft.
برخی ممکن است آن را نام جدیدی برای یک مفهوم قدیمی بدانند. پیش از این مردم آن را Agent Loops یا Workflow Engineering مینامیدند. اما تغییری که در سیلیکونولی در حال رخ دادن است، واقعی است.
متخصصانی مانند Andrej Karpathy و Boris Cherny در حال فاصله گرفتن از پرامپتنویسی دستی هستند. آنها دیگر به عاملها (agents) پرامپت نمیدهند، بلکه در حال طراحی حلقههایی هستند که به عاملها پرامپت میدهند.
تغییر اصلی، حول محور انتزاع (abstraction) میچرخد.
روش قدیمی: انسان -> پرامپت -> عامل -> نتیجه
روش جدید: انسان -> طراحی حلقه -> کشف وظیفه -> اجرا -> تأیید خودکار -> تلاش مجدد -> ذخیره وضعیت -> ادامه
Prompt Engineering یک تعامل واحد را بهینه میکند، اما Loopcraft کل سیستمی را که بهطور مکرر اجرا میشود، بهینه میکند.
Loopcraft بر پرسشهای سیستمی تمرکز دارد:
- چه کسی وظیفه بعدی را شروع میکند؟
- عامل چگونه از هدف مطلع میشود؟
- چه کسی خروجی را بررسی میکند؟
- شکست چگونه باعث ایجاد بازخورد میشود؟
- وضعیت چگونه در طول جلسات ذخیره میشود؟
اگر فقط یک مرحله را خودکار کنید، در حال ساخت یک سیستم نیستید؛ بلکه فقط در حال سرعت بخشیدن به یک فرآیند دستی هستید.
یک حلقه واقعی، کل چرخه حیات را مدیریت میکند. برای مثال، به جای اینکه شما بهصورت دستی یک خطای CI را اصلاح کنید، یک سیستم Loopcraft:
- خطا را شناسایی میکند.
- لاگها را میخواند.
- یک عامل را در یک محیط ایزوله اجرا میکند.
- کد را تغییر میدهد.
- تستها را اجرا میکند.
- از یک تأییدکننده (verifier) دوم برای بررسی تغییرات (diff) استفاده میکند.
- پس از موفقیت، یک PR ایجاد میکند.
این تفاوت بین یک Agent Harness و Loopcraft است. یک Harness همان محیط است. ابزارها، حافظه و مجوزها را فراهم میکند و به این سوال پاسخ میدهد: «عامل چگونه کار میکند؟» Loopcraft همان ارکستراسیون (orchestration) است. به این سوال پاسخ میدهد: «عامل چه زمانی اجرا میشود و چرا ادامه میدهد؟»
برای ساخت یک حلقه حداقلی، به شش بخش نیاز دارید:
- Trigger (محرک): رویدادی مانند خطای CI یا یک وظیفه زمانبندی شده.
- Goal (هدف): یک شرط یا تست که توسط ماشین قابل تأیید باشد.
- State (وضعیت): روشی برای ذخیره پیشرفت و دلایل شکست.
- Worker (کارگر): عاملی که در یک کانتینر ایزوله در حال اجراست.
- Verifier (تأییدکننده): یک تست یا یک LLM دوم برای امتیازدهی به کار انجام شده.
- Budget (بودجه): محدودیتهایی در نظر گرفته شده برای زمان، هزینه و دفعات تلاش مجدد.
بالاترین سطح Loopcraft، «حلقه بهبود» (improvement loop) است. یک حلقه ساده، کار را تکرار میکند، اما یک حلقه بهبود، شکستها را تحلیل میکند تا خودِ سیستم را تغییر دهد. این حلقه پرامپتها و ابزارها را طوری تنظیم میکند که اجرای بعدی بهتر باشد.
دست از تلاش برای اصلاح دستی تکتک نتایج بردارید. شروع کنید به اصلاح سیستمی که آن نتایج را تولید میکند.
Source: https://dev.to/luhuidev/what-is-loopcraft-from-prompt-engineering-to-agent-loop-system-design-2dff
Optional learning community: https://t.me/GyaanSetuAi
