Loopcraft چیست؟

دنیای هوش مصنوعی با اصطلاح جدیدی روبرو شده است: Loopcraft.

برخی ممکن است آن را نام جدیدی برای یک مفهوم قدیمی بدانند. پیش از این مردم آن را Agent Loops یا Workflow Engineering می‌نامیدند. اما تغییری که در سیلیکون‌ولی در حال رخ دادن است، واقعی است.

متخصصانی مانند Andrej Karpathy و Boris Cherny در حال فاصله گرفتن از پرامپت‌نویسی دستی هستند. آن‌ها دیگر به عامل‌ها (agents) پرامپت نمی‌دهند، بلکه در حال طراحی حلقه‌هایی هستند که به عامل‌ها پرامپت می‌دهند.

تغییر اصلی، حول محور انتزاع (abstraction) می‌چرخد.

روش قدیمی: انسان -> پرامپت -> عامل -> نتیجه

روش جدید: انسان -> طراحی حلقه -> کشف وظیفه -> اجرا -> تأیید خودکار -> تلاش مجدد -> ذخیره وضعیت -> ادامه

Prompt Engineering یک تعامل واحد را بهینه می‌کند، اما Loopcraft کل سیستمی را که به‌طور مکرر اجرا می‌شود، بهینه می‌کند.

Loopcraft بر پرسش‌های سیستمی تمرکز دارد:

  • چه کسی وظیفه بعدی را شروع می‌کند؟
  • عامل چگونه از هدف مطلع می‌شود؟
  • چه کسی خروجی را بررسی می‌کند؟
  • شکست چگونه باعث ایجاد بازخورد می‌شود؟
  • وضعیت چگونه در طول جلسات ذخیره می‌شود؟

اگر فقط یک مرحله را خودکار کنید، در حال ساخت یک سیستم نیستید؛ بلکه فقط در حال سرعت بخشیدن به یک فرآیند دستی هستید.

یک حلقه واقعی، کل چرخه حیات را مدیریت می‌کند. برای مثال، به جای اینکه شما به‌صورت دستی یک خطای CI را اصلاح کنید، یک سیستم Loopcraft:

  • خطا را شناسایی می‌کند.
  • لاگ‌ها را می‌خواند.
  • یک عامل را در یک محیط ایزوله اجرا می‌کند.
  • کد را تغییر می‌دهد.
  • تست‌ها را اجرا می‌کند.
  • از یک تأییدکننده (verifier) دوم برای بررسی تغییرات (diff) استفاده می‌کند.
  • پس از موفقیت، یک PR ایجاد می‌کند.

این تفاوت بین یک Agent Harness و Loopcraft است. یک Harness همان محیط است. ابزارها، حافظه و مجوزها را فراهم می‌کند و به این سوال پاسخ می‌دهد: «عامل چگونه کار می‌کند؟» Loopcraft همان ارکستراسیون (orchestration) است. به این سوال پاسخ می‌دهد: «عامل چه زمانی اجرا می‌شود و چرا ادامه می‌دهد؟»

برای ساخت یک حلقه حداقلی، به شش بخش نیاز دارید:

  • Trigger (محرک): رویدادی مانند خطای CI یا یک وظیفه زمان‌بندی شده.
  • Goal (هدف): یک شرط یا تست که توسط ماشین قابل تأیید باشد.
  • State (وضعیت): روشی برای ذخیره پیشرفت و دلایل شکست.
  • Worker (کارگر): عاملی که در یک کانتینر ایزوله در حال اجراست.
  • Verifier (تأییدکننده): یک تست یا یک LLM دوم برای امتیازدهی به کار انجام شده.
  • Budget (بودجه): محدودیت‌هایی در نظر گرفته شده برای زمان، هزینه و دفعات تلاش مجدد.

بالاترین سطح Loopcraft، «حلقه بهبود» (improvement loop) است. یک حلقه ساده، کار را تکرار می‌کند، اما یک حلقه بهبود، شکست‌ها را تحلیل می‌کند تا خودِ سیستم را تغییر دهد. این حلقه پرامپت‌ها و ابزارها را طوری تنظیم می‌کند که اجرای بعدی بهتر باشد.

دست از تلاش برای اصلاح دستی تک‌تک نتایج بردارید. شروع کنید به اصلاح سیستمی که آن نتایج را تولید می‌کند.

Source: https://dev.to/luhuidev/what-is-loopcraft-from-prompt-engineering-to-agent-loop-system-design-2dff

Optional learning community: https://t.me/GyaanSetuAi