Що таке Loopcraft?
У світі ШІ з'явився новий термін: Loopcraft.
Дехто може назвати це новою назвою для старого концепту. Раніше це називали Agent Loops або Workflow Engineering. Але зміни, що відбуваються в Кремнієвій долині, є реальними.
Такі експерти, як Андрій Карпати та Борис Черний, відходять від ручного промптингу. Вони більше не створюють промпти для агентів. Вони проєктують цикли (loops), які створюють промпти для агентів.
Суть змін полягає в абстракції.
Старий підхід: Human -> Prompt -> Agent -> Result
Новий підхід: Human -> Design the Loop -> Task Discovery -> Execution -> Automatic Verification -> Retry -> Save State -> Continue
Prompt Engineering оптимізує одну взаємодію. Loopcraft оптимізує всю систему, яка працює повторно.
Loopcraft зосереджується на системних питаннях:
- Хто запускає наступне завдання?
- Як агент дізнається про мету?
- Хто перевіряє результат?
- Як помилка створює зворотний зв'язок?
- Як стан зберігається між сесіями?
Якщо ви автоматизуєте лише один крок, ви не будуєте систему. Ви просто прискорюєте ручний процес.
Справжній цикл охоплює весь життєвий цикл. Наприклад, замість того, щоб ви вручну виправляли помилку CI, система Loopcraft:
- Виявляє помилку.
- Читає логи.
- Запускає агента в ізольованому середовищі.
- Модифікує код.
- Запускає тести.
- Використовує другого верифікатора для перевірки diff.
- Створює PR після успішного проходження.
У цьому полягає різниця між Agent Harness та Loopcraft. Harness — це середовище. Воно надає інструменти, пам'ять і дозволи. Воно відповідає на питання: «Як працює агент?» Loopcraft — це оркестрація. Вона відповідає на питання: «Коли запускається агент і чому він продовжує роботу?»
Щоб побудувати мінімальний цикл, вам потрібні шість складових:
- Trigger (Тригер): Подія, як-от помилка CI або заплановане завдання.
- Goal (Мета): Умова або тест, що піддається машинній перевірці.
- State (Стан): Спосіб зберігання прогресу та причин помилок.
- Worker (Воркер): Агент, що працює в ізольованому контейнері.
- Verifier (Верифікатор): Тест або друга LLM для оцінки роботи.
- Budget (Бюджет): Обмеження за часом, вартістю та кількістю спроб.
Найвищий рівень Loopcraft — це цикл вдосконалення (improvement loop). Простий цикл повторює роботу. Цикл вдосконалення аналізує помилки, щоб змінити саму систему. Він коригує промпти та інструменти, щоб наступний запуск був кращим.
Припиніть намагатися виправляти кожен окремий результат вручну. Почніть виправляти систему, яка створює ці результати.
Джерело: https://dev.to/luhuidev/what-is-loopcraft-from-prompt-engineering-to-agent-loop-system-design-2dff
Додаткова спільнота для навчання: https://t.me/GyaanSetuAi
