Co to jest Loopcraft?
Świat AI ma nowy termin: Loopcraft.
Niektórzy mogą nazwać to nową nazwą dla starego konceptu. Kiedyś nazywano to Agent Loops lub Workflow Engineering. Jednak zmiana zachodząca w Dolinie Krzemowej jest realna.
Eksperci tacy jak Andrej Karpathy i Boris Cherny odchodzą od ręcznego promptowania. Nie promptują już agentów. Projektują pętle, które promptują agentów.
Kluczowa zmiana dotyczy abstrakcji.
Stary sposób: Człowiek -> Prompt -> Agent -> Wynik
Nowy sposób: Człowiek -> Projektowanie pętli -> Odkrywanie zadań -> Wykonanie -> Automatyczna weryfikacja -> Ponowienie próby -> Zapisanie stanu -> Kontynuacja
Prompt Engineering optymalizuje pojedynczą interakcję. Loopcraft optymalizuje cały system, który działa cyklicznie.
Loopcraft koncentruje się na pytaniach systemowych:
- Kto uruchamia następne zadanie?
- Jak agent dowiaduje się o celu?
- Kto sprawdza wynik?
- Jak błąd generuje informację zwrotną?
- Jak stan jest zapisywany między sesjami?
Jeśli automatyzujesz tylko jeden krok, nie budujesz systemu. Po prostu przyspieszasz proces manualny.
Prawdziwa pętla obsługuje cały cykl życia. Na przykład, zamiast ręcznego naprawiania błędu CI, system Loopcraft:
- Wykrywa błąd.
- Odczytuje logi.
- Uruchamia agenta w odizolowanym środowisku.
- Modyfikuje kod.
- Uruchamia testy.
- Używa drugiego weryfikatora do sprawdzenia różnic (diff).
- Tworzy PR po pomyślnym przejściu.
To jest różnica między Agent Harness a Loopcraft. Harness to środowisko. Zapewnia narzędzia, pamięć i uprawnienia. Odpowiada na pytanie: „Jak działa agent?”. Loopcraft to orkiestracja. Odpowiada na pytanie: „Kiedy agent się uruchamia i dlaczego kontynuuje pracę?”.
Aby zbudować minimalną pętlę, potrzebujesz sześciu elementów:
- Trigger (Wyzwalacz): Zdarzenie, takie jak błąd CI lub zaplanowane zadanie.
- Goal (Cel): Warunek lub test weryfikowalny przez maszynę.
- State (Stan): Sposób przechowywania postępów i przyczyn błędów.
- Worker (Pracownik): Agent działający w odizolowanym kontenerze.
- Verifier (Weryfikator): Test lub drugi model LLM do oceny pracy.
- Budget (Budżet): Limity czasu, kosztów i liczby prób ponowienia.
Najwyższym poziomem Loopcraft jest pętla doskonalenia (improvement loop). Prosta pętla powtarza pracę. Pętla doskonalenia analizuje błędy, aby zmienić sam system. Dostosowuje prompty i narzędzia tak, aby kolejne uruchomienie było lepsze.
Przestań próbować ręcznie naprawiać każdy pojedynczy wynik. Zacznij naprawiać system, który te wyniki generuje.
Źródło: https://dev.to/luhuidev/what-is-loopcraft-from-prompt-engineering-to-agent-loop-system-design-2dff
Opcjonalna społeczność edukacyjna: https://t.me/GyaanSetuAi
