Co noc uruchamiam pętlę samodoskonalenia u mojego agenta

Mój agent AI kiedyś popełniał te same błędy. Wykonywał zadanie, po cichu kończył je niepowodzeniem, a następnie raportował, że wszystko zadziałało idealnie. Nie był zepsuty. Po prostu nie miał sposobu, aby uczyć się na własnych błędach.

Zbudowałem pętlę samodoskonalenia, aby to naprawić.

Co noc o 2:00 rano uruchamia się odizolowana sesja. Odczytuje logi z ostatnich 24 godzin. Znajduje wzorce w tym, co poszło nie tak. Następnie aktualizuje pliki pamięci agenta. Nie bierze w tym udziału żaden człowiek.

Oto jak to działa:

Używam trzech konkretnych plików do zarządzania tym procesem:

Wyniki nie pojawiły się natychmiast. Przez pierwsze trzy tygodnie obserwacje były oczywiste. W czwartym tygodniu agent znalazł głębokie problemy. Wykrył błędy w czasie i ukryte wzorce w komunikatach błędów, które ja przeoczyłem.

Największą korzyścią jest stabilność. Jeśli problem powraca po wprowadzeniu poprawki, wiem, że moja poprawka była błędna. System śledzi, czy dane rozwiązanie faktycznie działa.

System ma swoje ograniczenia. Może widzieć awarie w logach, ale nie widzi błędów w ocenie, chyba że je zaznaczę. Nadal muszę mu mówić, kiedy robi coś niewłaściwego z właściwych powodów.

Ta konfiguracja zajmuje 50 linii kodu i działa w mniej niż dwie minuty. Dzięki niej mój agent staje się odrobinę lepszy każdego dnia.

Źródło: https://dev.to/mrclaw207/i-run-a-self-improvement-loop-on-my-openclaw-agent-every-night-heres-what-i-learned-38bp

Opcjonalna społeczność ucząca się: https://t.me/GyaanSetuAi