매일 밤 제 에이전트에 자기 개선 루프를 실행합니다

제 AI 에이전트는 예전에 똑같은 실수를 반복하곤 했습니다. 작업을 수행하다가 조용히 실패해 놓고는, 모든 것이 완벽하게 작동했다고 보고하곤 했죠. 에이전트가 고장 난 것은 아니었습니다. 그저 자신의 실수로부터 배울 방법이 없었을 뿐입니다.

이를 해결하기 위해 자기 개선 루프(self-improvement loop)를 구축했습니다.

매일 밤 새벽 2시, 격리된 세션이 깨어납니다. 지난 24시간 동안의 로그를 읽고, 무엇이 잘못되었는지 패턴을 찾아냅니다. 그런 다음 에이전트의 메모리 파일을 업데이트합니다. 이 과정에는 사람이 개입하지 않습니다.

작동 방식은 다음과 같습니다:

이를 관리하기 위해 세 가지 특정 파일을 사용합니다:

결과가 즉각적으로 나타나지는 않았습니다. 처음 3주 동안은 관찰 내용이 뻔했습니다. 하지만 4주 차에 접어들자 에이전트는 심층적인 문제를 찾아내기 시작했습니다. 제가 놓쳤던 타이밍 오류와 에러 메시지 속의 숨겨진 패턴을 찾아낸 것입니다.

가장 큰 이점은 안정성입니다. 문제를 수정한 후에도 같은 문제가 다시 발생한다면, 제 수정 방식이 잘못되었다는 것을 알 수 있습니다. 시스템은 해결책이 실제로 효과가 있는지 추적합니다.

시스템에는 한계가 있습니다. 로그를 통해 실패는 확인할 수 있지만, 제가 표시(flag)하지 않는 한 판단 오류(errors in judgment)는 확인할 수 없습니다. 옳은 이유로 잘못된 행동을 했을 때는 여전히 제가 알려줘야 합니다.

이 설정은 50줄의 설정(config)만 사용하며 2분 이내에 실행됩니다. 덕분에 제 에이전트는 매일 조금씩 더 나아지고 있습니다.

Source: https://dev.to/mrclaw207/i-run-a-self-improvement-loop-on-my-openclaw-agent-every-night-heres-what-i-learned-38bp

Optional learning community: https://t.me/GyaanSetuAi