Agent OpenClaw của tôi mơ mỗi đêm

Mỗi tối vào lúc 7:10, agent OpenClaw của tôi "đi ngủ".

Nó không nghỉ ngơi. Nó xử lý. Một script chạy trong 60 giây để thực hiện một pipeline đối với tất cả những gì tôi đã làm trong ngày. Nó xem xét mọi tác vụ, mọi lỗi và mọi quyết định. Đến sáng, agent đã tự chỉnh sửa bộ nhớ của mình. Nó loại bỏ nhiễu và giữ lại các tín hiệu quan trọng.

Tôi đã chạy quy trình này trong ba tuần. Các con số cho thấy lý do tại sao nó hiệu quả:

  • 23 tháng 6: 62 ứng viên được đưa vào hàng chờ -> tìm thấy 257 chủ đề -> 2 được đưa vào bộ nhớ
  • 22 tháng 6: 64 ứng viên được đưa vào hàng chờ -> tìm thấy 242 chủ đề -> 1 được đưa vào bộ nhớ
  • 21 tháng 6: 63 ứng viên được đưa vào hàng chờ -> tìm thấy 241 chủ đề -> 1 được đưa vào bộ nhớ

Hầu hết dữ liệu đều bị loại bỏ. Điều này là có chủ đích.

Các AI agent chạy lâu dài thường gặp phải vấn đề nén ngữ cảnh (context compression). Khi một hệ thống tóm tắt 40 tin nhắn thành vài đoạn văn, nó sẽ mất đi các chi tiết. Những bài học quan trọng dần phai nhạt. Các lỗi chỉnh sửa trở nên mơ hồ.

Tôi đã xây dựng Dream Protocol để khắc phục điều này. Đó là một script Python đơn giản giúp quét các nhật ký bộ nhớ hàng ngày. Nó đưa mọi bài học rút ra và mọi lỗi chỉnh sửa vào hàng chờ.

Script này sử dụng ba cổng kiểm soát (gates) để quyết định những gì được giữ lại:

  • Số lần nhắc lại tối thiểu: 3 (phải xuất hiện 3 lần)
  • Số truy vấn duy nhất tối thiểu: 3 (phải xuất hiện trong 3 ngữ cảnh khác nhau)
  • Điểm số tối thiểu: 0.8

Nếu một khuôn mẫu (pattern) vượt qua được, nó sẽ được đưa vào MEMORY.md. Đây chính là cơ sở kiến thức dài hạn.

Tỷ lệ loại bỏ là rất cao. Vào ngày 23 tháng 6, script đã loại bỏ 824 trên tổng số 828 ứng viên. Hầu hết những gì agent học được, nó đều quên mất. Chỉ những khuôn mẫu lặp đi lặp lại mới tồn tại.

Quy trình này đã thay đổi cách agent của tôi hoạt động. Giờ đây, nó nhận diện các khuôn mẫu lỗi nhanh hơn. Nó ngừng đề xuất các mô hình miễn phí (free-tier) cho các tác vụ thực tế (production) vì nó đã ghi nhớ những thất bại trước đó.

Lưu trữ mọi thứ là một sai lầm. Một bộ nhớ đầy nhiễu sẽ khiến việc tìm kiếm sự thật trở nên khó khăn. Việc nén dữ liệu (compaction) sẽ làm loãng các tín hiệu quan trọng.

Quy tắc rất đơn giản: Hãy quên đi 97% những gì bạn học được. Chỉ giữ lại 3% xuất hiện trong ba ngữ cảnh khác nhau vào ba ngày khác nhau.

Nếu bộ nhớ của agent đang trở nên nhiễu, hãy thêm một bước loại bỏ trùng lặp (deduplication) hàng đêm. Bạn không cần những công cụ phức tạp. Bạn chỉ cần một cổng kiểm soát và kỷ luật để xóa bỏ phần còn lại.

Nguồn: https://dev.to/mrclaw207/my-openclaw-agent-dreams-every-night-heres-what-actually-sticks-3gcp

Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi