Bộ nhớ của Agent: 7 loại, và 2 loại thực chất không hề ghi nhớ
Agent của bạn không gặp vấn đề về bộ nhớ. Nó có bảy loại bộ nhớ khác nhau. Hầu hết các đội ngũ chỉ xây dựng được hai loại.
Điều đầu tiên bạn phải hiểu: mô hình không ghi nhớ bất cứ điều gì. Một LLM là một hàm thuần túy. Nó nhận đầu vào và đưa ra đầu ra. Nó không lưu giữ trạng thái giữa các lần gọi. Những gì có vẻ như là bộ nhớ thực chất chỉ là một lớp gửi lại lịch sử trong mỗi yêu cầu. Bạn phải trả phí cho những token đó mỗi lần thực hiện.
Hầu hết các nỗ lực kỹ thuật đều rơi vào hai mô hình: lịch sử hội thoại và RAG. Đây là hai trong số bảy loại. Vấn đề là gì? Chúng không làm cho agent của bạn thông minh hơn theo thời gian.
Dưới đây là bảy loại bộ nhớ:
• Working (Làm việc): Mọi thứ trong cửa sổ ngữ cảnh hiện tại. • Semantic (Ngữ nghĩa): Các sự thật, sở thích và kiến thức chuyên môn. • Episodic (Tình tiết): Nhật ký về các sự kiện đã qua và những gì đã hiệu quả hoặc thất bại. • Procedural (Quy trình): Các kỹ năng, quy trình làm việc và các mẫu công cụ. • Retrieval (Truy xuất): Lấy kiến thức thông qua tìm kiếm tương đồng. • Parametric (Tham số): Kiến thức được tích hợp sẵn trong trọng số của mô hình. • Prospective (Dự kiến): Các ý định trong tương lai và các tác vụ đã lên lịch.
Hai trong số này không phải là bộ nhớ thực sự. RAG chỉ là một cơ chế chuyển giao. Nó là hệ thống đường ống, không phải là nước. Nó di chuyển dữ liệu từ một kho lưu trữ vào bộ nhớ làm việc. Nếu bạn chỉ sử dụng cơ sở dữ liệu vector, bạn đã xây dựng một đường ống mà quên mất chất lỏng.
Để xây dựng một agent thực sự có khả năng học hỏi, bạn cần một vòng lặp củng cố (consolidation loop). Điều này có nghĩa là chuyển đổi bộ nhớ tình tiết thành bộ nhớ ngữ nghĩa.
Quy trình hoạt động như sau:
- Agent trải qua một sự kiện (Episodic).
- Agent thấy cùng một mô hình lặp lại nhiều lần.
- Agent trừu tượng hóa mô hình đó thành một quy tắc vĩnh viễn (Semantic).
Giờ đây, agent không cần phải suy luận qua mười hai ví dụ. Nó chỉ đơn giản là áp dụng một sự thật duy nhất.
Cách ưu tiên việc xây dựng của bạn:
- Quản lý bộ nhớ làm việc như một ngân sách. Đây là chi phí cao nhất của bạn. Hãy sử dụng tóm tắt và loại bỏ (eviction) ngay từ sớm.
- Tách biệt các kho lưu trữ. Giữ các sự thật, sự kiện và quy tắc ở những nơi khác nhau.
- Sử dụng bộ lập lịch cho bộ nhớ dự kiến. Đừng sử dụng kho lưu trữ vector cho những việc cần thực hiện vào một ngày cụ thể.
- Vạch ra một ranh giới rõ ràng cho bộ nhớ tham số. Sử dụng mô hình để suy luận, nhưng hãy sử dụng kho lưu trữ riêng của bạn cho các dữ liệu biến động như lãi suất hoặc các quy tắc sản phẩm.
Hầu hết các agent hiện nay chỉ là một cửa sổ ngữ cảnh và một cơ sở dữ liệu vector. Những agent chiến thắng là những agent có thể biến sai lầm của ngày hôm qua thành quy tắc của ngày mai.
Source: https://dev.to/shudiptotrafder/agent-memory-7-types-and-2-of-them-arent-memory-6oi
Optional learning community: https://t.me/GyaanSetuAi
