Ghi chép thực địa: Cách Agentic RAG xử lý dữ liệu doanh nghiệp
Một khách hàng gửi yêu cầu hỗ trợ. Họ hỏi về chi tiết bảo hành của các máy chủ cụ thể từ một dự án trước đây. Họ cũng cần các điều khoản hợp đồng và thông tin liên hệ hỗ trợ hiện tại.
Việc trả lời câu hỏi này rất khó. Nó đòi hỏi dữ liệu từ bốn nơi khác nhau:
- CRM để lấy lịch sử khách hàng.
- ERP để lấy các điều khoản hợp đồng.
- Quản lý tài sản để lấy số sê-ri.
- Hệ thống nhân sự (HR) để lấy thông tin nhân viên.
Các hệ thống này sử dụng các cơ sở dữ liệu và quyền truy cập khác nhau. RAG tiêu chuẩn sẽ thất bại ở đây. Nó chỉ tìm kiếm một lần và bỏ cuộc nếu không tìm thấy gì.
Agentic RAG giải quyết vấn đề này bằng cách biến việc truy xuất thành một kế hoạch. Nó không chỉ tìm kiếm. Nó suy nghĩ, hành động và kiểm tra lại công việc của mình.
Dưới đây là cách quy trình làm việc vận hành:
Bộ điều phối (The Orchestrator) Hệ thống chia nhỏ câu hỏi thành các tác vụ con. Nó xác định nguồn dữ liệu nào cần sử dụng và tác vụ nào phụ thuộc vào các tác vụ khác.
Bộ viết lại truy vấn (The Query Rewriter) Mỗi hệ thống sử dụng một ngôn ngữ khác nhau. Một hệ thống cần SQL. Một hệ thống khác cần tìm kiếm theo từ khóa. Bộ viết lại sẽ chuyển đổi câu hỏi của người dùng sang định dạng phù hợp cho từng công cụ.
Truy xuất song song (Parallel Retrieval) Hệ thống truy vấn nhiều nguồn cùng một lúc. Nó phải tuân thủ các quy tắc bảo mật. AI chỉ truy cập vào những dữ liệu mà người dùng cụ thể đó có quyền xem.
Bộ kiểm tra tính đầy đủ (The Sufficiency Checker) Đây là phần quan trọng nhất. Hệ thống sẽ hỏi: "Thông tin này đã đủ để trả lời câu hỏi chưa?" Nếu thiếu một phần thông tin, chẳng hạn như một tệp đính kèm PDF cụ thể, hệ thống sẽ không dừng lại. Nó sẽ lập một kế hoạch mới để tìm tệp đó. Nó sẽ lặp lại cho đến khi có được bức tranh toàn cảnh.
Tổng hợp (Synthesis) Agent cuối cùng sẽ thu thập tất cả các mảnh thông tin và xây dựng một câu trả lời duy nhất, chính xác kèm theo các nguồn tham chiếu.
Agentic RAG không phải là giải pháp vạn năng. Nó chậm hơn và tốn kém hơn so với RAG truyền thống.
Sử dụng RAG truyền thống cho các câu hỏi đơn giản trong một cơ sở dữ liệu. Sử dụng Agentic RAG cho các câu hỏi phức tạp, gồm nhiều bước trên nhiều hệ thống khác nhau.
Mục tiêu là chuyển từ mô hình truy vấn-phản hồi đơn giản sang một quy trình làm việc có trạng thái (stateful workflow): Lập kế hoạch. Thực thi. Đánh giá. Lặp lại.
Nguồn: https://dev.to/luhuidev/field-notes-how-agentic-rag-handles-the-real-mess-of-enterprise-data-a68
Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi