𝗔𝗺𝗮𝘇𝗼𝗻 𝗕𝗲𝗱𝗿𝗼𝗰𝗸 𝗔𝗴𝗲𝗻𝘁𝗖𝗼𝗿𝗲 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵: 𝟳 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀 𝗧𝗵𝗮𝘁 𝗞𝗶𝗹𝗹 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗔𝗴𝗲𝗻𝘁𝘀
Hầu hết các đội ngũ AI đã mắc một sai lầm trong năm 2024. Họ xây dựng các pipeline RAG dựa trên dữ liệu tĩnh.
Một pipeline RAG tĩnh giống như một bức ảnh chụp lại internet. Nó trở nên lỗi thời ngay khoảnh khắc bạn chụp nó. AWS vừa thay đổi điều này với Web Search trên Amazon Bedrock AgentCore.
Công cụ này cho phép các agent của bạn sử dụng dữ liệu trực tiếp (live data) mà không cần bạn phải xây dựng hạ tầng tìm kiếm. Tuy nhiên, nhiều đội ngũ đã thất bại trong quá trình triển khai.
Dưới đây là 7 sai lầm bạn phải tránh:
Sử dụng web search để thay thế cho RAG. Web search dành cho các sự kiện hiện tại và giá cả. RAG dành cho các tài liệu nội bộ của công ty. Hãy sử dụng một router để chọn con đường phù hợp cho mỗi truy vấn.
Cho rằng Bedrock Guardrails bao quát cả web search. Thực tế là không. Web search là một luồng riêng biệt. Bạn phải tự thiết lập các kiểm soát chính sách của AgentCore như danh sách cho phép tên miền (domain allowlists) và làm sạch thông tin định danh cá nhân (PII scrubbing).
Thực hiện các tìm kiếm dư thừa trong các hệ thống đa agent (multi-agent systems). Trong các framework như AutoGen, mỗi sub-agent có thể gọi tìm kiếm một cách riêng biệt. Điều này làm tăng chi phí của bạn lên gấp 4 đến 8 lần. Thay vào đó, hãy sử dụng một bộ nhớ tìm kiếm dùng chung (shared search memory).
Bỏ qua "Bẫy kiến thức đóng băng" (Frozen Knowledge Trap). Đừng đổ lỗi cho mô hình khi nó đưa ra các câu trả lời cũ. Vấn đề có khả năng nằm ở kiến trúc dữ liệu của bạn. Nếu câu trả lời thay đổi hàng tuần, bạn cần tìm kiếm trực tiếp (live search).
Bỏ qua khả năng quan sát (observability). Nếu agent của bạn gặp hiện tượng ảo giác (hallucinate), bạn cần biết lý do tại sao. Đó là do kết quả tìm kiếm kém hay do lỗi của mô hình? Hãy sử dụng Langfuse để truy vết (trace) từng bước.
Hardcode các endpoint cụ thể. AWS sẽ cập nhật các công cụ này. Hãy sử dụng các mô tả công cụ tương thích với MCP để bạn có thể dễ dàng thay đổi nhà cung cấp.
Không kiểm tra lỗi prompt injection. Một trang web bị "đầu độc" có thể chiếm quyền điều khiển agent của bạn. Hãy kiểm tra agent của bạn với các payload injection đã biết trước khi triển khai chính thức.
Cách xây dựng một agent sẵn sàng cho production:
- Phân loại ý định của truy vấn.
- Điều hướng đến RAG, Web Search, hoặc Memory.
- Chuyển kết quả web qua một bộ lọc chính sách (policy filter).
- Tập hợp ngữ cảnh và gọi mô hình.
Đừng xây dựng các hệ thống tĩnh nữa. Hãy hướng tới các agent trực tiếp và có căn cứ (grounded agents).
Optional learning community: https://t.me/GyaanSetuAi