𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗮 𝗦𝗲𝗿𝘃𝗲𝗿𝗹𝗲𝘀𝘀 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵 𝗦𝗲𝗿𝘃𝗶𝗰𝗲 𝗳𝗼𝗿 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀
Các AI agent cần tìm kiếm web để tìm các thông tin thực tế mới nhất.
Khi nhiều nhóm cùng xây dựng các agent, họ thường sử dụng các nhà cung cấp tìm kiếm khác nhau. Điều này tạo ra sự hỗn loạn. Bạn sẽ phải đối mặt với các API khác nhau, chi phí khác nhau và các công cụ bị phân mảnh.
Tại PostNL, chúng tôi đã giải quyết vấn đề này bằng cách xây dựng một dịch vụ tìm kiếm tập trung trên AWS.
Chúng tôi đã xây dựng một hệ thống hoạt động như sau:
• Một giao diện duy nhất cho tất cả các nhóm. • Hỗ trợ nhiều backend tìm kiếm. • Ít công việc vận hành. • Chi phí thấp. • Khả năng thay đổi nhà cung cấp mà không làm gián đoạn bất cứ điều gì.
Kiến trúc của chúng tôi sử dụng một lớp định tuyến (routing layer). Lớp này nằm giữa ứng dụng AI của bạn và nhà cung cấp tìm kiếm.
Các thành phần cốt lõi của hệ thống:
- API Gateway: Cung cấp một điểm truy cập riêng tư cho những người dùng được ủy quyền.
- AWS Lambda: Chạy một bộ định tuyến (router) nhẹ được viết bằng Go.
- ECS Fargate: Lưu trữ backend tìm kiếm ban đầu của chúng tôi bằng SearXNG.
Chúng tôi chọn Go cho bộ định tuyến vì nó nhanh và tiêu tốn ít bộ nhớ. Nó hoạt động hoàn hảo dưới dạng một hàm Lambda nhỏ. Thiết lập này có khả năng tự động mở rộng khi mức độ sử dụng tăng lên.
Chúng tôi cũng sử dụng kiến trúc lục giác (hexagonal architecture). Điều này có nghĩa là logic cốt lõi không phụ thuộc vào việc bạn sử dụng công cụ tìm kiếm nào. Hôm nay chúng tôi sử dụng SearXNG. Ngày mai, chúng tôi có thể chuyển sang một nhà cung cấp thương mại chỉ bằng cách thêm một adapter mới. Người dùng sẽ không bao giờ nhận thấy sự thay đổi.
Mục tiêu rất đơn giản. Chúng tôi cung cấp dữ liệu tìm kiếm. AI agent sẽ xử lý việc suy luận và đưa ra câu trả lời.
Bằng cách tập trung hóa dịch vụ này, các nhóm sẽ ngừng lo lắng về các API tìm kiếm và bắt đầu tập trung vào việc xây dựng các giải pháp AI tốt hơn.
Optional learning community: https://t.me/GyaanSetuAi