𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗮 𝗦𝗲𝗿𝘃𝗲𝗿𝗹𝗲𝘀𝘀 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵 𝗦𝗲𝗿𝘃𝗶𝗰𝗲 𝗳𝗼𝗿 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀
AI agents จำเป็นต้องมีการค้นหาเว็บเพื่อค้นหาข้อมูลที่เป็นปัจจุบัน
เมื่อหลายทีมสร้าง agent พวกเขามักจะใช้ผู้ให้บริการค้นหาที่แตกต่างกัน ซึ่งทำให้เกิดความวุ่นวาย คุณจะต้องรับมือกับ API ที่หลากหลาย ต้นทุนที่ต่างกัน และเครื่องมือที่กระจัดกระจาย
ที่ PostNL เราแก้ปัญหานี้ด้วยการสร้างบริการค้นหาแบบรวมศูนย์บน AWS
เราได้สร้างระบบที่ทำงานดังนี้:
• อินเทอร์เฟซเดียวสำหรับทุกทีม • รองรับ search backend ที่หลากหลาย • ภาระงานด้านการปฏิบัติการต่ำ • ต้นทุนต่ำ • ความสามารถในการเปลี่ยนผู้ให้บริการโดยไม่ส่งผลกระทบต่อระบบ
สถาปัตยกรรมของเราใช้ routing layer ซึ่งเลเยอร์นี้จะอยู่ระหว่างแอปพลิเคชัน AI ของคุณและผู้ให้บริการค้นหา
ส่วนประกอบหลักของระบบ:
- API Gateway: ให้จุดเชื่อมต่อส่วนตัวสำหรับผู้ใช้ที่ได้รับอนุญาต
- AWS Lambda: รัน router ขนาดเล็กที่เขียนด้วยภาษา Go
- ECS Fargate: โฮสต์ search backend เริ่มต้นของเราโดยใช้ SearXNG
เราเลือกใช้ Go สำหรับ router เพราะมีความเร็วสูงและใช้หน่วยความจำน้อย ซึ่งทำงานได้อย่างสมบูรณ์แบบในฐานะ Lambda function ขนาดเล็ก การตั้งค่านี้สามารถขยายขนาด (scale) ได้โดยอัตโนมัติตามปริมาณการใช้งานที่เพิ่มขึ้น
นอกจากนี้เรายังใช้ hexagonal architecture ซึ่งหมายความว่า logic หลักจะไม่ขึ้นอยู่กับว่าคุณใช้ search engine ตัวไหน วันนี้เราใช้ SearXNG แต่วันหน้าเราสามารถเปลี่ยนไปใช้ผู้ให้บริการเชิงพาณิชย์ได้เพียงแค่เพิ่ม adapter ใหม่ โดยที่ผู้ใช้จะไม่สังเกตเห็นความเปลี่ยนแปลงใดๆ
เป้าหมายนั้นเรียบง่าย คือเราจัดเตรียมข้อมูลการค้นหา ส่วน AI agent จะทำหน้าที่ในการให้เหตุผลและตอบคำถาม
ด้วยการรวมบริการนี้เข้าสู่ศูนย์กลาง ทีมต่างๆ ก็ไม่ต้องกังวลเรื่อง search API อีกต่อไป และสามารถเริ่มมุ่งเน้นไปที่การสร้างโซลูชัน AI ที่ดีขึ้นได้
Optional learning community: https://t.me/GyaanSetuAi