𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗮 𝗦𝗲𝗿𝘃𝗲𝗿𝗹𝗲𝘀𝘀 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵 𝗦𝗲𝗿𝘃𝗶𝗰𝗲 𝗳𝗼𝗿 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

AI agents จำเป็นต้องมีการค้นหาเว็บเพื่อค้นหาข้อมูลที่เป็นปัจจุบัน

เมื่อหลายทีมสร้าง agent พวกเขามักจะใช้ผู้ให้บริการค้นหาที่แตกต่างกัน ซึ่งทำให้เกิดความวุ่นวาย คุณจะต้องรับมือกับ API ที่หลากหลาย ต้นทุนที่ต่างกัน และเครื่องมือที่กระจัดกระจาย

ที่ PostNL เราแก้ปัญหานี้ด้วยการสร้างบริการค้นหาแบบรวมศูนย์บน AWS

เราได้สร้างระบบที่ทำงานดังนี้:

• อินเทอร์เฟซเดียวสำหรับทุกทีม • รองรับ search backend ที่หลากหลาย • ภาระงานด้านการปฏิบัติการต่ำ • ต้นทุนต่ำ • ความสามารถในการเปลี่ยนผู้ให้บริการโดยไม่ส่งผลกระทบต่อระบบ

สถาปัตยกรรมของเราใช้ routing layer ซึ่งเลเยอร์นี้จะอยู่ระหว่างแอปพลิเคชัน AI ของคุณและผู้ให้บริการค้นหา

ส่วนประกอบหลักของระบบ:

เราเลือกใช้ Go สำหรับ router เพราะมีความเร็วสูงและใช้หน่วยความจำน้อย ซึ่งทำงานได้อย่างสมบูรณ์แบบในฐานะ Lambda function ขนาดเล็ก การตั้งค่านี้สามารถขยายขนาด (scale) ได้โดยอัตโนมัติตามปริมาณการใช้งานที่เพิ่มขึ้น

นอกจากนี้เรายังใช้ hexagonal architecture ซึ่งหมายความว่า logic หลักจะไม่ขึ้นอยู่กับว่าคุณใช้ search engine ตัวไหน วันนี้เราใช้ SearXNG แต่วันหน้าเราสามารถเปลี่ยนไปใช้ผู้ให้บริการเชิงพาณิชย์ได้เพียงแค่เพิ่ม adapter ใหม่ โดยที่ผู้ใช้จะไม่สังเกตเห็นความเปลี่ยนแปลงใดๆ

เป้าหมายนั้นเรียบง่าย คือเราจัดเตรียมข้อมูลการค้นหา ส่วน AI agent จะทำหน้าที่ในการให้เหตุผลและตอบคำถาม

ด้วยการรวมบริการนี้เข้าสู่ศูนย์กลาง ทีมต่างๆ ก็ไม่ต้องกังวลเรื่อง search API อีกต่อไป และสามารถเริ่มมุ่งเน้นไปที่การสร้างโซลูชัน AI ที่ดีขึ้นได้

Source: https://dev.to/aws-builders/building-a-serverless-multi-backend-web-search-service-for-ai-agents-on-aws-1219

Optional learning community: https://t.me/GyaanSetuAi