Amazon Bedrock AgentCore Web Search vs RAG
Pipeline RAG ของคุณอาจกำลังโกหกผู้ใช้งานของคุณอยู่
ระบบ RAG ส่วนใหญ่พึ่งพา vector database แบบ static ซึ่งฐานข้อมูลเหล่านี้เป็นเพียงภาพจำลองของข้อมูลในอดีตเท่านั้น ทันทีที่คุณทำ index ข้อมูล ข้อมูลนั้นก็เริ่มล้าสมัยทันที สิ่งนี้ทำให้เกิด Freshness Debt
หากคุณสร้าง agent สำหรับข่าวการเงินหรือราคาสินค้าโดยใช้ static RAG ตัว agent ของคุณจะให้ข้อมูลที่ล้าสมัย
Amazon Bedrock AgentCore web search จะเปลี่ยนสิ่งนี้ มันไม่ใช่แค่ฟีเจอร์ แต่มันคือเครื่องมือ managed grounding
นี่คือความแตกต่างระหว่างมันกับ RAG แบบดั้งเดิม:
- RAG เหมาะที่สุดสำหรับเอกสารภายในที่เป็นความลับซึ่งมีการเปลี่ยนแปลงช้า โดยให้การดึงข้อมูลที่รวดเร็วภายในเวลาไม่ถึง 100ms
- AgentCore web search เหมาะที่สุดสำหรับข้อเท็จจริงสาธารณะที่มีความผันผวนสูง เช่น ข่าวสารหรือกฎระเบียบต่างๆ โดยจะดึงข้อมูลแบบสดใหม่ (live data) ในขณะที่มีการ query
ทำไมเรื่องนี้ถึงสำคัญสำหรับนักพัฒนา:
- Less Glue: แทนที่จะต้องเขียนโค้ด custom ถึง 150 บรรทัดเพื่อจัดการเรื่อง API retries และการ parse ข้อมูล คุณเพียงแค่เรียกใช้งาน managed call เพียงครั้งเดียว
- Security: ทำงานอยู่ภายใต้ขอบเขตความปลอดภัย (trust boundary) ของ AWS โดยใช้ IAM และบันทึก log ลงใน CloudTrail
- Model Agnostic: คุณสามารถใช้งานร่วมกับ Claude, Llama, Mistral หรือ Titan ได้ โดยไม่ต้องถูกผูกขาดกับผู้ให้บริการรายใดรายหนึ่ง
- Reduced Errors: การทำ live grounding พร้อมการบังคับใช้การอ้างอิง (citation enforcement) สามารถลดอัตราข้อผิดพลาดด้านข้อเท็จจริงได้ถึง 40% ถึง 60%
The Winning Pattern:
อย่าเลือกอย่างใดอย่างหนึ่ง แต่ให้ใช้แนวทางแบบไฮบริด (hybrid approach)
- ใช้ RAG สำหรับเอกสารภายในบริษัทที่เป็นส่วนตัว
- ใช้ AgentCore web search สำหรับข้อมูลสาธารณะที่มีความผันผวนสูง
คำเตือนสำหรับการใช้งานจริง (production):
ระวังเรื่องค่าใช้จ่าย การกำหนดความลึกในการค้นหาแบบไม่จำกัด (unbounded search depth) ในระบบ multi-agent อาจทำให้ค่าใช้จ่ายพุ่งสูงเกินควบคุม เราพบว่าในการทดสอบ ค่าใช้จ่ายพุ่งจาก $30 เป็น $900 เนื่องจากการเรียกค้นหาแบบ recursive ดังนั้นควรตั้งค่าขีดจำกัด (hard limit) ของจำนวนการเรียกค้นหาต่อหนึ่ง query เสมอ
เลิกมองว่าความสดใหม่ของข้อมูลเป็นเรื่องรอง เพราะมันคือข้อกำหนดด้านความน่าเชื่อถือ (reliability requirement)
Optional learning community: https://t.me/GyaanSetuAi