𝗔𝗺𝗮𝘇𝗼𝗻 𝗕𝗲𝗱𝗿𝗼𝗰𝗸 𝗔𝗴𝗲𝗻𝘁𝗖𝗼𝗿𝗲 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵: 𝗧𝗵𝗲 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗚𝘂𝗶𝗱𝗲
AI agent ของคุณไม่ได้เกิดอาการหลอน (hallucinating) เพราะโมเดลของคุณไม่ดี แต่มันหลอนเพราะสถาปัตยกรรมของคุณหยุดนิ่งอยู่กับที่
RAG pipeline ส่วนใหญ่มักเป็นเพียงการแก้ปัญหาเฉพาะหน้าที่มีราคาแพงสำหรับข้อมูลที่ล้าสมัย แต่ตอนนี้ AWS ได้นำเสนอทางออกแล้ว นั่นคือ Web Search บน Amazon Bedrock AgentCore ซึ่งเป็นเครื่องมือแบบ managed ที่ช่วยให้ agent ของคุณสามารถเข้าถึงข้อมูลบนเว็บแบบเรียลไทม์ได้
ทำไมเรื่องนี้ถึงสำคัญ:
ช่องว่างระหว่างสิ่งที่ LLM รู้กับสิ่งที่ผู้ใช้ถามนั้นกว้างขึ้นทุกวัน และช่องว่างนี้เองที่เปลี่ยน agent ให้กลายเป็นเครื่องจักรที่สร้างภาระและความเสี่ยง (liability machines)
สิ่งที่คุณจะได้รับจาก AgentCore Web Search:
- การเข้าถึงผลลัพธ์จากเว็บแบบเรียลไทม์อย่างเป็นระบบ
- ไม่ต้องสร้าง custom crawlers เอง
- ไม่ต้องทำสัญญา API กับผู้ให้บริการ search รายอื่น
- ไม่ต้องแยกการเรียกเก็บเงิน
- เรียกใช้ SDK เพียงครั้งเดียวเพื่อจัดการทั้งการ crawl, การจัดลำดับ (ranking) และการเรียกเก็บเงิน
เลิกจ่าย "ภาษีความรู้หยุดนิ่ง" (Knowledge Freeze Tax) ได้แล้ว นี่คือต้นทุนของการใช้ข้อมูลที่ล้าสมัย ซึ่งจะแสดงออกมาในรูปแบบของคำตอบที่ผิดพลาด, การเสียเวลาของวิศวกรโดยเปล่าประโยชน์ และความหน่วง (latency) ที่สูง
วิธีการสร้าง pipeline ระดับใช้งานจริง (production-grade):
Intent Classification: ใช้ router เพื่อตัดสินใจว่าคำถามนั้นจำเป็นต้องใช้ข้อมูลจากเว็บแบบเรียลไทม์, ใช้ internal RAG หรือใช้ข้อมูลแบบมีโครงสร้าง (structured data) อย่าสั่งรัน web search ในทุกคำถาม มิฉะนั้นงบประมาณของคุณจะหมดอย่างรวดเร็ว
Web Search Invocation: เครื่องมือจะส่งคืนข้อมูลชื่อหัวข้อ (titles), URL, เนื้อหาโดยย่อ (snippets) และเวลาที่บันทึกข้อมูล (timestamps)
Result Synthesis: ใส่ snippets และ timestamps เข้าไปในโมเดล คุณต้องใส่ timestamps เข้าไปด้วยเพื่อให้โมเดลทราบว่าแหล่งข้อมูลนั้นเก่าเกินไปหรือไม่
Observability: ใช้ Langfuse เพื่อติดตาม (trace) ว่าผลลัพธ์จากเว็บใดที่มีอิทธิพลต่อคำตอบของคุณ สิ่งนี้สำคัญมากสำหรับการปฏิบัติตามข้อกำหนดขององค์กร (enterprise compliance)
เคล็ดลับทางเทคนิคที่สำคัญ:
- ใช้ Web Search สำหรับข้อมูลข้อเท็จจริงที่รวดเร็ว
- ใช้ Browser Tool เฉพาะกับหน้าเว็บที่มี JavaScript ซับซ้อนหรือต้องผ่านการล็อกอินเท่านั้น การใช้ Browser Tool สำหรับการค้นหาข้อมูลทั่วไปจะเพิ่มความหน่วง (latency) อีก 3 ถึง 8 วินาที
- ตรวจสอบสิทธิ์ IAM ของคุณ ตรวจสอบให้แน่ใจว่าคุณมีสิทธิ์
bedrock-agentcore:InvokeWebSearch - ใช้แนวทางแบบไฮบริด (hybrid approach) โดยใช้ Web Search สำหรับข้อมูลภายนอก และใช้ RAG สำหรับเอกสารภายในที่เป็นความลับของคุณ
เป้าหมายไม่ใช่การใช้ web search ให้บ่อยที่สุด แต่เป้าหมายคือการสร้าง router ที่ฉลาดพอที่จะใช้งานมันเฉพาะเมื่อจำเป็นเท่านั้น
Optional learning community: https://t.me/GyaanSetuAi