𝗔𝗺𝗮𝘇𝗼𝗻 𝗕𝗲𝗱𝗿𝗼𝗰𝗸 𝗔𝗴𝗲𝗻𝘁𝗖𝗼𝗿𝗲 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵: 𝗧𝗵𝗲 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗚𝘂𝗶𝗱𝗲

AI agent ของคุณไม่ได้เกิดอาการหลอน (hallucinating) เพราะโมเดลของคุณไม่ดี แต่มันหลอนเพราะสถาปัตยกรรมของคุณหยุดนิ่งอยู่กับที่

RAG pipeline ส่วนใหญ่มักเป็นเพียงการแก้ปัญหาเฉพาะหน้าที่มีราคาแพงสำหรับข้อมูลที่ล้าสมัย แต่ตอนนี้ AWS ได้นำเสนอทางออกแล้ว นั่นคือ Web Search บน Amazon Bedrock AgentCore ซึ่งเป็นเครื่องมือแบบ managed ที่ช่วยให้ agent ของคุณสามารถเข้าถึงข้อมูลบนเว็บแบบเรียลไทม์ได้

ทำไมเรื่องนี้ถึงสำคัญ:

ช่องว่างระหว่างสิ่งที่ LLM รู้กับสิ่งที่ผู้ใช้ถามนั้นกว้างขึ้นทุกวัน และช่องว่างนี้เองที่เปลี่ยน agent ให้กลายเป็นเครื่องจักรที่สร้างภาระและความเสี่ยง (liability machines)

สิ่งที่คุณจะได้รับจาก AgentCore Web Search:

  • การเข้าถึงผลลัพธ์จากเว็บแบบเรียลไทม์อย่างเป็นระบบ
  • ไม่ต้องสร้าง custom crawlers เอง
  • ไม่ต้องทำสัญญา API กับผู้ให้บริการ search รายอื่น
  • ไม่ต้องแยกการเรียกเก็บเงิน
  • เรียกใช้ SDK เพียงครั้งเดียวเพื่อจัดการทั้งการ crawl, การจัดลำดับ (ranking) และการเรียกเก็บเงิน

เลิกจ่าย "ภาษีความรู้หยุดนิ่ง" (Knowledge Freeze Tax) ได้แล้ว นี่คือต้นทุนของการใช้ข้อมูลที่ล้าสมัย ซึ่งจะแสดงออกมาในรูปแบบของคำตอบที่ผิดพลาด, การเสียเวลาของวิศวกรโดยเปล่าประโยชน์ และความหน่วง (latency) ที่สูง

วิธีการสร้าง pipeline ระดับใช้งานจริง (production-grade):

  1. Intent Classification: ใช้ router เพื่อตัดสินใจว่าคำถามนั้นจำเป็นต้องใช้ข้อมูลจากเว็บแบบเรียลไทม์, ใช้ internal RAG หรือใช้ข้อมูลแบบมีโครงสร้าง (structured data) อย่าสั่งรัน web search ในทุกคำถาม มิฉะนั้นงบประมาณของคุณจะหมดอย่างรวดเร็ว

  2. Web Search Invocation: เครื่องมือจะส่งคืนข้อมูลชื่อหัวข้อ (titles), URL, เนื้อหาโดยย่อ (snippets) และเวลาที่บันทึกข้อมูล (timestamps)

  3. Result Synthesis: ใส่ snippets และ timestamps เข้าไปในโมเดล คุณต้องใส่ timestamps เข้าไปด้วยเพื่อให้โมเดลทราบว่าแหล่งข้อมูลนั้นเก่าเกินไปหรือไม่

  4. Observability: ใช้ Langfuse เพื่อติดตาม (trace) ว่าผลลัพธ์จากเว็บใดที่มีอิทธิพลต่อคำตอบของคุณ สิ่งนี้สำคัญมากสำหรับการปฏิบัติตามข้อกำหนดขององค์กร (enterprise compliance)

เคล็ดลับทางเทคนิคที่สำคัญ:

  • ใช้ Web Search สำหรับข้อมูลข้อเท็จจริงที่รวดเร็ว
  • ใช้ Browser Tool เฉพาะกับหน้าเว็บที่มี JavaScript ซับซ้อนหรือต้องผ่านการล็อกอินเท่านั้น การใช้ Browser Tool สำหรับการค้นหาข้อมูลทั่วไปจะเพิ่มความหน่วง (latency) อีก 3 ถึง 8 วินาที
  • ตรวจสอบสิทธิ์ IAM ของคุณ ตรวจสอบให้แน่ใจว่าคุณมีสิทธิ์ bedrock-agentcore:InvokeWebSearch
  • ใช้แนวทางแบบไฮบริด (hybrid approach) โดยใช้ Web Search สำหรับข้อมูลภายนอก และใช้ RAG สำหรับเอกสารภายในที่เป็นความลับของคุณ

เป้าหมายไม่ใช่การใช้ web search ให้บ่อยที่สุด แต่เป้าหมายคือการสร้าง router ที่ฉลาดพอที่จะใช้งานมันเฉพาะเมื่อจำเป็นเท่านั้น

Source: https://dev.to/aarhamforensics_eb3c024eb/amazon-bedrock-agentcore-web-search-the-complete-production-guide-1jep

Optional learning community: https://t.me/GyaanSetuAi