𝗛𝗼𝘄 𝗝𝗮𝗽𝗮𝗻𝗲𝘀𝗲 𝗟𝗮𝗯𝘀 𝗕𝘂𝗶𝗹𝗱 𝗕𝗲𝘁𝘁𝗲𝗿 𝗥𝗔𝗚 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialเมื่อวานซืน2min read

ฐานข้อมูลเวกเตอร์ของคุณคืนค่า chunk ที่เกี่ยวข้อง โมเดล embedding ของคุณได้คะแนนสูงในการทดสอบ benchmark แต่เมื่อผู้ใช้ถามคำถามที่ซับซ้อน ระบบกลับให้คำตอบที่ไร้ประโยชน์

นี่คือความล้มเหลวของสถาปัตยกรรมการดึงข้อมูล (retrieval architecture) การปรับจูน LLM ของคุณจะไม่ช่วยแก้ปัญหานี้

ทีมวิจัยชาวญี่ปุ่นได้ค้นพบทางออก พวกเขาสร้างระบบ Knowledge Graph RAG ซึ่งแนวทางนี้ช่วยเพิ่มความแม่นยำในงานด้านวิทยาศาสตร์ได้ถึง 90%

ปัญหาของ RAG แบบมาตรฐานคือความคล้ายคลึงทางความหมาย (semantic similarity) chunk เกี่ยวกับการพับตัวของโปรตีน (protein folding) อาจดูคล้ายกับคำถามเกี่ยวกับ CRISPR แต่ความคล้ายคลึงไม่ได้หมายความว่ามีความเกี่ยวข้องเสมอไป

ทีมญี่ปุ่นใช้ความสัมพันธ์ระหว่างเอนทิตี (entity relationships) แทนที่จะใช้เพียงแค่ text chunks พวกเขาทำการสกัดข้อมูลดังนี้:

เอนทิตี (Entities) เช่น โปรตีน หรือนักวิจัย
ความสัมพันธ์ (Relationships) เช่น ยับยั้ง (inhibits) หรือ อ้างอิง (cites)
คุณลักษณะ (Attributes) เช่น คะแนนความเชื่อมั่น (confidence scores)

พวกเขาใช้กระบวนการแบบสองขั้นตอน ขั้นแรกคือการระบุ subgraph ที่เกี่ยวข้อง ขั้นที่สองคือการดึงข้อความที่ยึดโยงกับเอนทิตีเหล่านั้น วิธีนี้ช่วยหยุดการหลงประเด็นทางความหมาย (semantic drift) คุณจะได้บริบท (context) ไม่ใช่แค่คำที่คล้ายกัน

GraphRAG สร้างยากกว่า RAG แบบมาตรฐาน คุณจำเป็นต้องมี:

pipeline สำหรับการสกัดเอนทิตี (Entity extraction pipelines)
การจำแนกความสัมพันธ์ (Relationship classification)
โครงสร้างพื้นฐานสำหรับการจัดเก็บกราฟ (Graph storage infrastructure)
เครื่องมือค้นหาแบบไฮบริด (Hybrid query engines)

ความเสี่ยงที่ใหญ่ที่สุดคือการบำรุงรักษา กราฟจะเสื่อมสภาพ (rot) หากคุณไม่คอยอัปเดต ผมเรียนรู้เรื่องนี้ด้วยบทเรียนราคาแพงในปี 2023 ผมเคยสร้างระบบ RAG สำหรับงานกฎหมายที่มีความแม่นยำสูง แต่ผมล้มเหลวในการสร้างกลไกการอัปเดตข้อมูล หกเดือนต่อมา ข้อมูลก็ล้าสมัย ความแม่นยำลดลงจาก 94% เหลือเพียง 71%

วิธีการสร้างให้ถูกต้อง:

เริ่มต้นด้วยการจัดหมวดหมู่เอนทิตี (entity taxonomy) เลือกประเภทที่สำคัญมาประมาณ 20 ถึง 30 ประเภท
ใช้การดึงข้อมูลแบบไฮบริด (hybrid retrieval) ตั้งแต่วันแรก ใช้กราฟสำหรับความสัมพันธ์ และใช้เวกเตอร์สำหรับหัวข้อ (topics)
สร้าง pipeline สำหรับการบำรุงรักษาเป็นอันดับแรก วางแผนว่าเอกสารใหม่จะอัปเดตกราฟได้อย่างไร
วัดผลสายการให้เหตุผล (reasoning chains) ติดตามว่าระบบต้องใช้กี่ขั้นตอนในการตอบคำถาม

หากคุณทำงานในด้านวิทยาศาสตร์ กฎหมาย หรือการแพทย์ ค่าใช้จ่ายในการบำรุงรักษานั้นคุ้มค่า แต่สำหรับคำถามที่พบบ่อย (FAQs) ทั่วไป RAG แบบมาตรฐานก็เพียงพอแล้ว

ลองถามตัวเองดูว่า: คำถามของคุณมีกี่เปอร์เซ็นต์ที่ถามถึงความสัมพันธ์? หากผู้ใช้มากกว่า 40% ถามว่าสิ่งต่างๆ เกี่ยวข้องกันอย่างไร คุณจำเป็นต้องใช้กราฟ

Source: https://dev.to/xu_xu_b2179aa8fc958d531d1/how-japans-research-labs-are-building-rag-systems-that-actually-work-and-what-western-teams-keep-21b2

Optional learning community: https://t.me/GyaanSetuAi

𝗛𝗼𝘄 𝗝𝗮𝗽𝗮𝗻𝗲𝘀𝗲 𝗟𝗮𝗯𝘀 𝗕𝘂𝗶𝗹𝗱 𝗕𝗲𝘁𝘁𝗲𝗿 𝗥𝗔𝗚 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

Continue reading

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗕𝗲𝘁𝘁𝗲𝗿 𝗔𝗜 𝘄𝗶𝘁𝗵 𝗥𝗔𝗚

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗮𝗻𝗱 𝗔𝗴𝗲𝗻𝘁 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆

𝗞𝗻𝗼𝘄𝗹𝗲𝗱𝗴𝗲 𝗚𝗿𝗮𝗽𝗵𝘀: 𝗧𝗵𝗲 𝗠𝗶𝘀𝘀𝗶𝗻𝗴 𝗣𝗶𝗲𝗰𝗲 𝗶𝗻 𝗥𝗔𝗚 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

ทำไมระบบ RAG ของคุณถึงเกิดอาการหลอน

Phase 1: Document Ingestion