𝗛𝗼𝘄 𝗝𝗮𝗽𝗮𝗻𝗲𝘀𝗲 𝗟𝗮𝗯𝘀 𝗕𝘂𝗶𝗹𝗱 𝗕𝗲𝘁𝘁𝗲𝗿 𝗥𝗔𝗚 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialگزشتہ پرسوں2min read

जापानी लैब्स बेहतर RAG सिस्टम कैसे बनाते हैं

आपका वेक्टर डेटाबेस प्रासंगिक चंक्स (chunks) वापस करता है। आपका एम्बेडिंग मॉडल बेंचमार्क पर उच्च स्कोर करता है। लेकिन जब कोई उपयोगकर्ता एक जटिल प्रश्न पूछता है, तो सिस्टम एक बेकार उत्तर देता है।

यह रिट्रीवल आर्किटेक्चर (retrieval architecture) की विफलता है। आपके LLM को ट्यून करने से यह ठीक नहीं होगा।

जापानी शोध टीम ने इसका समाधान खोज लिया है। उन्होंने एक नॉलेज ग्राफ (knowledge graph) RAG सिस्टम बनाया है। इस दृष्टिकोण ने वैज्ञानिक कार्यों में सटीकता को 90% तक सुधार दिया।

मानक RAG के साथ समस्या सिमेंटिक समानता (semantic similarity) की है। प्रोटीन फोल्डिंग के बारे में एक चंक CRISPR के बारे में पूछे गए प्रश्न के समान लग सकता है। लेकिन समानता का अर्थ प्रासंगिकता (relevance) नहीं है।

जापानी टीम केवल टेक्स्ट चंक्स के बजाय एंटिटी संबंधों (entity relationships) का उपयोग करती है। वे निकालते हैं:

एंटिटीज जैसे प्रोटीन या शोधकर्ता
संबंध जैसे रोकता है (inhibits) या उद्धृत करता है (cites)
गुण जैसे कॉन्फिडेंस स्कोर

वे दो-चरणीय प्रक्रिया का उपयोग करते हैं। पहले, वे प्रासंगिक सबग्राफ (subgraphs) की पहचान करते हैं। दूसरे, वे उन एंटिटीज से जुड़े टेक्स्ट को रिट्रीव करते हैं। यह सिमेंटिक ड्रिफ्ट (semantic drift) को रोकता है। आप केवल समान शब्द नहीं, बल्कि संदर्भ (context) रिट्रीव करते हैं।

GraphRAG को बनाना मानक RAG की तुलना में कठिन है। आपको आवश्यकता है:

एंटिटी एक्सट्रैक्शन पाइपलाइन
संबंध वर्गीकरण (relationship classification)
ग्राफ स्टोरेज इंफ्रास्ट्रक्चर
हाइब्रिड क्वेरी इंजन

सबसे बड़ा जोखिम रखरखाव (maintenance) है। यदि आप उन्हें अपडेट नहीं करते हैं तो ग्राफ खराब हो जाते हैं। मैंने 2023 में इसे कठिन तरीके से सीखा। मैंने उच्च सटीकता के साथ एक कानूनी RAG सिस्टम बनाया था। मैं एक अपडेट तंत्र (update mechanism) बनाने में विफल रहा। छह महीने बाद, डेटा पुराना हो गया था। सटीकता 94% से गिरकर 71% हो गई।

इसे सही ढंग से कैसे बनाएं:

एक एंटिटी टैक्सोनॉमी (entity taxonomy) के साथ शुरुआत करें। 20 से 30 महत्वपूर्ण प्रकार चुनें।
पहले दिन से हाइब्रिड रिट्रीवल का उपयोग करें। संबंधों के लिए ग्राफ और विषयों के लिए वेक्टर का उपयोग करें।
पहले अपना रखरखाव पाइपलाइन (maintenance pipeline) बनाएं। योजना बनाएं कि नए दस्तावेज़ ग्राफ को कैसे अपडेट करेंगे।
रीजनिंग चेन (reasoning chains) को मापें। ट्रैक करें कि सिस्टम उत्तर देने के लिए कितने कदम उठाता है।

यदि आप विज्ञान, कानून या चिकित्सा में काम करते हैं, तो रखरखाव की लागत इसके लायक है। सरल FAQs के लिए, मानक RAG पर्याप्त है।

खुद से यह पूछें: आपके प्रश्नों का कितना प्रतिशत संबंधों के बारे में पूछता है? यदि आपके 40% से अधिक उपयोगकर्ता पूछते हैं कि चीजें कैसे संबंधित हैं, तो आपको एक ग्राफ की आवश्यकता है।

Source: https://dev.to/xu_xu_b2179aa8fc958d531d1/how-japans-research-labs-are-building-rag-systems-that-actually-work-and-what-western-teams-keep-21b2

Optional learning community: https://t.me/GyaanSetuAi

𝗛𝗼𝘄 𝗝𝗮𝗽𝗮𝗻𝗲𝘀𝗲 𝗟𝗮𝗯𝘀 𝗕𝘂𝗶𝗹𝗱 𝗕𝗲𝘁𝘁𝗲𝗿 𝗥𝗔𝗚 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

Continue reading

RAG کے ذریعے بہتر AI کی تعمیر

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗮𝗻𝗱 𝗔𝗴𝗲𝗻𝘁 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆

𝗞𝗻𝗼𝘄𝗹𝗲𝗱𝗴𝗲 𝗚𝗿𝗮𝗽𝗵𝘀: 𝗧𝗵𝗲 𝗠𝗶𝘀𝘀𝗶𝗻𝗴 𝗣𝗶𝗲𝗰𝗲 𝗶𝗻 𝗥𝗔𝗚 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

𝗪𝗵𝘆 𝗬𝗼𝘂𝗿 𝗥𝗔𝗚 𝗦𝘆𝘀𝘁𝗲𝗺 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗲𝘀

Phase 1: Document Ingestion