जापानी लैब्स बेहतर RAG सिस्टम कैसे बनाते हैं
आपका वेक्टर डेटाबेस प्रासंगिक चंक्स (chunks) वापस करता है। आपका एम्बेडिंग मॉडल बेंचमार्क पर उच्च स्कोर करता है। लेकिन जब कोई उपयोगकर्ता एक जटिल प्रश्न पूछता है, तो सिस्टम एक बेकार उत्तर देता है।
यह रिट्रीवल आर्किटेक्चर (retrieval architecture) की विफलता है। आपके LLM को ट्यून करने से यह ठीक नहीं होगा।
जापानी शोध टीम ने इसका समाधान खोज लिया है। उन्होंने एक नॉलेज ग्राफ (knowledge graph) RAG सिस्टम बनाया है। इस दृष्टिकोण ने वैज्ञानिक कार्यों में सटीकता को 90% तक सुधार दिया।
मानक RAG के साथ समस्या सिमेंटिक समानता (semantic similarity) की है। प्रोटीन फोल्डिंग के बारे में एक चंक CRISPR के बारे में पूछे गए प्रश्न के समान लग सकता है। लेकिन समानता का अर्थ प्रासंगिकता (relevance) नहीं है।
जापानी टीम केवल टेक्स्ट चंक्स के बजाय एंटिटी संबंधों (entity relationships) का उपयोग करती है। वे निकालते हैं:
- एंटिटीज जैसे प्रोटीन या शोधकर्ता
- संबंध जैसे रोकता है (inhibits) या उद्धृत करता है (cites)
- गुण जैसे कॉन्फिडेंस स्कोर
वे दो-चरणीय प्रक्रिया का उपयोग करते हैं। पहले, वे प्रासंगिक सबग्राफ (subgraphs) की पहचान करते हैं। दूसरे, वे उन एंटिटीज से जुड़े टेक्स्ट को रिट्रीव करते हैं। यह सिमेंटिक ड्रिफ्ट (semantic drift) को रोकता है। आप केवल समान शब्द नहीं, बल्कि संदर्भ (context) रिट्रीव करते हैं।
GraphRAG को बनाना मानक RAG की तुलना में कठिन है। आपको आवश्यकता है:
- एंटिटी एक्सट्रैक्शन पाइपलाइन
- संबंध वर्गीकरण (relationship classification)
- ग्राफ स्टोरेज इंफ्रास्ट्रक्चर
- हाइब्रिड क्वेरी इंजन
सबसे बड़ा जोखिम रखरखाव (maintenance) है। यदि आप उन्हें अपडेट नहीं करते हैं तो ग्राफ खराब हो जाते हैं। मैंने 2023 में इसे कठिन तरीके से सीखा। मैंने उच्च सटीकता के साथ एक कानूनी RAG सिस्टम बनाया था। मैं एक अपडेट तंत्र (update mechanism) बनाने में विफल रहा। छह महीने बाद, डेटा पुराना हो गया था। सटीकता 94% से गिरकर 71% हो गई।
इसे सही ढंग से कैसे बनाएं:
- एक एंटिटी टैक्सोनॉमी (entity taxonomy) के साथ शुरुआत करें। 20 से 30 महत्वपूर्ण प्रकार चुनें।
- पहले दिन से हाइब्रिड रिट्रीवल का उपयोग करें। संबंधों के लिए ग्राफ और विषयों के लिए वेक्टर का उपयोग करें।
- पहले अपना रखरखाव पाइपलाइन (maintenance pipeline) बनाएं। योजना बनाएं कि नए दस्तावेज़ ग्राफ को कैसे अपडेट करेंगे।
- रीजनिंग चेन (reasoning chains) को मापें। ट्रैक करें कि सिस्टम उत्तर देने के लिए कितने कदम उठाता है।
यदि आप विज्ञान, कानून या चिकित्सा में काम करते हैं, तो रखरखाव की लागत इसके लायक है। सरल FAQs के लिए, मानक RAG पर्याप्त है।
खुद से यह पूछें: आपके प्रश्नों का कितना प्रतिशत संबंधों के बारे में पूछता है? यदि आपके 40% से अधिक उपयोगकर्ता पूछते हैं कि चीजें कैसे संबंधित हैं, तो आपको एक ग्राफ की आवश्यकता है।
Optional learning community: https://t.me/GyaanSetuAi