मल्टी-हॉप रीजनिंग (Multi-Hop Reasoning) को समझना

वेक्टर डेटाबेस सिमेंटिक सर्च (semantic search) के लिए काम करते हैं। वे लोगों, सिस्टम और घटनाओं के बीच मल्टी-स्टेप रीजनिंग (multi-step reasoning) करने में संघर्ष करते हैं।

स्टैंडर्ड RAG गणित के आधार पर टेक्स्ट चंक्स (text chunks) को रिट्रीव करता है। यह डेटा पॉइंट्स के बीच के लिंक को मिस कर देता है। GraphRAG इसे हल करता है। यह लार्ज लैंग्वेज मॉडल्स (LLMs) को एक लाइव नॉलेज ग्राफ से जोड़ता है।

एक टेक्स्ट-एट्रीब्यूटेड ग्राफ (Text-Attributed Graph) नोड्स और एडजेस (nodes and edges) का उपयोग करता है।

  • नोड्स (Nodes) यूजर्स या प्रोडक्ट्स जैसी एंटिटीज (entities) होते हैं।
  • एडजेस (Edges) "IMPACTS" या "CLONED_FROM" जैसे संबंध होते हैं।
  • एक "हॉप" (hop) का अर्थ है एक एड्ज के माध्यम से एक नोड से दूसरे नोड पर जाना।

मल्टी-हॉप रीजनिंग उन कनेक्शनों को ढूंढती है जो किसी भी एकल दस्तावेज़ में नहीं होते हैं।

उदाहरण: एक यूजर पूछता है, "मैं CSV अपलोड एरर को कैसे ठीक करूँ?"

स्टैंडर्ड RAG कीवर्ड्स के लिए सर्च करता है। यह कोई पुराना FAQ या कोई रैंडम बग रिपोर्ट दे सकता है। यह बिजनेस कॉन्टेक्स्ट (business context) को मिस कर देता है।

GraphRAG सटीक पथ (path) का पता लगाता है: (User Bug Report) -> [CLONED_FROM] -> (Master Engineering Ticket) -> [HAS_RESOLUTION] -> (Patch Deployed).

यह LLM को एक अंदाजे के बजाय सत्यापित (verified) स्टेप्स प्रदान करता है।

आप इसे दो तरीकों से नियंत्रित कर सकते हैं:

  1. डेप्थ ट्रैवर्सल (Depth Traversal) विशिष्ट विवरणों में गहराई तक जाने के लिए इसका उपयोग करें। यह रूट-कॉज़ एनालिसिस (root-cause analysis) के लिए उपयोगी है। Cypher में, आप हॉप्स की एक रेंज सेट करते हैं। एक क्वेरी किसी बग के रिप्रोडक्शन स्टेप्स (reproduction steps) खोजने के लिए 1 से 5 लेयर्स तक गहराई में देख सकती है।

  2. ब्रैडथ ट्रैवर्सल (Breadth Traversal) पूरे इकोसिस्टम को देखने के लिए इसका उपयोग करें। यह सभी तत्काल कनेक्शनों को देखने के लिए क्षैतिज रूप से (horizontally) फैलता है। यह आपको एक ही बार में किसी एक प्रोडक्ट को प्रभावित करने वाले हर सपोर्ट टिकट को देखने में मदद करता है।

एडवांस AI बनाने के लिए, इन क्वेरीज को हार्ड-कोड न करें। एक मल्टी-एजेंट सिस्टम (multi-agent system) का उपयोग करें:

  • द कोऑर्डिनेटर एजेंट (The Coordinator Agent): यह एजेंट क्वेरी की योजना बनाता है। यह तय करता है कि प्रश्न को ब्रैडथ की आवश्यकता है या डेप्थ की। यह यूजर प्रॉम्प्ट को ग्राफ क्वेरी के लिए एक गणितीय पैरामीटर में बदल देता है।
  • द रिकर्सिव रिट्रीवल एजेंट (The Recursive Retrieval Agent): यह एजेंट डेटाबेस द्वारा नोड्स को खोजने पर उनका मूल्यांकन करता है। यह LLM के देखने से पहले महत्वपूर्ण डेटा रखता है और शोर (noise) को हटा देता है।

यह आर्किटेक्चर ऐसे सिस्टम बनाता है जो अपनी जांच को स्केल कर सकते हैं। आपको पूर्ण उत्तर मिलते हैं जो वेक्टर सर्च नहीं दे सकता।

Source: https://dev.to/imhyke/understanding-multi-hop-reasoning-how-graph-databases-traverse-data-for-ai-31ml

Optional learning community: https://t.me/GyaanSetuAi