मल्टी-हॉप रिझनिंग समजून घेणे

वेक्टर डेटाबेस सिमेंटिक सर्चसाठी उपयुक्त ठरतात. परंतु, लोक, प्रणाली आणि घटनांमधील बहु-स्तरीय तर्क (multi-step reasoning) करण्यात त्यांना अडचणी येतात.

स्टँडर्ड RAG गणिताच्या आधारावर मजकुराचे तुकडे (text chunks) शोधून काढते. यामुळे डेटा पॉइंट्समधील दुवे सुटतात. GraphRAG ही समस्या सोडवते. ते लार्ज लँग्वेज मॉडेल्सना (LLMs) एका लाईव्ह नॉलेज ग्राफशी जोडते.

एका टेक्स्ट-ॲट्रिब्युटेड ग्राफमध्ये नोड्स (nodes) आणि एडजेस (edges) वापरले जातात.

  • नोड्स म्हणजे युजर्स किंवा प्रॉडक्ट्स सारख्या एंटिटीज (entities).
  • एडजेस म्हणजे "IMPACTS" किंवा "CLONED_FROM" सारखे संबंध.
  • "हॉप" (hop) म्हणजे एका एडजेसच्या माध्यमातून एका नोडवरून दुसऱ्या नोडवर जाणे.

मल्टी-हॉप रिझनिंग अशा कनेक्शनचा शोध घेते जे कोणत्याही एका दस्तऐवजात (document) उपलब्ध नसतात.

उदाहरण: एक युजर विचारतो, "मी CSV अपलोड एरर कसा दुरुस्त करू?"

स्टँडर्ड RAG कीवर्ड्स शोधते. ते कदाचित एखादा जुना FAQ किंवा एखादा रँडम बग रिपोर्ट देऊ शकते. यामुळे बिझनेस कॉन्टेक्स्ट (business context) सुटतो.

GraphRAG नेमका मार्ग शोधते: (User Bug Report) -> [CLONED_FROM] -> (Master Engineering Ticket) -> [HAS_RESOLUTION] -> (Patch Deployed).

यामुळे LLM ला केवळ अंदाज लावण्याऐवजी पडताळलेले (verified) स्टेप्स मिळतात.

तुम्ही या दोन पद्धतींद्वारे हे नियंत्रित करू शकता:

  1. डेप्थ ट्रॅव्हर्सल (Depth Traversal) विशिष्ट तपशीलांपर्यंत पोहोचण्यासाठी याचा वापर करा. हे मूळ कारणाचे विश्लेषण (root-cause analysis) करण्यासाठी उपयुक्त आहे. Cypher मध्ये, तुम्ही 'हॉप्स'ची (hops) एक रेंज सेट करू शकता. एखादा बग दुरुस्त करण्यासाठी लागणारे स्टेप्स शोधण्यासाठी क्वेरी १ ते ५ लेयर्स खोलवर शोध घेऊ शकते.

  2. ब्रॅडथ ट्रॅव्हर्सल (Breadth Traversal) संपूर्ण इकोसिस्टम पाहण्यासाठी याचा वापर करा. हे सर्व तात्काळ संबंध पाहण्यासाठी क्षैतिजपणे (horizontally) विस्तारते. यामुळे एकाच वेळी एका विशिष्ट प्रॉडक्टवर परिणाम करणाऱ्या सर्व सपोर्ट तिकिट्सना पाहण्यास मदत होते.

प्रगत AI तयार करण्यासाठी, या क्वेरीज हार्ड-कोड करू नका. मल्टी-एजंट सिस्टमचा (multi-agent system) वापर करा:

  • कोऑर्डिनेटर एजंट (The Coordinator Agent): हा एजंट क्वेरीचे नियोजन करतो. प्रश्नासाठी ब्रॅडथ आवश्यक आहे की डेप्थ, हे तो ठरवतो. तो युजर प्रॉम्प्टला ग्राफ क्वेरीसाठी गणितीय पॅरामीटरमध्ये रूपांतरित करतो.
  • रिकर्सिव्ह रिट्रिव्हल एजंट (The Recursive Retrieval Agent): डेटाबेस नोड्स शोधत असताना हा एजंट त्यांचे मूल्यांकन करतो. LLM कडे डेटा जाण्यापूर्वी तो महत्त्वाचा डेटा ठेवतो आणि अनावश्यक माहिती (noise) काढून टाकतो.

ही आर्किटेक्चर अशी सिस्टम्स तयार करते जी त्यांच्या तपासाची व्याप्ती वाढवू शकतात. तुम्हाला अशी पूर्ण उत्तरे मिळतात जी वेक्टर सर्च देऊ शकत नाही.

Source: https://dev.to/imhyke/understanding-multi-hop-reasoning-how-graph-databases-traverse-data-for-ai-31ml

Optional learning community: https://t.me/GyaanSetuAi