जपानी लॅब्स अधिक चांगले RAG सिस्टम्स कसे तयार करतात
तुमचा वेक्टर डेटाबेस संबंधित चंक्स (chunks) परत करतो. तुमचे एम्बेडिंग मॉडेल बेंचमार्कवर उच्च स्कोअर मिळवते. परंतु जेव्हा वापरकर्ता एखादा जटिल प्रश्न विचारतो, तेव्हा सिस्टम निरर्थक उत्तर देते.
ही रिट्रिव्हल आर्किटेक्चरची (retrieval architecture) त्रुटी आहे. तुमचे LLM ट्यून केल्याने ही समस्या सुटणार नाही.
एका जपानी संशोधन पथकाला याचे समाधान सापडले आहे. त्यांनी नॉलेज ग्राफ RAG सिस्टम तयार केली. या दृष्टिकोनामुळे वैज्ञानिक कार्यांमधील अचूकता ९०% ने सुधारली आहे.
स्टँडर्ड RAG मधील समस्या म्हणजे सिमेंटिक सिमिलॅरिटी (semantic similarity). प्रोटीन फोल्डिंगबद्दलचा एखादा चंक CRISPR बद्दलच्या क्वेरीसारखा वाटू शकतो. परंतु साम्य (similarity) म्हणजे सुसंगतता (relevance) नव्हे.
जपानी टीम केवळ टेक्स्ट चंक्सऐवजी एंटिटी रिलेशनशिप्सचा (entity relationships) वापर करते. ते खालील गोष्टी काढतात:
- प्रोटिन किंवा संशोधक यांसारख्या एंटिटीज (Entities)
- 'inhibits' किंवा 'cites' सारखी रिलेशनशिप्स (Relationships)
- कॉन्फिडन्स स्कोअरसारखे ॲट्रिब्युट्स (Attributes)
ते दोन टप्प्यांची प्रक्रिया वापरतात. पहिले, ते संबंधित सबग्राफ्स (subgraphs) ओळखतात. दुसरे, ते त्या एंटिटीजशी जोडलेला मजकूर रिट्रिव्ह करतात. यामुळे सिमेंटिक ड्रिफ्ट (semantic drift) थांबते. तुम्ही केवळ साम्य असलेले शब्द नाही, तर संदर्भ (context) मिळवता.
GraphRAG तयार करणे स्टँडर्ड RAG पेक्षा कठीण आहे. तुम्हाला याची आवश्यकता आहे:
- एंटिटी एक्सट्रॅक्शन पाइपलाइन्स (Entity extraction pipelines)
- रिलेशनशिप क्लासिफिकेशन (Relationship classification)
- ग्राफ स्टोरेज इन्फ्रास्ट्रक्चर (Graph storage infrastructure)
- हायब्रिड क्वेरी इंजिन्स (Hybrid query engines)
सर्वात मोठा धोका म्हणजे मेंटेनन्स (maintenance). जर तुम्ही ग्राफ अपडेट केले नाहीत, तर ते कालबाह्य होतात. मी २०२३ मध्ये याचा कडू अनुभव घेतला. मी उच्च अचूकतेसह एक लीगल RAG सिस्टम तयार केली होती. मी अपडेट मेकॅनिझम तयार करण्यात अपयशी ठरलो. सहा महिन्यांनंतर, डेटा जुना झाला होता. अचूकता ९४% वरून ७१% पर्यंत खाली आली.
ते योग्यरित्या कसे तयार करावे:
- एंटिटी टॅक्सोनॉमीने (entity taxonomy) सुरुवात करा. २० ते ३० महत्त्वाचे प्रकार निवडा.
- पहिल्या दिवसापासून हायब्रिड रिट्रिव्हलचा (hybrid retrieval) वापर करा. रिलेशनशिप्ससाठी ग्राफ आणि विषयांसाठी वेक्टर्स वापरा.
- प्रथम तुमची मेंटेनन्स पाइपलाइन तयार करा. नवीन दस्तऐवज ग्राफ कसा अपडेट करतील याचे नियोजन करा.
- रिझनिंग चेन्स (reasoning chains) मोजा. उत्तर देण्यासाठी सिस्टम किती पायऱ्या घेते यावर लक्ष ठेवा.
जर तुम्ही विज्ञान, कायदा किंवा वैद्यकीय क्षेत्रात काम करत असाल, तर मेंटेनन्सचा खर्च सार्थ आहे. साध्या FAQs साठी, स्टँडर्ड RAG पुरेसे आहे.
स्वतःला हे विचारा: तुमच्या क्वेरीजपैकी किती टक्के रिलेशनशिप्सबद्दल विचारतात? जर तुमच्या ४०% पेक्षा जास्त वापरकर्त्यांनी गोष्टी एकमेकांशी कशा संबंधित आहेत हे विचारले, तर तुम्हाला ग्राफची गरज आहे.
वैकल्पिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi