जपानी लॅब्स अधिक चांगल्या RAG सिस्टम्स कशा तयार करतात

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial२ दिवसांपूर्वी2min read

जपानी लॅब्स अधिक चांगले RAG सिस्टम्स कसे तयार करतात

तुमचा वेक्टर डेटाबेस संबंधित चंक्स (chunks) परत करतो. तुमचे एम्बेडिंग मॉडेल बेंचमार्कवर उच्च स्कोअर मिळवते. परंतु जेव्हा वापरकर्ता एखादा जटिल प्रश्न विचारतो, तेव्हा सिस्टम निरर्थक उत्तर देते.

ही रिट्रिव्हल आर्किटेक्चरची (retrieval architecture) त्रुटी आहे. तुमचे LLM ट्यून केल्याने ही समस्या सुटणार नाही.

एका जपानी संशोधन पथकाला याचे समाधान सापडले आहे. त्यांनी नॉलेज ग्राफ RAG सिस्टम तयार केली. या दृष्टिकोनामुळे वैज्ञानिक कार्यांमधील अचूकता ९०% ने सुधारली आहे.

स्टँडर्ड RAG मधील समस्या म्हणजे सिमेंटिक सिमिलॅरिटी (semantic similarity). प्रोटीन फोल्डिंगबद्दलचा एखादा चंक CRISPR बद्दलच्या क्वेरीसारखा वाटू शकतो. परंतु साम्य (similarity) म्हणजे सुसंगतता (relevance) नव्हे.

जपानी टीम केवळ टेक्स्ट चंक्सऐवजी एंटिटी रिलेशनशिप्सचा (entity relationships) वापर करते. ते खालील गोष्टी काढतात:

प्रोटिन किंवा संशोधक यांसारख्या एंटिटीज (Entities)
'inhibits' किंवा 'cites' सारखी रिलेशनशिप्स (Relationships)
कॉन्फिडन्स स्कोअरसारखे ॲट्रिब्युट्स (Attributes)

ते दोन टप्प्यांची प्रक्रिया वापरतात. पहिले, ते संबंधित सबग्राफ्स (subgraphs) ओळखतात. दुसरे, ते त्या एंटिटीजशी जोडलेला मजकूर रिट्रिव्ह करतात. यामुळे सिमेंटिक ड्रिफ्ट (semantic drift) थांबते. तुम्ही केवळ साम्य असलेले शब्द नाही, तर संदर्भ (context) मिळवता.

GraphRAG तयार करणे स्टँडर्ड RAG पेक्षा कठीण आहे. तुम्हाला याची आवश्यकता आहे:

एंटिटी एक्सट्रॅक्शन पाइपलाइन्स (Entity extraction pipelines)
रिलेशनशिप क्लासिफिकेशन (Relationship classification)
ग्राफ स्टोरेज इन्फ्रास्ट्रक्चर (Graph storage infrastructure)
हायब्रिड क्वेरी इंजिन्स (Hybrid query engines)

सर्वात मोठा धोका म्हणजे मेंटेनन्स (maintenance). जर तुम्ही ग्राफ अपडेट केले नाहीत, तर ते कालबाह्य होतात. मी २०२३ मध्ये याचा कडू अनुभव घेतला. मी उच्च अचूकतेसह एक लीगल RAG सिस्टम तयार केली होती. मी अपडेट मेकॅनिझम तयार करण्यात अपयशी ठरलो. सहा महिन्यांनंतर, डेटा जुना झाला होता. अचूकता ९४% वरून ७१% पर्यंत खाली आली.

ते योग्यरित्या कसे तयार करावे:

एंटिटी टॅक्सोनॉमीने (entity taxonomy) सुरुवात करा. २० ते ३० महत्त्वाचे प्रकार निवडा.
पहिल्या दिवसापासून हायब्रिड रिट्रिव्हलचा (hybrid retrieval) वापर करा. रिलेशनशिप्ससाठी ग्राफ आणि विषयांसाठी वेक्टर्स वापरा.
प्रथम तुमची मेंटेनन्स पाइपलाइन तयार करा. नवीन दस्तऐवज ग्राफ कसा अपडेट करतील याचे नियोजन करा.
रिझनिंग चेन्स (reasoning chains) मोजा. उत्तर देण्यासाठी सिस्टम किती पायऱ्या घेते यावर लक्ष ठेवा.

जर तुम्ही विज्ञान, कायदा किंवा वैद्यकीय क्षेत्रात काम करत असाल, तर मेंटेनन्सचा खर्च सार्थ आहे. साध्या FAQs साठी, स्टँडर्ड RAG पुरेसे आहे.

स्वतःला हे विचारा: तुमच्या क्वेरीजपैकी किती टक्के रिलेशनशिप्सबद्दल विचारतात? जर तुमच्या ४०% पेक्षा जास्त वापरकर्त्यांनी गोष्टी एकमेकांशी कशा संबंधित आहेत हे विचारले, तर तुम्हाला ग्राफची गरज आहे.

स्रोत: https://dev.to/xu_xu_b2179aa8fc958d531d1/how-japans-research-labs-are-building-rag-systems-that-actually-work-and-what-western-teams-keep-21b2

वैकल्पिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi

जपानी लॅब्स अधिक चांगल्या RAG सिस्टम्स कशा तयार करतात

Continue reading

RAG सह अधिक प्रगत AI तयार करणे

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗮𝗻𝗱 𝗔𝗴𝗲𝗻𝘁 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆

𝗞𝗻𝗼𝘄𝗹𝗲𝗱𝗴𝗲 𝗚𝗿𝗮𝗽𝗵𝘀: 𝗧𝗵𝗲 𝗠𝗶𝘀𝘀𝗶𝗻𝗴 𝗣𝗶𝗲𝗰𝗲 𝗶𝗻 𝗥𝗔𝗚 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

𝗪𝗵𝘆 𝗬𝗼𝘂𝗿 𝗥𝗔𝗚 𝗦𝘆𝘀𝘁𝗲𝗺 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗲𝘀

टप्पा १: दस्तऐवज इनजेशन