𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗮𝗻𝗱 𝗔𝗴𝗲𝗻𝘁 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆
చాలా RAG సిస్టమ్స్ ప్రొడక్షన్లో విఫలమవుతాయి. అవి లాంగ్వేజ్ మోడల్ వల్ల విఫలం కావు. అవి రిట్రీవల్ (retrieval) దశలో విఫలమవుతాయి.
సిస్టమ్ సరైన డేటా చంక్ను (data chunk) పొందడంలో విఫలమవుతుంది. లేదా డేటాను పొందుతుంది కానీ దానిని 40వ ర్యాంక్లో ఉంచుతుంది. దీనివల్ల జనరేటర్ ఆ సమాచారాన్ని ఎప్పటికీ చూడలేదు. అసలు ఏం తప్పు జరిగిందో తెలుసుకోవడానికి మీ టీమ్కు ఎటువంటి మార్గం ఉండదు.
ఈ ఆర్కిటెక్చర్ ఈ రెండు సమస్యలను పరిష్కరిస్తుంది.
మెరుగైన ఫలితాల కోసం ఈ మూడు దశలను అనుసరించండి:
హైబ్రిడ్ రిట్రీవల్ (Hybrid Retrieval) ఉపయోగించండి లెక్సికల్ BM25 మరియు డెన్స్ సెమాంటిక్ సెర్చ్ను (dense semantic search) ఒకేసారి రన్ చేయండి. లిస్టులను విలీనం చేయడానికి reciprocal rank fusion ఉపయోగించండి. కేవలం BM25 మాత్రమే వాడటం కంటే, దీనివల్ల టెక్స్ట్ మరియు టేబుల్ డేటాపై Recall@5 లో 8 శాతం పాయింట్లు పెరుగుతాయని బెంచ్మార్క్లు చూపుతున్నాయి.
రీర్యాంకర్ (Reranker) జోడించండి ప్రిసిషన్ (precision) పెంచడానికి రీర్యాంకర్ ఉత్తమమైన మార్గం. టాప్ 50 నుండి 100 కాండిడేట్స్పై cross-encoder ఉపయోగించండి. ఈ దశ మీ ఫలితాలను గణనీయంగా మెరుగుపరుస్తుంది.
అబ్జర్వబిలిటీ (Observability) పై దృష్టి పెట్టండి మీ రిట్రీవల్ పైప్లైన్లో లోపాలను కనుగొనడానికి మీకు traces అవసరం. traces లేకపోతే, మీరు సిస్టమ్ను సరిదిద్దలేరు.
ఈ ప్రొడక్షన్ ప్రమాణాలతో మీ RAG సిస్టమ్ను నిర్మించండి.
Source: https://dev.to/rishi_kora/hybrid-retrieval-and-agent-observability-a-production-rag-build-2h6p
ఐచ్ఛిక అభ్యాస కమ్యూనిటీ: https://t.me/GyaanSetuAi