𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗮𝗻𝗱 𝗔𝗴𝗲𝗻𝘁 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆

📅3 hours ago⏱1 min read

చాలా RAG సిస్టమ్స్ ప్రొడక్షన్‌లో విఫలమవుతాయి. అవి లాంగ్వేజ్ మోడల్ వల్ల విఫలం కావు. అవి రిట్రీవల్ (retrieval) దశలో విఫలమవుతాయి.

సిస్టమ్ సరైన డేటా చంక్‌ను (data chunk) పొందడంలో విఫలమవుతుంది. లేదా డేటాను పొందుతుంది కానీ దానిని 40వ ర్యాంక్‌లో ఉంచుతుంది. దీనివల్ల జనరేటర్ ఆ సమాచారాన్ని ఎప్పటికీ చూడలేదు. అసలు ఏం తప్పు జరిగిందో తెలుసుకోవడానికి మీ టీమ్‌కు ఎటువంటి మార్గం ఉండదు.

ఈ ఆర్కిటెక్చర్ ఈ రెండు సమస్యలను పరిష్కరిస్తుంది.

మెరుగైన ఫలితాల కోసం ఈ మూడు దశలను అనుసరించండి:

హైబ్రిడ్ రిట్రీవల్ (Hybrid Retrieval) ఉపయోగించండి లెక్సికల్ BM25 మరియు డెన్స్ సెమాంటిక్ సెర్చ్‌ను (dense semantic search) ఒకేసారి రన్ చేయండి. లిస్టులను విలీనం చేయడానికి reciprocal rank fusion ఉపయోగించండి. కేవలం BM25 మాత్రమే వాడటం కంటే, దీనివల్ల టెక్స్ట్ మరియు టేబుల్ డేటాపై Recall@5 లో 8 శాతం పాయింట్లు పెరుగుతాయని బెంచ్‌మార్క్‌లు చూపుతున్నాయి.
రీర్యాంకర్ (Reranker) జోడించండి ప్రిసిషన్ (precision) పెంచడానికి రీర్యాంకర్ ఉత్తమమైన మార్గం. టాప్ 50 నుండి 100 కాండిడేట్స్‌పై cross-encoder ఉపయోగించండి. ఈ దశ మీ ఫలితాలను గణనీయంగా మెరుగుపరుస్తుంది.
అబ్జర్వబిలిటీ (Observability) పై దృష్టి పెట్టండి మీ రిట్రీవల్ పైప్‌లైన్‌లో లోపాలను కనుగొనడానికి మీకు traces అవసరం. traces లేకపోతే, మీరు సిస్టమ్‌ను సరిదిద్దలేరు.

ఈ ప్రొడక్షన్ ప్రమాణాలతో మీ RAG సిస్టమ్‌ను నిర్మించండి.

Source: https://dev.to/rishi_kora/hybrid-retrieval-and-agent-observability-a-production-rag-build-2h6p

ఐచ్ఛిక అభ్యాస కమ్యూనిటీ: https://t.me/GyaanSetuAi

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗮𝗻𝗱 𝗔𝗴𝗲𝗻𝘁 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆

Continue reading

𝗛𝗶𝗴𝗵 𝗣𝗲𝗿𝗳𝗼𝗿𝗺𝗮𝗻𝗰𝗲 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗔𝗿𝗲 𝗗𝗶𝘀𝘁𝗿𝗶𝗯𝘂𝘁𝗲𝗱 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗔𝗚, 𝗔𝗜 𝗠𝗲𝗺𝗼𝗿𝘆, 𝗮𝗻𝗱 𝗚𝗼𝗼𝗴𝗹𝗲 𝗖𝗟𝗜

𝗬𝗢𝗨𝗥 𝗔𝗚𝗘𝗡𝗧 𝗙𝗔𝗜𝗟𝗘𝗗 𝗜𝗡 𝗣𝗥𝗢𝗗. 𝗚𝗢𝗢𝗗 𝗟𝗨𝗖𝗞 𝗥𝗘𝗣𝗥𝗢𝗗𝗨𝗖𝗜𝗡𝗚 𝗜𝗧.

దృఢమైన AI ఏజెంట్లను రూపొందించడం

𝟳 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀 𝗧𝗵𝗮𝘁 𝗕𝗿𝗲𝗮𝗸 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀