MCP + RAG: నేను సంక్లిష్టమైన RAG సిస్టమ్లను నిర్మించడం ఎందుకు ఆపివేశానంటే
సంక్లిష్టమైన RAG సిస్టమ్లను నిర్మించడానికి నేను నాలుగు సంవత్సరాలు వెచ్చించాను.
నేను chunking strategies, embedding models, vector databases మరియు rerankers ఉపయోగించాను. నా 1,800 గంటల నాలెడ్జ్ బేస్ కోసం ఒక సిస్టమ్ను నిర్మించాను. ప్రతిసారీ, నేను దానిని పరిపూర్ణంగా చేస్తున్నానని అనుకున్నాను.
అది ఎప్పుడూ సరిగ్గా పనిచేయలేదు.
ఆ తర్వాత నేను Model Context Protocol (MCP) సపోర్ట్ను జోడించాను. అది అన్నింటినీ మార్చేసింది. MCP సాంప్రదాయ సంక్లిష్ట RAGలను చాలా మందికి అనవసరమైనవిగా మార్చేస్తుంది.
నేను ఈ సమస్యలతో పోరాడేవాడిని:
- semantic లేదా recursive chunking మధ్య ఎంచుకోవడం.
- OpenAI, Cohere, లేదా Nomic embeddings మధ్య ఎంచుకోవడం.
- Pinecone, Weaviate, లేదా Chroma మధ్య నిర్ణయించుకోవడం.
- top-k retrieval మరియు reranking నిర్వహించడం.
నా RAG సిస్టమ్ 2,000 లైన్ల కోడ్కు చేరుకుంది. అది ఆకట్టుకునేలా ఉన్నప్పటికీ విఫలమైంది. AI ఇప్పటికే తెలివైనది అయినప్పుడు, నేను నా డేటాను తెలివైనదిగా చేయడానికి ప్రయత్నిస్తున్నాను.
నేను MCP విధానానికి మారాను. నేను కేవలం 150 లైన్ల కోడ్తో ఒక సర్వర్ను నిర్మించాను.
నేను AIకి కేవలం రెండు టూల్స్ మాత్రమే ఇచ్చాను:
search_notes: నోట్స్ను కనుగొనడానికి సింపుల్ టెక్స్ట్ మ్యాచింగ్ను ఉపయోగిస్తుంది.get_note_content: ఒక నోట్ యొక్క పూర్తి వచనాన్ని (full text) తిరిగి ఇస్తుంది.
చంక్స్ లేవు. సంక్లిష్టమైన ఎంబెడ్డింగ్స్ లేవు. వెక్టర్ డేటాబేస్లు లేవు.
ఈ సరళమైన విధానం నా ఫ్యాన్సీ RAG సిస్టమ్ కంటే 10 సార్లు చూస్తే 9 సార్లు మెరుగ్గా పనిచేస్తుంది. దానికి కారణాలు ఇవే:
- AI లాజిక్ను నిర్వహిస్తుంది. ముందే సెట్ చేసిన chunker కంటే ఏది సందర్భోచితమో (relevant) నిర్ణయించడంలో AI మెరుగ్గా ఉంటుంది.
- పూర్తి సందర్భం (Full context). సాంప్రదాయ RAG నోట్స్ను చిన్న చిన్న ముక్కలుగా విడగొడుతుంది. దీనివల్ల తరచుగా సమాధానం కోల్పోవచ్చు. MCPతో, AI మొత్తం నోట్ను చదువుతుంది. అది పూర్తి భావనను అర్థం చేసుకుంటుంది.
- అంచనా వేయదగినది (Predictability). టెక్స్ట్ సెర్చ్ చాలా సరళమైనది. కీవర్డ్ ఉంటే, అది పనిచేస్తుంది. మీరు embedding drift మరియు dimension errors వంటి సమస్యలను నివారించవచ్చు.
మీరు ఈ క్రింది సందర్భాలలో సాంప్రదాయ RAGని ఉపయోగించాల్సి ఉంటుంది:
- మీకు 1,00,000 కంటే ఎక్కువ పెద్ద డాక్యుమెంట్లు ఉన్నప్పుడు.
- మీకు తక్కువ లాటెన్సీతో (low latency) హై-స్కేల్ ప్రొడక్షన్ అవసరమైనప్పుడు.
కానీ వ్యక్తిగత నాలెడ్జ్ బేస్లు, సైడ్ ప్రాజెక్ట్లు లేదా అంతర్గత సాధనాల (internal tools) కోసం మీకు ఇది అవసరం లేదు.
MCP వల్ల కలిగే ప్రయోజనాలు:
- నిర్వహించడం సులభం: 2,000 లైన్లకు బదులుగా 150 లైన్లు మాత్రమే.
- ఎంబెడ్డింగ్ ఖర్చులు ఉండవు: మోడల్స్ మారినప్పుడు మీరు డేటాను మళ్లీ ఎంబెడ్ చేయాల్సిన అవసరం లేదు.
- మెరుగైన ఖచ్చితత్వం: AI పూర్తి సందర్భాన్ని పొందుతుంది.
- డీబగ్ చేయడం సులభం: సెర్చ్ ఎందుకు విఫలమైందో మీరు ఖచ్చితంగా చూడవచ్చు.
ఓవర్-ఇంజనీరింగ్ చేయడం ఆపండి. కష్టమైన పనులను AIకే వదిలేయండి. దానికి మీ డేటా యాక్సెస్ ఇవ్వండి మరియు అది చదవనివ్వండి.
Optional learning community: https://t.me/GyaanSetuAi
