మీరు ఒక్క పదం కూడా టైప్ చేయకముందే మీ MCP సర్వర్లు టోకెన్లను వృథా చేస్తున్నాయి

మీరు ఎప్పుడూ ఉపయోగించని డేటా కోసం డబ్బు చెల్లిస్తున్నారు.

గత వారం నేను ఒక ఏజెంట్ సెషన్‌ను ట్రాక్ చేశాను. అందులో 47 MCP టూల్స్ లోడ్ అయ్యి ఉన్నాయి. ప్రతి టూల్ తన పూర్తి JSON schemaను సిస్టమ్ ప్రాంప్ట్‌లోకి పంపింది. నేను ఒక్క పదం కూడా టైప్ చేయకముందే ఇది జరిగిపోయింది.

ప్రతి టూల్ schema 150 నుండి 400 టోకెన్లను ఉపయోగిస్తుంది. 47 టూల్స్ వల్ల నాకు 11,000 టోకెన్ల అదనపు ఖర్చు (overhead) అయ్యింది. మోడల్ ప్రతి టర్న్ (turn) లోనూ ఈ టోకెన్లను చదువుతుంది. మీరు కేవలం రెండు టూల్స్ మాత్రమే ఉపయోగించినప్పటికీ, ఈ కాంటెక్స్ట్ (context) కోసం మీరు చెల్లించాల్సి ఉంటుంది.

చాలా మంది పెద్ద ఫైల్ అప్‌లోడ్‌ల గురించి ఆందోళన చెందుతారు. కానీ టూల్ మెనూ వల్ల కలిగే ఖర్చును వారు మర్చిపోతారు.

మీరు GitHub, Slack మరియు డేటాబేస్‌ల వంటి సర్వర్‌లను ఒకదానిపై ఒకటి అమర్చినప్పుడు, మీకు 60 నుండి 100 టూల్స్ వరకు వస్తాయి. టూల్ డెఫినిషన్లే మొత్తం కాంటెక్స్ట్ బడ్జెట్‌లో 20% వరకు ఆక్రమించే సెషన్‌లను నేను చూశాను.

అన్నింటినీ ఒకేసారి లోడ్ చేయడం ఆపండి. దానికి బదులుగా deferred loading ఉపయోగించండి.

ఈ పద్ధతిని అనుసరించండి: • టూల్స్ పేరు మరియు చిన్న వివరణతో మాత్రమే జాబితా చేయండి. • అవసరమైనప్పుడు పూర్తి schemaలను పొందడానికి ఒక సెర్చ్ టూల్‌ను ఉపయోగించండి.

ప్రతి టూల్ కోసం భారీ JSON ఆబ్జెక్ట్‌ను పంపే బదులు, మీరు ఒక సాధారణ పేరును మాత్రమే అందిస్తారు. మోడల్‌కు ఏదైనా నిర్దిష్ట టూల్ అవసరమైనప్పుడు, అది ఒక సెర్చ్ ఫంక్షన్‌ను పిలుస్తుంది (calls). ఆ ఫంక్షన్ కేవలం సరిపోలే టూల్స్ కోసం మాత్రమే పూర్తి schemaను తిరిగి ఇస్తుంది.

దీని ఫలితాలు అద్భుతం: • 80 టూల్స్‌ను Eager loading ద్వారా లోడ్ చేస్తే: ~18,000 టోకెన్లు. • 80 టూల్స్‌ను Deferred loading ద్వారా లోడ్ చేస్తే: ~1,000 టోకెన్లు.

ఇది టూల్ డెఫినిషన్లను ఒక పెద్ద ఖర్చు నుండి చాలా స్వల్పమైన ఖర్చుగా మారుస్తుంది.

ఈ వ్యూహం పని చేస్తుంది ఎందుకంటే చాలా సెషన్‌లలో అందుబాటులో ఉన్న టూల్స్‌లో చాలా తక్కువ భాగం మాత్రమే ఉపయోగించబడతాయి. ఒకవేళ మీరు సెషన్‌లో ప్రతి టూల్‌ను ఉపయోగిస్తే, ఖర్చు అలాగే ఉంటుంది. కానీ చాలా మంది వినియోగదారులకు, ఇది భారీ మొత్తంలో కాంటెక్స్ట్‌ను ఆదా చేస్తుంది.

మోడల్ ఏ టూల్స్‌ను పిలవాలి (call) అని అడగకండి. మోడల్‌కు డిఫాల్ట్‌గా ఏ టూల్స్ ఉన్నాయని తెలియాలి అని అడగండి.

చాలా క్యాటలాగ్‌లు సులభం కాబట్టి అన్నింటినీ ఒకేసారి అందిస్తాయి. కానీ ఎవరూ చూడని మెనూ కోసం మీ బడ్జెట్‌ను వేగంగా ఖర్చు చేయడానికి ఇది ఒక మార్గం.

దీన్ని సరళంగా ఉంచండి. ఒక పేరు, వివరణ మరియు సెర్చ్ ఫంక్షన్‌ను మాత్రమే అందించండి. మీరు ఉపయోగించే మూడు టూల్స్ కోసం మాత్రమే చెల్లించండి, మీరు పట్టించుకోని ఎనభై టూల్స్ కోసం కాదు.

Source: https://dev.to/enjoy_kumawat/your-mcp-servers-are-burning-tokens-before-you-type-a-word-3076

Optional learning community: https://t.me/GyaanSetuAi