MCP ਕੰਟੈਕਸ ਟੈਕਸ
ਤੁਹਾਡਾ AI ਏਜੰਟ ਤੁਹਾਡੀ ਸੋਚ ਨਾਲੋਂ ਕਿਤੇ ਜ਼ਿਆਦਾ ਖਰਚਾ ਕਰਦਾ ਹੈ।
ਹਰ ਵਾਰ ਜਦੋਂ ਕੋਈ ਏਜੰਟ MCP ਟੂਲ ਨੂੰ ਕਾਲ ਕਰਦਾ ਹੈ, ਤਾਂ ਤੁਸੀਂ ਇੱਕ ਵੱਡਾ ਲੁਕਿਆ ਹੋਇਆ ਫੀਸ ਭਰਦੇ ਹੋ। ਤੁਸੀਂ ਸ਼ਾਇਦ ਇੱਕ ਸਿੱਧੀ API ਕਾਲ ਨਾਲੋਂ 10 ਤੋਂ 32 ਗੁਣਾ ਜ਼ਿਆਦਾ ਟੋਕਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋ। ਜ਼ਿਆਦਾਤਰ ਡਿਵੈਲਪਰ ਇਸ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕਰ ਦਿੰਦੇ ਹਨ।
MCP ਈਕੋਸਿਸਟਮ ਵਿੱਚ 14,000 ਸਰਵਰ ਹਨ ਅਤੇ ਮਹੀਨਾਵਾਰ 97 ਮਿਲੀਅਨ ਡਾਊਨਲੋਡ ਹਨ। ਫਿਰ ਵੀ, ਬਹੁਤ ਘੱਟ ਟਿਊਟੋਰਿਅਲ ਇਸ ਦੀ ਲਾਗਤ ਦਾ ਜ਼ਿਕਰ ਕਰਦੇ ਹਨ।
ਸਮੱਸਿਆ ਇੱਥੇ ਹੈ।
ਜਦੋਂ ਕੋਈ LLM ਇੱਕ MCP ਟੂਲ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ, ਤਾਂ ਸਿਸਟਮ ਪੂਰਾ tool schema ਕੰਟੈਕਸ ਵਿੰਡੋ ਵਿੱਚ ਭੇਜ ਦਿੰਦਾ ਹੈ। ਇਸ ਵਿੱਚ ਹਰ ਪੈਰਾਮੀਟਰ, ਟਾਈਪ ਅਤੇ ਵੇਰਵਾ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ। ਇੱਕ ਸਧਾਰਨ ਫਾਈਲ ਸਰਚ 500 ਤੋਂ 2,000 ਟੋਕਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੀ ਹੈ। ਇਸ ਨੂੰ 50 ਵਾਰ ਚਲਾਓ, ਅਤੇ ਤੁਸੀਂ ਸਿਰਫ਼ ਮੈਟਾਡਾਟਾ 'ਤੇ ਹੀ 100,000 ਟੋਕਨ ਖਰਚ ਕਰ ਦਿੰਦੇ ਹੋ।
ਗਣਿਤ ਸਧਾਰਨ ਹੈ।
ਦਿਨ ਵਿੱਚ 500 ਕਾਲਾਂ ਕਰਨ ਵਾਲਾ ਇੱਕ ਏਜੰਟ 250,000 ਤੋਂ 8 ਮਿਲੀਅਨ ਟੋਕਨਾਂ ਦੇ ਵਿਚਕਾਰ ਖਰਚ ਕਰਦਾ ਹੈ। ਮੌਜੂਦਾ ਕੀਮਤਾਂ 'ਤੇ, ਇੱਕ ਏਜੰਟ ਦੀ ਲਾਗਤ $200 ਤੋਂ $500 ਪ੍ਰਤੀ ਦਿਨ ਹੈ। Optimized ਏਜੰਟਾਂ ਦੀ ਲਾਗਤ $6 ਤੋਂ $50 ਹੈ।
ਆਪਣੀ ਲਾਗਤ ਘਟਾਉਣ ਲਈ ਇਹਨਾਂ ਤਿੰਨ ਪੈਟਰਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰੋ:
Schema minimization. ਜ਼ਿਆਦਾਤਰ MCP ਸਰਵਰ ਬਹੁਤ ਜ਼ਿਆਦਾ ਟੈਕਸਟ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ। Schema ਨੂੰ ਘੱਟ ਕਰੋ। ਸਿਰਫ਼ ਐਕਸ਼ਨ ਦਾ ਨਾਮ, ਲੋੜੀਂਦੇ ਪੈਰਾਮੀਟਰ ਅਤੇ ਇੱਕ ਲਾਈਨ ਦਾ ਸਾਰ (summary) ਭੇਜੋ। ਇਹ ਓਵਰਹੈੱਡ ਨੂੰ 40% ਤੋਂ 60% ਤੱਕ ਘਟਾ ਦਿੰਦਾ ਹੈ।
Batch tool calls. ਹਰ ਐਕਸ਼ਨ ਲਈ ਇੱਕ ਕਾਲ ਨਾ ਕਰੋ। ਸਬੰਧਤ ਕਾਰਜਾਂ ਨੂੰ ਇੱਕ ਕਾਲ ਵਿੱਚ ਸਮੂਹਬੱਧ ਕਰੋ। ਜ਼ਿਆਦਾਤਰ ਸਰਵਰ arrays ਨੂੰ ਸੰਭਾਲਦੇ ਹਨ। ਇਹ ਕੰਟੈਕਸ ਲਾਗਤ ਨੂੰ ਕਈ ਕਾਰਜਾਂ ਵਿੱਚ ਵੰਡ ਦਿੰਦਾ ਹੈ।
Result caching. ਜੇਕਰ ਤੁਹਾਡਾ ਏਜੰਟ ਇੱਕੋ ਇਨਪੁਟ ਦੇ ਨਾਲ ਇੱਕੋ ਟੂਲ ਨੂੰ ਕਾਲ ਕਰਦਾ ਹੈ, ਤਾਂ ਕੈਸ਼ (cache) ਦੀ ਵਰਤੋਂ ਕਰੋ। 60-ਸਕਿੰਟ ਦਾ in-memory ਕੈਸ਼ ਵਾਰ-ਵਾਰ ਹੋਣ ਵਾਲੀਆਂ ਕਾਲਾਂ ਨੂੰ ਰੋਕਦਾ ਹੈ।
ਟੋਕਨ ਲਾਗਤ ਨੂੰ ਇੱਕ ਮੁੱਖ ਮਾਪਦੰਡ (metric) ਵਜੋਂ ਲਓ। ਸਿਰਫ਼ ਲੇਟੈਂਸੀ (latency) ਜਾਂ ਸ਼ੁੱਧਤਾ (accuracy) ਵੱਲ ਹੀ ਨਾ ਦੇਖੋ।
ਜਿੱਤਣ ਦਾ ਤਰੀਕਾ: • ਨਵਾਂ ਸਰਵਰ ਤਾਇਨਾਤ (deploy) ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਟੂਲ ਦੀ ਲਾਗਤ ਦਾ ਪਤਾ ਲਗਾਓ। • ਹਰ ਸੈਸ਼ਨ ਲਈ ਟੋਕਨ ਬਜਟ ਨਿਰਧਾਰਤ ਕਰੋ। • ਅਜਿਹੇ ਸਰਵਰ ਚੁਣੋ ਜੋ ਲੰਬੇ ਟੈਕਸਟ ਦੀ ਬਜਾਏ ਸੰਖੇਪ JSON ਵਾਪਸ ਕਰਦੇ ਹਨ।
MCP ਈਕੋਸਿਸਟਮ ਮਜ਼ਬੂਤ ਹੈ। ਇਹ ਤੁਹਾਨੂੰ ਮਿੰਟਾਂ ਵਿੱਚ ਸਮਰੱਥਾਵਾਂ ਜੋੜਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ। ਪਰ ਕੰਟੈਕਸ ਟੈਕਸ ਅਸਲੀ ਹੈ।
ਜੇਕਰ ਤੁਸੀਂ production ਵਿੱਚ ਏਜੰਟ ਚਲਾਉਂਦੇ ਹੋ, ਤਾਂ ਆਪਣੀ ਲਾਗਤ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰੋ। Optimization ਹੀ ਉਸ ਪ੍ਰੋਜੈਕਟ ਅਤੇ ਉਸ ਪ੍ਰੋਜੈਕਟ ਵਿਚਕਾਰ ਅੰਤਰ ਹੈ ਜੋ ਵਧਦਾ (scales) ਹੈ ਅਤੇ ਉਹ ਜੋ ਬਿੱਲ ਆਉਣ 'ਤੇ ਫੇਲ ਹੋ ਜਾਂਦਾ ਹੈ।
ਜਾਣੋ ਕਿ ਤੁਸੀਂ ਕੀ ਭੁਗਤਾਨ ਕਰ ਰਹੇ ਹੋ।
ਵਿਕਲਪਿਕ ਸਿੱਖਣ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi