MCP ਕੰਟੈਕਸ ਟੈਕਸ

ਤੁਹਾਡਾ AI ਏਜੰਟ ਤੁਹਾਡੀ ਸੋਚ ਨਾਲੋਂ ਕਿਤੇ ਜ਼ਿਆਦਾ ਖਰਚਾ ਕਰਦਾ ਹੈ।

ਹਰ ਵਾਰ ਜਦੋਂ ਕੋਈ ਏਜੰਟ MCP ਟੂਲ ਨੂੰ ਕਾਲ ਕਰਦਾ ਹੈ, ਤਾਂ ਤੁਸੀਂ ਇੱਕ ਵੱਡਾ ਲੁਕਿਆ ਹੋਇਆ ਫੀਸ ਭਰਦੇ ਹੋ। ਤੁਸੀਂ ਸ਼ਾਇਦ ਇੱਕ ਸਿੱਧੀ API ਕਾਲ ਨਾਲੋਂ 10 ਤੋਂ 32 ਗੁਣਾ ਜ਼ਿਆਦਾ ਟੋਕਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋ। ਜ਼ਿਆਦਾਤਰ ਡਿਵੈਲਪਰ ਇਸ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕਰ ਦਿੰਦੇ ਹਨ।

MCP ਈਕੋਸਿਸਟਮ ਵਿੱਚ 14,000 ਸਰਵਰ ਹਨ ਅਤੇ ਮਹੀਨਾਵਾਰ 97 ਮਿਲੀਅਨ ਡਾਊਨਲੋਡ ਹਨ। ਫਿਰ ਵੀ, ਬਹੁਤ ਘੱਟ ਟਿਊਟੋਰਿਅਲ ਇਸ ਦੀ ਲਾਗਤ ਦਾ ਜ਼ਿਕਰ ਕਰਦੇ ਹਨ।

ਸਮੱਸਿਆ ਇੱਥੇ ਹੈ।

ਜਦੋਂ ਕੋਈ LLM ਇੱਕ MCP ਟੂਲ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ, ਤਾਂ ਸਿਸਟਮ ਪੂਰਾ tool schema ਕੰਟੈਕਸ ਵਿੰਡੋ ਵਿੱਚ ਭੇਜ ਦਿੰਦਾ ਹੈ। ਇਸ ਵਿੱਚ ਹਰ ਪੈਰਾਮੀਟਰ, ਟਾਈਪ ਅਤੇ ਵੇਰਵਾ ਸ਼ਾਮਲ ਹੁੰਦਾ ਹੈ। ਇੱਕ ਸਧਾਰਨ ਫਾਈਲ ਸਰਚ 500 ਤੋਂ 2,000 ਟੋਕਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੀ ਹੈ। ਇਸ ਨੂੰ 50 ਵਾਰ ਚਲਾਓ, ਅਤੇ ਤੁਸੀਂ ਸਿਰਫ਼ ਮੈਟਾਡਾਟਾ 'ਤੇ ਹੀ 100,000 ਟੋਕਨ ਖਰਚ ਕਰ ਦਿੰਦੇ ਹੋ।

ਗਣਿਤ ਸਧਾਰਨ ਹੈ।

ਦਿਨ ਵਿੱਚ 500 ਕਾਲਾਂ ਕਰਨ ਵਾਲਾ ਇੱਕ ਏਜੰਟ 250,000 ਤੋਂ 8 ਮਿਲੀਅਨ ਟੋਕਨਾਂ ਦੇ ਵਿਚਕਾਰ ਖਰਚ ਕਰਦਾ ਹੈ। ਮੌਜੂਦਾ ਕੀਮਤਾਂ 'ਤੇ, ਇੱਕ ਏਜੰਟ ਦੀ ਲਾਗਤ $200 ਤੋਂ $500 ਪ੍ਰਤੀ ਦਿਨ ਹੈ। Optimized ਏਜੰਟਾਂ ਦੀ ਲਾਗਤ $6 ਤੋਂ $50 ਹੈ।

ਆਪਣੀ ਲਾਗਤ ਘਟਾਉਣ ਲਈ ਇਹਨਾਂ ਤਿੰਨ ਪੈਟਰਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰੋ:

ਟੋਕਨ ਲਾਗਤ ਨੂੰ ਇੱਕ ਮੁੱਖ ਮਾਪਦੰਡ (metric) ਵਜੋਂ ਲਓ। ਸਿਰਫ਼ ਲੇਟੈਂਸੀ (latency) ਜਾਂ ਸ਼ੁੱਧਤਾ (accuracy) ਵੱਲ ਹੀ ਨਾ ਦੇਖੋ।

ਜਿੱਤਣ ਦਾ ਤਰੀਕਾ: • ਨਵਾਂ ਸਰਵਰ ਤਾਇਨਾਤ (deploy) ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਟੂਲ ਦੀ ਲਾਗਤ ਦਾ ਪਤਾ ਲਗਾਓ। • ਹਰ ਸੈਸ਼ਨ ਲਈ ਟੋਕਨ ਬਜਟ ਨਿਰਧਾਰਤ ਕਰੋ। • ਅਜਿਹੇ ਸਰਵਰ ਚੁਣੋ ਜੋ ਲੰਬੇ ਟੈਕਸਟ ਦੀ ਬਜਾਏ ਸੰਖੇਪ JSON ਵਾਪਸ ਕਰਦੇ ਹਨ।

MCP ਈਕੋਸਿਸਟਮ ਮਜ਼ਬੂਤ ਹੈ। ਇਹ ਤੁਹਾਨੂੰ ਮਿੰਟਾਂ ਵਿੱਚ ਸਮਰੱਥਾਵਾਂ ਜੋੜਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ। ਪਰ ਕੰਟੈਕਸ ਟੈਕਸ ਅਸਲੀ ਹੈ।

ਜੇਕਰ ਤੁਸੀਂ production ਵਿੱਚ ਏਜੰਟ ਚਲਾਉਂਦੇ ਹੋ, ਤਾਂ ਆਪਣੀ ਲਾਗਤ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰੋ। Optimization ਹੀ ਉਸ ਪ੍ਰੋਜੈਕਟ ਅਤੇ ਉਸ ਪ੍ਰੋਜੈਕਟ ਵਿਚਕਾਰ ਅੰਤਰ ਹੈ ਜੋ ਵਧਦਾ (scales) ਹੈ ਅਤੇ ਉਹ ਜੋ ਬਿੱਲ ਆਉਣ 'ਤੇ ਫੇਲ ਹੋ ਜਾਂਦਾ ਹੈ।

ਜਾਣੋ ਕਿ ਤੁਸੀਂ ਕੀ ਭੁਗਤਾਨ ਕਰ ਰਹੇ ਹੋ।

ਸਰੋਤ: https://dev.to/mrclaw207/the-mcp-context-tax-why-your-agents-tool-calls-are-costing-you-10-32x-more-than-they-should-1nac

ਵਿਕਲਪਿਕ ਸਿੱਖਣ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi