Vos serveurs MCP brûlent des tokens avant même que vous ne tapiez un mot

Vous payez pour des données que vous n'utilisez jamais.

J'ai suivi une session d'agent la semaine dernière. Elle avait 47 outils MCP chargés. Chaque outil envoyait son schéma JSON complet dans le prompt système. Cela se produisait avant même que je ne tape un seul mot.

Chaque schéma d'outil utilise entre 150 et 400 tokens. 47 outils m'ont coûté 11 000 tokens de frais généraux. Le modèle lit ces tokens à chaque tour. Vous payez pour ce contexte même si vous n'utilisez que deux outils.

La plupart des gens s'inquiètent du téléchargement de fichiers volumineux. Ils oublient le coût du menu d'outils lui-même.

Lorsque vous empilez des serveurs comme GitHub, Slack et des bases de données, vous vous retrouvez avec 60 à 100 outils. J'ai vu des sessions où les définitions d'outils occupaient 20 % de l'ensemble du budget de contexte.

Arrêtez de tout charger d'un coup. Utilisez plutôt le chargement différé.

Voici le modèle : • Listez les outils uniquement par leur nom et une courte description. • Utilisez un outil de recherche pour récupérer les schémas complets à la demande.

Au lieu d'injecter un objet JSON massif pour chaque outil, vous fournissez un nom simple. Lorsque le modèle a besoin d'un outil spécifique, il appelle une fonction de recherche. Cette fonction renvoie le schéma complet uniquement pour les outils correspondants.

Les résultats sont massifs : • Chargement immédiat de 80 outils : ~18 000 tokens. • Chargement différé de 80 outils : ~1 000 tokens.

Cela transforme les définitions d'outils, passant d'une dépense majeure à une simple erreur d'arrondi.

Cette stratégie fonctionne car la plupart des sessions n'utilisent qu'une petite fraction des outils disponibles. Si vous utilisez chaque outil d'une session, le coût reste le même. Mais pour la plupart des utilisateurs, cela permet d'économiser d'énormes quantités de contexte.

Ne demandez pas quels outils le modèle doit appeler. Demandez ce que le modèle doit savoir exister par défaut.

La plupart des catalogues fournissent tout d'un coup parce que c'est facile. C'est aussi le moyen le plus rapide de brûler votre budget pour un menu que personne ne lit.

Restez simple. Fournissez un nom, une description et une fonction de recherche. Payez pour les trois outils que vous utilisez, pas pour les quatre-vingts outils que vous ignorez.

Source: https://dev.to/enjoy_kumawat/your-mcp-servers-are-burning-tokens-before-you-type-a-word-3076

Communauté d'apprentissage optionnelle: https://t.me/GyaanSetuAi