𝗠𝗖𝗣 𝗗𝗶𝗿𝘁𝘆 𝗦𝗲𝗰𝗿𝗲𝘁: 𝗬𝗼𝘂𝗿 𝗔𝗴𝗲𝗻𝘁 𝗜𝘀 𝗕𝘂𝗿𝗻𝗶𝗻𝗴 𝗧𝗼𝗸𝗲𝗻𝘀

📅1 hour ago⏱2 min read

Il segreto sporco di MCP: il tuo agente sta bruciando token

Il tuo agente AI paga una tassa nascosta ogni volta che chiama un server MCP. Questa tassa non è in dollari. È in token.

Se gestisci agenti su larga scala, questo costo cresce rapidamente. Ho monitorato il mio utilizzo di token e ho visto enormi picchi. Il problema non è il ragionamento del modello. Il problema è l'overhead del contesto.

Quando colleghi un agente a un server MCP, il server invia le definizioni dei tool nel prompt di sistema. Queste includono ogni parametro e descrizione.

Se utilizzi cinque server MCP con 20 tool ciascuno, aggiungi fino a 15.000 token a ogni singolo turno. Questo accade prima ancora che il modello parli.

Ecco i dati di un test di conversazione di 10 turni:

• Nessun MCP: 2.400 token per turno • 3 server MCP: 18.700 token per turno • 5 server MCP: 31.200 token per turno

Ai prezzi attuali, un team che gestisce 50 conversazioni al giorno con 5 server potrebbe spendere 23.400 $ al mese solo per l'overhead di MCP.

Questo causa due problemi principali:

La qualità diminuisce. Quando gli schemi dei tool occupano il 40% della finestra di contesto, il modello ha meno spazio per la cronologia. Il modello inizia a dimenticare le cose perché esaurisce lo spazio.
I costi sono fissi. Paghi il prezzo pieno per questi prompt di sistema in ogni singolo turno.

Ecco tre modi per risolvere il problema:

Usa un Gateway Non caricare tutte le definizioni dei tool in una volta sola. Usa un gateway per iniettare solo i tool necessari per il compito corrente. Questo può ridurre l'overhead da 8.000 token a 400 token per chiamata.
Usa un Classificatore di Intenti (Intent Classifier) Esegui prima una chiamata a un modello economico per decidere quale server sia rilevante. Un costo minimo per un classificatore può ridurre l'overhead di MCP dal 60% all'80%.
Comprimi i tuoi Schemi Gli schemi MCP utilizzano molte parole. Riduci le descrizioni ai soli sostantivi essenziali. Rimuovi i campi di esempio. Ho scoperto che uno schema da 400 token funziona perfettamente a 120 token se si semplifica il testo.

Smetti di trattare il contesto come illimitato. Il budget del contesto è infrastruttura. Gestiscilo come un costo reale.

Come gestisci l'overhead di MCP nei tuoi agenti in produzione? Fammi sapere nei commenti.

Fonte: https://dev.to/mrclaw207/mcps-dirty-secret-your-agent-is-burning-10-32x-more-tokens-than-you-think-32d1

Community di apprendimento opzionale: https://t.me/GyaanSetuAi

𝗠𝗖𝗣 𝗗𝗶𝗿𝘁𝘆 𝗦𝗲𝗰𝗿𝗲𝘁: 𝗬𝗼𝘂𝗿 𝗔𝗴𝗲𝗻𝘁 𝗜𝘀 𝗕𝘂𝗿𝗻𝗶𝗻𝗴 𝗧𝗼𝗸𝗲𝗻𝘀

Continue reading

𝗠𝗖𝗣 𝘃𝘀 𝗖𝗟𝗜: 𝗠𝗖𝗣 𝗨𝘀𝗲𝘀 𝟭𝟳𝘅 𝗠𝗼𝗿𝗲 𝗧𝗼𝗸𝗲𝗻𝘀

I server MCP rendono gli agenti AI utili in produzione

𝗧𝗵𝗲 𝗠𝗖𝗣 𝗚𝗮𝘁𝗲𝘄𝗮𝘆 𝗣𝗮𝘁𝘁𝗲𝗿𝗻: 𝗠𝗮𝗻𝗮𝗴𝗶𝗻𝗴 𝟭𝟯,𝟬𝟬𝟬+ 𝗦𝗲𝗿𝘃𝗲𝗿𝘀

Comprendere il Model Context Protocol

𝗧𝗵𝗲 𝗠𝗖𝗣 𝗖𝗼𝗻𝘁𝗲𝘅𝘁 𝗧𝗮𝘅