Por que Rejeitamos uma Economia de 96% de Tokens
Encontramos um servidor MCP que economiza 96% de tokens. Ele utiliza apenas uma ferramenta: execute_code. Em vez de chamar funções específicas, o agente escreve JavaScript para obter dados.
No papel, ele vence. Para tarefas complexas, a execução de código supera a chamada de ferramentas em termos de eficiência.
Mas não o adotamos. Em vez disso, mantivemos nossas ferramentas discretas e nomeadas.
Aqui está o porquê de a escolha óbvia ter sido a escolha errada para o nosso agente.
O Alvo Determina o Design
A maioria das pessoas constrói para modelos de fronteira em uma janela de chat. Esses modelos possuem orçamentos de tokens enormes. Para eles, a execução de código é soberana.
Nós construímos para um agente focado em voz, rodando em um modelo local pequeno (Hermes 3 8B) em um barco.
Para um modelo pequeno, a restrição não são os tokens. A restrição é a confiabilidade.
Se um modelo pequeno tem dificuldade para chamar uma ferramenta simples, pedir que ele escreva um JavaScript correto é uma tarefa muito mais difícil. O execute_code troca confiabilidade por tokens. Não podemos nos dar ao luxo de fazer essa troca.
O Problema da Última Milha
A execução de código transfere a "última milha" do trabalho para o agente. O agente deve:
- Filtrar os dados
- Ordenar os resultados
- Formatar a saída
Nossas ferramentas realizam esse trabalho dentro do servidor. Por exemplo, ao perguntar sobre o estado da bateria, nossa ferramenta retorna uma string pronta para text-to-speech. Ela diz "68 por cento, 12,8 volts" em vez de números brutos.
Se usarmos o execute_code, o agente terá que escrever a lógica para formatar essa fala. Modelos pequenos falham nisso constantemente.
A Regra da Ausência
Em um barco, sensores ficam offline. Em nosso sistema, um sensor ausente retorna um null limpo. Isso é uma chamada bem-sucedida.
Em um modelo de execução de código, um sensor ausente geralmente gera um erro. Se um modelo pequeno tentar alguns caminhos errados, ele aciona limites de erro e quebra o agente. Ferramentas nomeadas nos permitem transformar a ausência em um sucesso, não em uma falha.
Checklist: Adotar vs. Construir
Antes de adotar ou construir um servidor MCP, faça estas perguntas:
• Quem é o agente alvo? (Modelo de fronteira vs. Modelo local pequeno)
• Qual é a restrição principal? (Tokens vs. Confiabilidade)
• Quem faz a última milha? (A ferramenta formata os dados ou o agente?)
• Como ele lida com a ausência? (Um valor ausente é um erro ou um null?)
• Qual é o custo de manutenção? (Você está herdando uma base de código dormente?)
Não ignoramos o outro projeto. Colhemos suas ideias. Pegamos o tratamento de alarmes e a lógica de descoberta de caminhos deles e os adicionamos ao nosso roadmap.
Eficiência é ótimo, mas confiabilidade é obrigatória quando você está na água.
Source: https://dev.to/clarkbw--/why-we-kept-named-mcp-tools-despite-a-96-token-saving-40ae
Optional learning community: https://t.me/GyaanSetuAi
