Uber esgotou todo o seu orçamento de codificação com IA em 4 meses
Os custos de codificação com IA estão subindo rapidamente.
A Uber gastou todo o seu orçamento de 2026 para o Claude Code até abril. Eles tiveram que limitar os gastos dos funcionários a US$ 1.500 por mês.
Outros dados mostram uma tendência massiva:
- O Gartner afirma que 23% dos líderes de tecnologia gastam de US$ 200 a US$ 500 por desenvolvedor mensalmente com tokens.
- O GitHub Copilot mudou para o faturamento baseado no uso.
- As principais empresas gastam US$ 7.500 por funcionário mensalmente com IA.
O problema é simples. Fluxos de trabalho de agentes (agentic workflows) consomem tokens rápido demais. Se você usar um modelo caro para cada tarefa, você desperdiça dinheiro.
Eu vi isso acontecer com meus próprios gastos. Minha fatura de codificação com IA chegou a US$ 10.000 por mês.
Eu usava o Claude Opus para tudo. Eu o utilizava para planejamento de código, escrita de testes, formatação de arquivos e renomeação de variáveis.
Isso é como contratar um arquiteto sênior para mudar móveis de lugar. Você realiza o trabalho, mas paga caro demais.
Analisei meu uso e encontrei um padrão:
- 15% das tarefas exigiam raciocínio de alto nível.
- 25% das tarefas exigiam capacidade de nível intermediário.
- 60% das tarefas eram mecânicas.
Esses 60% de trabalho não precisam de um modelo de fronteira (frontier model). Modelos menores podem fazer isso por muito menos.
Equipes inteligentes direcionam as tarefas para o modelo correto:
- Nível 1 (Frontier Models): Use estes para arquitetura, bugs complexos e segurança.
- Nível 2 (Mid-Tier Models): Use estes para implementação de funcionalidades e revisões de código.
- Nível 3 (Fast/Cheap Models): Use estes para formatação, documentação e boilerplate.
Eu mudei para este método. Meu gasto mensal caiu de US$ 10.000 para US$ 3.000. A qualidade da minha entrega permaneceu a mesma.
Como começar:
- Registre seus prompts de API por uma semana.
- Procure por excesso de contexto (context bloat) ou loops de pensamento desnecessários.
- Direcione por tarefa, não por sessão. Um único fluxo de trabalho deve usar modelos diferentes em etapas diferentes.
As empresas que estão vencendo com IA não apenas gastam mais. Elas gastam de forma mais inteligente. Elas combinam diferentes modelos para manter os custos baixos.
Pare de pagar por raciocínio caro em tarefas simples.
Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi
