Uber agotó todo su presupuesto de codificación con IA en 4 meses

Los costes de la codificación con IA están aumentando rápidamente.

Uber agotó todo su presupuesto de Claude Code para 2026 en abril. Tuvieron que limitar el gasto de los empleados a 1.500 $ al mes.

Otros datos muestran una tendencia masiva:

  • Gartner afirma que el 23 % de los líderes tecnológicos gastan entre 200 $ y 500 $ mensuales por desarrollador en tokens.
  • GitHub Copilot pasó a un modelo de facturación basado en el uso.
  • Las empresas líderes gastan 7.500 $ mensuales por empleado en IA.

El problema es sencillo. Los flujos de trabajo de agentes (agentic workflows) consumen tokens demasiado rápido. Si utilizas un modelo costoso para cada tarea, estás desperdiciando dinero.

Vi esto ocurrir con mi propio gasto. Mi factura de codificación con IA alcanzó los 10.000 $ al mes.

Usaba Claude Opus para todo. Lo utilizaba para la planificación de código, la escritura de pruebas, el formateo de archivos y el renombramiento de variables.

Esto es como contratar a un arquitecto sénior para mover muebles. Consigues el trabajo, pero pagas demasiado.

Analicé mi uso y encontré un patrón:

  • El 15 % de las tareas requerían un razonamiento de alto nivel.
  • El 25 % de las tareas requerían una capacidad de nivel medio.
  • El 60 % de las tareas eran mecánicas.

Ese 60 % de trabajo no necesita un modelo de frontera (frontier model). Los modelos pequeños pueden hacerlo por mucho menos.

Los equipos inteligentes dirigen las tareas al modelo adecuado:

  • Nivel 1 (Modelos de frontera): Úsalos para arquitectura, errores complejos y seguridad.
  • Nivel 2 (Modelos de nivel medio): Úsalos para la implementación de funciones y revisiones de código.
  • Nivel 3 (Modelos rápidos/baratos): Úsalos para formateo, documentación y código repetitivo (boilerplate).

Cambié a este método. Mi gasto mensual bajó de 10.000 $ a 3.000 $. La calidad de mi producción se mantuvo igual.

Cómo empezar:

  • Registra tus prompts de API durante una semana.
  • Busca el exceso de contexto (context bloat) o bucles de pensamiento innecesarios.
  • Dirige por tarea, no por sesión. Un solo flujo de trabajo debería utilizar diferentes modelos en diferentes pasos.

Las empresas que están ganando con la IA no solo gastan más. Gastan de forma más inteligente. Combinan diferentes modelos para mantener los costes bajos.

Deja de pagar por un razonamiento costoso en tareas sencillas.

Fuente: https://dev.to/aplomb2/uber-burned-through-its-entire-ai-coding-budget-in-4-months-heres-what-smart-teams-do-instead-2792

Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi