Uber가 4개월 만에 AI 코딩 예산을 모두 소진했습니다

AI 코딩 비용이 빠르게 상승하고 있습니다.

Uber는 2026년 Claude Code 예산을 4월에 모두 소진했습니다. 결국 직원 1인당 월 지출액을 1,500달러로 제한해야 했습니다.

다른 데이터들은 거대한 트렌드를 보여줍니다:

  • Gartner에 따르면 기술 리더의 23%가 개발자 1인당 매달 토큰 비용으로 200~500달러를 지출합니다.
  • GitHub Copilot은 사용량 기반 과금 방식으로 전환했습니다.
  • 상위 기업들은 AI에 직원 1인당 매달 7,500달러를 지출합니다.

문제는 간단합니다. 에이전트 워크플로우(Agentic workflows)가 토큰을 너무 빨리 소모한다는 점입니다. 모든 작업에 하나의 비싼 모델만 사용하면 돈을 낭비하게 됩니다.

저 역시 제 지출에서 이런 현상을 경험했습니다. 제 AI 코딩 청구액이 월 10,000달러에 달했습니다.

저는 모든 작업에 Claude Opus를 사용했습니다. 코드 계획 수립, 테스트 작성, 파일 포맷팅, 변수 이름 변경 등에 모두 사용했습니다.

이는 가구를 옮기기 위해 수석 설계자를 고용하는 것과 같습니다. 일은 완수되겠지만, 비용이 너무 많이 듭니다.

사용량을 분석해 보니 다음과 같은 패턴을 발견했습니다:

  • 15%의 작업은 고도의 추론이 필요했습니다.
  • 25%의 작업은 중간 수준의 역량이 필요했습니다.
  • 60%의 작업은 기계적인 작업이었습니다.

그 60%의 작업에는 프런티어 모델(frontier model)이 필요하지 않습니다. 작은 모델들로 훨씬 저렴하게 처리할 수 있습니다.

스마트한 팀은 작업을 적절한 모델로 라우팅합니다:

  • Tier 1 (Frontier Models): 아키텍처, 복잡한 버그, 보안 작업에 사용합니다.
  • Tier 2 (Mid-Tier Models): 기능 구현 및 코드 리뷰에 사용합니다.
  • Tier 3 (Fast/Cheap Models): 포맷팅, 문서화, 보일러플레이트(boilerplate) 작성에 사용합니다.

저는 이 방식으로 전환했습니다. 월 지출액은 10,000달러에서 3,000달러로 줄었지만, 결과물의 품질은 그대로 유지되었습니다.

시작하는 방법:

  • 일주일 동안 API 프롬프트를 기록하세요.
  • 컨텍스트 팽창(context bloat)이나 불필요한 사고 루프가 있는지 확인하세요.
  • 세션이 아닌 작업 단위로 라우팅하세요. 하나의 워크플로우 내에서도 단계별로 서로 다른 모델을 사용해야 합니다.

AI로 승리하는 기업들은 단순히 돈을 더 많이 쓰는 것이 아닙니다. 더 똑똑하게 씁니다. 비용을 낮추기 위해 여러 모델을 조합하여 사용합니다.

단순한 작업에 비싼 추론 비용을 지불하는 것을 멈추세요.

Source: https://dev.to/aplomb2/uber-burned-through-its-entire-ai-coding-budget-in-4-months-heres-what-smart-teams-do-instead-2792

Optional learning community: https://t.me/GyaanSetuAi