Uber đã tiêu hết toàn bộ ngân sách lập trình AI chỉ trong 4 tháng

Chi phí lập trình bằng AI đang tăng nhanh chóng.

Uber đã tiêu hết toàn bộ ngân sách Claude Code cho năm 2026 vào tháng Tư. Họ đã phải giới hạn mức chi tiêu của nhân viên ở mức 1.500 USD mỗi tháng.

Các dữ liệu khác cho thấy một xu hướng khổng lồ:

  • Gartner cho biết 23% các nhà lãnh đạo công nghệ chi từ 200 đến 500 USD mỗi tháng cho mỗi lập trình viên để trả phí token.
  • GitHub Copilot đã chuyển sang hình thức thanh toán dựa trên mức độ sử dụng.
  • Các công ty hàng đầu chi 7.500 USD mỗi nhân viên mỗi tháng cho AI.

Vấn đề rất đơn giản. Các quy trình làm việc dạng tác nhân (agentic workflows) tiêu tốn token quá nhanh. Nếu bạn sử dụng một mô hình đắt tiền cho mọi tác vụ, bạn đang lãng phí tiền bạc.

Tôi đã thấy điều này xảy ra với chính mức chi tiêu của mình. Hóa đơn lập trình AI của tôi đã chạm mức 10.000 USD mỗi tháng.

Tôi đã dùng Claude Opus cho mọi thứ. Tôi dùng nó để lập kế hoạch mã nguồn, viết kiểm thử (tests), định dạng tệp và đổi tên biến.

Việc này giống như thuê một kiến trúc sư trưởng để di chuyển đồ đạc. Bạn vẫn hoàn thành công việc, nhưng cái giá phải trả là quá đắt.

Tôi đã phân tích mức độ sử dụng của mình và tìm thấy một quy luật:

  • 15% tác vụ cần khả năng suy luận cấp cao.
  • 25% tác vụ cần khả năng ở mức trung bình.
  • 60% tác vụ mang tính máy móc.

60% khối lượng công việc đó không cần đến một mô hình tiên phong (frontier model). Các mô hình nhỏ có thể thực hiện chúng với chi phí thấp hơn nhiều.

Các đội ngũ thông minh sẽ điều hướng tác vụ đến đúng mô hình:

  • Tier 1 (Các mô hình tiên phong): Sử dụng cho kiến trúc, các lỗi phức tạp và bảo mật.
  • Tier 2 (Các mô hình tầm trung): Sử dụng để triển khai tính năng và đánh giá mã nguồn (code reviews).
  • Tier 3 (Các mô hình nhanh/rẻ): Sử dụng để định dạng, viết tài liệu và tạo mã mẫu (boilerplate).

Tôi đã chuyển sang phương pháp này. Chi tiêu hàng tháng của tôi giảm từ 10.000 USD xuống còn 3.000 USD. Chất lượng đầu ra vẫn giữ nguyên.

Cách bắt đầu:

  • Ghi lại các câu lệnh (prompts) API của bạn trong một tuần.
  • Tìm kiếm sự phình to của ngữ cảnh (context bloat) hoặc các vòng lặp suy nghĩ không cần thiết.
  • Điều hướng theo tác vụ, không phải theo phiên làm việc. Một quy trình làm việc duy nhất nên sử dụng các mô hình khác nhau ở các bước khác nhau.

Những công ty chiến thắng nhờ AI không chỉ chi tiêu nhiều hơn. Họ chi tiêu thông minh hơn. Họ kết hợp linh hoạt các mô hình để giữ chi phí ở mức thấp.

Đừng trả tiền cho khả năng suy luận đắt đỏ cho những tác vụ đơn giản.

Nguồn: https://dev.to/aplomb2/uber-burned-through-its-entire-ai-coding-budget-in-4-months-heres-what-smart-teams-do-instead-2792

Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi