Uber ਨੇ 4 ਮਹੀਨਿਆਂ ਵਿੱਚ ਆਪਣਾ ਸਾਰਾ AI ਕੋਡਿੰਗ ਬਜਟ ਖ਼ਤਮ ਕਰ ਦਿੱਤਾ

AI ਕੋਡਿੰਗ ਦੀਆਂ ਲਾਗਤਾਂ ਤੇਜ਼ੀ ਨਾਲ ਵਧ ਰਹੀਆਂ ਹਨ।

Uber ਨੇ ਅਪ੍ਰੈਲ ਤੱਕ ਆਪਣਾ ਸਾਰਾ 2026 Claude Code ਬਜਟ ਖ਼ਤਮ ਕਰ ਦਿੱਤਾ। ਉਨ੍ਹਾਂ ਨੂੰ ਕਰਮਚਾਰੀਆਂ ਦੇ ਖ਼ਰਚੇ ਨੂੰ $1,500 ਪ੍ਰਤੀ ਮਹੀਨਾ ਤੱਕ ਸੀਮਤ ਕਰਨਾ ਪਿਆ।

ਹੋਰ ਡੇਟਾ ਇੱਕ ਵੱਡਾ ਰੁਝਾਨ ਦਿਖਾਉਂਦਾ ਹੈ:

  • Gartner ਦਾ ਕਹਿਣਾ ਹੈ ਕਿ 23% ਤਕਨੀਕੀ ਲੀਡਰ ਟੋਕਨਾਂ (tokens) 'ਤੇ ਪ੍ਰਤੀ ਡਿਵੈਲਪਰ ਮਹੀਨਾਵਾਰ $200 ਤੋਂ $500 ਖ਼ਰਚ ਕਰਦੇ ਹਨ।
  • GitHub Copilot ਵਰਤੋਂ-ਅਧਾਰਤ ਬਿਲਿੰਗ (usage-based billing) ਵੱਲ ਵਧ ਗਿਆ ਹੈ।
  • ਪ੍ਰਮੁੱਖ ਫਰਮਾਂ AI 'ਤੇ ਪ੍ਰਤੀ ਕਰਮਚਾਰੀ ਮਹੀਨਾਵਾਰ $7,500 ਖ਼ਰਚ ਕਰਦੀਆਂ ਹਨ।

ਸਮੱਸਿਆ ਸਰਲ ਹੈ। Agentic workflows ਟੋਕਨਾਂ ਦੀ ਵਰਤੋਂ ਬਹੁਤ ਤੇਜ਼ੀ ਨਾਲ ਕਰਦੇ ਹਨ। ਜੇਕਰ ਤੁਸੀਂ ਹਰ ਕੰਮ ਲਈ ਇੱਕ ਮਹਿੰਗਾ ਮਾਡਲ ਵਰਤਦੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਪੈਸੇ ਬਰਬਾਦ ਕਰਦੇ ਹੋ।

ਮੈਂ ਇਹ ਆਪਣੇ ਖ਼ਰਚੇ ਵਿੱਚ ਦੇਖਿਆ। ਮੇਰਾ AI ਕੋਡਿੰਗ ਬਿੱਲ $10,000 ਪ੍ਰਤੀ ਮਹੀਨਾ ਤੱਕ ਪਹੁੰਚ ਗਿਆ ਸੀ।

ਮੈਂ ਹਰ ਚੀਜ਼ ਲਈ Claude Opus ਦੀ ਵਰਤੋਂ ਕੀਤੀ। ਮੈਂ ਇਸਦੀ ਵਰਤੋਂ ਕੋਡ ਪਲਾਨਿੰਗ, ਟੈਸਟ ਲਿਖਣ, ਫਾਈਲਾਂ ਫਾਰਮੈਟ ਕਰਨ ਅਤੇ ਵੇਰੀਏਬਲਜ਼ (variables) ਦਾ ਨਾਮ ਬਦਲਣ ਲਈ ਕੀਤੀ।

ਇਹ ਫਰਨੀਚਰ ਹਟਾਉਣ ਲਈ ਇੱਕ ਸੀਨੀਅਰ ਆਰਕੀਟੈਕਟ ਨੂੰ ਰੱਖਣ ਵਰਗਾ ਹੈ। ਕੰਮ ਤਾਂ ਹੋ ਜਾਂਦਾ ਹੈ, ਪਰ ਤੁਸੀਂ ਬਹੁਤ ਜ਼ਿਆਦਾ ਭੁਗਤਾਨ ਕਰਦੇ ਹੋ।

ਮੈਂ ਆਪਣੇ ਵਰਤੋਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕੀਤਾ ਅਤੇ ਇੱਕ ਪੈਟਰਨ ਲੱਭਿਆ:

  • 15% ਕੰਮਾਂ ਲਈ ਉੱਚ-ਪੱਧਰੀ ਤਰਕ (high-level reasoning) ਦੀ ਲੋੜ ਸੀ।
  • 25% ਕੰਮਾਂ ਲਈ ਮਿਡ-ਟੀਅਰ (mid-tier) ਸਮਰੱਥਾ ਦੀ ਲੋੜ ਸੀ।
  • 60% ਕੰਮ ਮਕੈਨੀਕਲ (mechanical) ਸਨ।

ਉਸ 60% ਕੰਮ ਲਈ ਫਰੰਟੀਅਰ ਮਾਡਲ (frontier model) ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਛੋਟੇ ਮਾਡਲ ਇਸਨੂੰ ਬਹੁਤ ਘੱਟ ਕੀਮਤ 'ਤੇ ਕਰ ਸਕਦੇ ਹਨ।

ਸਮਝਦਾਰ ਟੀਮਾਂ ਕੰਮਾਂ ਨੂੰ ਸਹੀ ਮਾਡਲ ਵੱਲ ਭੇਜਦੀਆਂ ਹਨ:

  • Tier 1 (Frontier Models): ਇਹਨਾਂ ਦੀ ਵਰਤੋਂ ਆਰਕੀਟੈਕਚਰ, ਗੁੰਝਲਦਾਰ ਬੱਗ (bugs) ਅਤੇ ਸੁਰੱਖਿਆ ਲਈ ਕਰੋ।
  • Tier 2 (Mid-Tier Models): ਇਹਨਾਂ ਦੀ ਵਰਤੋਂ ਫੀਚਰ ਇੰਪਲੀਮੈਂਟੇਸ਼ਨ (feature implementation) ਅਤੇ ਕੋਡ ਰਿਵਿਊ ਲਈ ਕਰੋ।
  • Tier 3 (Fast/Cheap Models): ਇਹਨਾਂ ਦੀ ਵਰਤੋਂ ਫਾਰਮੈਟਿੰਗ, ਡਾਕੂਮੈਂਟੇਸ਼ਨ ਅਤੇ ਬੁਆਇਲਰਪਲੇਟ (boilerplate) ਲਈ ਕਰੋ।

ਮੈਂ ਇਸ ਵਿਧੀ ਨੂੰ ਅਪਣਾਇਆ। ਮੇਰਾ ਮਹੀਨਾਵਾਰ ਖ਼ਰਚਾ $10,000 ਤੋਂ ਘਟ ਕੇ $3,000 ਰਹਿ ਗਿਆ। ਮੇਰੇ ਕੰਮ ਦੀ ਗੁਣਵੱਤਾ ਉਹੀ ਰਹੀ।

ਕਿਵੇਂ ਸ਼ੁਰੂ ਕਰੀਏ:

  • ਇੱਕ ਹਫ਼ਤੇ ਲਈ ਆਪਣੇ API ਪ੍ਰੋਂਪਟ (prompts) ਦਾ ਰਿਕਾਰਡ ਰੱਖੋ।
  • ਕੰਟੈਕਸ ਬਲੋਟ (context bloat) ਜਾਂ ਬੇਲੋੜੇ ਥਿੰਕਿੰਗ ਲੂਪਸ (thinking loops) ਦੀ ਭਾਲ ਕਰੋ।
  • ਸੈਸ਼ਨ ਦੀ ਬਜਾਏ ਕੰਮ (task) ਦੇ ਅਧਾਰ 'ਤੇ ਰੂਟ ਕਰੋ। ਇੱਕ ਸਿੰਗਲ ਵਰਕਫਲੋ ਦੇ ਵੱਖ-ਵੱਖ ਪੜਾਵਾਂ 'ਤੇ ਵੱਖ-ਵੱਖ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਹੋਣੀ ਚਾਹੀਦੀ ਹੈ।

AI ਨਾਲ ਜਿੱਤਣ ਵਾਲੀਆਂ ਕੰਪਨੀਆਂ ਸਿਰਫ਼ ਜ਼ਿਆਦਾ ਖ਼ਰਚ ਨਹੀਂ ਕਰਦੀਆਂ। ਉਹ ਸਮਝਦਾਰੀ ਨਾਲ ਖ਼ਰਚ ਕਰਦੀਆਂ ਹਨ। ਉਹ ਲਾਗਤ ਘੱਟ ਰੱਖਣ ਲਈ ਮਾਡਲਾਂ ਨੂੰ ਮਿਕਸ ਅਤੇ ਮੈਚ ਕਰਦੀਆਂ ਹਨ।

ਸਧਾਰਨ ਕੰਮਾਂ ਲਈ ਮਹਿੰਗੇ ਤਰਕ (reasoning) ਲਈ ਭੁਗਤਾਨ ਕਰਨਾ ਬੰਦ ਕਰੋ।

ਸਰੋਤ: https://dev.to/aplomb2/uber-burned-through-its-entire-ai-coding-budget-in-4-months-heres-what-smart-teams-do-instead-2792

ਵਿਕਲਪਿਕ ਲਰਨਿੰਗ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi