Uber نے اپنا پورا AI کوڈنگ بجٹ 4 ماہ میں ہی ختم کر دیا
AI کوڈنگ کے اخراجات تیزی سے بڑھ رہے ہیں۔
Uber نے اپریل تک اپنا پورا 2026 Claude Code بجٹ خرچ کر دیا۔ انہیں ملازمین کے اخراجات کو ماہانہ 1,500 ڈالر تک محدود کرنا پڑا۔
دیگر اعداد و شمار ایک بڑے رجحان کی نشاندہی کرتے ہیں:
- Gartner کا کہنا ہے کہ 23% ٹیک لیڈرز ٹوکنز پر فی ڈویلپر ماہانہ 200 سے 500 ڈالر خرچ کرتے ہیں۔
- GitHub Copilot usage-based billing کی طرف منتقل ہو گیا ہے۔
- بڑی کمپنیاں AI پر فی ملازم ماہانہ 7,500 ڈالر خرچ کرتی ہیں۔
مسئلہ سادہ ہے۔ Agentic workflows ٹوکنز کا استعمال بہت تیزی سے کرتے ہیں۔ اگر آپ ہر کام کے لیے ایک ہی مہنگا ماڈل استعمال کرتے ہیں، تو آپ پیسے ضائع کرتے ہیں۔
میں نے یہ اپنے اخراجات میں بھی دیکھا۔ میرا AI کوڈنگ بل ماہانہ 10,000 ڈالر تک پہنچ گیا۔
میں ہر چیز کے لیے Claude Opus استعمال کرتا تھا۔ میں نے اسے کوڈ پلاننگ، ٹیسٹ لکھنے، فائلیں فارمیٹ کرنے اور ویری ایبلز کے نام تبدیل کرنے کے لیے استعمال کیا۔
یہ فرنیچر ہلانے کے لیے کسی سینئر آرکیٹیکٹ کو ہائر کرنے جیسا ہے۔ کام تو ہو جاتا ہے، لیکن آپ بہت زیادہ ادائیگی کرتے ہیں۔
میں نے اپنے استعمال کا تجزیہ کیا اور ایک پیٹرن دریافت کیا:
- 15% کاموں کے لیے high-level reasoning کی ضرورت تھی۔
- 25% کاموں کے لیے mid-tier capability کی ضرورت تھی۔
- 60% کام مشینی (mechanical) تھے۔
اس 60% کام کے لیے کسی frontier model کی ضرورت نہیں ہے۔ چھوٹے ماڈلز یہ کام بہت کم قیمت میں کر سکتے ہیں۔
سمجھدار ٹیمیں کاموں کو صحیح ماڈل کی طرف بھیجتی ہیں:
- Tier 1 (Frontier Models): انہیں آرکیٹیکچر، پیچیدہ بگ (bugs) اور سیکیورٹی کے لیے استعمال کریں۔
- Tier 2 (Mid-Tier Models): انہیں feature implementation اور کوڈ ریویو کے لیے استعمال کریں۔
- Tier 3 (Fast/Cheap Models): انہیں فارمیٹنگ، documentation اور boilerplate کے لیے استعمال کریں۔
میں نے اس طریقے کو اپنایا۔ میرا ماہانہ خرچ 10,000 ڈالر سے کم ہو کر 3,000 ڈالر رہ گیا۔ میری آؤٹ پٹ کا معیار وہی رہا۔
آغاز کیسے کریں:
- ایک ہفتے کے لیے اپنے API prompts کا ریکارڈ رکھیں۔
- context bloat یا غیر ضروری thinking loops کو تلاش کریں۔
- کام کے لحاظ سے راؤٹ کریں، نہ کہ سیشن کے لحاظ سے۔ ایک ہی ورک فلو کو مختلف مراحل پر مختلف ماڈلز استعمال کرنے چاہئیں۔
وہ کمپنیاں جو AI کے ذریعے کامیابی حاصل کر رہی ہیں، وہ صرف زیادہ خرچ نہیں کرتیں۔ وہ زیادہ سمجھداری سے خرچ کرتی ہیں۔ وہ اخراجات کم رکھنے کے لیے مختلف ماڈلز کا ملا جلا استعمال کرتی ہیں۔
سادہ کاموں کے لیے مہنگی reasoning پر پیسے خرچ کرنا بند کریں۔
اختیاری لرننگ کمیونٹی: https://t.me/GyaanSetuAi
