𝗧𝗵𝗶𝗻𝗸𝗶𝗻𝗴 𝗧𝗼𝗸𝗲𝗻𝘀 𝗗𝗿𝗶𝘃𝗲 𝗛𝗶𝗱𝗱𝗲𝗻 𝗜𝗻𝗳𝗲𝗿𝗲𝗻𝗰𝗲 𝗖𝗼𝘀𝘁𝘀

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial9 گھنٹے پہلے1min read

تھنکنگ ٹوکنز AI ڈویلپرز کے لیے ایک پوشیدہ ٹیکس کی مانند ہیں۔

OpenAI، Anthropic، اور Google تھنکنگ ٹوکنز کے لیے آؤٹ پٹ ریٹس کے مطابق چارج کرتے ہیں۔ یہ ایجنٹک پائپ لائنز (agentic pipelines) میں لاگت کو 5 سے 10 گنا تک بڑھا دیتا ہے۔ زیادہ تر ڈویلپرز یہ فرض کر لیتے ہیں کہ یہ ٹوکنز مفت یا سستے ہیں۔ ایسا نہیں ہے۔

ایجنٹک پائپ لائنز اس مسئلے کو مزید سنگین بنا دیتی ہیں۔ ایجنٹس اکثر ناکام مراحل کو دوبارہ کرنے (retry) کی کوشش کرتے ہیں۔ ہر ری ٹرائی سے سینکڑوں نئے تھنکنگ ٹوکنز پیدا ہوتے ہیں۔ ایک ہی لوپ (perceive, reason, act, and observe) کئی بار ری ٹرائی کا باعث بن سکتا ہے۔

آپ کے منافع (margins) کے لیے یہ حساب کتاب خطرناک ہے: • 3 سے 5 ری ٹرائیز والے ایک ٹاسک کی پوشیدہ ٹوکنز کی لاگت $0.10 سے $0.50 تک ہوتی ہے۔ • روزانہ 10,000 ٹاسک والی ایک پائپ لائن میں اضافی فیس کے طور پر $5,000 سے $25,000 تک کا خرچ آتا ہے۔ • APIs پر $10,000 خرچ کرنے والا ایک اسٹارٹ اپ صرف تھنکنگ ٹوکنز کے لیے $5,000 ادا کر سکتا ہے۔

ایک بڑی قیمتوں کی جنگ شروع ہو رہی ہے۔ Google نے Gemini reasoning model کی قیمتوں میں 80% کمی کرنے کا منصوبہ بنایا ہے۔ یہ ٹیک کمپنیوں کے بڑے ناموں اور اسٹارٹ اپس کے درمیان فرق کو ظاہر کرتا ہے۔ Google ٹوکنز پر نقصان برداشت کر سکتا ہے کیونکہ وہ کمپیوٹ پر اربوں ڈالر خرچ کرتے ہیں۔ اسٹارٹ اپس ایسا نہیں کر سکتے۔

یہ عدم توازن بڑے فراہم کنندگان کے حق میں ہے۔ چھوٹی کمپنیوں کے لیے ان اخراجات کو برداشت کرنا مشکل ہوتا ہے۔ یہاں تک کہ Microsoft بھی اب استعمال پر مبنی قیمتوں (usage-based pricing) کی طرف منتقل ہو رہا ہے اور اخراجات کو سنبھالنے کے لیے DeepSeek V4 جیسے سستے متبادل تلاش کر رہا ہے۔

ان دو چیزوں پر نظر رکھیں: • 2026 کی تیسری سہ ماہی (Q3) میں Google کی آفیشل Gemini قیمتیں۔ • تھنکنگ ٹوکنز کے لیے ٹیرڈ پرائسنگ (tiered pricing) پر OpenAI کا ردعمل۔

ابھی سے اپنے ٹوکن کے استعمال کو منظم کریں ورنہ اپنے منافع کو ختم ہوتے ہوئے دیکھیں۔

ماخذ: https://pub.towardsai.net

اختیاری لرننگ کمیونٹی: https://t.me/GyaanSetuAi

𝗧𝗵𝗶𝗻𝗸𝗶𝗻𝗴 𝗧𝗼𝗸𝗲𝗻𝘀 𝗗𝗿𝗶𝘃𝗲 𝗛𝗶𝗱𝗱𝗲𝗻 𝗜𝗻𝗳𝗲𝗿𝗲𝗻𝗰𝗲 𝗖𝗼𝘀𝘁𝘀

Continue reading

میں نے اپنے AI API کے اخراجات میں 70% تک کمی کی

𝗠𝗖𝗣 𝗗𝗶𝗿𝘁𝘆 𝗦𝗲𝗰𝗿𝗲𝘁: 𝗬𝗼𝘂𝗿 𝗔𝗴𝗲𝗻𝘁 𝗜𝘀 𝗕𝘂𝗿𝗻𝗶𝗻𝗴 𝗧𝗼𝗸𝗲𝗻𝘀

ایم سی پی کانٹیکسٹ ٹیکس

ہالوسینیشن ٹیکس: 67 ارب ڈالر کا چھپا ہوا نقصان

𝗧𝗵𝗲 𝗥𝗲𝗮𝗹 𝗖𝗼𝘀𝘁 𝗼𝗳 𝗔𝗜 𝗔𝗣𝗜𝘀