𝗧𝗵𝗶𝗻𝗸𝗶𝗻𝗴 𝗧𝗼𝗸𝗲𝗻𝘀 𝗗𝗿𝗶𝘃𝗲 𝗛𝗶𝗱𝗱𝗲𝗻 𝗜𝗻𝗳𝗲𝗿𝗲𝗻𝗰𝗲 𝗖𝗼𝘀𝘁𝘀
تھنکنگ ٹوکنز AI ڈویلپرز کے لیے ایک پوشیدہ ٹیکس کی مانند ہیں۔
OpenAI، Anthropic، اور Google تھنکنگ ٹوکنز کے لیے آؤٹ پٹ ریٹس کے مطابق چارج کرتے ہیں۔ یہ ایجنٹک پائپ لائنز (agentic pipelines) میں لاگت کو 5 سے 10 گنا تک بڑھا دیتا ہے۔ زیادہ تر ڈویلپرز یہ فرض کر لیتے ہیں کہ یہ ٹوکنز مفت یا سستے ہیں۔ ایسا نہیں ہے۔
ایجنٹک پائپ لائنز اس مسئلے کو مزید سنگین بنا دیتی ہیں۔ ایجنٹس اکثر ناکام مراحل کو دوبارہ کرنے (retry) کی کوشش کرتے ہیں۔ ہر ری ٹرائی سے سینکڑوں نئے تھنکنگ ٹوکنز پیدا ہوتے ہیں۔ ایک ہی لوپ (perceive, reason, act, and observe) کئی بار ری ٹرائی کا باعث بن سکتا ہے۔
آپ کے منافع (margins) کے لیے یہ حساب کتاب خطرناک ہے: • 3 سے 5 ری ٹرائیز والے ایک ٹاسک کی پوشیدہ ٹوکنز کی لاگت $0.10 سے $0.50 تک ہوتی ہے۔ • روزانہ 10,000 ٹاسک والی ایک پائپ لائن میں اضافی فیس کے طور پر $5,000 سے $25,000 تک کا خرچ آتا ہے۔ • APIs پر $10,000 خرچ کرنے والا ایک اسٹارٹ اپ صرف تھنکنگ ٹوکنز کے لیے $5,000 ادا کر سکتا ہے۔
ایک بڑی قیمتوں کی جنگ شروع ہو رہی ہے۔ Google نے Gemini reasoning model کی قیمتوں میں 80% کمی کرنے کا منصوبہ بنایا ہے۔ یہ ٹیک کمپنیوں کے بڑے ناموں اور اسٹارٹ اپس کے درمیان فرق کو ظاہر کرتا ہے۔ Google ٹوکنز پر نقصان برداشت کر سکتا ہے کیونکہ وہ کمپیوٹ پر اربوں ڈالر خرچ کرتے ہیں۔ اسٹارٹ اپس ایسا نہیں کر سکتے۔
یہ عدم توازن بڑے فراہم کنندگان کے حق میں ہے۔ چھوٹی کمپنیوں کے لیے ان اخراجات کو برداشت کرنا مشکل ہوتا ہے۔ یہاں تک کہ Microsoft بھی اب استعمال پر مبنی قیمتوں (usage-based pricing) کی طرف منتقل ہو رہا ہے اور اخراجات کو سنبھالنے کے لیے DeepSeek V4 جیسے سستے متبادل تلاش کر رہا ہے۔
ان دو چیزوں پر نظر رکھیں: • 2026 کی تیسری سہ ماہی (Q3) میں Google کی آفیشل Gemini قیمتیں۔ • تھنکنگ ٹوکنز کے لیے ٹیرڈ پرائسنگ (tiered pricing) پر OpenAI کا ردعمل۔
ابھی سے اپنے ٹوکن کے استعمال کو منظم کریں ورنہ اپنے منافع کو ختم ہوتے ہوئے دیکھیں۔
ماخذ: https://pub.towardsai.net
اختیاری لرننگ کمیونٹی: https://t.me/GyaanSetuAi