OpenAI نے مہمان صارفین (Guest Users) کے لیے ChatGPT کے انفرنس (Inference) اخراجات میں 50 فیصد سے زیادہ کی کمی کر دی ہے

OpenAI نے ChatGPT کے مہمان صارفین کے لیے انفرنس اخراجات میں آدھے سے زیادہ کی کمی کر کے آپریشنل کارکردگی میں ایک بڑی کامیابی حاصل کی ہے۔ موجودہ AI ماڈلز کو چلانے کے اخراجات میں یہ نمایاں کمی بڑے پیمانے پر AI کے استعمال کو زیادہ پائیدار بنانے کی جانب ایک اہم قدم ہے۔

مہمان صارفین کے تجربے کو بہتر بنانا (Optimizing the Guest Experience)

The Information کی رپورٹ کے مطابق، OpenAI کے انجینئرز نے خاص طور پر ان زائرین کے لیے نئی بہتری (optimizations) نافذ کی ہے جو بغیر اکاؤنٹ کے ChatGPT استعمال کرتے ہیں۔ اگرچہ مہمان صارفین فی الحال Plus یا Team سبسکرائبرز کے مقابلے میں محدود فیچرز تک رسائی رکھتے ہیں، لیکن ہارڈ ویئر کی ضروریات پر اس کا اثر بہت گہرا ہے۔

ان بہتریوں کے ذریعے حاصل ہونے والی تکنیکی کارکردگی نے ان مخصوص صارفین کو سروس فراہم کرنے کے لیے درکار Nvidia GPUs کی تعداد کو کم کر کے محض چند سو تک محدود کر دیا ہے۔ اگرچہ ان نتائج کو حاصل کرنے کے لیے استعمال ہونے والا طریقہ کار خفیہ (proprietary) ہے، لیکن اخراجات میں کمی کا پیمانہ اس بات کی نشاندہی کرتا ہے کہ OpenAI اپنے کمپیوٹ پر مبنی انفرنس ورک لوڈز کو مینیج کرنے کے طریقے میں ایک بڑی چھلانگ لگا چکا ہے۔

انفرنس کی کارکردگی کے لیے مقابلہ

یہ پیش رفت صنعت کے لیے ایک اہم موڑ پر سامنے آئی ہے، کیونکہ کمپیوٹ کی زیادہ قیمت AI سروسز کو وسعت دینے میں سب سے بڑی رکاوٹ بنی ہوئی ہے۔ OpenAI اکیلا کھلاڑی نہیں ہے جو اس "ایفیشنسی فرنٹیر" (efficiency frontier) پر توجہ مرکوز کر رہا ہے۔ حال ہی میں، DeepSeek نے ایک نیا اوپن سورس طریقہ متعارف کرایا ہے جو انفرنس درخواستوں کی رفتار کو 60% سے 85% تک تیز کرنے کی صلاحیت رکھتا ہے۔

جیسے جیسے مقابلہ بڑھ رہا ہے، توجہ محض بڑے ماڈلز بنانے سے ہٹ کر انہیں چلانے کے لیے زیادہ ذہین اور کم لاگت والے طریقے ڈھونڈنے کی طرف منتقل ہو رہی ہے۔ AI لیبز کے لیے، انفرنس اخراجات میں بچایا گیا ہر فیصد براہ راست "سانس لینے کی جگہ" (breathing room) فراہم کرتا ہے—یعنی اضافی وسائل جنہیں اگلی نسل کے ماڈلز کی تربیت، رسپانس لیٹنسی (response latency) کو بہتر بنانے، یا منافع کے مارجن بڑھانے کے لیے استعمال کیا جا سکتا ہے۔

وسیع تر AI منظرنامے پر اثرات

اگرچہ یہ بہتری فی الحال پروڈکٹ کے ایک محدود حصے پر لاگو ہوتی ہے، لیکن یہ AI حکمت عملی میں ایک وسیع تبدیلی کا اشارہ دیتی ہے۔ چونکہ ڈیٹا سینٹرز کی تعمیر کمپیوٹ کی بڑھتی ہوئی طلب کے ساتھ ہم آہنگ ہونے کے لیے جدوجہد کر رہی ہے، اس لیے سافٹ ویئر لیول کی بہتری (optimizations) ہارڈ ویئر اسکیلنگ جتنی ہی اہم ہوتی جا رہی ہے۔

اگر OpenAI ان انفرنس بچانے والی تکنیکوں کو مہمان انٹرفیس سے مکمل ChatGPT پروڈکٹ تک کامیابی سے منتقل کرنے میں کامیاب ہو جاتا ہے، تو یہ کنزیومر AI کی معیشت کو بنیادی طور پر بدل سکتا ہے۔ ڈویلپرز اور فاؤنڈرز کے لیے، یہ ایک بڑھتے ہوئے رجحان کو اجاگر کرتا ہے: سب سے کامیاب AI کمپنیاں صرف وہ نہیں ہوں گی جن کے پاس سب سے زیادہ پیرامیٹرز ہوں گے، بلکہ وہ ہوں گی جن کے پاس سب سے زیادہ موثر انفرنس پائپ لائنز ہوں گی۔

اہم نکات

  • بڑی لاگت میں کمی: رپورٹ کے مطابق، OpenAI نے نئی انجینئرنگ بہتریوں کے ذریعے بغیر اکاؤنٹ والے ChatGPT صارفین کے لیے انفرنس اخراجات میں 50 فیصد سے زیادہ کی کمی کی ہے۔
  • ہارڈ ویئر کی کارکردگی: اس بہتری نے مہمان صارفین کو سروس فراہم کرنے کے لیے درکار Nvidia GPU کی تعداد کو نمایاں طور پر کم کر کے محض چند سو یونٹس تک پہنچا دیا ہے۔
  • صنعتی رجحان: چونکہ ہارڈ ویئر کی سپلائی ایک رکاوٹ بنی ہوئی ہے، اس لیے صنعت DeepSeek جیسے حریفوں کی اسی طرح کی کارکردگی والی کوششوں کے بعد اب انفرنس کی رفتار میں بڑی پیش رفت کی طرف مائل ہو رہی ہے۔