OpenAI کے پیپر سے GPT-5.6 Pro ماڈلز کی نئی درجہ بندی (Tiered) کا انکشاف
OpenAI کی جانب سے حال ہی میں جاری کردہ جینیومکس بینچ مارک پیپر نے غیر ارادی طور پر ChatGPT Pro کے مستقبل سے پردہ اٹھا دیا ہے۔ ڈیٹا سے یہ اشارہ ملتا ہے کہ ایک واحد فلیگ شپ ماڈل کے بجائے، OpenAI ایک پیچیدہ تین درجوں (three-tier) والی "Pro" لائن اپ تیار کر رہا ہے جسے استدلال کی طاقت (reasoning power)، تھرو پٹ (throughput) اور لاگت کے درمیان توازن برقرار رکھنے کے لیے ڈیزائن کیا گیا ہے۔
تین ستون: Sol، Terra، اور Luna Pro
اپنی تاریخ کے بیشتر حصے میں، OpenAI کی "Pro" پیشکش ایک واحد، یکجان (monolithic) درجے کے طور پر کام کرتی رہی ہے—جو پاور صارفین کے لیے دستیاب بہترین ماڈل ہوتا تھا۔ تاہم، لیک شدہ جینیومکس پیپر تین مختلف "Pro (Extended)" ورژنز متعارف کرواتا ہے جو موجودہ GPT-5.6 آرکیٹیکچر کی عکاسی کرتے ہیں: Sol Pro، Terra Pro، اور Luna Pro۔
بینچ مارکس کی بنیاد پر، ان ماڈلز کو ان کے مطلوبہ استعمال کے لحاظ سے درجہ بندی کیا گیا ہے:
- Sol Pro: ایک اعلیٰ استدلال (high-reasoning) والا پاور ہاؤس، جسے انتہائی پیچیدہ اور کثیر مراحل والے تجزیاتی کاموں کے لیے ڈیزائن کیا گیا ہے۔
- Terra Pro: ایک زیادہ حجم (high-volume) والا ورژن جو بڑے کاروباری ورک لوڈز اور انٹرپرائز لیول کے تھرو پٹ کے لیے موزوں بنایا گیا ہے۔
- Luna Pro: ایک ہلکا پھلکا، تیز رفتار اور کم لاگت والا ورژن جو روزمرہ کے کثیر تعداد میں پوچھے جانے والے سوالات کے لیے ہے۔
کارکردگی کے اضافے کا بینچ مارکنگ
جینیومکس بینچ مارک، معیاری ماڈلز اور ان کے Pro متبادل کے درمیان کارکردگی کے فرق کا ٹھوس ثبوت فراہم کرتا ہے۔ اس مطالعے میں 129 کاموں کے مجموعے پر "پاس ریٹ" (pass rate)—یعنی بغیر کسی غلطی کے کثیر مراحل والے تجزیے کو مکمل کرنے کی صلاحیت—کی پیمائش کی گئی۔
نتائج ظاہر کرتے ہیں کہ Pro ورژنز ذہانت میں نمایاں اضافہ فراہم کرتے ہیں، خاص طور پر نچلے درجوں کے لیے۔ Sol Pro بلا شرکتِ غیرے لیڈر کے طور پر ابھرا، جس نے 31.5% پاس ریٹ حاصل کیا۔ یہ معیاری Sol ماڈل (28.7%) سے بہتر ہے اور صنعت کے موجودہ بڑے کھلاڑیوں، جیسے کہ Claude Opus 4.8 (جس کا اسکور 16.0% تھا)، کو بھی پیچھے چھوڑ دیتا ہے۔
دلچسپ بات یہ ہے کہ "Pro boost" یکساں نہیں ہے۔ ڈیٹا سے پتہ چلتا ہے کہ جیسے جیسے ماڈل کی پیچیدگی بڑھتی ہے، اضافی کمپیوٹنگ سے حاصل ہونے والا فائدہ کم ہوتا جاتا ہے۔ جہاں Luna Pro میں اپنے معیاری ورژن کے مقابلے میں 7 پوائنٹس کا بڑا اضافہ دیکھا گیا، وہیں Sol Pro میں 3 پوائنٹس سے بھی کم کا معمولی اضافہ ہوا۔ خاص طور پر، Terra Pro نے 28.5% پاس ریٹ حاصل کیا، جس کا مطلب ہے کہ OpenAI کا ہائی والیم Pro ماڈل تقریباً معیاری فلیگ شپ Sol ماڈل جتنا ہی اچھا کارکردگی دکھاتا ہے۔
AI کے استعمال میں ایک اسٹریٹجک تبدیلی
یہ انکشاف OpenAI کی پروڈکٹ اسٹریٹجی میں ایک بنیادی تبدیلی کی نشاندہی کرتا ہے۔ "ایک ہی سائز سب کے لیے" (one-size-fits-all) والے Pro درجے سے ہٹ کر، OpenAI ڈویلپرز اور اداروں کے لیے بنیادی مسئلے کو حل کر رہا ہے: ذہانت اور کارکردگی (efficiency) کے درمیان توازن کا مسئلہ۔
ایک ایسا "Terra Pro" فراہم کرنا جو فلیگ شپ جیسی ذہانت رکھتا ہو لیکن زیادہ حجم کے لیے موزوں ہو، کمپنیوں کو خالص استدلال (reasoning) ماڈل کی بھاری لاگت کے بغیر AI ایجنٹس کو وسعت دینے کی اجازت دیتا ہے۔ اسی طرح، "Luna Pro" ان صارفین کے لیے ایک درمیانی راستہ فراہم کرتا ہے جنہیں معیاری ماڈل سے زیادہ قابل اعتماد نظام چاہیے لیکن وہ مکمل Sol رن کی تاخیر (latency) کو برداشت نہیں کر سکتے۔
اگرچہ OpenAI نے ان ناموں یا مخصوص ٹوکن لاگت پر باضابطہ طور پر کوئی تبصرہ نہیں کیا ہے—جو کہ پیپر کے کمپیوٹ اکاؤنٹنگ میں نمایاں طور پر غیر موجود تھے—تاہم تکنیکی روڈ میپ واضح ہے۔ واحد فلیگ شپ کا دور ختم ہو رہا ہے، اور اس کی جگہ پیشہ ورانہ معیار کے ماڈلز کا ایک مخصوص ایکو سسٹم لے رہا ہے۔
اہم نکات
- درجہ بندی شدہ Pro آرکیٹیکچر: OpenAI ممکنہ طور پر ایک واحد ٹاپ ٹیر سبسکرپشن کے بجائے تین ماڈلز والی Pro لائن اپ (Sol، Terra، اور Luna) کی طرف بڑھ رہا ہے۔
- اعلیٰ استدلال: Sol Pro نے 31.5% پاس ریٹ کے ساتھ جینیومکس میں ایک نیا معیار قائم کیا، جو Claude Opus 4.8 جیسے حریفوں سے نمایاں طور پر بہتر ہے۔
- کارکردگی میں اضافہ: نیا ڈھانچہ صارفین کو زیادہ سے زیادہ استدلال کی طاقت، زیادہ حجم کے تھرو پٹ، یا کم لاگت والی رفتار کے درمیان انتخاب کرنے کی اجازت دیتا ہے۔
