افشای طیف جدید مدل‌های لایه‌بندی‌شده GPT-5.6 Pro در مقاله OpenAI

یک مقاله اخیر در زمینه بنچمارک ژنومیک که توسط OpenAI منتشر شده، به‌طور ناخواسته پرده از آینده ChatGPT Pro برداشته است. داده‌ها نشان می‌دهند که OpenAI به‌جای یک مدل پرچم‌دار واحد، در حال آماده‌سازی یک مجموعه سه لایه و پیشرفته از مدل‌های "Pro" است که برای ایجاد تعادل میان قدرت استدلال، ظرفیت پردازش (throughput) و هزینه طراحی شده است.

سه ستون اصلی: Sol، Terra و Luna Pro

در بخش بزرگی از تاریخچه خود، پیشنهاد "Pro" شرکت OpenAI به‌عنوان یک لایه واحد و یکپارچه عمل کرده است؛ یعنی بهترین مدل موجود برای کاربران حرفه‌ای. با این حال، مقاله فاش‌شده در حوزه ژنومیک، سه نسخه متمایز "Pro (Extended)" را معرفی می‌کند که بازتاب‌دهنده معماری فعلی GPT-5.6 هستند: Sol Pro، Terra Pro و Luna Pro.

بر اساس بنچمارک‌ها، این مدل‌ها بر اساس کاربرد مورد نظرشان دسته‌بندی شده‌اند:

  • Sol Pro: غول استدلال بالا که برای پیچیده‌ترین وظایف تحلیلی چندمرحله‌ای طراحی شده است.
  • Terra Pro: نسخه‌ای با حجم بالا که برای حجم عظیم وظایف تجاری و ظرفیت پردازش در مقیاس سازمانی بهینه‌سازی شده است.
  • Luna Pro: نسخه‌ای سبک، سریع و مقرون‌به‌صرفه که برای پرس‌وجوهای روزمره با فرکانس بالا در نظر گرفته شده است.

بنچمارک جهش عملکرد

بنچمارک ژنومیک شواهد ملموسی از تفاوت عملکرد (delta) بین مدل‌های استاندارد و همتایان Pro آن‌ها ارائه می‌دهد. این مطالعه «نرخ موفقیت» (pass rate) — یعنی توانایی تکمیل یک تحلیل چندمرحله‌ای بدون خطا — را در مجموعه‌ای شامل ۱۲۹ وظیفه اندازه‌گیری کرده است.

نتایج نشان می‌دهد که نسخه‌های Pro بهبودهای هوشمندی قابل‌توجهی را ارائه می‌دهند، به‌ویژه در لایه‌های پایین‌تر. Sol Pro به‌عنوان رهبر بی‌چون‌وچران ظاهر شد و به نرخ موفقیت ۳۱.۵٪ دست یافت. این نتیجه از مدل استاندارد Sol (۲۸.۷٪) بهتر است و به‌طور قابل‌توجهی از سنگین‌وزن‌های فعلی صنعت، مانند Claude Opus 4.8 که امتیاز ۱۶.۰٪ را کسب کرد، پیشی می‌گیرد.

جالب اینجاست که «افزایش قدرت Pro» یکسان نیست. داده‌ها نشان می‌دهند که با افزایش پیچیدگی مدل، بازدهی محاسبات اضافی کاهش می‌یابد. در حالی که Luna Pro جهش عظیم ۷ امتیازی نسبت به نسخه استاندارد خود داشت، Sol Pro افزایش متواضعانه‌تری (کمتر از ۳ امتیاز) را تجربه کرد. قابل توجه است که Terra Pro به نرخ موفقیت ۲۸.۵٪ رسید، به این معنی که مدل Pro با حجم بالای OpenAI تقریباً به خوبی مدل پرچم‌دار استاندارد Sol عمل می‌کند.

یک تغییر استراتژیک در استقرار هوش مصنوعی

این افشاگری نشان‌دهنده یک تغییر بنیادین در استراتژی محصول OpenAI است. با فاصله گرفتن از لایه Pro با رویکرد «یک نسخه برای همه»، OpenAI در حال رسیدگی به اصلی‌ترین نقطه اصطکاک برای توسعه‌دهندگان و سازمان‌هاست: یعنی توازن میان هوشمندی و کارایی.

ارائه یک "Terra Pro" که با هوشمندی مدل پرچم‌دار برابری می‌کند اما برای حجم بالا بهینه‌سازی شده است، به شرکت‌ها اجازه می‌دهد تا عوامل هوش مصنوعی (AI agents) خود را بدون هزینه‌های گزاف یک مدل استدلالی خالص، مقیاس‌پذیر کنند. به همین ترتیب، "Luna Pro" راه حلی میانه برای کاربرانی ارائه می‌دهد که به قابلیت اطمینان بیشتری نسبت به مدل استاندارد نیاز دارند، اما نمی‌توانند تأخیر (latency) اجرای کامل مدل Sol را تحمل کنند.

اگرچه OpenAI به‌طور رسمی درباره این نام‌ها یا هزینه‌های مشخص توکن‌ها — که به‌طور قابل‌توجهی در محاسبات پردازشی مقاله غایب بودند — اظهار نظری نکرده است، اما نقشه راه فنی روشن است. عصر مدل پرچم‌دار واحد در حال پایان است و جای خود را به اکوسیستمی تخصصی از مدل‌های در سطح حرفه‌ای می‌دهد.

نکات کلیدی

  • معماری لایه‌بندی‌شده Pro: OpenAI احتمالاً به‌جای یک اشتراک تک‌لایه سطح بالا، به سمت یک مجموعه سه مدل Pro (Sol، Terra و Luna) حرکت می‌کند.
  • استدلال برتر: Sol Pro با نرخ موفقیت ۳۱.۵٪، معیار جدیدی در حوزه ژنومیک تعیین کرد و به‌طور قابل‌توجهی از رقبایی مانند Claude Opus 4.8 پیشی گرفت.
  • افزایش کارایی: ساختار جدید به کاربران اجازه می‌دهد بین حداکثر قدرت استدلال، ظرفیت پردازش بالا یا سرعت مقرون‌به‌صرفه، یکی را انتخاب کنند.