Звіт OpenAI розкриває нову багаторівневу лінійку моделей GPT-5.6 Pro
Нещодавній звіт про бенчмарки в галузі геноміки, опублікований OpenAI, ненавмисно привідкрив завісу над майбутнім ChatGPT Pro. Замість однієї флагманської моделі дані свідчать про те, що OpenAI готує складну трирівневу лінійку «Pro», розроблену для балансування потужності міркування, пропускної здатності та вартості.
Три стовпи: Sol, Terra та Luna Pro
Протягом більшої частини своєї історії пропозиція «Pro» від OpenAI функціонувала як єдиний монолітний рівень — найкраща модель, доступна для досвідчених користувачів. Однак витік звіту з геноміки представляє три окремі варіанти «Pro (Extended)», які відображають існуючу архітектуру GPT-5.6: Sol Pro, Terra Pro та Luna Pro.
На основі бенчмарків ці моделі класифіковані за їхнім призначенням:
- Sol Pro: Потужна модель із високим рівнем міркування, розроблена для найскладніших багатоетапних аналітичних завдань.
- Terra Pro: Варіант для великих обсягів, оптимізований для масивних бізнес-навантажень та пропускної здатності корпоративного рівня.
- Luna Pro: Легкий, швидкий і економічно вигідний варіант, призначений для щоденних запитів із високою частотою.
Бенчмарки стрибка продуктивності
Бенчмарк у галузі геноміки надає конкретні докази різниці в продуктивності між стандартними моделями та їхніми Pro-аналогами. У дослідженні вимірювався «показник успішності» (pass rate) — здатність завершити багатоетапний аналіз без помилок — у наборі з 129 завдань.
Результати вказують на те, що варіанти Pro забезпечують значне підвищення інтелекту, особливо для нижчих рівнів. Sol Pro став беззаперечним лідером, досягнувши показника успішності 31,5%. Це перевершує стандартну модель Sol (28,7%) і значно випереджає нинішніх важковаговиків галузі, таких як Claude Opus 4.8, який набрав 16,0%.
Цікаво, що «Pro-приріст» не є рівномірним. Дані показують, що додаткові обчислювальні ресурси дають менший ефект зі збільшенням складності моделі. У той час як Luna Pro продемонструвала величезний стрибок у 7 пунктів порівняно зі стандартною версією, Sol Pro показала скромніше зростання — менше ніж на 3 пункти. Примітно, що Terra Pro досягла показника успішності 28,5%, що означає, що Pro-модель OpenAI для великих обсягів працює майже так само добре, як стандартна флагманська модель Sol.
Стратегічний зсув у розгортанні ШІ
Це відкриття знаменує собою фундаментальний зсув у стратегії продуктів OpenAI. Відходячи від принципу «один розмір підходить усім» для рівня Pro, OpenAI вирішує головну проблему розробників та підприємств: компроміс між інтелектом та ефективністю.
Надання «Terra Pro», яка відповідає інтелекту флагмана, але оптимізована для великих обсягів, дозволяє компаніям масштабувати ШІ-агентів без непомірних витрат на суто моделі для міркування. Подібним чином, «Luna Pro» пропонує золоту середину для користувачів, яким потрібна більша надійність, ніж у стандартної моделі, але які не можуть дозволити собі затримку повного циклу роботи Sol.
Хоча OpenAI офіційно не коментувала ці назви або конкретну вартість токенів (яка була помітно відсутня в розрахунках обчислювальних ресурсів у звіті), технічна дорожня карта зрозуміла. Ера єдиного флагмана закінчується, поступаючись місцем спеціалізованій екосистемі моделей професійного рівня.
Основні висновки
- Багаторівнева архітектура Pro: OpenAI, ймовірно, переходить до лінійки з трьох моделей Pro (Sol, Terra та Luna) замість однієї підписки найвищого рівня.
- Переважне міркування: Sol Pro встановила новий стандарт у геноміці з показником успішності 31,5%, значно перевершивши таких конкурентів, як Claude Opus 4.8.
- Підвищення ефективності: Нова структура дозволяє користувачам обирати між максимальною потужністю міркування, високою пропускною здатністю або економічно вигідною швидкістю.
