В научной работе OpenAI раскрыта новая многоуровневая линейка моделей GPT-5.6 Pro

Недавно опубликованная OpenAI научная работа по геномным бенчмаркам случайно приоткрыла завесу тайны над будущим ChatGPT Pro. Судя по данным, вместо одной флагманской модели OpenAI готовит сложную трехступенчатую линейку «Pro», предназначенную для баланса между мощностью рассуждений, пропускной способностью и стоимостью.

Три столпа: Sol, Terra и Luna Pro

На протяжении большей части своей истории предложение «Pro» от OpenAI представляло собой единый монолитный уровень — самую совершенную модель, доступную для продвинутых пользователей. Однако в утекшей работе по геномике представлены три различных варианта «Pro (Extended)», которые повторяют существующую архитектуру GPT-5.6: Sol Pro, Terra Pro и Luna Pro.

На основе бенчмарков эти модели классифицируются по их целевому назначению:

  • Sol Pro: Мощная модель с высоким уровнем рассуждений, предназначенная для самых сложных многоэтапных аналитических задач.
  • Terra Pro: Высокопроизводительный вариант, оптимизированный для огромных бизнес-нагрузок и пропускной способности корпоративного уровня.
  • Luna Pro: Легковесный, быстрый и экономичный вариант, предназначенный для высокочастотных повседневных запросов.

Бенчмаркинг скачка производительности

Геномный бенчмарк предоставляет конкретные доказательства разницы в производительности между стандартными моделями и их Pro-аналогами. В исследовании измерялся «процент успешного выполнения» (pass rate) — способность завершить многоэтапный анализ без ошибок — в рамках набора из 129 задач.

Результаты показывают, что варианты Pro обеспечивают значительный прирост интеллекта, особенно для младших уровней. Sol Pro стал бесспорным лидером, достигнув показателя в 31,5%. Это превосходит стандартную модель Sol (28,7%) и значительно затмевает нынешних тяжеловесов индустрии, таких как Claude Opus 4.8, результат которой составил 16,0%.

Интересно, что «Pro-ускорение» неоднородно. Данные показывают, что дополнительные вычислительные мощности приносят всё меньше пользы по мере роста сложности модели. В то время как Luna Pro показала огромный скачок в 7 пунктов по сравнению со стандартной версией, Sol Pro продемонстрировала более скромный рост — менее чем на 3 пункта. Примечательно, что Terra Pro достигла показателя в 28,5%, что означает, что высокопроизводительная Pro-модель от OpenAI работает почти так же хорошо, как стандартная флагманская модель Sol.

Стратегический сдвиг в развертывании ИИ

Это разоблачение знаменует собой фундаментальный сдвиг в продуктовой стратегии OpenAI. Отходя от принципа «один размер подходит всем» для уровня Pro, OpenAI решает основную проблему разработчиков и предприятий: поиск компромисса между интеллектом и эффективностью.

Предоставление «Terra Pro», которая соответствует интеллекту флагмана, но оптимизирована для больших объемов, позволяет компаниям масштабировать ИИ-агентов без непомерных затрат, характерных для чисто «рассуждающих» моделей. Аналогично, «Luna Pro» предлагает золотую середину для пользователей, которым нужна большая надежность, чем у стандартной модели, но которые не могут позволить себе задержки при полном запуске Sol.

Хотя OpenAI официально не прокомментировала эти названия или конкретную стоимость токенов (которые заметно отсутствовали в расчетах вычислительных мощностей в работе), техническая дорожная карта ясна. Эра единого флагмана заканчивается, уступая место специализированной экосистеме моделей профессионального уровня.

Основные выводы

  • Многоуровневая архитектура Pro: OpenAI, вероятно, переходит к линейке из трех моделей Pro (Sol, Terra и Luna) вместо единой подписки высшего уровня.
  • Превосходство в рассуждениях: Sol Pro установила новый стандарт в геномике с показателем 31,5%, значительно опередив таких конкурентов, как Claude Opus 4.8.
  • Повышение эффективности: Новая структура позволяет пользователям выбирать между максимальной мощностью рассуждений, высокой пропускной способностью или экономичной скоростью.