Сэм Альтман утверждает, что скептики масштабирования тормозили развитие ИИ
Генеральный директор OpenAI Сэм Альтман вновь заявляет о силе масштабирования, утверждая, что предыдущее поколение исследователей тормозило прогресс, недооценивая потенциал больших языковых моделей (LLM). На фоне обостряющихся споров о пределах архитектуры трансформеров, Альтман утверждает, что эмпирические данные убедительно свидетельствуют в пользу дальнейшего наращивания вычислительных мощностей и объемов данных.
Цена интеллектуального догматизма
Во время недавнего выступления в Стэнфорде Альтман затронул тему трений между сторонниками масштабирования и скептиками, особо упомянув таких критиков, как Ян Лекун из Meta, который прославился тем, что назвал LLM «тупиковым путем». Альтман предполагает, что большая часть сопротивления гипотезе масштабирования проистекает из чрезмерной уверенности исследователей в своих прогнозах относительно того, чего ИИ не может делать.
Он аргументировал это тем, что некоторые деятели индустрии связали свою профессиональную идентичность с определенными теоретическими позициями, что делает их невосприимчивыми к новым данным, противоречащим их давним убеждениям. Признавая, что «модели мира» необходимы для прогресса в таких областях, как робототехника, Альтман настаивает на том, что нынешняя траектория развития LLM — это не отклонение от курса, а основной двигатель интеллекта.
Эмпирические доказательства: выход за рамки сопоставления шаблонов
Одним из наиболее значимых аргументов в защите масштабирования со стороны Альтмана является переход LLM от простых предсказателей текста к инструментам, способным к оригинальным рассуждениям. Он привел в пример недавнее достижение, когда модель OpenAI успешно опровергла математическую гипотезу, которая долгое время оставалась нерешенной для экспертов-людей.
Это событие имеет решающее значение, поскольку оно бросает вызов утверждению о том, что LLM — это всего лишь «стохастические попугаи», неспособные на подлинные открытия. «Очевидно, что LLM способны добывать новые знания», — заявил Альтман, отметив, что математическое сообщество сейчас активно осмысляет последствия доказательств, полученных с помощью ИИ. Этот сдвиг указывает на то, что масштабирование не просто улучшает беглость речи, оно расширяет горизонты когнитивных способностей.
Новые рубежи: рассуждение против долгосрочных задач
Несмотря на свой оптимизм, Альтман сохраняет реалистичный взгляд на текущие ограничения технологии. Он отметил явный разрыв в производительности, когда речь заходит о «задачах с долгосрочной перспективой» (long-horizon tasks) — сложных рабочих процессах, требующих устойчивого высокоуровневого суждения и многоэтапного планирования в течение длительного времени. В этих конкретных областях он признал, что LLM все еще «кажутся гораздо слабее людей».
Для всего ландшафта ИИ это различие определяет следующий рубеж исследований. Индустрия переходит от фазы «масштабирования ради знаний» к фазе «масштабирования ради рассуждений и агентности» (reasoning and agency). Поскольку такие компании, как OpenAI и Anthropic (возглавляемая генеральным директором Дарио Амодеи, который разделяет убежденность Альтмана в важности масштабирования), продолжают вливать миллиарды в вычислительные мощности, целью является преодоление разрыва между мгновенным интеллектом и надежной долгосрочной автономностью.
Основные выводы
- Масштабирование — основной драйвер: Альтман утверждает, что недооценка влияния увеличения вычислительных мощностей и объемов данных исторически замедляла темпы прорывов в области ИИ.
- Открытия важнее имитации: Способность моделей OpenAI решать сложные математические гипотезы доказывает, что LLM движутся в сторону подлинного создания знаний.
- Следующее «узкое место»: Хотя масштабирование решает многие проблемы, достижение уровня человеческих возможностей в задачах с долгосрочной перспективой и требующих высокого уровня суждений остается следующим серьезным препятствием для индустрии.