OpenAI представляет Jalapeño: свой первый специализированный чип для ИИ-инференса

OpenAI официально вступила в «гонку кремния», анонсировав Jalapeño — свой первый специализированный процессор для инференса, разработанный в сотрудничестве с Broadcom. Этот стратегический шаг знаменует собой значительный сдвиг в инфраструктурной стратегии OpenAI, направленный на оптимизацию способов развертывания её масштабных моделей для пользователей.

Преодоление зависимости от GPU от Nvidia

На протяжении многих лет индустрия ИИ сильно зависела от высокопроизводительных GPU от Nvidia. Однако OpenAI встает в один ряд с такими технологическими гигантами, как Google и Amazon, разрабатывая собственные «ИИ-акселераторы» — специализированные чипы, предназначенные для выполнения конкретных задач машинного обучения. В то время как Nvidia остается золотым стандартом в плане колоссальной вычислительной мощности, необходимой для предварительного обучения (pre-training) передовых моделей, OpenAI нацелилась на следующее критическое «узкое место»: инференс.

Jalapeño спроектирован специально для инференса — этапа, на котором предварительно обученная модель обрабатывает команды пользователя для генерации ответов. Сосредоточившись на этой конкретной фазе, OpenAI стремится снизить зависимость от универсального оборудования и получить детальный контроль над своими операционными расходами.

Производительность на ватт и экономическая эффективность

Одним из наиболее значимых технических заявлений относительно Jalapeño является его эффективность. OpenAI сообщает, что первые испытания показывают значительно более высокую производительность на ватт по сравнению с современными аналогами. В мире гипермасштабируемого ИИ энергоэффективность — это не просто технический показатель, а ключевой экономический фактор.

Компания особо отметила способность чипа снижать операционные расходы при работе с моделями кодинга в реальном времени. По мере того как OpenAI расширяет свои агентские продукты, такие как Codex, возможность выполнения сложных задач рассуждения с более низкой стоимостью за токен станет жизненно важной для поддержания высокой маржинальности и обеспечения доступности ИИ как для разработчиков, так и для корпоративных пользователей.

Вертикальная интеграция: оптимизация всего стека ИИ

Разработка Jalapeño является свидетельством стремления OpenAI к вертикальной интеграции. Компания больше не является просто разработчиком моделей; она становится поставщиком инфраструктуры. Стратегия OpenAI предполагает оптимизацию каждого уровня технологического стека, включая архитектуру чипа, ядра (kernels), системы памяти, сетевое взаимодействие и планирование развертывания.

Примечательно, что OpenAI использовала собственные модели ИИ для помощи в проектировании и разработке чипа Jalapeño. Эта петля обратной связи — когда ИИ проектирует оборудование, на котором в конечном итоге будет работать следующее поколение ИИ — представляет собой сложную эволюцию в проектировании аппаратного обеспечения. Контролируя оборудование, OpenAI может гарантировать идеальную синхронизацию своего программного обеспечения и кремния, что приведет к более быстрой и надежной работе моделей.

Основные выводы

  • Целевой инференс: Jalapeño — это специализированный процессор для инференса, разработанный OpenAI и Broadcom для оптимизации развертывания моделей, а не процесса их первоначального обучения.
  • Повышение эффективности: Первые результаты указывают на превосходную производительность на ватт, что особенно важно для снижения операционных расходов в приложениях реального времени, таких как модели кодинга.
  • Полностековая стратегия: OpenAI движется к полной вертикальной интеграции, проектируя всё: от архитектуры чипа и систем памяти до агентских продуктов, работающих на этом оборудовании.