OpenAI и Broadcom представляют Jalapeño: специализированный чип для инференса LLM

Translated for your language. Читать оригинал.

AI-assisted draft.

GyaanSetu Editorialна прошлой неделе2мин чтения

В этой статье

OpenAI и Broadcom представляют Jalapeño: специализированный чип для инференса LLM

OpenAI официально выходит за рамки программного обеспечения, осваивая разработку специализированных полупроводников с анонсом «Jalapeño» — выделенного процессора для задач искусственного интеллекта (Intelligence Processor). Разработанный в партнерстве с Broadcom, этот специализированный ускоритель предназначен для оптимизации инференса больших языковых моделей (LLM) в колоссальных масштабах.

Специализированная архитектура для современных LLM

В отличие от многих современных решений, полагающихся на модифицированные GPU общего назначения, Jalapeño представляет собой архитектуру, спроектированную с нуля специально под уникальные требования инференса LLM. Цель состоит в том, чтобы устранить основные «узкие места» современного ИИ: перемещение данных и неполную загрузку оборудования. Оптимизируя архитектуру для приближения коэффициента использования к теоретическому максимуму, OpenAI стремится значительно повысить производительность на ватт по сравнению с современным передовым оборудованием.

Хотя OpenAI еще не опубликовала окончательный технический отчет или результаты независимых бенчмарков, первые внутренние тесты указывают на существенный прирост эффективности. Инженерные образцы уже используются в лабораторных условиях для выполнения сложных задач машинного обучения, включая модель GPT-5.3-Codex-Spark — модель, которая на данный момент использует оборудование Cerebras для своих нужд в инференсе.

Мощное многостороннее сотрудничество

Разработка Jalapeño — это сложный многосторонний процесс, охватывающий весь стек аппаратного обеспечения. OpenAI руководит проектированием чипа, используя собственные модели ИИ для ускорения цикла разработки, который, по сообщениям, занял всего девять месяцев от проектирования до этапа tape-out. Broadcom предоставляет критически важный опыт в производстве полупроводников и передовые сетевые технологии, включая свои высокопроизводительные сетевые чипы Tomahawk. Замыкает экосистему компания Celestica, отвечающая за платы, стойки и полную системную интеграцию.

Это сотрудничество знаменует собой стратегический сдвиг для OpenAI: переход от компании, сосредоточенной исключительно на моделях и продуктах, к компании, контролирующей базовый стек аппаратного обеспечения. Владея собственными чипами, OpenAI теоретически сможет запускать свои модели быстрее, надежнее и с гораздо меньшими затратами, чем конкуренты, зависящие от сторонних поставщиков.

Масштабирование до гигаваттных уровней к 2026 году

Дорожная карта Jalapeño крайне амбициозна. Генеральный директор Broadcom Хок Тан (Hock Tan) заявил, что первое развертывание запланировано на конец 2026 года с намерением выйти на гигаваттный масштаб совместно с Microsoft и другими стратегическими партнерами. Масштаб этого развертывания подчеркивает колоссальные инфраструктурные требования ИИ следующего поколения.

Сообщается, что партнерство включает значительные коммерческие обязательства: ожидается, что Microsoft гарантирует закупку 40 процентов первоначального объема производства чипов для обеспечения первой фазы. Такой уровень вертикальной интеграции и гарантированного спроса сигнализирует о масштабном шаге к стабилизации дорогостоящей и энергоемкой цепочки поставок, необходимой для поддержания революции в области ИИ.

Основные выводы

Стратегия разработки специализированных чипов: Jalapeño — это «процессор для задач ИИ» (Intelligence Processor), спроектированный с нуля для инференса LLM и нацеленный на превосходство над оборудованием общего назначения по показателю производительности на ватт.
Сверхбыстрая разработка: Используя собственные модели ИИ для ускорения процесса, OpenAI достигла цикла от проектирования до tape-out всего в девять месяцев, что является рекордом для высокопроизводительных ASIC.
Масштабное развертывание: Первое крупномасштабное развертывание запланировано на конец 2026 года в гигаваттном масштабе при поддержке Broadcom и Microsoft.

OpenAI и Broadcom представляют Jalapeño: специализированный чип для инференса LLM

OpenAI и Broadcom представляют Jalapeño: специализированный чип для инференса LLM

Специализированная архитектура для современных LLM

Мощное многостороннее сотрудничество

Масштабирование до гигаваттных уровней к 2026 году

Основные выводы

Продолжить чтение

OpenAI представляет Jalapeño: свой первый специализированный чип для ИИ-вычислений

OpenAI представляет Jalapeño: свой первый специализированный чип для инференса ИИ

Разбор математики: как чип Jalapeño от OpenAI меняет экономику ИИ

Чип Jalapeño от OpenAI: стратегический отход от доминирования Nvidia

Чип OpenAI Jalapeño: как OpenAI сокращает расходы на ИИ на 50%