OpenAI та Broadcom представляють Jalapeño: спеціалізований чип для інференсу LLM
OpenAI офіційно виходить за межі програмного забезпечення, розпочинаючи роботу з власними чипами завдяки анонсу «Jalapeño» — спеціалізованого процесора інтелекту (Intelligence Processor). Розроблений у партнерстві з Broadcom, цей кастомний прискорювач призначений для оптимізації інференсу великих мовних моделей (LLM) у величезних масштабах.
Спеціалізована архітектура для сучасних LLM
На відміну від багатьох сучасних рішень, що базуються на модифікованих універсальних GPU, Jalapeño — це архітектура, розроблена з нуля спеціально під унікальні потреби інференсу LLM. Мета полягає в усуненні основних вузьких місць сучасного ШІ: переміщення даних та недостатнього використання апаратного забезпечення. Оптимізуючи архітектуру для наближення рівня використання до теоретичного максимуму, OpenAI прагне значно підвищити продуктивність на ват порівняно з сучасним передовим обладнанням.
Хоча OpenAI ще не оприлюднила остаточний технічний звіт або незалежні бенчмарки, перші внутрішні тести свідчать про суттєве зростання ефективності. Інженерні зразки вже використовуються в лабораторних умовах для виконання складних робочих навантажень машинного навчання, зокрема моделі GPT-5.3-Codex-Spark — моделі, яка наразі покладається на обладнання Cerebras для потреб інференсу.
Потужна багатостороння співпраця
Розробка Jalapeño — це складний багатосторонній процес, що охоплює весь апаратний стек. OpenAI очолює проектування чипа, використовуючи власні моделі ШІ для прискорення циклу розробки, який, за повідомленнями, тривав лише дев'ять місяців від етапу проектування до tape-out. Broadcom забезпечує критично важливий досвід у виробництві кремнію та передові мережеві технології, включаючи свої високопродуктивні мережеві чипи Tomahawk. Завершує екосистему компанія Celestica, яка відповідає за плати, стійки та повну системну інтеграцію.
Ця співпраця є стратегічним зсувом для OpenAI: компанія перетворюється з розробника лише моделей і продуктів на гравця, що контролює базовий апаратний стек. Володіючи власним кремнієм, OpenAI теоретично може запускати свої моделі швидше, надійніше та за значно нижчою вартістю, ніж конкуренти, які покладаються на сторонніх постачальників.
Масштабування до гігаватних рівнів до 2026 року
Дорожня карта Jalapeño є надзвичайно амбітною. Генеральний директор Broadcom Хок Тан зазначив, що перше розгортання заплановане на кінець 2026 року з наміром працювати в гігаватних масштабах разом із Microsoft та іншими стратегічними партнерами. Масштаб цього впровадження підкреслює величезні інфраструктурні потреби ШІ наступного покоління.
Згідно з повідомленнями, партнерство включає значні комерційні зобов'язання: очікується, що Microsoft гарантує закупівлю 40 відсотків початкової продукції чипів для забезпечення першої фази. Такий рівень вертикальної інтеграції та гарантованого попиту свідчить про серйозний крок до стабілізації високовартісного та енергоємного ланцюга постачання, необхідного для підтримки революції ШІ.
Основні висновки
- Стратегія спеціалізованого кремнію: Jalapeño — це «процесор інтелекту» (Intelligence Processor), розроблений з нуля для інференсу LLM, що має перевершити універсальне обладнання за показником продуктивності на ват.
- Швидка розробка: Використовуючи власні моделі ШІ для прискорення процесу, OpenAI досягла циклу від проектування до tape-out тривалістю лише дев'ять місяців, що є рекордом для високопродуктивних ASIC.
- Масштабне розгортання: Перше великомасштабне розгортання заплановане на кінець 2026 року в гігаватних масштабах за підтримки Broadcom та Microsoft.
