OpenAI en Broadcom onthullen Jalapeño: een custom chip voor LLM-inferentie

OpenAI gaat officieel verder dan alleen software door de stap te wagen naar custom silicon met de aankondiging van "Jalapeño", een speciale Intelligence Processor. Deze custom accelerator, ontwikkeld in samenwerking met Broadcom, is ontworpen om de inferentie van large language models (LLM's) op enorme schaal te optimaliseren.

Een speciaal ontwikkelde architectuur voor moderne LLM's

In tegenstelling tot veel huidige oplossingen die vertrouwen op aangepaste general-purpose GPU's, is Jalapeño een ontwerp vanaf de grond af aan dat specifiek is ontwikkeld voor de unieke eisen van LLM-inferentie. Het doel is om de belangrijkste knelpunten van moderne AI op te lossen: datatransport en onderbenutting van hardware. Door de architectuur te optimaliseren om de benutting dichter bij het theoretische maximum te brengen, streeft OpenAI ernaar om de prestaties per watt aanzienlijk te verbeteren ten opzichte van de huidige state-of-the-art hardware.

Hoewel OpenAI nog geen definitief technisch rapport of onafhankelijke benchmarks heeft vrijgegeven, wijzen vroege interne tests op aanzienlijke efficiëntiewinsten. Engineering-samples worden al gebruikt in laboratoriumomgevingen om complexe machine learning-workloads uit te voeren, waaronder het GPT-5.3-Codex-Spark-model — een model dat momenteel voor zijn inferentiebehoeften afhankelijk is van Cerebras-hardware.

Een samenwerking tussen meerdere techreuzen

De ontwikkeling van Jalapeño is een geavanceerde inspanning met meerdere partners die de gehele hardwarestack beslaat. OpenAI leidt het chipontwerp en maakt gebruik van de eigen AI-modellen om de ontwikkelingscyclus te versnellen, die naar verluidt slechts negen maanden duurde van ontwerp tot tape-out. Broadcom levert de cruciale expertise op het gebied van silicon manufacturing en geavanceerde netwerktechnologie, waaronder de high-performance Tomahawk-netwerkchips. Als sluitstuk van het ecosysteem is Celestica verantwoordelijk voor de printplaten, racks en volledige systeemintegratie.

Deze samenwerking vertegenwoordigt een strategische verschuiving voor OpenAI: van een bedrijf dat zich uitsluitend richt op modellen en producten naar een bedrijf dat de onderliggende hardwarestack beheert. Door eigenaar te zijn van de silicon, kan OpenAI zijn modellen theoretisch sneller, betrouwbaarder en tegen veel lagere kosten draaien dan concurrenten die afhankelijk zijn van externe leveranciers.

Opschalen naar gigawattniveaus tegen 2026

De roadmap voor Jalapeño is zeer ambitieus. Broadcom-CEO Hock Tan heeft aangegeven dat de eerste uitrol gepland staat voor eind 2026, met de bedoeling om op gigawatt-schaal te opereren samen met Microsoft en andere strategische partners. De omvang van deze uitrol onderstreept de enorme infrastructuurvereisten van de volgende generatie AI.

Rapporten suggereren dat de samenwerking aanzienlijke commerciële toezeggingen omvat, waarbij Microsoft naar verluidt wordt verwacht 40 procent van de initiële chipproductie te garanderen om de eerste fase veilig te stellen. Dit niveau van verticale integratie en gegarandeerde vraag signaleert een belangrijke stap richting het stabiliseren van de kostbare en energie-intensieve toeleveringsketen die nodig is om de AI-revolutie in stand te houden.

Kernpunten

  • Custom Silicon-strategie: Jalapeño is een "Intelligence Processor" die vanaf de basis is ontworpen voor LLM-inferentie, met als doel general-purpose hardware te overtreffen in prestaties per watt.
  • Snelle ontwikkeling: Door de eigen AI-modellen te gebruiken om het proces te versnellen, realiseerde OpenAI een cyclus van ontwerp tot tape-out van slechts negen maanden, een record voor high-performance ASIC's.
  • Grootschalige uitrol: De eerste grootschalige uitrol is gepland voor eind 2026 op gigawatt-schaal, ondersteund door Broadcom en Microsoft.