OpenAI und Broadcom enthüllen Jalapeño: Ein maßgeschneiderter Chip für die LLM-Inferenz

Translated for your language. Original lesen.

AI-assisted draft.

GyaanSetu Editorialletzte Woche2Min. Lesezeit

OpenAI und Broadcom enthüllen Jalapeño: Ein maßgeschneiderter Chip für die LLM-Inferenz

In diesem Artikel

OpenAI und Broadcom enthüllen Jalapeño: Ein maßgeschneiderter Chip für LLM-Inferenz

OpenAI geht offiziell über Software hinaus und wagt den Schritt in den Bereich des Custom Silicon mit der Ankündigung von „Jalapeño“, einem dedizierten Intelligence Processor. Dieser in Partnerschaft mit Broadcom entwickelte maßgeschneiderte Beschleuniger ist darauf ausgelegt, die Inferenz großer Sprachmodelle (LLM) in massivem Maßstab zu optimieren.

Eine zweckgebundene Architektur für moderne LLMs

Im Gegensatz zu vielen aktuellen Lösungen, die auf modifizierten Allzweck-GPUs basieren, ist Jalapeño ein von Grund auf neu entwickeltes Design, das speziell für die einzigartigen Anforderungen der LLM-Inferenz konzipiert wurde. Das Ziel ist es, die primären Engpässe moderner KI zu lösen: Datentransfer und Hardware-Unterauslastung. Durch die Optimierung der Architektur, um die Auslastung näher an das theoretische Maximum zu bringen, strebt OpenAI eine signifikante Verbesserung der Performance pro Watt im Vergleich zu aktueller State-of-the-Art-Hardware an.

Obwohl OpenAI noch keinen finalen technischen Bericht oder unabhängige Benchmarks veröffentlicht hat, deuten erste interne Tests auf erhebliche Effizienzsteigerungen hin. Engineering-Samples werden bereits in Laborumgebungen eingesetzt, um komplexe Machine-Learning-Workloads auszuführen, einschließlich des GPT-5.3-Codex-Spark-Modells – eines Modells, das derzeit für seine Inferenzanforderungen auf Cerebras-Hardware angewiesen ist.

Eine leistungsstarke Zusammenarbeit mehrerer Unternehmen

Die Entwicklung von Jalapeño ist eine anspruchsvolle Multi-Partner-Anstrengung, die den gesamten Hardware-Stack umfasst. OpenAI leitet das Chipdesign und nutzt seine eigenen KI-Modelle, um den Entwicklungszyklus zu beschleunigen, der Berichten zufolge nur neun Monate vom Design bis zum Tape-out dauerte. Broadcom liefert die entscheidende Expertise in der Siliziumfertigung sowie fortschrittliche Netzwerktechnologie, einschließlich seiner Hochleistungs-Tomahawk-Netzwerkchips. Celestica vervollständigt das Ökosystem und ist für die Boards, Racks und die vollständige Systemintegration verantwortlich.

Diese Zusammenarbeit stellt einen strategischen Wendepunkt für OpenAI dar: Das Unternehmen wandelt sich von einem reinen Modell- und Produktanbieter zu einem Akteur, der den zugrunde liegenden Hardware-Stack kontrolliert. Durch den Besitz des Siliziums kann OpenAI seine Modelle theoretisch schneller, zuverlässiger und zu weitaus geringeren Kosten ausführen als Wettbewerber, die auf Drittanbieter angewiesen sind.

Skalierung auf Gigawatt-Ebene bis 2026

Die Roadmap für Jalapeño ist äußerst ambitioniert. Broadcom-CEO Hock Tan hat angedeutet, dass der erste Einsatz für Ende 2026 geplant ist, mit der Absicht, zusammen mit Microsoft und anderen strategischen Partnern auf Gigawatt-Ebene zu operieren. Das Ausmaß dieses Rollouts unterstreicht die massiven Infrastrukturanforderungen der KI der nächsten Generation.

Berichten zufolge umfasst die Partnerschaft bedeutende kommerzielle Verpflichtungen, wobei Microsoft voraussichtlich 40 Prozent der anfänglichen Chipproduktion abnehmen wird, um die erste Phase abzusichern. Dieses Maß an vertikaler Integration und garantierter Nachfrage signalisiert einen wichtigen Schritt zur Stabilisierung der kosten- und energieintensiven Lieferkette, die für die Aufrechterhaltung der KI-Revolution erforderlich ist.

Die wichtigsten Erkenntnisse

Custom-Silicon-Strategie: Jalapeño ist ein „Intelligence Processor“, der von Grund auf für die LLM-Inferenz entwickelt wurde und darauf abzielt, herkömmliche Allzweck-Hardware bei der Performance pro Watt zu übertreffen.
Schnelle Entwicklung: Durch den Einsatz eigener KI-Modelle zur Beschleunigung des Prozesses erreichte OpenAI einen Zyklus von neun Monaten vom Design bis zum Tape-out – ein Rekord für Hochleistungs-ASICs.
Massive Skalierung beim Rollout: Der erste großflächige Einsatz ist für Ende 2026 auf Gigawatt-Ebene geplant, unterstützt durch Broadcom und Microsoft.

OpenAI und Broadcom enthüllen Jalapeño: Ein maßgeschneiderter Chip für die LLM-Inferenz

OpenAI und Broadcom enthüllen Jalapeño: Ein maßgeschneiderter Chip für LLM-Inferenz

Eine zweckgebundene Architektur für moderne LLMs

Eine leistungsstarke Zusammenarbeit mehrerer Unternehmen

Skalierung auf Gigawatt-Ebene bis 2026

Die wichtigsten Erkenntnisse

Weiterlesen

OpenAI Unveils Jalapeño: Its First Custom AI Inference Chip

OpenAI enthüllt Jalapeño: Seinen ersten maßgeschneiderten KI-Inferenz-Chip

Ein Blick in die Mathematik: Wie OpenAIs Jalapeño-Chip auf die KI-Ökonomie abzielt

OpenAIs Jalapeño-Chip: Ein strategischer Wandel weg von der Nvidia-Dominanz

OpenAI Jalapeño-Chip: Wie OpenAI die KI-Kosten um 50 % senkt