OpenAI e Broadcom svelano Jalapeño: un chip personalizzato per l'inferenza di LLM

OpenAI sta ufficialmente andando oltre il software avventurandosi nel settore del silicio personalizzato con l'annuncio di "Jalapeño", un Intelligence Processor dedicato. Sviluppato in collaborazione con Broadcom, questo acceleratore custom è progettato per ottimizzare l'inferenza dei modelli linguistici di grandi dimensioni (LLM) su scala massiccia.

Un'architettura progettata appositamente per i moderni LLM

A differenza di molte soluzioni attuali che si affidano a GPU general-purpose modificate, Jalapeño è un progetto nato da zero, ingegnerizzato specificamente per le esigenze uniche dell'inferenza LLM. L'obiettivo è risolvere i principali colli di bottiglia dell'IA moderna: il movimento dei dati e la sottoutilizzazione dell'hardware. Ottimizzando l'architettura per spingere l'utilizzo il più vicino possibile al suo massimo teorico, OpenAI punta a migliorare significativamente le prestazioni per watt rispetto all'hardware allo stato dell'arte attuale.

Sebbene OpenAI non abbia ancora rilasciato un rapporto tecnico definitivo o benchmark indipendenti, i primi test interni suggeriscono guadagni di efficienza sostanziali. Campioni ingegneristici sono già in uso in ambienti di laboratorio per eseguire carichi di lavoro di machine learning complessi, incluso il modello GPT-5.3-Codex-Spark, un modello che attualmente si affida all'hardware Cerebras per le proprie esigenze di inferenza.

Una collaborazione di potenza tra più aziende

Lo sviluppo di Jalapeño è uno sforzo sofisticato che coinvolge più partner e che abbraccia l'intero stack hardware. OpenAI guida la progettazione del chip, sfruttando i propri modelli di IA per accelerare il ciclo di sviluppo, che si dice sia durato solo nove mesi dal design al tape-out. Broadcom fornisce l'esperienza critica nella produzione di silicio e la tecnologia di rete avanzata, inclusi i suoi chip di rete ad alte prestazioni Tomahawk. A completare l'ecosistema, Celestica è responsabile delle schede, dei rack e dell'integrazione completa del sistema.

Questa collaborazione rappresenta un cambiamento strategico per OpenAI, che passa dall'essere un'azienda focalizzata esclusivamente su modelli e prodotti a una che controlla lo stack hardware sottostante. Possedendo il silicio, OpenAI può teoricamente eseguire i propri modelli più velocemente, in modo più affidabile e a un costo molto inferiore rispetto ai concorrenti che si affidano a fornitori terzi.

Scalare a livelli di gigawatt entro il 2026

La roadmap per Jalapeño è estremamente ambiziosa. L'amministratore delegato di Broadcom, Hock Tan, ha indicato che il primo deployment è previsto per la fine del 2026, con l'intenzione di operare su scala gigawatt insieme a Microsoft e altri partner strategici. La portata di questo rollout sottolinea i massicci requisiti infrastrutturali dell'IA di prossima generazione.

I rapporti suggeriscono che la partnership includa impegni commerciali significativi, con Microsoft che dovrebbe garantire l'acquisto del 40 percento della produzione iniziale di chip per assicurare la prima fase. Questo livello di integrazione verticale e domanda garantita segnala un importante passo verso la stabilizzazione della catena di approvvigionamento ad alto costo e ad alto consumo energetico necessaria per sostenere la rivoluzione dell'IA.

Punti chiave

  • Strategia del silicio personalizzato: Jalapeño è un "Intelligence Processor" progettato da zero per l'inferenza LLM, con l'obiettivo di superare l'hardware general-purpose in termini di prestazioni per watt.
  • Sviluppo rapido: Utilizzando i propri modelli di IA per accelerare il processo, OpenAI ha raggiunto un ciclo di nove mesi dal design al tape-out, un record per gli ASIC ad alte prestazioni.
  • Deployment su scala massiccia: Il primo deployment su larga scala è previsto per la fine del 2026 su scala gigawatt, con il supporto di Broadcom e Microsoft.