OpenAI dan Broadcom Dedahkan Jalapeño: Cip Tersuai untuk Inferens LLM

OpenAI secara rasminya melangkah melampaui perisian dengan menceburi bidang silikon tersuai melalui pengumuman "Jalapeño," sebuah Pemproses Kecerdasan (Intelligence Processor) khusus. Dibangunkan melalui kerjasama dengan Broadcom, pemecut tersuai ini direka untuk mengoptimumkan inferens model bahasa besar (LLM) pada skala yang sangat besar.

Seni Bina Dibina Khusus untuk LLM Moden

Berbeza dengan kebanyakan penyelesaian semasa yang bergantung kepada GPU kegunaan am yang telah diubah suai, Jalapeño adalah reka bentuk dari peringkat asas yang direka khusus untuk keperluan unik inferens LLM. Matlamatnya adalah untuk menyelesaikan kekangan utama AI moden: pergerakan data dan penggunaan perkakasan yang tidak optimum. Dengan mengoptimumkan seni bina untuk memacu penggunaan lebih dekat dengan tahap maksimum teori, OpenAI menyasarkan untuk meningkatkan prestasi per watt secara signifikan berbanding perkakasan tercanggih masa kini.

Walaupun OpenAI belum mengeluarkan laporan teknikal muktamad atau penanda aras bebas, ujian dalaman awal menunjukkan peningkatan kecekapan yang ketara. Sampel kejuruteraan sudah mula digunakan dalam persekitaran makmal untuk menjalankan beban kerja pembelajaran mesin yang kompleks, termasuk model GPT-5.3-Codex-Spark—sebuah model yang kini bergantung kepada perkakasan Cerebras untuk keperluan inferensnya.

Kolaborasi Berkuasa Pelbagai Syarikat

Pembangunan Jalapeño merupakan usaha pelbagai rakan kongsi yang canggih merangkumi keseluruhan timbunan perkakasan (hardware stack). OpenAI menerajui reka bentuk cip, memanfaatkan model AI miliknya sendiri untuk mempercepatkan kitaran pembangunan, yang dilaporkan hanya mengambil masa sembilan bulan dari reka bentuk hingga ke peringkat tape-out. Broadcom menyediakan kepakaran pembuatan silikon yang kritikal dan teknologi rangkaian lanjutan, termasuk cip rangkaian Tomahawk berprestasi tinggi miliknya. Melengkapkan ekosistem ini, Celestica bertanggungjawab bagi papan litar, rak, dan integrasi sistem penuh.

Kolaborasi ini mewakili anjakan strategik bagi OpenAI, beralih daripada syarikat yang hanya menumpukan kepada model dan produk kepada syarikat yang mengawal keseluruhan timbunan perkakasan asas. Dengan memiliki silikon tersebut, OpenAI secara teorinya boleh menjalankan modelnya dengan lebih pantas, lebih dipercayai, dan pada kos yang jauh lebih rendah berbanding pesaing yang bergantung kepada penyedia pihak ketiga.

Penskalaan ke Tahap Gigawatt menjelang 2026

Hala tuju (roadmap) untuk Jalapeño sangat bercita-cita tinggi. CEO Broadcom, Hock Tan, telah menyatakan bahawa pelaksanaan pertama dirancang untuk akhir tahun 2026, dengan niat untuk beroperasi pada skala gigawatt bersama Microsoft dan rakan strategik lain. Skala pelancaran ini menekankan keperluan infrastruktur yang besar bagi AI generasi seterusnya.

Laporan menunjukkan bahawa kerjasama ini merangkumi komitmen komersial yang signifikan, dengan Microsoft dilaporkan dijangka menjamin pembelian 40 peratus daripada pengeluaran cip awal untuk mengamankan fasa pertama. Tahap integrasi menegak dan permintaan terjamin ini menandakan langkah besar ke arah menstabilkan rantaian bekalan kos tinggi dan tenaga tinggi yang diperlukan untuk mengekalkan revolusi AI.

Ringkasan Utama

  • Strategi Silikon Tersuai: Jalapeño ialah "Pemproses Kecerdasan" yang direka dari awal untuk inferens LLM, bertujuan untuk mengatasi prestasi perkakasan kegunaan am dari segi prestasi per watt.
  • Pembangunan Pantas: Dengan menggunakan model AI miliknya sendiri untuk mempercepatkan proses, OpenAI mencapai kitaran reka bentuk-ke-tape-out selama sembilan bulan, satu rekod bagi ASIC berprestasi tinggi.
  • Pelaksanaan Skala Besar: Pelaksanaan skala besar yang pertama disasarkan pada akhir 2026 pada skala gigawatt, dengan sokongan daripada Broadcom dan Microsoft.