OpenAI Melancarkan Jalapeño: Cip Inferens AI Tersuai Pertamanya

OpenAI telah secara rasmi memasuki perlumbaan silikon dengan pengumuman Jalapeño, sebuah pemproses kecerdasan rekaan tersuai yang dibina melalui kerjasama dengan Broadcom. Langkah strategik ini menandakan peralihan besar dalam cara gergasi AI tersebut merancang untuk menskalakan infrastrukturnya dan menguruskan permintaan pengkomputeran yang amat besar bagi model bahasa besar (LLM) pada masa hadapan.

Melangkaui Nvidia: Kebangkitan ASIC

Selama bertahun-tahun, industri AI telah terikat kepada GPU berprestasi tinggi milik Nvidia. Walau bagaimanapun, OpenAI kini beralih ke arah pendekatan khusus dengan Jalapeño, sebuah Litar Bersepadu Khusus Aplikasi (ASIC). Berbeza dengan GPU kegunaan umum, ASIC ini dibina khusus untuk inferens AI—peringkat kritikal di mana model, seperti ChatGPT atau Codex, memproses permintaan pengguna untuk menjana respons masa nyata.

Dengan mereka bentuk perkakasan khusus untuk inferens, OpenAI bertujuan untuk mengoptimumkan kecekapan menjalankan model sedia ada mereka. Ini menyusuli kerjasama dengan Broadcom yang diumumkan hanya sembilan bulan lalu, yang bertujuan khusus untuk mengurangkan kebergantungan berat OpenAI terhadap perkakasan Nvidia yang mempunyai kekangan bekalan.

Menandingi Gergasi Industri dari Segi Prestasi

Ambisi teknikal untuk Jalapeño adalah sangat signifikan. CEO Broadcom, Hock Tan, menyatakan bahawa cip tersebut direka untuk menandingi prestasi penanda aras industri, khususnya seni bina Blackwell milik Nvidia dan Tensor Processing Units (TPU) milik Google.

Walaupun pesaing seperti Microsoft, Meta, dan Amazon juga telah melancarkan silikon tersuai untuk menjana pusat data mereka, OpenAI memberi tumpuan kepada metrik kritikal: kecekapan. Ujian awal menunjukkan bahawa Jalapeño akan memberikan keupayaan prestasi-setiap-watt yang jauh lebih baik daripada penyelesaian canggih sedia ada. Dalam dunia penggunaan AI skala besar, di mana kos elektrik dan pengurusan terma merupakan kekangan utama, kelebihan kecekapan ini boleh menjadi kelebihan daya saing yang menentukan.

Strategi Pengkomputeran Pelbagai Generasi

OpenAI tidak melihat Jalapeño sebagai pelancaran perkakasan sekali sahaja. Sebaliknya, syarikat itu menyifatkannya sebagai "langkah pertama dalam platform pengkomputeran pelbagai generasi." Ini menunjukkan pelan hala tuju jangka panjang untuk membina timbunan bersepadu secara menegak, di mana perisian (LLM) dan perkakasan (ASIC) direka bersama untuk sinergi maksimum.

Syarikat tersebut menjangkakan untuk mula melaksanakan platform pengkomputeran baharu ini menjelang akhir tahun 2026. Memandangkan model semakin kompleks dan aliran kerja ejen (agentic workflows) menjadi lebih lazim, penggunaan silikon khusus akan membolehkan OpenAI mengurangkan kependaman (latency) dan mengurangkan kos astronomi yang berkaitan dengan menjalankan kecerdasan tahap perintis (frontier-level intelligence) pada skala besar.

Mengapa Ini Penting untuk Ekosistem AI

Kemasukan OpenAI ke dalam ruang reka bentuk cip menandakan kematangan industri AI. Kita sedang beralih daripada fasa "penggunaan perkakasan tanpa kekangan" kepada "pengoptimuman perkakasan khusus." Memandangkan permintaan untuk inferens melonjak tinggi dengan kebangkitan ejen AI, keupayaan untuk mengawal silikon asas akan menentukan syarikat mana yang boleh berkembang secara mampan dan syarikat mana yang akan terus terikat kepada rantaian bekalan GPU.

Ringkasan Utama

  • Fokus Khusus: Jalapeño ialah ASIC yang direka khusus untuk inferens AI, mengoptimumkan kelajuan dan kos menjalankan model seperti ChatGPT.
  • Penanda Aras Prestasi: Dibangunkan bersama Broadcom, cip ini bertujuan untuk menyaingi Blackwell milik Nvidia dan TPU milik Google dari segi prestasi sambil menawarkan prestasi-setiap-watt yang lebih unggul.
  • Pelan Hala Tuju Jangka Panjang: Dijangka untuk dilaksanakan menjelang akhir 2026, Jalapeño merupakan asas kepada platform perkakasan pelbagai generasi untuk mengurangkan kebergantungan kepada GPU pihak ketiga.