OpenAI Jalapeñoチップ：OpenAIがいかにしてAIコストを50%削減するか

Translated for your language. 原文を読む.

AI-assisted draft.

OpenAIとBroadcomは、Jalapeñoを発表しました。これは、大規模言語モデル（LLM）の実行という、たった一つの目的のために構築されたカスタムチップです。

このチップは、NvidiaのGPUと比較して推論コストを50%削減できる可能性があります。エンジニアリングサンプルは、すでにGPT-5.3-Codex-Sparkを稼働させています。量産は2026年後半に開始される予定です。

OpenAIはChatGPTの推論に年間約140億ドルを費やしています。これは同社の総収益を上回る金額です。このコストを50%削減することで、毎年70億ドルの節約になります。この動きは、OpenAIが2026年に予定しているIPO（新規株式公開）への準備を後押しします。

仕組み：

ほとんどのAIハードウェアはGPUを使用しています。GPUは汎用的なツールであり、グラフィックス、トレーニング、推論のすべてを行います。この柔軟性が、余分なオーバーヘッドを生み出しています。

JalapeñoはASICです。これは、特定のタスクのために構築されていることを意味します。トレーニング済みのモデルを実行することだけに特化しており、汎用GPUよりもメモリやネットワーキングを効率的に処理します。

主な詳細：

• TSMCの3nm技術を採用。 • OpenAIがアーキテクチャを設計。 • Broadcomがシリコン実装を担当。 • Microsoftが初回ロットの40%を購入予定。

OpenAIは、このチップの設計に自社のAIモデルを使用しました。AIがコードを書き、レイアウトを最適化しました。これにより、「AIがより優れたチップの設計を助け、より優れたチップがより優れたAIを動かす」というループが生まれます。

あなたへの影響：

OpenAI APIを使用している場合、12〜18ヶ月以内に以下のような変化が見られる可能性があります：

考慮すべきリスク：

OpenAIはもはや単なるAI研究所ではありません。今やインフラ企業です。彼らはモデル、ソフトウェア、そして今やハードウェアまでもコントロールしています。

続きを読む