OpenAI Jalapeñoチップ:OpenAIがいかにしてAIコストを50%削減するか

OpenAIとBroadcomは、Jalapeñoを発表しました。これは、大規模言語モデル(LLM)の実行という、たった一つの目的のために構築されたカスタムチップです。

このチップは、NvidiaのGPUと比較して推論コストを50%削減できる可能性があります。エンジニアリングサンプルは、すでにGPT-5.3-Codex-Sparkを稼働させています。量産は2026年後半に開始される予定です。

OpenAIはChatGPTの推論に年間約140億ドルを費やしています。これは同社の総収益を上回る金額です。このコストを50%削減することで、毎年70億ドルの節約になります。この動きは、OpenAIが2026年に予定しているIPO(新規株式公開)への準備を後押しします。

仕組み:

ほとんどのAIハードウェアはGPUを使用しています。GPUは汎用的なツールであり、グラフィックス、トレーニング、推論のすべてを行います。この柔軟性が、余分なオーバーヘッドを生み出しています。

JalapeñoはASICです。これは、特定のタスクのために構築されていることを意味します。トレーニング済みのモデルを実行することだけに特化しており、汎用GPUよりもメモリやネットワーキングを効率的に処理します。

主な詳細:

• TSMCの3nm技術を採用。 • OpenAIがアーキテクチャを設計。 • Broadcomがシリコン実装を担当。 • Microsoftが初回ロットの40%を購入予定。

OpenAIは、このチップの設計に自社のAIモデルを使用しました。AIがコードを書き、レイアウトを最適化しました。これにより、「AIがより優れたチップの設計を助け、より優れたチップがより優れたAIを動かす」というループが生まれます。

あなたへの影響:

OpenAI APIを使用している場合、12〜18ヶ月以内に以下のような変化が見られる可能性があります:

  • API価格の低下:OpenAIのコスト削減により、開発者向けの料金が安くなります。
  • スピードの向上:チップがTransformerモデル向けにチューニングされているため、レイテンシが低減します。
  • サブスクリプションの低価格化:ChatGPT Plusの価格が下がるか、より多くの機能が含まれる可能性があります。

考慮すべきリスク:

  • 独立したテストの欠如:データの大部分はOpenAI自身から提供されたものです。
  • 限定的な用途:このチップはモデルのトレーニングには使用できません。トレーニングには引き続きNvidiaが必要です。
  • 新たな依存関係:OpenAIはNvidiaからBroadcomへと移行しています。
  • 将来の技術変化:AIモデルの構造が変わった場合、このチップの価値が低下する可能性があります。

OpenAIはもはや単なるAI研究所ではありません。今やインフラ企業です。彼らはモデル、ソフトウェア、そして今やハードウェアまでもコントロールしています。

出典: https://dev.to/tekmag/openai-jalapeno-chip-how-openais-custom-inference-asic-slashes-ai-