OpenAI Jalapeñoチップ:OpenAIがいかにしてAIコストを50%削減するか
OpenAIとBroadcomは、Jalapeñoを発表しました。これは、大規模言語モデル(LLM)の実行という、たった一つの目的のために構築されたカスタムチップです。
このチップは、NvidiaのGPUと比較して推論コストを50%削減できる可能性があります。エンジニアリングサンプルは、すでにGPT-5.3-Codex-Sparkを稼働させています。量産は2026年後半に開始される予定です。
OpenAIはChatGPTの推論に年間約140億ドルを費やしています。これは同社の総収益を上回る金額です。このコストを50%削減することで、毎年70億ドルの節約になります。この動きは、OpenAIが2026年に予定しているIPO(新規株式公開)への準備を後押しします。
仕組み:
ほとんどのAIハードウェアはGPUを使用しています。GPUは汎用的なツールであり、グラフィックス、トレーニング、推論のすべてを行います。この柔軟性が、余分なオーバーヘッドを生み出しています。
JalapeñoはASICです。これは、特定のタスクのために構築されていることを意味します。トレーニング済みのモデルを実行することだけに特化しており、汎用GPUよりもメモリやネットワーキングを効率的に処理します。
主な詳細:
• TSMCの3nm技術を採用。 • OpenAIがアーキテクチャを設計。 • Broadcomがシリコン実装を担当。 • Microsoftが初回ロットの40%を購入予定。
OpenAIは、このチップの設計に自社のAIモデルを使用しました。AIがコードを書き、レイアウトを最適化しました。これにより、「AIがより優れたチップの設計を助け、より優れたチップがより優れたAIを動かす」というループが生まれます。
あなたへの影響:
OpenAI APIを使用している場合、12〜18ヶ月以内に以下のような変化が見られる可能性があります:
- API価格の低下:OpenAIのコスト削減により、開発者向けの料金が安くなります。
- スピードの向上:チップがTransformerモデル向けにチューニングされているため、レイテンシが低減します。
- サブスクリプションの低価格化:ChatGPT Plusの価格が下がるか、より多くの機能が含まれる可能性があります。
考慮すべきリスク:
- 独立したテストの欠如:データの大部分はOpenAI自身から提供されたものです。
- 限定的な用途:このチップはモデルのトレーニングには使用できません。トレーニングには引き続きNvidiaが必要です。
- 新たな依存関係:OpenAIはNvidiaからBroadcomへと移行しています。
- 将来の技術変化:AIモデルの構造が変わった場合、このチップの価値が低下する可能性があります。
OpenAIはもはや単なるAI研究所ではありません。今やインフラ企業です。彼らはモデル、ソフトウェア、そして今やハードウェアまでもコントロールしています。
出典: https://dev.to/tekmag/openai-jalapeno-chip-how-openais-custom-inference-asic-slashes-ai-
