Coinbase、APIコスト削減のため中国製AIモデルへ移行

西洋のAI研究所が膨大な計算コストと収益性のバランスに苦慮する中、業界のリーダーたちは効率性を求めて東洋に目を向け始めている。Coinbaseは、運用コストを最適化するために中国製AIモデルへと舵を切るテックジャイアントの潮流に、正式に加わった。

中国製モデルへの転換:GLMとKimi

CoinbaseのCEOであるBrian Armstrong氏は先日、同社のインフラにGLM 5.2やKimi 2.7といった中国開発のモデルを統合したことを明らかにした。この戦略的転換により、CoinbaseはAI支出を半分に削減しながら、大幅に多いトークン量を処理することが可能になった。

この動きは暗号資産(クリプト)セクターに限ったことではない。スタートアップのLindyはDeepSeek v4へと移行しており、データ大手のSnowflakeは、OpenAIやAnthropicの高価なサービスに代わる費用対効果の高い選択肢として、現在中国製モデルのテストを行っている。この変化は、企業がAIの「フロンティア(最前線)」をどのように捉えるかにおける大規模な転換を示唆しており、ブランドの知名度よりもコストパフォーマンス(価格対性能比)が優先されるようになっている。

インテリジェント・ルーティングとコンテキスト・エンジニアリング

これらの節約効果を最大化するため、Coinbaseは自動ルーティング・システムを導入した。単一のLLMに依存するのではなく、このシステムは「タスクの複雑さ」「コスト」「キャッシュの可能性」という3つの重要な指標に基づいて、すべてのリクエストを評価する。

この戦略の技術的な実行は、「コンテキスト・エンジニアリング」に大きく依存している。開発者に対してコンテキストを軽量に保ち、新しいタスクには新しいセッションを開始するよう促すことで、Coinbaseはキャッシュのヒット率をわずか5%から60%へと引き上げることに成功した。この効率性により、同社はルーチンワークには安価なモデルを活用し、複雑な操作には高度な推論モデルを確保することができる。この手法は、エージェンティック(agentic)なワークフローをスケールさせるための設計図となりつつある。

「トークンマキシング」とパフォーマンスへの責任

期待されるGPT-5.xシリーズのような「エージェンティック推論(agentic reasoning)」モデルの台頭は、トークン消費量の急増を招いている。AmazonやMetaなどの企業では、厳格な監視なしに従業員が大量のトークンを消費してしまう「トークンマキシング(tokenmaxxing)」の傾向が見られるが、Coinbaseは異なる哲学を導入している。

Armstrong氏は、制限のない可視化モデルを導入した。開発者の使用量に上限は設けないが、その支出は透明化される。指針となるのは「インパクトに基づく責任(impact-based accountability)」だ。開発者がAIトークンに多額の費用をかけるほど、期待されるアウトプットとビジネスへのインパクトも高くなければならない。このアプローチは、膨大な計算能力の必要性とROI(投資利益率)の必要性のバランスを取るものである。

西洋の研究所に対する価格競争の試練

より安価な中国の代替案への流出は、西洋のAI研究所に多大な圧力をかけている。特にOpenAIやAnthropicのような企業がIPO(新規株式公開)を見据え、持続可能な成長を証明する必要がある中で、その傾向は顕著だ。価格競争の兆候はすでに明らかになっており、OpenAIはGPT-5.6-Solのようなよりトークン効率の高いバリエーションや、低価格で軽量なモデルを提供することで対抗していると報じられている。西洋のプロバイダーにとって、課題はもはや知能の高さだけではなく、企業クライアントがより経済的なグローバル競合他社へ移行するのを防ぐための価格帯を維持することにある。

主なポイント

  • コストの最適化: Coinbaseは、GLM 5.2やKimi 2.7といった中国製モデルを統合することで、総トークン使用量を増やしながらも、AI支出を半分に削減した。
  • 技術的効率性: 自動ルーティングとコンテキスト・エンジニアリングの導入により、Coinbaseはキャッシュのヒット率を5%から60%に向上させた。
  • 市場の圧力: 安価なモデルへの転換は、西洋の研究所に対し、高い企業価値や今後のIPOの見通しを正当化するための価格競争を強いている。