Snowflake CEO:GLM-5.2がClaude Opus 4.7に匹敵、コストはわずか数分の一
Snowflakeが実施した最新のハンズオン・ベンチマークがAI業界に衝撃を与えている。中国のGLM-5.2が、専門的なコーディングタスクにおいて欧米のトップティアモデルと競合できることが明らかになった。Claude Opus 4.7は技術的な優位性を維持しているものの、その圧倒的な価格差は、大規模言語モデル(LLM)の経済学における大きな転換が迫っていることを示唆している。
ベンチマーク:複雑な環境におけるコーディングの同等性
SnowflakeのCEOであるSridhar Ramaswamy氏は、DuckDBとSnowflakeの両方の環境におけるコード生成を評価するために設計された、103の異なるタスクを含む厳格なテストを主導した。結果は驚くほど僅差であった。タスクごとに3回の試行が与えられた場合、GLM-5.2はタスクの66%を解決し、成功率67%を達成したClaude Opus 4.7にわずかに遅れをとるのみであった。
しかし、パフォーマンスの細部を見ると、信頼性の違いが浮き彫りになる。Opus 4.7は初回試行の正確度が53.7%であり、GLM-5.2の47.6%と比較して優れた一貫性を示した。また、この中国製モデルは「考えすぎる」傾向や、不要なプロセスをループする傾向も見られた。注目すべき事例として、GLM-5.2は24分間にわたって411回のツールコール(行数、分布、NULL値の確認など)を実行したが、3回の試行すべてに失敗した。対照的に、Opus 4.7はわずか49回のコールで、同じタスクをわずか9分で解決した。
AIの経済学:中国による価格圧力
Opus 4.7の方が効率的で一貫性のあるモデルではあるが、真の焦点はユニットエコノミクス(単位あたりの経済性)にある。欧米のフラッグシップモデルとGLM-5.2のコスト差は驚異的であり、企業によるAI導入のROI(投資利益率)計算を根本から変える可能性がある。
Zhipuの公式価格によると、GLM-5.2のコストは入力トークン100万件あたり1.40ドル、出力トークン100万件あたり4.40ドルである。比較すると以下のようになる:
- Claude Opus 4.7: $5.00 (入力) / $25.00 (出力)
- GPT-5.5: $5.00 (入力) / $30.00 (出力)
GLM-5.2は、タスクあたりの平均実行回数がOpusの80回に対して99回、消費トークン数がOpusの4億3900万に対して8億6000万と、より「トークンを大量に消費する」傾向にあるものの、依然として大幅に手頃な価格である。この価格モデルは、現在OpenAIやAnthropicが採用している高利益率戦略に対する直接的な挑戦となる。
なぜこれがAI業界にとって重要なのか
GLM-5.2のような高性能かつ低コストなモデルの登場は、「AIバブル」に対するストレス・テストとして機能する。欧米のAI研究所の巨額の企業価値は、急速かつ高利益な収益成長という前提に基づいている。もし開発者や企業が、コーディングやデータエンジニアリングのような頻度の高いタスクにおいて、より安価な代替案へとシフトすれば、フラッグシップモデルの予測収益は大幅な縮小に直面する可能性がある。
SnowflakeがGLM-5.2を顧客に提供する準備を進める中、業界は「知能」がもはや贅沢品ではなく、コモディティ化されたユーティリティ(公共サービス)となる現実へと向かっている。
主なポイント
- 競争力の同等性: GLM-5.2は、複雑なSnowflake/DuckDBコーディング・ベンチマークにおいて66%の成功率を達成し、Claude Opus 4.7の67%に肉薄した。
- 効率性の差: GLM-5.2は非常に高い能力を持つ一方で効率性は低く、解決策に到達するために、より多くのツールコールと高いトークン消費を必要とする。
- 経済的破壊: GLM-5.2の出力トークン価格は、Claude Opus 4.7やGPT-5.5の約5分の1から7分の1のコストであり、欧米のAIプロバイダーに対して激しい価格圧力を生み出している。
