CEO Snowflake: GLM-5.2 Menyaingi Claude Opus 4.7 dengan Biaya Jauh Lebih Murah
Sebuah benchmark praktis terbaru yang dilakukan oleh Snowflake telah mengejutkan industri AI, mengungkapkan bahwa GLM-5.2 dari Tiongkok dapat bersaing dengan model-model Barat kelas atas dalam tugas pengodean khusus. Meskipun Claude Opus 4.7 mempertahankan keunggulan teknis, perbedaan harga yang masif menunjukkan adanya pergeseran yang akan datang dalam ekonomi Large Language Models (LLM).
Benchmark: Paritas Pengodean dalam Lingkungan yang Kompleks
CEO Snowflake Sridhar Ramaswamy memimpin pengujian ketat yang melibatkan 103 tugas berbeda yang dirancang untuk mengevaluasi pembuatan kode di lingkungan DuckDB dan Snowflake. Hasilnya sangat mengejutkan: ketika diberikan tiga kesempatan per tugas, GLM-5.2 menyelesaikan 66% tugas, hanya sedikit tertinggal di belakang Claude Opus 4.7 yang mencapai tingkat keberhasilan 67%.
Namun, nuansa performanya menunjukkan adanya perbedaan dalam hal keandalan. Opus 4.7 menunjukkan konsistensi yang lebih unggul dengan akurasi percobaan pertama sebesar 53,7%, dibandingkan dengan 47,6% milik GLM-5.2. Model asal Tiongkok tersebut juga menunjukkan kecenderungan untuk "berpikir berlebihan" (over-think) atau terjebak dalam proses yang tidak perlu. Dalam satu contoh yang menonjol, GLM-5.2 melakukan 411 panggilan alat (tool calls) selama 24 menit—memeriksa jumlah baris, distribusi, dan nilai null—namun gagal dalam ketiga percobaannya. Sebaliknya, Opus 4.7 menyelesaikan tugas yang sama hanya dalam 9 menit dengan hanya 49 panggilan.
Ekonomi AI: Tekanan Harga dari Tiongkok
Meskipun Opus 4.7 adalah model yang lebih efisien dan konsisten, inti masalahnya terletak pada ekonomi per unitnya. Perbedaan biaya antara model unggulan Barat dan GLM-5.2 sangat mencengangkan dan dapat mengubah perhitungan ROI untuk penerapan AI di perusahaan secara fundamental.
Menurut harga resmi Zhipu, GLM-5.2 berbiaya $1,40 per satu juta token input dan $4,40 per satu juta token output. Sebagai perbandingan:
- Claude Opus 4.7: $5,00 (Input) / $25,00 (Output)
- GPT-5.5: $5,00 (Input) / $30,00 (Output)
Meskipun GLM-5.2 lebih "boros token"—dengan rata-rata 99 kali jalan per tugas dibandingkan dengan 80 kali milik Opus dan mengonsumsi 860 juta token dibandingkan dengan 439 juta milik Opus—model ini tetap jauh lebih terjangkau. Model penetapan harga ini menghadirkan tantangan langsung terhadap strategi margin tinggi yang saat ini diterapkan oleh OpenAI dan Anthropic.
Mengapa Ini Penting bagi Lanskap AI
Munculnya model berbiaya rendah namun sangat mumpuni seperti GLM-5.2 bertindak sebagai uji stres bagi "gelembung AI" (AI bubble). Valuasi masif dari laboratorium AI Barat didasarkan pada asumsi pertumbuhan pendapatan yang cepat dan bermargin tinggi. Jika pengembang dan perusahaan beralih ke alternatif yang jauh lebih murah untuk tugas-tugas frekuensi tinggi seperti pengodean dan rekayasa data, aliran pendapatan yang diproyeksikan untuk model-model unggulan mungkin akan menghadapi kontraksi yang signifikan.
Saat Snowflake bersiap untuk menyediakan GLM-5.2 bagi para pelanggannya, industri ini bergerak menuju realitas di mana "kecerdasan" bukan lagi barang mewah, melainkan utilitas yang terkomoditasi.
Poin-Poin Penting
- Paritas Kompetitif: GLM-5.2 mencapai tingkat keberhasilan 66% dalam benchmark pengodean Snowflake/DuckDB yang kompleks, hampir menyamai 67% milik Claude Opus 4.7.
- Kesenjangan Efisiensi: Meskipun GLM-5.2 sangat mumpuni, model ini kurang efisien, memerlukan lebih banyak panggilan alat dan konsumsi token yang lebih tinggi untuk mencapai solusi.
- Disrupsi Ekonomi: GLM-5.2 menawarkan harga token output sekitar 1/5 hingga 1/7 dari biaya Claude Opus 4.7 atau GPT-5.5, menciptakan tekanan harga yang intens pada penyedia AI Barat.
