CEO Snowflake: GLM-5.2 Menyaingi Claude Opus 4.7 dengan Kos Jauh Lebih Rendah
Penanda aras (benchmark) praktikal yang dijalankan oleh Snowflake baru-baru ini telah mengejutkan industri AI, mendedahkan bahawa GLM-5.2 dari China mampu bersaing dengan model Barat terkemuka dalam tugasan pengekodan khusus. Walaupun Claude Opus 4.7 mengekalkan kelebihan teknikal, perbezaan harga yang besar menunjukkan peralihan yang bakal berlaku dalam ekonomi Model Bahasa Besar (LLM).
Penanda Aras: Kesetaraan Pengekodan dalam Persekitaran Kompleks
CEO Snowflake, Sridhar Ramaswamy, mengetuai ujian rapi yang melibatkan 103 tugasan berbeza yang direka untuk menilai penjanaan kod merentasi persekitaran DuckDB dan Snowflake. Keputusannya sangat hampir: apabila diberikan tiga percubaan bagi setiap tugasan, GLM-5.2 menyelesaikan 66% tugasan, hanya ketinggalan sedikit di belakang Claude Opus 4.7 yang mencapai kadar kejayaan 67%.
Walau bagaimanapun, nuansa prestasi tersebut mendedahkan jurang dalam kebolehpercayaan. Opus 4.7 menunjukkan konsistensi yang lebih unggul dengan ketepatan percubaan pertama sebanyak 53.7%, berbanding 47.6% bagi GLM-5.2. Model China tersebut juga menunjukkan kecenderungan untuk "berfikir berlebihan" (over-think) atau berulang-ulang melalui proses yang tidak perlu. Dalam satu contoh yang ketara, GLM-5.2 melaksanakan 411 panggilan alat (tool calls) selama 24 minit—menyemak bilangan baris, taburan, dan nilai null—namun gagal dalam ketiga-tiga percubaan. Sebaliknya, Opus 4.7 menyelesaikan tugasan yang sama dalam masa hanya 9 minit dengan hanya 49 panggilan.
Ekonomi AI: Tekanan Harga dari China
Walaupun Opus 4.7 adalah model yang lebih cekap dan konsisten, perkara yang paling penting terletak pada ekonomi unitnya. Perbezaan kos antara model utama Barat dan GLM-5.2 adalah sangat besar dan boleh mengubah pengiraan ROI bagi penggunaan AI perusahaan secara fundamental.
Menurut harga rasmi Zhipu, GLM-5.2 berharga $1.40 bagi setiap satu juta token input dan $4.40 bagi setiap satu juta token output. Sebagai perbandingan:
- Claude Opus 4.7: $5.00 (Input) / $25.00 (Output)
- GPT-5.5: $5.00 (Input) / $30.00 (Output)
Walaupun GLM-5.2 lebih "lapar token" (token-hungry)—dengan purata 99 larian bagi setiap tugasan berbanding 80 bagi Opus dan menggunakan 860 juta token berbanding 439 juta bagi Opus—ia tetap jauh lebih mampu milik. Model harga ini memberikan cabaran langsung kepada strategi margin tinggi yang kini digunakan oleh OpenAI dan Anthropic.
Mengapa Ini Penting untuk Landskap AI
Kemunculan model kos rendah yang sangat berkemampuan seperti GLM-5.2 bertindak sebagai ujian tekanan (stress test) bagi "gelembung AI" (AI bubble). Penilaian besar-besaran makmal AI Barat adalah berdasarkan andaian pertumbuhan hasil yang pantas dan bermargin tinggi. Jika pembangun dan perusahaan beralih kepada alternatif yang jauh lebih murah untuk tugasan frekuensi tinggi seperti pengekodan dan kejuruteraan data, aliran hasil yang diunjurkan bagi model utama mungkin menghadapi pengecutan yang ketara.
Memandangkan Snowflake sedang bersedia untuk menyediakan GLM-5.2 kepada pelanggannya, industri kini bergerak ke arah realiti di mana "kecerdasan" bukan lagi barangan mewah, sebaliknya menjadi utiliti komoditi.
Ringkasan Utama
- Kesetaraan Kompetitif: GLM-5.2 mencapai kadar kejayaan 66% dalam penanda aras pengekodan Snowflake/DuckDB yang kompleks, hampir menyamai 67% bagi Claude Opus 4.7.
- Jurang Kecekapan: Walaupun GLM-5.2 sangat berkemampuan, ia kurang cekap, memerlukan lebih banyak panggilan alat dan penggunaan token yang lebih tinggi untuk mencapai penyelesaian.
- Gangguan Ekonomi: GLM-5.2 menawarkan harga token output pada kira-kira 1/5 hingga 1/7 daripada kos Claude Opus 4.7 atau GPT-5.5, mewujudkan tekanan harga yang sengit terhadap penyedia AI Barat.
