Mkurugenzi Mtendaji wa Snowflake: GLM-5.2 Inashindana na Claude Opus 4.7 kwa Gharama Ndogo Sana
Jaribio la hivi karibuni la ulinganifu (benchmark) lililofanywa na Snowflake limeleta mshtuko katika sekta ya AI, likionyesha kuwa GLM-5.2 ya China inaweza kushindana na mifano bora zaidi ya Magharibi katika kazi maalum za uandishi wa kodi (coding). Ingawa Claude Opus 4.7 inadumisha ubora wa kiufundi, tofauti kubwa ya bei inadokeza mabadiliko yanayokuja katika uchumi wa Mifano Mikubwa ya Lugha (LLMs).
Jaribio la Ulinganifu: Usawa wa Coding katika Mazingira Tata
Mkurugenzi Mtendaji wa Snowflake, Sridhar Ramaswamy, aliongoza jaribio kali lililohusisha kazi 103 tofauti zilizoundwa kutathmini uundaji wa kodi katika mazingira ya DuckDB na Snowflake. Matokeo yalikuwa karibu sana: baada ya kupewa majaribio matatu kwa kila kazi, GLM-5.2 ilitatua 66% ya kazi hizo, ikifuata nyuma kidogo ya Claude Opus 4.7, ambayo ilifikia kiwango cha mafanikio cha 67%.
Hata hivyo, tofauti ndogo za utendaji zinaonyesha pengo katika uaminifu. Opus 4.7 ilionyesha uthabiti bora zaidi kwa usahihi wa 53.7% katika jaribio la kwanza, ikilinganishwa na 47.6% ya GLM-5.2. Mfano huo wa China pia ulionyesha tabia ya "kufikiria kupita kiasi" au kurudia michakato isiyo ya lazima. Katika tukio moja la kushangaza, GLM-5.2 ilifanya simu za zana (tool calls) 411 kwa dakika 24—ikikagua idadi ya mistari, usambazaji, na thamani za null—lakini ikashindwa katika majaribio yote matatu. Kinyume chake, Opus 4.7 ilitatua kazi hiyo hiyo kwa dakika 9 tu kwa kutumia simu 49 pekee.
Uchumi wa AI: Shinikizo la Bei kutoka China
Ingawa Opus 4.7 ndiyo mfano wenye ufanisi na uthabiti zaidi, habari halisi iko katika uchumi wa gharama za kila kitengo. Tofauti ya gharama kati ya mifano mikuu ya Magharibi na GLM-5.2 ni kubwa sana na inaweza kubadilisha kabisa hesabu za ROI (faida ya uwekezaji) kwa matumizi ya AI katika makampuni.
Kulingana na bei rasmi ya Zhipu, GLM-5.2 inagharimu $1.40 kwa kila milioni ya tokeni za kuingiza (input tokens) na $4.40 kwa kila milioni ya tokeni za kutolea (output tokens). Ili kuweka jambo hili katika muktadha:
- Claude Opus 4.7: $5.00 (Input) / $25.00 (Output)
- GPT-5.5: $5.00 (Input) / $30.00 (Output)
Ingawa GLM-5.2 "inatumia tokeni nyingi zaidi"—ikichukua wastani wa marudio 99 kwa kila kazi ikilinganishwa na 80 ya Opus na kutumia tokeni milioni 860 dhidi ya milioni 439 za Opus—bado inabaki na bei nafuu zaidi. Mtindo huu wa bei unatoa changamoto ya moja kwa moja kwa mikakati ya faida kubwa inayotumiwa sasa na OpenAI na Anthropic.
Kwa Nini Hili Ni Muhimu kwa Sekta ya AI
Kuibuka kwa mifano yenye uwezo mkubwa na gharama nafuu kama GLM-5.2 kunafanya kazi kama jaribio la shinikizo (stress test) kwa "mapovu ya AI" (AI bubble). Thamani kubwa za maabara za AI za Magharibi zinategemea dhana ya ukuaji wa mapato wa haraka na yenye faida kubwa. Ikiwa watengenezaji na makampuni watahamia kwenye mbadala rahisi zaidi kwa kazi za mara kwa mara kama uandishi wa kodi na uhandisi wa data, mtiririko wa mapato uliotarajiwa kwa mifano mikuu unaweza kupungua kwa kiasi kikubwa.
Wakati Snowflake ikijiandaa kuwafanya wateja wake wapate GLM-5.2, sekta hii inasogea kuelekea uhalisia ambapo "akili" si bidhaa ya anasa tena, bali ni huduma ya kawaida inayopatikana kwa urahisi.
Mambo Muhimu ya Kuzingatia
- Usawa wa Ushindani: GLM-5.2 ilifikia kiwango cha mafanikio cha 66% katika majaribio tata ya coding ya Snowflake/DuckDB, ikilingana karibu na 67% ya Claude Opus 4.7.
- Pengo la Ufanisi: Ingawa GLM-5.2 ina uwezo mkubwa, haina ufanisi kama ilivyo, ikihitaji simu nyingi zaidi za zana na matumizi makubwa ya tokeni ili kupata suluhisho.
- Mvurugiko wa Kiuchumi: GLM-5.2 inatoa bei ya tokeni za kutolea (output tokens) kwa takriban 1/5 hadi 1/7 ya gharama ya Claude Opus 4.7 au GPT-5.5, ikileta shinikizo kubwa la bei kwa watoa huduma wa AI wa Magharibi.
