Snowflake CEO: GLM-5.2 अत्यंत कमी खर्चात Claude Opus 4.7 ला टक्कर देत आहे

Snowflake ने नुकत्याच केलेल्या एका प्रत्यक्ष बेंचमार्कमुळे (hands-on benchmark) AI उद्योगात खळबळ उडाली आहे. चीनचे GLM-5.2 विशेष कोडिंग कामांमध्ये उच्च दर्जाच्या पाश्चात्य मॉडेल्सना टक्कर देऊ शकते, असे यातून दिसून आले आहे. जरी Claude Opus 4.7 कडे तांत्रिकदृष्ट्या वरचढता फायदा असला, तरी किमतीतील प्रचंड तफावत Large Language Models (LLMs) च्या अर्थशास्त्रात मोठा बदल घडवून आणू शकते, असे सूचित करते.

बेंचमार्क: जटिल वातावरणात कोडिंगची समानता

Snowflake चे CEO श्रीधर रामास्वामी यांनी DuckDB आणि Snowflake या दोन्ही वातावरणांमधील कोड जनरेशनचे मूल्यमापन करण्यासाठी १०३ वेगवेगळ्या कार्यांचा समावेश असलेला एक कडक चाचणी प्रयोग केला. याचे निकाल आश्चर्यकारकपणे जवळचे होते: प्रत्येक कार्यासाठी तीन संधी दिल्यास, GLM-5.2 ने ६६% कार्ये यशस्वीपणे पूर्ण केली, जी Claude Opus 4.7 च्या (६७% यश दर) अगदी जवळ होती.

तथापि, कामगिरीतील बारकावे विश्वासार्हतेमधील फरक स्पष्ट करतात. GLM-5.2 च्या ४७.६% अचूकतेच्या तुलनेत, Opus 4.7 ने पहिल्या प्रयत्नात ५३.७% अचूकता दाखवून उत्कृष्ट सातत्य प्रदर्शित केले. चिनी मॉडेलमध्ये "अतिविचार" (over-think) करण्याची किंवा अनावश्यक प्रक्रियांच्या चक्रात अडकण्याची प्रवृत्ती देखील दिसून आली. एका उल्लेखनीय उदाहरणात, GLM-5.2 ने २४ मिनिटांत ४११ टूल कॉल्स (tool calls) केले—ज्यामध्ये रो काउंट्स (row counts), डिस्ट्रिब्युशन आणि नुल व्हॅल्यूज (null values) तपासले गेले—तरीही ते तिन्ही प्रयत्नांत अपयशी ठरले. याउलट, Opus 4.7 ने केवळ ४९ कॉल्ससह तेच कार्य अवघ्या ९ मिनिटांत पूर्ण केले.

AI चे अर्थशास्त्र: चीनचा किमतीचा दबाव

जरी Opus 4.7 हे अधिक कार्यक्षम आणि सातत्यपूर्ण मॉडेल असले, तरी खरी गोष्ट त्याच्या युनिट इकॉनॉमिक्समध्ये (unit economics) आहे. पाश्चात्य फ्लॅगशिप मॉडेल्स आणि GLM-5.2 मधील किमतीतील फरक धक्कादायक आहे आणि यामुळे एंटरप्राइझ AI उपयोजनांसाठी (enterprise AI deployments) ROI च्या गणनेमध्ये मूलभूत बदल होऊ शकतात.

Zhipu च्या अधिकृत किमतीनुसार, GLM-5.2 ची किंमत प्रति दशलक्ष इनपुट टोकन्ससाठी $1.40 आणि प्रति दशलक्ष आउटपुट टोकन्ससाठी $4.40 आहे. हे अधिक स्पष्टपणे समजून घेण्यासाठी:

  • Claude Opus 4.7: $5.00 (Input) / $25.00 (Output)
  • GPT-5.5: $5.00 (Input) / $30.00 (Output)

जरी GLM-5.2 अधिक "टोकन-हंग्री" (token-hungry) असले—Opus च्या ८० रनच्या तुलनेत प्रति कार्य सरासरी ९९ रन आणि Opus च्या ४३९ दशलक्ष टोकन्सच्या तुलनेत ८६० दशलक्ष टोकन्सचा वापर करते—तरीही ते लक्षणीयरीत्या परवडणारे आहे. ही किंमत मॉडेल OpenAI आणि Anthropic द्वारे सध्या वापरल्या जाणाऱ्या हाय-मार्जिन धोरणांना थेट आव्हान देते.

AI क्षेत्रासाठी हे का महत्त्वाचे आहे

GLM-5.2 सारख्या अत्यंत सक्षम आणि कमी खर्चाच्या मॉडेल्सचा उदय "AI बबल"साठी (AI bubble) एक स्ट्रेस टेस्ट म्हणून काम करतो. पाश्चात्य AI लॅब्सचे प्रचंड मूल्यांकन हे वेगाने आणि हाय-मार्जिन महसूल वाढण्याच्या गृहितकावर आधारित आहे. जर डेव्हलपर्स आणि एंटरप्राइजेस कोडिंग आणि डेटा इंजिनिअरिंगसारख्या वारंवार केल्या जाणाऱ्या कामांसाठी स्वस्त पर्यायांकडे वळले, तर फ्लॅगशिप मॉडेल्सच्या अंदाजित महसूल प्रवाहात मोठी घट होऊ शकते.

Snowflake आपल्या ग्राहकांसाठी GLM-5.2 उपलब्ध करून देण्याची तयारी करत असताना, उद्योग अशा वास्तवाकडे सरकत आहे जिथे "बुद्धिमत्ता" (intelligence) ही आता चैनीची वस्तू न राहता एक सामान्य उपयुक्तता (commoditized utility) बनेल.

मुख्य निष्कर्ष

  • स्पर्धात्मक समानता: GLM-5.2 ने जटिल Snowflake/DuckDB कोडिंग बेंचमार्कमध्ये ६६% यश दर प्राप्त केला, जो Claude Opus 4.7 च्या ६७% च्या जवळ आहे.
  • कार्यक्षमतेतील तफावत: जरी GLM-5.2 अत्यंत सक्षम असले, तरी ते कमी कार्यक्षम आहे; उपाय शोधण्यासाठी त्याला अधिक टूल कॉल्स आणि जास्त टोकन वापराची आवश्यकता असते.
  • आर्थिक विस्कळीतपणा: GLM-5.2 आउटपुट टोकनची किंमत Claude Opus 4.7 किंवा GPT-5.5 च्या तुलनेत साधारणपणे १/५ ते १/७ पट कमी दरात देते, ज्यामुळे पाश्चात्य AI प्रदात्यांवर तीव्र किमतीचा दबाव निर्माण होत आहे.