Snowflake CEO: अत्यंत कमी खर्चात GLM 5.2 ने Claude Opus 4.7 ला दिली टक्कर

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialमागील आठवडा3min read

Snowflake CEO: अत्यंत कमी खर्चात GLM 5.2 ने Claude Opus 4.7 ला दिली टक्कर

In this article

Snowflake CEO: GLM-5.2 अत्यंत कमी खर्चात Claude Opus 4.7 ला टक्कर देत आहे

Snowflake ने नुकत्याच केलेल्या एका प्रत्यक्ष बेंचमार्कमुळे (hands-on benchmark) AI उद्योगात खळबळ उडाली आहे. चीनचे GLM-5.2 विशेष कोडिंग कामांमध्ये उच्च दर्जाच्या पाश्चात्य मॉडेल्सना टक्कर देऊ शकते, असे यातून दिसून आले आहे. जरी Claude Opus 4.7 कडे तांत्रिकदृष्ट्या वरचढता फायदा असला, तरी किमतीतील प्रचंड तफावत Large Language Models (LLMs) च्या अर्थशास्त्रात मोठा बदल घडवून आणू शकते, असे सूचित करते.

बेंचमार्क: जटिल वातावरणात कोडिंगची समानता

Snowflake चे CEO श्रीधर रामास्वामी यांनी DuckDB आणि Snowflake या दोन्ही वातावरणांमधील कोड जनरेशनचे मूल्यमापन करण्यासाठी १०३ वेगवेगळ्या कार्यांचा समावेश असलेला एक कडक चाचणी प्रयोग केला. याचे निकाल आश्चर्यकारकपणे जवळचे होते: प्रत्येक कार्यासाठी तीन संधी दिल्यास, GLM-5.2 ने ६६% कार्ये यशस्वीपणे पूर्ण केली, जी Claude Opus 4.7 च्या (६७% यश दर) अगदी जवळ होती.

तथापि, कामगिरीतील बारकावे विश्वासार्हतेमधील फरक स्पष्ट करतात. GLM-5.2 च्या ४७.६% अचूकतेच्या तुलनेत, Opus 4.7 ने पहिल्या प्रयत्नात ५३.७% अचूकता दाखवून उत्कृष्ट सातत्य प्रदर्शित केले. चिनी मॉडेलमध्ये "अतिविचार" (over-think) करण्याची किंवा अनावश्यक प्रक्रियांच्या चक्रात अडकण्याची प्रवृत्ती देखील दिसून आली. एका उल्लेखनीय उदाहरणात, GLM-5.2 ने २४ मिनिटांत ४११ टूल कॉल्स (tool calls) केले—ज्यामध्ये रो काउंट्स (row counts), डिस्ट्रिब्युशन आणि नुल व्हॅल्यूज (null values) तपासले गेले—तरीही ते तिन्ही प्रयत्नांत अपयशी ठरले. याउलट, Opus 4.7 ने केवळ ४९ कॉल्ससह तेच कार्य अवघ्या ९ मिनिटांत पूर्ण केले.

AI चे अर्थशास्त्र: चीनचा किमतीचा दबाव

जरी Opus 4.7 हे अधिक कार्यक्षम आणि सातत्यपूर्ण मॉडेल असले, तरी खरी गोष्ट त्याच्या युनिट इकॉनॉमिक्समध्ये (unit economics) आहे. पाश्चात्य फ्लॅगशिप मॉडेल्स आणि GLM-5.2 मधील किमतीतील फरक धक्कादायक आहे आणि यामुळे एंटरप्राइझ AI उपयोजनांसाठी (enterprise AI deployments) ROI च्या गणनेमध्ये मूलभूत बदल होऊ शकतात.

Zhipu च्या अधिकृत किमतीनुसार, GLM-5.2 ची किंमत प्रति दशलक्ष इनपुट टोकन्ससाठी $1.40 आणि प्रति दशलक्ष आउटपुट टोकन्ससाठी $4.40 आहे. हे अधिक स्पष्टपणे समजून घेण्यासाठी:

Claude Opus 4.7: $5.00 (Input) / $25.00 (Output)
GPT-5.5: $5.00 (Input) / $30.00 (Output)

जरी GLM-5.2 अधिक "टोकन-हंग्री" (token-hungry) असले—Opus च्या ८० रनच्या तुलनेत प्रति कार्य सरासरी ९९ रन आणि Opus च्या ४३९ दशलक्ष टोकन्सच्या तुलनेत ८६० दशलक्ष टोकन्सचा वापर करते—तरीही ते लक्षणीयरीत्या परवडणारे आहे. ही किंमत मॉडेल OpenAI आणि Anthropic द्वारे सध्या वापरल्या जाणाऱ्या हाय-मार्जिन धोरणांना थेट आव्हान देते.

AI क्षेत्रासाठी हे का महत्त्वाचे आहे

GLM-5.2 सारख्या अत्यंत सक्षम आणि कमी खर्चाच्या मॉडेल्सचा उदय "AI बबल"साठी (AI bubble) एक स्ट्रेस टेस्ट म्हणून काम करतो. पाश्चात्य AI लॅब्सचे प्रचंड मूल्यांकन हे वेगाने आणि हाय-मार्जिन महसूल वाढण्याच्या गृहितकावर आधारित आहे. जर डेव्हलपर्स आणि एंटरप्राइजेस कोडिंग आणि डेटा इंजिनिअरिंगसारख्या वारंवार केल्या जाणाऱ्या कामांसाठी स्वस्त पर्यायांकडे वळले, तर फ्लॅगशिप मॉडेल्सच्या अंदाजित महसूल प्रवाहात मोठी घट होऊ शकते.

Snowflake आपल्या ग्राहकांसाठी GLM-5.2 उपलब्ध करून देण्याची तयारी करत असताना, उद्योग अशा वास्तवाकडे सरकत आहे जिथे "बुद्धिमत्ता" (intelligence) ही आता चैनीची वस्तू न राहता एक सामान्य उपयुक्तता (commoditized utility) बनेल.

मुख्य निष्कर्ष

स्पर्धात्मक समानता: GLM-5.2 ने जटिल Snowflake/DuckDB कोडिंग बेंचमार्कमध्ये ६६% यश दर प्राप्त केला, जो Claude Opus 4.7 च्या ६७% च्या जवळ आहे.
कार्यक्षमतेतील तफावत: जरी GLM-5.2 अत्यंत सक्षम असले, तरी ते कमी कार्यक्षम आहे; उपाय शोधण्यासाठी त्याला अधिक टूल कॉल्स आणि जास्त टोकन वापराची आवश्यकता असते.
आर्थिक विस्कळीतपणा: GLM-5.2 आउटपुट टोकनची किंमत Claude Opus 4.7 किंवा GPT-5.5 च्या तुलनेत साधारणपणे १/५ ते १/७ पट कमी दरात देते, ज्यामुळे पाश्चात्य AI प्रदात्यांवर तीव्र किमतीचा दबाव निर्माण होत आहे.

Snowflake CEO: अत्यंत कमी खर्चात GLM 5.2 ने Claude Opus 4.7 ला दिली टक्कर

Snowflake CEO: GLM-5.2 अत्यंत कमी खर्चात Claude Opus 4.7 ला टक्कर देत आहे

बेंचमार्क: जटिल वातावरणात कोडिंगची समानता

AI चे अर्थशास्त्र: चीनचा किमतीचा दबाव

AI क्षेत्रासाठी हे का महत्त्वाचे आहे

मुख्य निष्कर्ष

Continue reading

Zhipu AI's GLM 5.2 Closes the Gap with Closed Source Coding Giants

नवीन MirrorCode बेंचमार्कमध्ये AI मॉडेल्स सलग १९ दिवस चालतात

API खर्च कमी करण्यासाठी Coinbase चिनी AI मॉडेल्सकडे वळले

Claude Sonnet 5: उच्च कार्यक्षमता किमतीतील मोठी वाढ लपवत आहे