Snowflake CEO: GLM-5.2 ખૂબ જ ઓછા ખર્ચમાં Claude Opus 4.7 ને ટક્કર આપે છે

Snowflake દ્વારા તાજેતરમાં કરવામાં આવેલા હેન્ડ્સ-ઓન બેન્ચમાર્ક (hands-on benchmark) એ AI ઉદ્યોગમાં ખળભળાટ મચાવી દીધો છે, જે દર્શાવે છે કે ચીનનું GLM-5.2 વિશિષ્ટ કોડિંગ કાર્યોમાં ટોચના પશ્ચિમી મોડલ્સ સાથે સ્પર્ધા કરી શકે છે. જોકે Claude Opus 4.7 ટેકનિકલ રીતે આગળ છે, પરંતુ કિંમતમાં રહેલો મોટો તફાવત લાર્જ લેંગ્વેજ મોડલ્સ (LLMs) ના અર્થશાસ્ત્રમાં આવનારા મોટા ફેરફારનો સંકેત આપે છે.

બેન્ચમાર્ક: જટિલ વાતાવરણમાં કોડિંગની સમાનતા

Snowflake ના CEO શ્રીધર રામાસ્વામીએ DuckDB અને Snowflake બંને વાતાવરણમાં કોડ જનરેશનનું મૂલ્યાંકન કરવા માટે રચાયેલ 103 અલગ-અલગ કાર્યો સાથેના કડક પરીક્ષણનું નેતૃત્વ કર્યું હતું. પરિણામો આશ્ચર્યજનક રીતે નજીક હતા: દરેક કાર્ય માટે ત્રણ પ્રયાસો આપવામાં આવ્યા ત્યારે, GLM-5.2 એ 66% કાર્યો સફળતાપૂર્વક પૂર્ણ કર્યા, જે Claude Opus 4.7 થી માત્ર થોડું જ પાછળ હતું, જેણે 67% સફળતા દર હાંસલ કર્યો હતો.

જોકે, કામગીરીની ઝીણવટભરી વિગતો વિશ્વસનીયતામાં તફાવત દર્શાવે છે. GLM-5.2 ના 47.6% ની સરખામણીમાં, Opus 4.7 એ પ્રથમ પ્રયાસમાં 53.7% ચોકસાઈ સાથે શ્રેષ્ઠ સુસંગતતા દર્શાવી હતી. ચીની મોડલમાં "ઓવર-થિંક" (વધારે વિચારવું) કરવાની અથવા બિનજરૂરી પ્રક્રિયાઓમાં લૂપમાં ફસાઈ જવાની વૃત્તિ પણ જોવા મળી હતી. એક નોંધપાત્ર કિસ્સામાં, GLM-5.2 એ 24 મિનિટ દરમિયાન 411 ટૂલ કોલ્સ (tool calls) કર્યા—જેમાં રો કાઉન્ટ, ડિસ્ટ્રિબ્યુશન અને નલ વેલ્યુઝની તપાસ કરવામાં આવી હતી—તેમ છતાં ત્રણેય પ્રયાસો નિષ્ફળ રહ્યા હતા. તેનાથી વિપરીત, Opus 4.7 એ માત્ર 49 કોલ્સ સાથે માત્ર 9 મિનિટમાં તે જ કાર્ય પૂર્ણ કર્યું હતું.

AI નું અર્થશાસ્ત્ર: ચીનનું પ્રાઇસિંગ દબાણ

જોકે Opus 4.7 વધુ કાર્યક્ષમ અને સુસંગત મોડલ છે, પરંતુ વાસ્તવિક વાત તેની યુનિટ ઇકોનોમિક્સ (unit economics) માં છે. પશ્ચિમી ફ્લેગશિપ મોડલ્સ અને GLM-5.2 વચ્ચેનો કિંમતનો તફાવત આશ્ચર્યજનક છે અને તે એન્ટરપ્રાઇઝ AI ડિપ્લોયમેન્ટ્સ માટેના ROI (રોકાણ પર વળતર) ના ગણતરીઓને મૂળભૂત રીતે બદલી શકે છે.

Zhipu ના સત્તાવાર ભાવ મુજબ, GLM-5.2 ની કિંમત પ્રતિ મિલિયન ઇનપુટ ટોકન્સ માટે $1.40 અને પ્રતિ મિલિયન આઉટપુટ ટોકન્સ માટે $4.40 છે. આને સમજવા માટે:

  • Claude Opus 4.7: $5.00 (Input) / $25.00 (Output)
  • GPT-5.5: $5.00 (Input) / $30.00 (Output)

ભલે GLM-5.2 વધુ "ટોકન-હંગ્રી" (token-hungry) હોય—Opus ના 80 ની સરખામણીમાં સરેરાશ પ્રતિ કાર્ય 99 રન કરે છે અને Opus ના 439 મિલિયન ટોકન્સ સામે 860 મિલિયન ટોકન્સ વાપરે છે—તે છતાં તે નોંધપાત્ર રીતે વધુ સસ્તું છે. આ પ્રાઇસિંગ મોડલ OpenAI અને Anthropic દ્વારા હાલમાં અપનાવવામાં આવેલી હાઈ-માર્જિન વ્યૂહરચનાઓ સામે સીધો પડકાર રજૂ કરે છે.

AI લેન્ડસ્કેપ માટે આ શા માટે મહત્વનું છે

GLM-5.2 જેવા અત્યંત સક્ષમ અને ઓછા ખર્ચવાળા મોડલ્સનું આગમન "AI બબલ" (AI bubble) માટે સ્ટ્રેસ ટેસ્ટ તરીકે કામ કરે છે. પશ્ચિમી AI લેબ્સનું વિશાળ મૂલ્યાંકન ઝડપી અને હાઈ-માર્જિન આવક વૃદ્ધિની ધારણા પર આધારિત છે. જો ડેવલપર્સ અને એન્ટરપ્રાઇઝ કોડિંગ અને ડેટા એન્જિનિયરિંગ જેવા વારંવાર થતા કાર્યો માટે ઘણા સસ્તા વિકલ્પો તરફ વળશે, તો ફ્લેગશિપ મોડલ્સ માટેના અંદાજિત આવકના સ્ત્રોતોમાં મોટો ઘટાડો થઈ શકે છે.

જેમ જેમ Snowflake તેના ગ્રાહકો માટે GLM-5.2 ઉપલબ્ધ કરાવવાની તૈયારી કરી રહ્યું છે, તેમ તેમ ઉદ્યોગ એક એવી વાસ્તવિકતા તરફ આગળ વધી રહ્યો છે જ્યાં "બુદ્ધિ" (intelligence) હવે લક્ઝરી વસ્તુ નથી, પરંતુ એક કોમોડિટીઝ યુટિલિટી (commoditized utility) છે.

મુખ્ય મુદ્દાઓ

  • સ્પર્ધાત્મક સમાનતા (Competitive Parity): GLM-5.2 એ જટિલ Snowflake/DuckDB કોડિંગ બેન્ચમાર્ક માં 66% સફળતા દર હાંસલ કર્યો, જે Claude Opus 4.7 ના 67% ની લગભગ બરાબર છે.
  • કાર્યક્ષમતાનો તફાવત (Efficiency Gap): જોકે GLM-5.2 અત્યંત સક્ષમ છે, તે ઓછી કાર્યક્ષમ છે, કારણ કે તેને ઉકેલો સુધી પહોંચવા માટે વધુ ટૂલ કોલ્સ અને વધુ ટોકન વપરાશની જરૂર પડે છે.
  • આર્થિક વિક્ષેપ (Economic Disruption): GLM-5.2 આઉટપુટ ટોકન પ્રાઇસિંગ Claude Opus 4.7 અથવા GPT-5.5 ના ખર્ચના અંદાજે 1/5 થી 1/7 ભાગમાં ઓફર કરે છે, જે પશ્ચિમી AI પ્રદાતાઓ પર તીવ્ર પ્રાઇસિંગ દબાણ ઊભું કરે છે.