Snowflake CEO: மிகக் குறைந்த விலையில் Claude Opus 4.7-க்கு இணையாகச் செயல்படும் GLM-5.2

Snowflake நடத்திய சமீபத்திய நேரடி ஒப்பீட்டுச் சோதனை (benchmark), AI துறையில் பெரும் அதிர்ச்சியை ஏற்படுத்தியுள்ளது. சீனாவின் GLM-5.2, சிறப்புத் திறன் கொண்ட கோடிங் (coding) பணிகளில் மேற்கத்திய நாடுகளின் உயர்தர மாடல்களுக்கு இணையாகப் போட்டியிட முடியும் என்பதை இது வெளிச்சம் போட்டுக் காட்டியுள்ளது. Claude Opus 4.7 தொழில்நுட்ப ரீதியாக முன்னிலையில் இருந்தாலும், இரு மாடல்களுக்கும் இடையிலான மிகப்பெரிய விலை வேறுபாடு, Large Language Models (LLMs)-ன் பொருளாதாரத்தில் ஒரு பெரிய மாற்றத்தை ஏற்படுத்தப்போவதைக் குறிக்கிறது.

ஒப்பீட்டுச் சோதனை: சிக்கலான சூழல்களில் கோடிங் திறன் சமநிலை

DuckDB மற்றும் Snowflake ஆகிய இரண்டு சூழல்களிலும் கோட் உருவாக்கும் திறனை (code generation) மதிப்பிடுவதற்காக வடிவமைக்கப்பட்ட 103 தனித்துவமான பணிகளை உள்ளடக்கிய ஒரு கடுமையான சோதனையை Snowflake CEO Sridhar Ramaswamy முன்னின்று நடத்தினார். இதன் முடிவுகள் ஆச்சரியப்படும் வகையில் நெருக்கமாக இருந்தன: ஒரு பணிக்கு மூன்று முயற்சிகள் வழங்கப்பட்டபோது, GLM-5.2 66% பணிகளைத் தீர்த்தது; இது 67% வெற்றி விகிதத்தைப் பெற்ற Claude Opus 4.7-க்கு மிகக் குறைவாகவே பின் தங்கியிருந்தது.

இருப்பினும், செயல்பாட்டின் நுணுக்கங்கள் நம்பகத்தன்மையில் உள்ள வேறுபாட்டை வெளிப்படுத்துகின்றன. GLM-5.2-ன் முதல் முயற்சியில் துல்லியத்தன்மை 47.6% ஆக இருந்த நிலையில், Opus 4.7 53.7% துல்லியத்துடன் சிறந்த நிலைத்தன்மையைக் காட்டியது. சீன மாடலான GLM-5.2, தேவையற்ற செயல்முறைகளில் சிக்கிக்கொள்ளும் அல்லது "அதிகமாகச் சிந்திக்கும்" (over-think) போக்கையும் வெளிப்படுத்தியது. ஒரு குறிப்பிடத்தக்க நிகழ்வில், GLM-5.2 24 நிமிடங்களில் 411 டூல் கால்களை (tool calls) மேற்கொண்டது—வரிசை எண்ணிக்கைகள் (row counts), விநியோகங்கள் (distributions) மற்றும் காலியான மதிப்புகளை (null values) சரிபார்த்தது—இருப்பினும் மூன்று முயற்சிகளிலும் தோல்வியடைந்தது. இதற்கு நேர்மாறாக, Opus 4.7 அதே பணியை வெறும் 9 நிமிடங்களில், 49 அழைப்புகளுடன் முடித்தது.

AI-ன் பொருளாதாரம்: சீனாவின் விலை நிர்ணய அழுத்தம்

Opus 4.7 அதிக திறன் மற்றும் நிலைத்தன்மை கொண்ட மாடலாக இருந்தாலும், உண்மையான முக்கியத்துவம் அதன் பொருளாதாரச் செலவில் உள்ளது. மேற்கத்திய முன்னணி மாடல்களுக்கும் GLM-5.2-க்கும் இடையிலான விலை வேறுபாடு வியக்கத்தக்கது; இது நிறுவனங்களின் AI பயன்பாடுகளுக்கான ROI (முதலீட்டின் மீதான லாபம்) கணக்கீடுகளை அடிப்படையாகவே மாற்றியமைக்கக்கூடும்.

Zhipu-வின் அதிகாரப்பூர்வ விலை நிர்ணயத்தின்படி, GLM-5.2 ஒரு மில்லியன் இன்புட் டோக்கன்களுக்கு (input tokens) $1.40 மற்றும் ஒரு மில்லியன் அவுட்புட் டோக்கன்களுக்கு (output tokens) $4.40 செலவாகிறது. இதை ஒப்பிட்டுப் பார்த்தால்:

  • Claude Opus 4.7: $5.00 (Input) / $25.00 (Output)
  • GPT-5.5: $5.00 (Input) / $30.00 (Output)

GLM-5.2 அதிக டோக்கன்களைப் பயன்படுத்து olsa (Opus-ன் 80 சராசரி ஓட்டங்களுடன் ஒப்பிடும்போது இது ஒரு பணிக்கு சராசரியாக 99 ஓட்டங்களைச் செய்கிறது; மேலும் Opus-ன் 439 மில்லியன் டோக்கன்களுடன் ஒப்பிடும்போது இது 860 மில்லியன் டோக்கன்களைப் பயன்படுத்துகிறது), இது கணிசமான அளவில் மலிவானதாகவே உள்ளது. இந்த விலை நிர்ணய முறை, தற்போது OpenAI மற்றும் Anthropic நிறுவனங்கள் பின்பற்றி வரும் அதிக லாபகரமான (high-margin) உத்திகளுக்கு நேரடி சவாலாக உள்ளது.

AI சூழலில் இது ஏன் முக்கியமானது

GLM-5.2 போன்ற அதிகத் திறன் கொண்ட, குறைந்த விலை மாடல்களின் வருகை, "AI குமிழியை" (AI bubble) சோதிக்கும் ஒரு அழுத்தச் சோதனை போலச் செயல்படுகிறது. மேற்கத்திய AI ஆய்வகங்களின் பிரம்மாண்டமான மதிப்பீடுகள், விரைவான மற்றும் அதிக லாபகரமான வருவாய் வளர்ச்சியின் அடிப்படையிலேயே அமைந்துள்ளன. கோடிங் மற்றும் டேட்டா இன்ஜினியரிங் (data engineering) போன்ற அடிக்கடி செய்யப்படும் பணிகளுக்கு டெவலப்பர்களும் நிறுவனங்களும் மிகவும் மலிவான மாற்று வழிகளை நோக்கித் திரும்பினால், முன்னணி மாடல்களுக்கான வருவாய் கணிப்புகள் கணிசமாகக் குறையக்கூடும்.

Snowflake தனது வாடிக்கையாளர்களுக்கு GLM-5.2-ஐ வழங்கத் தயாராகி வரும் நிலையில், "அறிவுத்திறன்" (intelligence) என்பது இனி ஒரு ஆடம்பரப் பொருள் அல்ல, மாறாக ஒரு பொதுவான பயன்பாட்டுப் பொருளாக (commoditized utility) மாறும் யதார்த்தத்தை நோக்கித் தொழில் துறை நகர்ந்து கொண்டிருக்கிறது.

முக்கியக் குறிப்புகள்

  • போட்டித் திறன்: சிக்கலான Snowflake/DuckDB கோடிங் ஒப்பீடுகளில் GLM-5.2 66% வெற்றி விகிதத்தைப் பெற்றது, இது Claude Opus 4.7-ன் 67% வெற்றி விகிதத்திற்கு இணையானது.
  • திறன் இடைவெளி: GLM-5.2 அதிகத் திறன் கொண்டதாக இருந்தாலும், தீர்வுகளை எட்டுவதற்கு அதிக டூல் கால்கள் மற்றும் அதிக டோக்கன் பயன்பாடு தேவைப்படுவதால், இது குறைந்த செயல்திறன் கொண்டதாக உள்ளது.
  • பொருளாதாரத் தாக்கம்: GLM-5.2, Claude Opus 4.7 அல்லது GPT-5.5-ன் அவுட்புட் டோக்கன் விலையில் சுமார் 1/5 முதல் 1/7 பங்கு விலையில் மட்டுமே வழங்குகிறது, இது மேற்கத்திய AI நிறுவனங்களுக்குக் கடுமையான விலை அழுத்தத்தை ஏற்படுத்துகிறது.