Snowflake CEO: GLM-5.2 ਬਹੁਤ ਹੀ ਘੱਟ ਕੀਮਤ 'ਤੇ Claude Opus 4.7 ਨੂੰ ਟੱਕਰ ਦੇ ਰਿਹਾ ਹੈ
Snowflake ਦੁਆਰਾ ਕੀਤੇ ਗਏ ਇੱਕ ਤਾਜ਼ਾ ਬੈਂਚਮਾਰਕ ਨੇ AI ਉਦਯੋਗ ਵਿੱਚ ਹਲਚਲ ਮਚਾ ਦਿੱਤੀ ਹੈ, ਜਿਸ ਤੋਂ ਪਤਾ ਲੱਗਦਾ ਹੈ ਕਿ ਚੀਨ ਦਾ GLM-5.2 ਵਿਸ਼ੇਸ਼ ਕੋਡਿੰਗ ਕੰਮਾਂ ਵਿੱਚ ਉੱਚ-ਦਰਜੇ ਦੇ ਪੱਛਮੀ ਮਾਡਲਾਂ ਨਾਲ ਮੁਕਾਬਲਾ ਕਰ ਸਕਦਾ ਹੈ। ਹਾਲਾਂਕਿ Claude Opus 4.7 ਤਕਨੀਕੀ ਤੌਰ 'ਤੇ ਅੱਗੇ ਹੈ, ਪਰ ਕੀਮਤਾਂ ਵਿੱਚ ਵੱਡਾ ਅੰਤਰ Large Language Models (LLMs) ਦੀ ਆਰਥਿਕਤਾ ਵਿੱਚ ਆਉਣ ਵਾਲੇ ਵੱਡੇ ਬਦਲਾਅ ਵੱਲ ਇਸ਼ਾਰਾ ਕਰਦਾ ਹੈ।
ਬੈਂਚਮਾਰਕ: ਗੁੰਝਲਦਾਰ ਵਾਤਾਵਰਣਾਂ ਵਿੱਚ ਕੋਡਿੰਗ ਦੀ ਸਮਾਨਤਾ
Snowflake ਦੇ CEO ਸ੍ਰੀਧਰ ਰਾਮਾਸਵਾਮੀ ਨੇ DuckDB ਅਤੇ Snowflake ਦੋਵਾਂ ਵਾਤਾਵਰਣਾਂ ਵਿੱਚ ਕੋਡ ਜਨਰੇਸ਼ਨ (code generation) ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ 103 ਵੱਖ-ਵੱਖ ਕੰਮਾਂ ਵਾਲਾ ਇੱਕ ਸਖ਼ਤ ਟੈਸਟ ਲਗਾਇਆ। ਨਤੀਜੇ ਹੈਰਾਨੀਜਨਕ ਤੌਰ 'ਤੇ ਨੇੜੇ ਸਨ: ਜਦੋਂ ਹਰੇਕ ਕੰਮ ਲਈ ਤਿੰਨ ਮੌਕੇ ਦਿੱਤੇ ਗਏ, ਤਾਂ GLM-5.2 ਨੇ 66% ਕੰਮ ਹੱਲ ਕੀਤੇ, ਜੋ ਕਿ Claude Opus 4.7 ਤੋਂ ਸਿਰਫ਼ ਥੋੜ੍ਹਾ ਹੀ ਪਿੱਛੇ ਸੀ, ਜਿਸ ਨੇ 67% ਦੀ ਸਫਲਤਾ ਦਰ ਪ੍ਰਾਪਤ ਕੀਤੀ ਸੀ।
ਹਾਲਾਂਕਿ, ਪ੍ਰਦਰਸ਼ਨ ਦੀਆਂ ਬਾਰੀਕੀਆਂ ਭਰੋਸੇਯੋਗਤਾ ਵਿੱਚ ਫਰਕ ਨੂੰ ਦਰਸਾਉਂਦੀਆਂ ਹਨ। Opus 4.7 ਨੇ 53.7% ਦੀ ਪਹਿਲੀ ਕੋਸ਼ਿਸ਼ ਦੀ ਸ਼ੁੱਧਤਾ ਨਾਲ ਬਿਹਤਰ ਇਕਸਾਰਤਾ ਦਿਖਾਈ, ਜਦੋਂ ਕਿ GLM-5.2 ਦੀ ਸ਼ੁੱਧਤਾ 47.6% ਸੀ। ਚੀਨੀ ਮਾਡਲ ਵਿੱਚ "over-think" ਕਰਨ ਜਾਂ ਬੇਲੋੜੀਆਂ ਪ੍ਰਕਿਰਿਆਵਾਂ ਨੂੰ ਵਾਰ-ਵਾਰ ਦੁਹਰਾਉਣ ਦੀ ਪ੍ਰਵਿਰਤੀ ਵੀ ਦੇਖੀ ਗਈ। ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਮਾਮਲੇ ਵਿੱਚ, GLM-5.2 ਨੇ 24 ਮਿੰਟਾਂ ਵਿੱਚ 411 ਟੂਲ ਕਾਲ (tool calls) ਕੀਤੇ—ਜਿਸ ਵਿੱਚ ਰੋਅ ਕਾਊਂਟ (row counts), ਡਿਸਟ੍ਰੀਬਿਊਸ਼ਨ ਅਤੇ null ਵੈਲਯੂਜ਼ ਦੀ ਜਾਂਚ ਕੀਤੀ ਗਈ—ਫਿਰ ਵੀ ਤਿੰਨੋਂ ਕੋਸ਼ਿਸ਼ਾਂ ਅਸਫਲ ਰਹੀਆਂ। ਇਸ ਦੇ ਉਲਟ, Opus 4.7 ਨੇ ਸਿਰਫ਼ 49 ਕਾਲਾਂ ਨਾਲ ਮਹਿਜ਼ 9 ਮਿੰਟਾਂ ਵਿੱਚ ਉਹੀ ਕੰਮ ਹੱਲ ਕਰ ਲਿਆ।
AI ਦੀ ਆਰਥਿਕਤਾ: ਚੀਨ ਦਾ ਕੀਮਤ ਦਾ ਦਬਾਅ
ਹਾਲਾਂਕਿ Opus 4.7 ਵਧੇਰੇ ਕੁਸ਼ਲ ਅਤੇ ਇਕਸਾਰ ਮਾਡਲ ਹੈ, ਪਰ ਅਸਲ ਗੱਲ ਯੂਨਿਟ ਇਕਨਾਮਿਕਸ (unit economics) ਵਿੱਚ ਹੈ। ਪੱਛਮੀ ਫਲੈਗਸ਼ਿਪ ਮਾਡਲਾਂ ਅਤੇ GLM-5.2 ਵਿਚਕਾਰ ਕੀਮਤ ਦਾ ਅੰਤਰ ਬਹੁਤ ਜ਼ਿਆਦਾ ਹੈ ਅਤੇ ਇਹ ਐਂਟਰਪ੍ਰਾਈਜ਼ AI ਤੈਨਾਤੀਆਂ (enterprise AI deployments) ਲਈ ROI ਦੀਆਂ ਗਣਨਾਵਾਂ ਨੂੰ ਬੁਨਿਆਦੀ ਤੌਰ 'ਤੇ ਬਦਲ ਸਕਦਾ ਹੈ।
Zhipu ਦੀ ਅਧਿਕਾਰਤ ਕੀਮਤਾਂ ਅਨੁਸਾਰ, GLM-5.2 ਦੀ ਕੀਮਤ ਪ੍ਰਤੀ ਮਿਲੀਅਨ ਇਨਪੁਟ ਟੋਕਨ $1.40 ਅਤੇ ਪ੍ਰਤੀ ਮਿਲੀਅਨ ਆਉਟਪੁੱਟ ਟੋਕਨ $4.40 ਹੈ। ਇਸ ਨੂੰ ਸਮਝਣ ਲਈ:
- Claude Opus 4.7: $5.00 (Input) / $25.00 (Output)
- GPT-5.5: $5.00 (Input) / $30.00 (Output)
ਭਾਵੇਂ GLM-5.2 ਵਧੇਰੇ "token-hungry" ਹੈ—Opus ਦੇ 80 ਦੇ ਮੁਕਾਬਲੇ ਪ੍ਰਤੀ ਕੰਮ ਔਸਤ 99 ਰਨ ਅਤੇ Opus ਦੇ 439 ਮਿਲੀਅਨ ਦੇ ਮੁਕਾਬਲੇ 860 ਮਿਲੀਅਨ ਟੋਕਨ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ—ਫਿਰ ਵੀ ਇਹ ਕਾਫ਼ੀ ਕਿਫਾਇਤੀ ਹੈ। ਇਹ ਕੀਮਤ ਮਾਡਲ OpenAI ਅਤੇ Anthropic ਦੁਆਰਾ ਵਰਤੀਆਂ ਜਾ ਰਹੀਆਂ ਉੱਚ-ਮਾਰਜਿਨ ਰਣਨੀਤੀਆਂ ਲਈ ਸਿੱਧੀ ਚੁਣੌਤੀ ਪੇਸ਼ ਕਰਦਾ ਹੈ।
ਇਹ AI ਲੈਂਡਸਕੇਪ ਲਈ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਹੈ
GLM-5.2 ਵਰਗੇ ਬਹੁਤ ਹੀ ਸਮਰੱਥ, ਘੱਟ ਲਾਗਤ ਵਾਲੇ ਮਾਡਲਾਂ ਦਾ ਉਭਾਰ "AI bubble" ਲਈ ਇੱਕ ਸਟ੍ਰੈੱਸ ਟੈਸਟ ਵਜੋਂ ਕੰਮ ਕਰਦਾ ਹੈ। ਪੱਛਮੀ AI ਲੈਬਾਂ ਦੀਆਂ ਭਾਰੀ ਕੀਮਤਾਂ (valuations) ਤੇਜ਼, ਉੱਚ-ਮਾਰਜਿਨ ਮਾਲੀਆ ਵਾਧੇ ਦੀ ਅਟੱਲਤਾ 'ਤੇ ਅਧਾਰਤ ਹਨ। ਜੇਕਰ ਡਿਵੈਲਪਰ ਅਤੇ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਕੋਡਿੰਗ ਅਤੇ ਡੇਟਾ ਇੰਜੀਨੀਅਰਿੰਗ ਵਰਗੇ ਉੱਚ-ਫ੍ਰੀਕੁਐਂਸੀ ਵਾਲੇ ਕੰਮਾਂ ਲਈ ਬਹੁਤ ਸਸਤੇ ਵਿਕਲਪਾਂ ਵੱਲ ਮੁੜਦੇ ਹਨ, ਤਾਂ ਫਲੈਗਸ਼ਿਪ ਮਾਡਲਾਂ ਲਈ ਅਨੁਮਾਨਿਤ ਮਾਲੀਆ ਪ੍ਰਵਾਹ ਵਿੱਚ ਵੱਡੀ ਗਿਰਾਵਟ ਆ ਸਕਦੀ ਹੈ।
ਜਿਵੇਂ ਹੀ Snowflake ਆਪਣੇ ਗਾਹਕਾਂ ਲਈ GLM-5.2 ਨੂੰ ਉਪਲਬਧ ਕਰਵਾਉਣ ਦੀ ਤਿਆਰੀ ਕਰ ਰਿਹਾ ਹੈ, ਉਦਯੋਗ ਇੱਕ ਅਜਿਹੀ ਅਸਲੀਅਤ ਵੱਲ ਵਧ ਰਿਹਾ ਹੈ ਜਿੱਥੇ "intelligence" ਹੁਣ ਕੋਈ ਲਗਜ਼ਰੀ ਵਸਤੂ ਨਹੀਂ, ਸਗੋਂ ਇੱਕ ਆਮ ਉਪਲਬਧ ਸਹੂਲਤ (commoditized utility) ਬਣ ਜਾਵੇਗੀ।
ਮੁੱਖ ਗੱਲਾਂ
- ਮੁਕਾਬਲੇ ਦੀ ਸਮਾਨਤਾ: GLM-5.2 ਨੇ ਗੁੰਝਲਦਾਰ Snowflake/DuckDB ਕੋਡਿੰਗ ਬੈਂਚਮਾਰਕਸ ਵਿੱਚ 66% ਦੀ ਸਫਲਤਾ ਦਰ ਪ੍ਰਾਪਤ ਕੀਤੀ, ਜੋ ਕਿ Claude Opus 4.7 ਦੇ 67% ਦੇ ਲਗਭਗ ਬਰਾਬਰ ਹੈ।
- ਕੁਸ਼ਲਤਾ ਦਾ ਪਾੜਾ: ਹਾਲਾਂਕਿ GLM-5.2 ਬਹੁਤ ਸਮਰੱਥ ਹੈ, ਪਰ ਇਹ ਘੱਟ ਕੁਸ਼ਲ ਹੈ, ਜਿਸ ਨੂੰ ਹੱਲ ਤੱਕ ਪਹੁੰਚਣ ਲਈ ਵਧੇਰੇ ਟੂਲ ਕਾਲਾਂ ਅਤੇ ਵਧੇਰੇ ਟੋਕਨ ਦੀ ਵਰਤੋਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।
- ਆਰਥਿਕ ਵਿਘਨ: GLM-5.2 ਆਉਟਪੁੱਟ ਟੋਕਨ ਦੀ ਕੀਮਤ Claude Opus 4.7 ਜਾਂ GPT-5.5 ਦੇ ਲਗਭਗ 1/5ਵੇਂ ਤੋਂ 1/7ਵੇਂ ਹਿੱਸੇ 'ਤੇ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਜੋ ਪੱਛਮੀ AI ਪ੍ਰਦਾਤਾਵਾਂ 'ਤੇ ਕੀਮਤ ਦਾ ਭਾਰੀ ਦਬਾਅ ਪਾ ਰਿਹਾ ਹੈ।
