Coinbase Shifts to Chinese AI Models to Slash API Costs

Translated for your language. Read the original.

AI-assisted draft.

Coinbase Shifts to Chinese AI Models to Slash API Costs

In this article

API ਲਾਗਤਾਂ ਨੂੰ ਘਟਾਉਣ ਲਈ Coinbase ਚੀਨੀ AI ਮਾਡਲਾਂ ਵੱਲ ਵਧਿਆ

ਜਦੋਂ ਪੱਛਮੀ AI ਲੈਬਾਂ ਭਾਰੀ ਕੰਪਿਊਟਿੰਗ ਲਾਗਤਾਂ ਅਤੇ ਮੁਨਾਫੇ ਦੇ ਵਿਚਕਾਰ ਸੰਤੁਲਨ ਬਣਾਉਣ ਲਈ ਸੰਘਰਸ਼ ਕਰ ਰਹੀਆਂ ਹਨ, ਉਦਯੋਗ ਦੇ ਮੋਹਰੀ ਕੰਪਨੀਆਂ ਕੁਸ਼ਲਤਾ ਲਈ ਪੂਰਬ ਵੱਲ ਦੇਖਣਾ ਸ਼ੁਰੂ ਕਰ ਰਹੀਆਂ ਹਨ। Coinbase ਨੇ ਆਪਣੇ ਸੰਚਾਲਨ ਖਰਚਿਆਂ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣ ਲਈ ਚੀਨੀ AI ਮਾਡਲਾਂ ਵੱਲ ਮੁੜਨ ਵਾਲੇ ਤਕਨੀਕੀ ਦਿੱਗਜਾਂ ਦੇ ਵਧ ਰਹੇ ਸਮੂਹ ਵਿੱਚ ਅਧਿਕਾਰਤ ਤੌਰ 'ਤੇ ਸ਼ਾਮਲ ਹੋਣ ਦਾ ਫੈਸਲਾ ਕੀਤਾ ਹੈ।

ਚੀਨੀ ਮਾਡਲਾਂ ਵੱਲ ਮੋੜ: GLM ਅਤੇ Kimi

Coinbase ਦੇ CEO Brian Armstrong ਨੇ ਹਾਲ ਹੀ ਵਿੱਚ ਖੁਲਾਸਾ ਕੀਤਾ ਕਿ ਕੰਪਨੀ ਨੇ ਆਪਣੇ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਵਿੱਚ GLM 5.2 ਅਤੇ Kimi 2.7 ਵਰਗੇ ਚੀਨ ਵਿੱਚ ਵਿਕਸਤ ਮਾਡਲਾਂ ਨੂੰ ਜੋੜ ਲਿਆ ਹੈ। ਇਸ ਰਣਨੀਤਕ ਤਬਦੀਲੀ ਨੇ Coinbase ਨੂੰ ਇੱਕੋ ਸਮੇਂ ਆਪਣੇ AI ਖਰਚਿਆਂ ਨੂੰ ਅੱਧਾ ਕਰਦੇ ਹੋਏ ਕਾਫ਼ੀ ਜ਼ਿਆਦਾ ਟੋਕਨ ਵੌਲਯੂਮ (token volumes) ਨੂੰ ਸੰਭਾਲਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੱਤੀ ਹੈ।

ਇਹ ਕਦਮ ਸਿਰਫ਼ ਕ੍ਰਿਪਟੋ ਖੇਤਰ ਤੱਕ ਸੀਮਤ ਨਹੀਂ ਹੈ। ਸਟਾਰਟਅੱਪ Lindy ਨੇ DeepSeek v4 ਵੱਲ ਤਬਦੀਲੀ ਕੀਤੀ ਹੈ, ਅਤੇ ਡੇਟਾ ਦਿੱਗਜ Snowflake ਇਸ ਸਮੇਂ OpenAI ਅਤੇ Anthropic ਦੀਆਂ ਮਹਿੰਗੀਆਂ ਪੇਸ਼ਕਸ਼ਾਂ ਦੇ ਕਿਫਾਇਤੀ ਵਿਕਲਪਾਂ ਵਜੋਂ ਚੀਨੀ ਮਾਡਲਾਂ ਦੀ ਜਾਂਚ ਕਰ ਰਿਹਾ ਹੈ। ਇਹ ਤਬਦੀਲੀ ਇਸ ਗੱਲ ਦਾ ਸੰਕੇਤ ਹੈ ਕਿ ਉਦਯੋਗਿਕ ਸੰਸਥਾਵਾਂ AI ਦੇ "ਫਰੰਟੀਅਰ" ਨੂੰ ਕਿਵੇਂ ਦੇਖਦੀਆਂ ਹਨ, ਜਿੱਥੇ ਉਹ ਬ੍ਰਾਂਡ ਦੀ ਜਾਣ-ਪਛਾਣ ਦੀ ਬਜਾਏ ਕੀਮਤ-ਵੱਲੋਂ-ਪ੍ਰਦਰਸ਼ਨ (price-to-performance) ਅਨੁਪਾਤ ਨੂੰ ਪਹਿਲ ਦੇ ਰਹੇ ਹਨ।

ਇੰਟੈਲੀਜੈਂਟ ਰੂਟਿੰਗ ਅਤੇ ਕੰਟੈਕਸਟ ਇੰਜੀਨੀਅਰਿੰਗ (Context Engineering)

ਇਹਨਾਂ ਬਚਤਾਂ ਨੂੰ ਵੱਧ ਤੋਂ ਵੱਧ ਕਰਨ ਲਈ, Coinbase ਨੇ ਇੱਕ ਆਟੋਮੇਟਡ ਰੂਟਿੰਗ ਸਿਸਟਮ ਲਾਗੂ ਕੀਤਾ ਹੈ। ਇੱਕ ਸਿੰਗਲ LLM 'ਤੇ ਨਿਰਭਰ ਰਹਿਣ ਦੀ ਬਜਾਏ, ਇਹ ਸਿਸਟਮ ਤਿੰਨ ਮਹੱਤਵਪੂਰਨ ਮਾਪਦੰਡਾਂ ਦੇ ਅਧਾਰ 'ਤੇ ਹਰ ਬੇਨਤੀ ਦਾ ਮੁਲਾਂਕਣ ਕਰਦਾ ਹੈ: ਕੰਮ ਦੀ ਜਟਿਲਤਾ (task complexity), ਲਾਗਤ, ਅਤੇ ਕੈਸ਼ਿੰਗ ਦੀ ਸੰਭਾਵਨਾ (caching potential)।

ਇਸ ਰਣਨੀਤੀ ਦਾ ਤਕਨੀਕੀ ਲਾਗੂਕਰਨ "ਕੰਟੈਕਸਟ ਇੰਜੀਨੀਅਰਿੰਗ" (context engineering) 'ਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਨਿਰਭਰ ਕਰਦਾ ਹੈ। ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਕੰਟੈਕਸਟ ਨੂੰ ਘੱਟ ਰੱਖਣ ਅਤੇ ਨਵੇਂ ਕੰਮਾਂ ਲਈ ਨਵੇਂ ਸੈਸ਼ਨ ਸ਼ੁਰੂ ਕਰਨ ਲਈ ਉਤਸ਼ਾਹਿਤ ਕਰਕੇ, Coinbase ਨੇ ਆਪਣੀ ਕੈਸ਼ਿੰਗ ਹਿੱਟ ਰੇਟ (caching hit rate) ਨੂੰ ਸਿਰਫ਼ 5% ਤੋਂ ਵਧਾ ਕੇ 60% ਕਰ ਦਿੱਤਾ ਹੈ। ਇਹ ਕੁਸ਼ਲਤਾ ਕੰਪਨੀ ਨੂੰ ਰੋਜ਼ਾਨਾ ਦੇ ਕੰਮਾਂ ਲਈ ਸਸਤੇ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦੀ ਹੈ ਜਦੋਂ ਕਿ ਗੁੰਝਲਦਾਰ ਕਾਰਜਾਂ ਲਈ ਉੱਚ-ਤਰਕ (high-reasoning) ਮਾਡਲਾਂ ਨੂੰ ਰਾਖਵਾਂ ਰੱਖਦੀ ਹੈ, ਇੱਕ ਅਜਿਹੀ ਤਕਨੀਕ ਜੋ agentic workflows ਨੂੰ ਵਧਾਉਣ ਲਈ ਇੱਕ ਨਮੂਨਾ ਬਣ ਰਹੀ ਹੈ।

Tokenmaxxing ਅਤੇ ਪ੍ਰਦਰਸ਼ਨ ਜਵਾਬਦੇਹੀ

"Agentic reasoning" ਮਾਡਲਾਂ ਦੇ ਵਧਣ ਨਾਲ—ਜਿਵੇਂ ਕਿ ਉਮੀਦ ਕੀਤੀ ਜਾ ਰਹੀ GPT-5.x ਸੀਰੀਜ਼—ਟੋਕਨ ਦੀ ਖਪਤ ਵਿੱਚ ਭਾਰੀ ਵਾਧਾ ਹੋਇਆ ਹੈ। ਜਦੋਂ ਕਿ Amazon ਅਤੇ Meta ਵਰਗੀਆਂ ਕੰਪਨੀਆਂ ਵਿੱਚ "tokenmaxxing" ਦਾ ਰੁਝਾਨ ਦੇਖਿਆ ਗਿਆ ਹੈ, ਜਿੱਥੇ ਕਰਮਚਾਰੀ ਸਖ਼ਤ ਨਿਗਰਾਨੀ ਤੋਂ ਬਿਨਾਂ ਬਹੁਤ ਜ਼ਿਆਦਾ ਟੋਕਨ ਖਤਮ ਕਰ ਦਿੰਦੇ ਹਨ, Coinbase ਇੱਕ ਵੱਖਰੀ ਫਲਸਫਾ ਲਾਗੂ ਕਰ ਰਿਹਾ ਹੈ।

Armstrong ਨੇ ਬਿਨਾਂ ਕਿਸੇ ਪਾਬੰਦੀ ਦੇ ਪਾਰਦਰਸ਼ਤਾ ਦਾ ਇੱਕ ਮਾਡਲ ਪੇਸ਼ ਕੀਤਾ ਹੈ: ਡਿਵੈਲਪਰਾਂ ਦੀ ਵਰਤੋਂ 'ਤੇ ਕੋਈ ਸੀਮਾ ਨਹੀਂ ਹੈ, ਪਰ ਉਹਨਾਂ ਦਾ ਖਰਚਾ ਪਾਰਦਰਸ਼ੀ ਹੈ। ਇਸਦਾ ਮਾਰਗਦਰਸ਼ਕ ਸਿਧਾਂਤ "ਇੰਪੈਕਟ-ਅਧਾਰਤ ਜਵਾਬਦੇਹੀ" (impact-based accountability) ਹੈ—ਡਿਵੈਲਪਰ AI ਟੋਕਨਾਂ 'ਤੇ ਜਿੰਨਾ ਜ਼ਿਆਦਾ ਖਰਚ ਕਰਦਾ ਹੈ, ਉਮੀਦ ਕੀਤੀ ਗਈ ਆਊਟਪੁੱਟ ਅਤੇ ਵਪਾਰਕ ਪ੍ਰਭਾਵ ਉਨਾ ਹੀ ਜ਼ਿਆਦਾ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਇਹ ਪਹੁੰਚ ਭਾਰੀ ਕੰਪਿਊਟਿੰਗ ਦੀ ਲੋੜ ਅਤੇ ROI ਦੀ ਲੋੜ ਵਿਚਕਾਰ ਸੰਤੁਲਨ ਬਣਾਉਂਦੀ ਹੈ।

ਪੱਛਮੀ ਲੈਬਾਂ ਲਈ ਕੀਮਤ ਦਾ ਸਟ੍ਰੈੱਸ ਟੈਸਟ

ਸਸਤੇ ਚੀਨੀ ਵਿਕਲਪਾਂ ਵੱਲ ਵਧ ਰਿਹਾ ਇਹ ਰੁਝਾਨ ਪੱਛਮੀ AI ਲੈਬਾਂ 'ਤੇ ਭਾਰੀ ਦਬਾਅ ਪਾ ਰਿਹਾ ਹੈ, ਖਾਸ ਕਰਕੇ ਜਦੋਂ OpenAI ਅਤੇ Anthropic ਵਰਗੀਆਂ ਕੰਪਨੀਆਂ IPOs ਦੀ ਉਮੀਦ ਕਰ ਰਹੀਆਂ ਹਨ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਟਿਕਾਊ ਵਿਕਾਸ ਸਾਬਤ ਕਰਨ ਦੀ ਲੋੜ ਹੈ। ਇੱਕ ਸ਼ੁਰੂ ਹੋ ਰਹੀ ਕੀਮਤ ਦੀ ਜੰਗ ਪਹਿਲਾਂ ਹੀ ਸਪੱਸ਼ਟ ਹੈ; ਰਿਪੋਰਟਾਂ ਅਨੁਸਾਰ OpenAI, GPT-5.6-Sol ਵਰਗੇ ਵਧੇਰੇ ਟੋਕਨ-ਕੁਸ਼ਲ ਵੇਰੀਐਂਟਸ ਅਤੇ ਘੱਟ ਕੀਮਤ ਵਾਲੇ, ਹਲਕੇ ਮਾਡਲ ਪੇਸ਼ ਕਰਕੇ ਮੁਕਾਬਲੇ ਦਾ ਸਾਹਮਣਾ ਕਰ ਰਿਹਾ ਹੈ। ਪੱਛਮੀ ਪ੍ਰਦਾਤਾਵਾਂ ਲਈ, ਚੁਣੌਤੀ ਹੁਣ ਸਿਰਫ਼ ਬੁੱਧੀਮਾਨਤਾ ਬਾਰੇ ਨਹੀਂ ਹੈ, ਸਗੋਂ ਇੱਕ ਅਜਿਹੀ ਕੀਮਤ ਬਣਾਈ ਰੱਖਣ ਬਾਰੇ ਹੈ ਜੋ ਉਦਯੋਗਿਕ ਗਾਹਕਾਂ ਨੂੰ ਵਧੇਰੇ ਕਿਫਾਇਤੀ ਵਿਸ਼ਵਵਿਆਪੀ ਮੁਕਾਬਲੇਬਾਜ਼ਾਂ ਵੱਲ ਜਾਣ ਤੋਂ ਰੋਕ ਸਕੇ।

ਮੁੱਖ ਗੱਲਾਂ

ਲਾਗਤ ਅਨੁਕੂਲਤਾ (Cost Optimization): Coinbase ਨੇ ਕੁੱਲ ਟੋਕਨ ਵਰਤੋਂ ਨੂੰ ਵਧਾਉਂਦੇ ਹੋਏ GLM 5.2 ਅਤੇ Kimi 2.7 ਵਰਗੇ ਚੀਨੀ ਮਾਡਲਾਂ ਨੂੰ ਜੋੜ ਕੇ ਆਪਣੇ AI ਖਰਚਿਆਂ ਨੂੰ ਅੱਧਾ ਕਰ ਦਿੱਤਾ ਹੈ।
ਤਕਨੀਕੀ ਕੁਸ਼ਲਤਾ: ਆਟੋਮੇਟਡ ਰੂਟਿੰਗ ਅਤੇ ਕੰਟੈਕਸਟ ਇੰਜੀਨੀਅਰਿੰਗ ਨੂੰ ਲਾਗੂ ਕਰਨ ਨਾਲ Coinbase ਨੂੰ ਕੈਸ਼ਿੰਗ ਹਿੱਟ ਰੇਟ ਨੂੰ 5% ਤੋਂ ਵਧਾ ਕੇ 60% ਕਰਨ ਵਿੱਚ ਮਦਦ ਮਿਲੀ ਹੈ।
ਮਾਰਕੀਟ ਦਾ ਦਬਾਅ: ਸਸਤੇ ਮਾਡਲਾਂ ਵੱਲ ਵਧ ਰਿਹਾ ਰੁਝਾਨ ਪੱਛਮੀ ਲੈਬਾਂ ਨੂੰ ਉਹਨਾਂ ਦੇ ਉੱਚ ਮੁਲਾਂਕਣ (valuations) ਅਤੇ ਆਉਣ ਵਾਲੇ IPO ਦੀਆਂ ਸੰਭਾਵਨਾਵਾਂ ਨੂੰ ਜਾਇਜ਼ ਠਹਿਰਾਉਣ ਲਈ ਕੀਮਤ ਦੀ ਜੰਗ ਵਿੱਚ ਧੱਕ ਰਿਹਾ ਹੈ।

Coinbase Shifts to Chinese AI Models to Slash API Costs

API ਲਾਗਤਾਂ ਨੂੰ ਘਟਾਉਣ ਲਈ Coinbase ਚੀਨੀ AI ਮਾਡਲਾਂ ਵੱਲ ਵਧਿਆ

ਚੀਨੀ ਮਾਡਲਾਂ ਵੱਲ ਮੋੜ: GLM ਅਤੇ Kimi

ਇੰਟੈਲੀਜੈਂਟ ਰੂਟਿੰਗ ਅਤੇ ਕੰਟੈਕਸਟ ਇੰਜੀਨੀਅਰਿੰਗ (Context Engineering)

Tokenmaxxing ਅਤੇ ਪ੍ਰਦਰਸ਼ਨ ਜਵਾਬਦੇਹੀ

ਪੱਛਮੀ ਲੈਬਾਂ ਲਈ ਕੀਮਤ ਦਾ ਸਟ੍ਰੈੱਸ ਟੈਸਟ

ਮੁੱਖ ਗੱਲਾਂ

Continue reading

Snowflake CEO: GLM 5.2 Rivals Claude Opus 4.7 at a Fraction of the Cost

Lindy Swaps Claude for DeepSeek to Save Millions in AI Costs

China’s AI Breakthrough: New Cybersecurity Tools Rival US Tech