API ਲਾਗਤਾਂ ਨੂੰ ਘਟਾਉਣ ਲਈ Coinbase ਚੀਨੀ AI ਮਾਡਲਾਂ ਵੱਲ ਵਧਿਆ

ਜਦੋਂ ਪੱਛਮੀ AI ਲੈਬਾਂ ਭਾਰੀ ਕੰਪਿਊਟਿੰਗ ਲਾਗਤਾਂ ਅਤੇ ਮੁਨਾਫੇ ਦੇ ਵਿਚਕਾਰ ਸੰਤੁਲਨ ਬਣਾਉਣ ਲਈ ਸੰਘਰਸ਼ ਕਰ ਰਹੀਆਂ ਹਨ, ਉਦਯੋਗ ਦੇ ਮੋਹਰੀ ਕੰਪਨੀਆਂ ਕੁਸ਼ਲਤਾ ਲਈ ਪੂਰਬ ਵੱਲ ਦੇਖਣਾ ਸ਼ੁਰੂ ਕਰ ਰਹੀਆਂ ਹਨ। Coinbase ਨੇ ਆਪਣੇ ਸੰਚਾਲਨ ਖਰਚਿਆਂ ਨੂੰ ਅਨੁਕੂਲ ਬਣਾਉਣ ਲਈ ਚੀਨੀ AI ਮਾਡਲਾਂ ਵੱਲ ਮੁੜਨ ਵਾਲੇ ਤਕਨੀਕੀ ਦਿੱਗਜਾਂ ਦੇ ਵਧ ਰਹੇ ਸਮੂਹ ਵਿੱਚ ਅਧਿਕਾਰਤ ਤੌਰ 'ਤੇ ਸ਼ਾਮਲ ਹੋਣ ਦਾ ਫੈਸਲਾ ਕੀਤਾ ਹੈ।

ਚੀਨੀ ਮਾਡਲਾਂ ਵੱਲ ਮੋੜ: GLM ਅਤੇ Kimi

Coinbase ਦੇ CEO Brian Armstrong ਨੇ ਹਾਲ ਹੀ ਵਿੱਚ ਖੁਲਾਸਾ ਕੀਤਾ ਕਿ ਕੰਪਨੀ ਨੇ ਆਪਣੇ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਵਿੱਚ GLM 5.2 ਅਤੇ Kimi 2.7 ਵਰਗੇ ਚੀਨ ਵਿੱਚ ਵਿਕਸਤ ਮਾਡਲਾਂ ਨੂੰ ਜੋੜ ਲਿਆ ਹੈ। ਇਸ ਰਣਨੀਤਕ ਤਬਦੀਲੀ ਨੇ Coinbase ਨੂੰ ਇੱਕੋ ਸਮੇਂ ਆਪਣੇ AI ਖਰਚਿਆਂ ਨੂੰ ਅੱਧਾ ਕਰਦੇ ਹੋਏ ਕਾਫ਼ੀ ਜ਼ਿਆਦਾ ਟੋਕਨ ਵੌਲਯੂਮ (token volumes) ਨੂੰ ਸੰਭਾਲਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੱਤੀ ਹੈ।

ਇਹ ਕਦਮ ਸਿਰਫ਼ ਕ੍ਰਿਪਟੋ ਖੇਤਰ ਤੱਕ ਸੀਮਤ ਨਹੀਂ ਹੈ। ਸਟਾਰਟਅੱਪ Lindy ਨੇ DeepSeek v4 ਵੱਲ ਤਬਦੀਲੀ ਕੀਤੀ ਹੈ, ਅਤੇ ਡੇਟਾ ਦਿੱਗਜ Snowflake ਇਸ ਸਮੇਂ OpenAI ਅਤੇ Anthropic ਦੀਆਂ ਮਹਿੰਗੀਆਂ ਪੇਸ਼ਕਸ਼ਾਂ ਦੇ ਕਿਫਾਇਤੀ ਵਿਕਲਪਾਂ ਵਜੋਂ ਚੀਨੀ ਮਾਡਲਾਂ ਦੀ ਜਾਂਚ ਕਰ ਰਿਹਾ ਹੈ। ਇਹ ਤਬਦੀਲੀ ਇਸ ਗੱਲ ਦਾ ਸੰਕੇਤ ਹੈ ਕਿ ਉਦਯੋਗਿਕ ਸੰਸਥਾਵਾਂ AI ਦੇ "ਫਰੰਟੀਅਰ" ਨੂੰ ਕਿਵੇਂ ਦੇਖਦੀਆਂ ਹਨ, ਜਿੱਥੇ ਉਹ ਬ੍ਰਾਂਡ ਦੀ ਜਾਣ-ਪਛਾਣ ਦੀ ਬਜਾਏ ਕੀਮਤ-ਵੱਲੋਂ-ਪ੍ਰਦਰਸ਼ਨ (price-to-performance) ਅਨੁਪਾਤ ਨੂੰ ਪਹਿਲ ਦੇ ਰਹੇ ਹਨ।

ਇੰਟੈਲੀਜੈਂਟ ਰੂਟਿੰਗ ਅਤੇ ਕੰਟੈਕਸਟ ਇੰਜੀਨੀਅਰਿੰਗ (Context Engineering)

ਇਹਨਾਂ ਬਚਤਾਂ ਨੂੰ ਵੱਧ ਤੋਂ ਵੱਧ ਕਰਨ ਲਈ, Coinbase ਨੇ ਇੱਕ ਆਟੋਮੇਟਡ ਰੂਟਿੰਗ ਸਿਸਟਮ ਲਾਗੂ ਕੀਤਾ ਹੈ। ਇੱਕ ਸਿੰਗਲ LLM 'ਤੇ ਨਿਰਭਰ ਰਹਿਣ ਦੀ ਬਜਾਏ, ਇਹ ਸਿਸਟਮ ਤਿੰਨ ਮਹੱਤਵਪੂਰਨ ਮਾਪਦੰਡਾਂ ਦੇ ਅਧਾਰ 'ਤੇ ਹਰ ਬੇਨਤੀ ਦਾ ਮੁਲਾਂਕਣ ਕਰਦਾ ਹੈ: ਕੰਮ ਦੀ ਜਟਿਲਤਾ (task complexity), ਲਾਗਤ, ਅਤੇ ਕੈਸ਼ਿੰਗ ਦੀ ਸੰਭਾਵਨਾ (caching potential)।

ਇਸ ਰਣਨੀਤੀ ਦਾ ਤਕਨੀਕੀ ਲਾਗੂਕਰਨ "ਕੰਟੈਕਸਟ ਇੰਜੀਨੀਅਰਿੰਗ" (context engineering) 'ਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਨਿਰਭਰ ਕਰਦਾ ਹੈ। ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਕੰਟੈਕਸਟ ਨੂੰ ਘੱਟ ਰੱਖਣ ਅਤੇ ਨਵੇਂ ਕੰਮਾਂ ਲਈ ਨਵੇਂ ਸੈਸ਼ਨ ਸ਼ੁਰੂ ਕਰਨ ਲਈ ਉਤਸ਼ਾਹਿਤ ਕਰਕੇ, Coinbase ਨੇ ਆਪਣੀ ਕੈਸ਼ਿੰਗ ਹਿੱਟ ਰੇਟ (caching hit rate) ਨੂੰ ਸਿਰਫ਼ 5% ਤੋਂ ਵਧਾ ਕੇ 60% ਕਰ ਦਿੱਤਾ ਹੈ। ਇਹ ਕੁਸ਼ਲਤਾ ਕੰਪਨੀ ਨੂੰ ਰੋਜ਼ਾਨਾ ਦੇ ਕੰਮਾਂ ਲਈ ਸਸਤੇ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦੀ ਹੈ ਜਦੋਂ ਕਿ ਗੁੰਝਲਦਾਰ ਕਾਰਜਾਂ ਲਈ ਉੱਚ-ਤਰਕ (high-reasoning) ਮਾਡਲਾਂ ਨੂੰ ਰਾਖਵਾਂ ਰੱਖਦੀ ਹੈ, ਇੱਕ ਅਜਿਹੀ ਤਕਨੀਕ ਜੋ agentic workflows ਨੂੰ ਵਧਾਉਣ ਲਈ ਇੱਕ ਨਮੂਨਾ ਬਣ ਰਹੀ ਹੈ।

Tokenmaxxing ਅਤੇ ਪ੍ਰਦਰਸ਼ਨ ਜਵਾਬਦੇਹੀ

"Agentic reasoning" ਮਾਡਲਾਂ ਦੇ ਵਧਣ ਨਾਲ—ਜਿਵੇਂ ਕਿ ਉਮੀਦ ਕੀਤੀ ਜਾ ਰਹੀ GPT-5.x ਸੀਰੀਜ਼—ਟੋਕਨ ਦੀ ਖਪਤ ਵਿੱਚ ਭਾਰੀ ਵਾਧਾ ਹੋਇਆ ਹੈ। ਜਦੋਂ ਕਿ Amazon ਅਤੇ Meta ਵਰਗੀਆਂ ਕੰਪਨੀਆਂ ਵਿੱਚ "tokenmaxxing" ਦਾ ਰੁਝਾਨ ਦੇਖਿਆ ਗਿਆ ਹੈ, ਜਿੱਥੇ ਕਰਮਚਾਰੀ ਸਖ਼ਤ ਨਿਗਰਾਨੀ ਤੋਂ ਬਿਨਾਂ ਬਹੁਤ ਜ਼ਿਆਦਾ ਟੋਕਨ ਖਤਮ ਕਰ ਦਿੰਦੇ ਹਨ, Coinbase ਇੱਕ ਵੱਖਰੀ ਫਲਸਫਾ ਲਾਗੂ ਕਰ ਰਿਹਾ ਹੈ।

Armstrong ਨੇ ਬਿਨਾਂ ਕਿਸੇ ਪਾਬੰਦੀ ਦੇ ਪਾਰਦਰਸ਼ਤਾ ਦਾ ਇੱਕ ਮਾਡਲ ਪੇਸ਼ ਕੀਤਾ ਹੈ: ਡਿਵੈਲਪਰਾਂ ਦੀ ਵਰਤੋਂ 'ਤੇ ਕੋਈ ਸੀਮਾ ਨਹੀਂ ਹੈ, ਪਰ ਉਹਨਾਂ ਦਾ ਖਰਚਾ ਪਾਰਦਰਸ਼ੀ ਹੈ। ਇਸਦਾ ਮਾਰਗਦਰਸ਼ਕ ਸਿਧਾਂਤ "ਇੰਪੈਕਟ-ਅਧਾਰਤ ਜਵਾਬਦੇਹੀ" (impact-based accountability) ਹੈ—ਡਿਵੈਲਪਰ AI ਟੋਕਨਾਂ 'ਤੇ ਜਿੰਨਾ ਜ਼ਿਆਦਾ ਖਰਚ ਕਰਦਾ ਹੈ, ਉਮੀਦ ਕੀਤੀ ਗਈ ਆਊਟਪੁੱਟ ਅਤੇ ਵਪਾਰਕ ਪ੍ਰਭਾਵ ਉਨਾ ਹੀ ਜ਼ਿਆਦਾ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਇਹ ਪਹੁੰਚ ਭਾਰੀ ਕੰਪਿਊਟਿੰਗ ਦੀ ਲੋੜ ਅਤੇ ROI ਦੀ ਲੋੜ ਵਿਚਕਾਰ ਸੰਤੁਲਨ ਬਣਾਉਂਦੀ ਹੈ।

ਪੱਛਮੀ ਲੈਬਾਂ ਲਈ ਕੀਮਤ ਦਾ ਸਟ੍ਰੈੱਸ ਟੈਸਟ

ਸਸਤੇ ਚੀਨੀ ਵਿਕਲਪਾਂ ਵੱਲ ਵਧ ਰਿਹਾ ਇਹ ਰੁਝਾਨ ਪੱਛਮੀ AI ਲੈਬਾਂ 'ਤੇ ਭਾਰੀ ਦਬਾਅ ਪਾ ਰਿਹਾ ਹੈ, ਖਾਸ ਕਰਕੇ ਜਦੋਂ OpenAI ਅਤੇ Anthropic ਵਰਗੀਆਂ ਕੰਪਨੀਆਂ IPOs ਦੀ ਉਮੀਦ ਕਰ ਰਹੀਆਂ ਹਨ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਟਿਕਾਊ ਵਿਕਾਸ ਸਾਬਤ ਕਰਨ ਦੀ ਲੋੜ ਹੈ। ਇੱਕ ਸ਼ੁਰੂ ਹੋ ਰਹੀ ਕੀਮਤ ਦੀ ਜੰਗ ਪਹਿਲਾਂ ਹੀ ਸਪੱਸ਼ਟ ਹੈ; ਰਿਪੋਰਟਾਂ ਅਨੁਸਾਰ OpenAI, GPT-5.6-Sol ਵਰਗੇ ਵਧੇਰੇ ਟੋਕਨ-ਕੁਸ਼ਲ ਵੇਰੀਐਂਟਸ ਅਤੇ ਘੱਟ ਕੀਮਤ ਵਾਲੇ, ਹਲਕੇ ਮਾਡਲ ਪੇਸ਼ ਕਰਕੇ ਮੁਕਾਬਲੇ ਦਾ ਸਾਹਮਣਾ ਕਰ ਰਿਹਾ ਹੈ। ਪੱਛਮੀ ਪ੍ਰਦਾਤਾਵਾਂ ਲਈ, ਚੁਣੌਤੀ ਹੁਣ ਸਿਰਫ਼ ਬੁੱਧੀਮਾਨਤਾ ਬਾਰੇ ਨਹੀਂ ਹੈ, ਸਗੋਂ ਇੱਕ ਅਜਿਹੀ ਕੀਮਤ ਬਣਾਈ ਰੱਖਣ ਬਾਰੇ ਹੈ ਜੋ ਉਦਯੋਗਿਕ ਗਾਹਕਾਂ ਨੂੰ ਵਧੇਰੇ ਕਿਫਾਇਤੀ ਵਿਸ਼ਵਵਿਆਪੀ ਮੁਕਾਬਲੇਬਾਜ਼ਾਂ ਵੱਲ ਜਾਣ ਤੋਂ ਰੋਕ ਸਕੇ।

ਮੁੱਖ ਗੱਲਾਂ

  • ਲਾਗਤ ਅਨੁਕੂਲਤਾ (Cost Optimization): Coinbase ਨੇ ਕੁੱਲ ਟੋਕਨ ਵਰਤੋਂ ਨੂੰ ਵਧਾਉਂਦੇ ਹੋਏ GLM 5.2 ਅਤੇ Kimi 2.7 ਵਰਗੇ ਚੀਨੀ ਮਾਡਲਾਂ ਨੂੰ ਜੋੜ ਕੇ ਆਪਣੇ AI ਖਰਚਿਆਂ ਨੂੰ ਅੱਧਾ ਕਰ ਦਿੱਤਾ ਹੈ।
  • ਤਕਨੀਕੀ ਕੁਸ਼ਲਤਾ: ਆਟੋਮੇਟਡ ਰੂਟਿੰਗ ਅਤੇ ਕੰਟੈਕਸਟ ਇੰਜੀਨੀਅਰਿੰਗ ਨੂੰ ਲਾਗੂ ਕਰਨ ਨਾਲ Coinbase ਨੂੰ ਕੈਸ਼ਿੰਗ ਹਿੱਟ ਰੇਟ ਨੂੰ 5% ਤੋਂ ਵਧਾ ਕੇ 60% ਕਰਨ ਵਿੱਚ ਮਦਦ ਮਿਲੀ ਹੈ।
  • ਮਾਰਕੀਟ ਦਾ ਦਬਾਅ: ਸਸਤੇ ਮਾਡਲਾਂ ਵੱਲ ਵਧ ਰਿਹਾ ਰੁਝਾਨ ਪੱਛਮੀ ਲੈਬਾਂ ਨੂੰ ਉਹਨਾਂ ਦੇ ਉੱਚ ਮੁਲਾਂਕਣ (valuations) ਅਤੇ ਆਉਣ ਵਾਲੇ IPO ਦੀਆਂ ਸੰਭਾਵਨਾਵਾਂ ਨੂੰ ਜਾਇਜ਼ ਠਹਿਰਾਉਣ ਲਈ ਕੀਮਤ ਦੀ ਜੰਗ ਵਿੱਚ ਧੱਕ ਰਿਹਾ ਹੈ।