API ખર્ચ ઘટાડવા માટે કોઈનબેઝ ચીની AI મોડલ્સ તરફ વળી રહ્યું છે

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial6 દિવસ પહેલાં3min read

API ખર્ચ ઘટાડવા માટે કોઈનબેઝ ચીની AI મોડલ્સ તરફ વળી રહ્યું છે

In this article

API ખર્ચ ઘટાડવા માટે Coinbase ચીની AI મોડલ્સ તરફ વળ્યું

જેમ જેમ પશ્ચિમી AI લેબ્સ વિશાળ કમ્પ્યુટ ખર્ચ અને નફાકારકતા વચ્ચે સંતુલન જાળવવાનો સંઘર્ષ કરી રહી છે, તેમ તેમ ઉદ્યોગના અગ્રણીઓ કાર્યક્ષમતા માટે પૂર્વ (East) તરફ જોવાનું શરૂ કરી રહ્યા છે. Coinbase એ તેમના ઓપરેશનલ ખર્ચને ઓપ્ટિમાઇઝ કરવા માટે ચીની AI મોડલ્સ તરફ વળતા ટેક જાયન્ટ્સના વધતા જતા સમૂહમાં સત્તાવાર રીતે જોડાણ કર્યું છે.

ચીની મોડલ્સ તરફનું વળાંક: GLM અને Kimi

Coinbase ના CEO Brian Armstrong એ તાજેતરમાં ખુલાસો કર્યો હતો કે કંપનીએ તેના ઇન્ફ્રાસ્ટ્રક્ચરમાં GLM 5.2 અને Kimi 2.7 જેવા ચીન દ્વારા વિકસિત મોડલ્સને સંકલિત (integrate) કર્યા છે. આ વ્યૂહાત્મક ફેરફારે Coinbase ને તેના AI ખર્ચમાં અડધા ઘટાડા સાથે નોંધપાત્ર રીતે વધુ ટોકન વોલ્યુમ હેન્ડલ કરવાની મંજૂરી આપી છે.

આ પગલું માત્ર ક્રિપ્ટો ક્ષેત્ર પૂરતું મર્યાદિત નથી. Lindy સ્ટાર્ટઅપે DeepSeek v4 પર સ્થાનાંતર કર્યું છે, અને ડેટા જાયન્ટ Snowflake હાલમાં OpenAI અને Anthropic ની ઊંચી કિંમતના વિકલ્પો તરીકે ચીની મોડલ્સનું ખર્ચ-અસરકારક વિકલ્પ તરીકે પરીક્ષણ કરી રહ્યું છે. આ ફેરફાર એ સંકેત આપે છે કે એન્ટરપ્રાઇઝ કેવી રીતે AI ના "ફ્રન્ટિયર" ને જુએ છે, જેમાં બ્રાન્ડની ઓળખ કરતા 'પ્રાઇસ-ટુ-પરફોર્મન્સ' રેશિયોને પ્રાધાન્ય આપવામાં આવે છે.

ઇન્ટેલિજન્ટ રાઉટિંગ અને કોન્ટેક્સ્ટ એન્જિનિયરિંગ

આ બચતને મહત્તમ કરવા માટે, Coinbase એ એક ઓટોમેટેડ રાઉટિંગ સિસ્ટમ અમલમાં મૂકી છે. કોઈ એક LLM પર આધાર રાખવાને બદલે, સિસ્ટમ દરેક વિનંતીનું ત્રણ મહત્વપૂર્ણ માપદંડોના આધારે મૂલ્યાંકન કરે છે: કાર્યની જટિલતા (task complexity), ખર્ચ અને કેશિંગ પોટેન્શિયલ.

આ વ્યૂહરચનાનું ટેકનિકલ અમલીકરણ "કોન્ટેક્સ્ટ એન્જિનિયરિંગ" પર ઘણું આધાર રાખે છે. ડેવલપર્સને કોન્ટેક્સ્ટને લિન (lean) રાખવા અને નવા કાર્યો માટે નવા સેશન્સ શરૂ કરવા માટે પ્રોત્સાહિત કરીને, Coinbase તેના કેશિંગ હિટ રેટને માત્ર 5% થી વધારીને 60% સુધી સફળતાપૂર્વક પહોંચાડ્યો છે. આ કાર્યક્ષમતા કંપનીને રૂટિન કાર્યો માટે સસ્તા મોડલ્સનો ઉપયોગ કરવાની અને જટિલ કામગીરી માટે હાઈ-રીઝનિંગ મોડલ્સ અનામત રાખવાની મંજૂરી આપે છે, જે એક એવી ટેકનિક છે જે એજન્ટિક વર્કફ્લોને સ્કેલ કરવા માટે બ્લુપ્રિન્ટ બની રહી છે.

Tokenmaxxing અને પરફોર્મન્સ એકાઉન્ટેબિલિટી

"એજન્ટિક રીઝનિંગ" મોડલ્સના ઉદય સાથે—જેમ કે અપેક્ષિત GPT-5.x શ્રેણી—ટોકન વપરાશમાં મોટો ઉછાળો આવ્યો છે. જ્યારે Amazon અને Meta જેવી કંપનીઓએ "tokenmaxxing" નો ટ્રેન્ડ જોયો છે, જ્યાં કર્મચારીઓ કડક દેખરેખ વિના મોટા પ્રમાણમાં ટોકન્સનો ઉપયોગ કરે છે, ત્યારે Coinbase એક અલગ ફિલોસોફી અમલમાં મૂકી રહ્યું છે.

Armstrong એ પ્રતિબંધ વિનાની વિઝિબિલિટીનું મોડેલ રજૂ કર્યું છે: ડેવલપર્સના વપરાશ પર કોઈ મર્યાદા નથી, પરંતુ તેમનો ખર્ચ પારદર્શક છે. તેનું માર્ગદર્શક સિદ્ધાંત "ઇમ્પેક્ટ-બેઝ્ડ એકાઉન્ટેબિલિટી" છે—એટલે કે ડેવલપર AI ટોકન્સ પર જેટલો વધુ ખર્ચ કરે છે, તેટલું જ અપેક્ષિત આઉટપુટ અને બિઝનેસ ઇમ્પેક્ટ વધુ હોવું જોઈએ. આ અભિગમ ભારે કમ્પ્યુટની જરૂરિયાત અને ROI ની આવશ્યકતા વચ્ચે સંતુલન જાળવે છે.

પશ્ચિમી લેબ્સ માટે પ્રાઇસિંગ સ્ટ્રેસ ટેસ્ટ

સસ્તા ચીની વિકલ્પો તરફનું આ સ્થળાંતર પશ્ચિમી AI લેબ્સ પર ભારે દબાણ લાવી રહ્યું છે, ખાસ કરીને જ્યારે OpenAI અને Anthropic જેવી કંપનીઓ IPO પર નજર રાખી રહી છે અને ટકાઉ વૃદ્ધિ સાબિત કરવાની જરૂર છે. એક વ્યાપેલી પ્રાઇસ વોર (કિંમત યુદ્ધ) પહેલેથી જ દેખાઈ રહી છે; અહેવાલો અનુસાર OpenAI, GPT-5.6-Sol જેવા વધુ ટોકન-એફિશિયન્ટ વેરિઅન્ટ્સ અને ઓછી કિંમતના, હળવા મોડલ્સ ઓફર કરીને સ્પર્ધાનો સામનો કરી રહ્યું છે. પશ્ચિમી પ્રદાતાઓ માટે, પડકાર હવે માત્ર બુદ્ધિ વિશે નથી, પરંતુ એવા પ્રાઇસ પોઈન્ટ જાળવી રાખવાનો છે જે એન્ટરપ્રાઇઝ ક્લાયન્ટ્સને વધુ આર્થિક વૈશ્વિક સ્પર્ધકો તરફ સ્થળાંતર કરતા અટકાવી શકે.

મુખ્ય મુદ્દાઓ

ખર્ચ ઓપ્ટિમાઇઝેશન: Coinbase એ કુલ ટોકન વપરાશ વધારવાની સાથે GLM 5.2 અને Kimi 2.7 જેવા ચીની મોડલ્સને સંકલિત કરીને તેના AI ખર્ચમાં અડધો ઘટાડો કર્યો છે.
ટેકનિકલ કાર્યક્ષમતા: ઓટોમેટેડ રાઉટિંગ અને કોન્ટેક્સ્ટ એન્જિનિયરિંગ અમલમાં મૂકવાથી Coinbase તેના કેશિંગ હિટ રેટને 5% થી વધારીને 60% સુધી લઈ જવામાં સફળ રહ્યું છે.
બજારનું દબાણ: સસ્તા મોડલ્સ તરફનું વળાંક પશ્ચિમી લેબ્સને તેમના ઉચ્ચ મૂલ્યાંકન અને આગામી IPO ની સંભાવનાઓને યોગ્ય ઠેરવવા માટે પ્રાઇસિંગ વોરમાં ધકેલી રહ્યું છે.

API ખર્ચ ઘટાડવા માટે કોઈનબેઝ ચીની AI મોડલ્સ તરફ વળી રહ્યું છે

API ખર્ચ ઘટાડવા માટે Coinbase ચીની AI મોડલ્સ તરફ વળ્યું

ચીની મોડલ્સ તરફનું વળાંક: GLM અને Kimi

ઇન્ટેલિજન્ટ રાઉટિંગ અને કોન્ટેક્સ્ટ એન્જિનિયરિંગ

Tokenmaxxing અને પરફોર્મન્સ એકાઉન્ટેબિલિટી

પશ્ચિમી લેબ્સ માટે પ્રાઇસિંગ સ્ટ્રેસ ટેસ્ટ

મુખ્ય મુદ્દાઓ

Continue reading

Snowflake CEO: GLM 5.2 ખૂબ જ ઓછા ખર્ચે Claude Opus 4.7 ને ટક્કર આપે છે

From Tokenmaxxing to Rationing: The Corporate AI Cost Crisis

ચીનની AI ક્ષેત્રે મોટી સફળતા: નવા સાયબર સિક્યુરિટી સાધનો અમેરિકન ટેકનોલોજીને ટક્કર આપી રહ્યા છે