Coinbase Shifts to Chinese AI Models to Slash API Costs

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial6 நாட்களுக்கு முன்3min read

Coinbase Shifts to Chinese AI Models to Slash API Costs

In this article

API செலவுகளைக் குறைக்க Coinbase சீன AI மாடல்களுக்கு மாறுகிறது

மேற்கத்திய AI ஆய்வகங்கள் (labs) மிகப்பெரிய கணினிச் செலவுகளையும் (compute costs) லாபத்தையும் சமநிலைப்படுத்த போராடிக்கொண்டிருக்கும் நிலையில், தொழில்துறைத் தலைவர்கள் செயல்திறனுக்காகக் கிழக்கு நோக்கிப் பார்க்கத் தொடங்கியுள்ளனர். தனது செயல்பாட்டுச் செலவுகளை (operational expenditures) மேம்படுத்த, சீன AI மாடல்களை நோக்கித் திரும்பும் தொழில்நுட்ப ஜாம்பவான்களின் குழுவில் Coinbase அதிகாரப்பூர்வமாக இணைந்துள்ளது.

சீன மாடல்களுக்கான மாற்றம்: GLM மற்றும் Kimi

Coinbase CEO Brian Armstrong சமீபத்தில், நிறுவனம் GLM 5.2 மற்றும் Kimi 2.7 போன்ற சீனாவில் உருவாக்கப்பட்ட மாடல்களைத் தனது உள்கட்டமைப்பில் (infrastructure) ஒருங்கிணைத்துள்ளதாகத் தெரிவித்தார். இந்த மூலோபாய மாற்றம், Coinbase அதிக அளவிலான டோக்கன் அளவுகளைக் (token volumes) கையாள அனுமதிப்பதோடு மட்டுமல்லாமல், அதன் AI செலவுகளையும் பாதியாகக் குறைத்துள்ளது.

இந்த நடவடிக்கை கிரிப்டோ துறையுடன் மட்டும் நின்றுவிடவில்லை. Lindy என்ற ஸ்டார்ட்அப் DeepSeek v4-க்கு மாறியுள்ளது, மேலும் தரவுத் துறையின் ஜாம்பவானான Snowflake, OpenAI மற்றும் Anthropic ஆகியவற்றின் அதிக விலையுள்ள சேவைகளுக்கு மாற்றாக, செலவு குறைந்த சீன மாடல்களை தற்போது சோதித்து வருகிறது. இந்த மாற்றம், நிறுவனங்கள் AI-ன் "முன்னணியை" (frontier) எவ்வாறு பார்க்கின்றன என்பதில் ஒரு மிகப்பெரிய மாற்றத்தைக் குறிக்கிறது; அதாவது, பிராண்ட் பெயர்களை விட விலை மற்றும் செயல்திறன் விகிதத்திற்கு (price-to-performance ratio) அவை முன்னுரிமை அளிக்கின்றன.

புத்திசாலித்தனமான ரூட்டிங் மற்றும் கான்டெக்ஸ்ட் இன்ஜினியரிங் (Context Engineering)

இந்தச் சேமிப்பைப் பெருமளவில் அதிகரிக்க, Coinbase ஒரு தானியங்கி ரூட்டிங் அமைப்பை (automated routing system) செயல்படுத்தியுள்ளது. ஒரே ஒரு LLM-ஐ மட்டும் நம்பியிருக்காமல், இந்த அமைப்பு ஒவ்வொரு கோரிக்கையையும் மூன்று முக்கியமான அளவுகோல்களின் அடிப்படையில் மதிப்பீடு செய்கிறது: பணியின் சிக்கல் (task complexity), செலவு மற்றும் கேச்சிங் சாத்தியக்கூறுகள் (caching potential).

இந்த உத்தியின் தொழில்நுட்பச் செயல்பாடானது "கான்டெக்ஸ்ட் இன்ஜினியரிங்" (context engineering) முறையை பெரிதும் நம்பியுள்ளது. டெவலப்பர்கள் கான்டெக்ஸ்ட்டை (context) சுருக்கமாக வைத்திருக்கவும், புதிய பணிகளுக்குப் புதிய செஷன்களைத் தொடங்கவும் ஊக்குவிப்பதன் மூலம், Coinbase தனது கேச்சிங் ஹிட் விகிதத்தை (caching hit rate) வெறும் 5%-லிருந்து 60%-ஆக வெற்றிகரமாக அதிகரித்துள்ளது. இந்தத் திறன், வழக்கமான பணிகளுக்கு மலிவான மாடல்களைப் பயன்படுத்தவும், சிக்கலான செயல்பாடுகளுக்கு உயர்-காரணத் திறன் கொண்ட (high-reasoning) மாடல்களைத் தக்கவைக்கவும் நிறுவனத்திற்கு உதவுகிறது; இந்த நுட்பம் ஏஜென்டிக் பணிப்பாய்வுகளை (agentic workflows) விரிவுபடுத்துவதற்கான ஒரு முன்மாதிரியாக மாறி வருகிறது.

Tokenmaxxing மற்றும் செயல்திறன் பொறுப்புக்கூறல்

எதிர்பார்க்கப்படும் GPT-5.x தொடர் போன்ற "ஏஜென்டிக் ரீசனிங்" (agentic reasoning) மாடல்களின் எழுச்சி, டோக்கன் நுகர்வில் பெரும் அதிகரிப்புக்கு வழிவகுத்துள்ளது. Amazon மற்றும் Meta போன்ற நிறுவனங்களில், ஊழியர்கள் கடுமையான கண்காணிப்பு இன்றி அதிகப்படியான டோக்கன்களைப் பயன்படுத்தும் "tokenmaxxing" போக்கு காணப்பட்டாலும், Coinbase ஒரு மாறுபட்ட தத்துவத்தைச் செயல்படுத்தி வருகிறது.

Armstrong கட்டுப்பாடுகள் இல்லாத வெளிப்படைத்தன்மை கொண்ட ஒரு மாதிரியை அறிமுகப்படுத்தியுள்ளார்: டெவலப்பர்களின் பயன்பாட்டிற்கு வரம்பு இல்லை, ஆனால் அவர்களின் செலவு வெளிப்படையாக இருக்கும். இதன் வழிகாட்டும் கொள்கை "தாக்கத்தின் அடிப்படையிலான பொறுப்புக்கூறல்" (impact-based accountability) ஆகும்—ஒரு டெவலப்பர் AI டோக்கன்களுக்காக எவ்வளவு அதிகமாகச் செலவிடுகிறாரோ, அவ்வளவு அதிகமாக எதிர்பார்க்கப்படும் வெளியீடும் (output) வணிகத் தாக்கமும் இருக்க வேண்டும். இந்த அணுகுமுறை, அதிக கணினித் தேவைகளுக்கும் (heavy compute) முதலீட்டின் மீதான வருவாய்க்கும் (ROI) இடையிலான சமநிலையைப் பேணுகிறது.

மேற்கத்திய ஆய்வகங்களுக்கான விலை அழுத்த சோதனை

மலிவான சீன மாற்றுகளை நோக்கி நிறுவனங்கள் இடம்பெயர்வது, மேற்கத்திய AI ஆய்வகங்களின் மீது பெரும் அழுத்தத்தை ஏற்படுத்துகிறது; குறிப்பாக OpenAI மற்றும் Anthropic போன்ற நிறுவனங்கள் IPO-களை நோக்கியும், நிலையான வளர்ச்சியை நிரூபிக்க வேண்டிய கட்டாயத்திலும் இருக்கும்போது இது நிகழ்கிறது. ஒரு விலைப்போர் ஏற்கனவே உருவாகத் தொடங்கியுள்ளது; OpenAI நிறுவனம் GPT-5.6-Sol போன்ற அதிக டோக்கன் திறன் கொண்ட மாடல்கள் மற்றும் குறைந்த விலையிலான, இலகுரக மாடல்களை வழங்குவதன் மூலம் போட்டியை எதிர்கொள்வதாகக் கூறப்படுகிறது. மேற்கத்திய சேவை வழங்குநர்களுக்கு, சவால் என்பது இனி வெறும் புத்திசாலித்தனம் சார்ந்தது மட்டுமல்ல, நிறுவன வாடிக்கையாளர்கள் சிக்கனமான உலகளாவிய போட்டியாளர்களை நோக்கி இடம்பெயராமல் தடுக்கும் வகையில் விலையைத் தக்கவைப்பதே ஆகும்.

முக்கியக் குறிப்புகள்

செலவு மேம்படுத்தல் (Cost Optimization): Coinbase, GLM 5.2 மற்றும் Kimi 2.7 போன்ற சீன மாடல்களை ஒருங்கிணைப்பதன் மூலம், மொத்த டோக்கன் பயன்பாட்டை அதிகரித்த அதே வேளையில், தனது AI செலவுகளை பாதியாகக் குறைத்துள்ளது.
தொழில்நுட்பத் திறன் (Technical Efficiency): தானியங்கி ரூட்டிங் மற்றும் கான்டெக்ஸ்ட் இன்ஜினியரிங் முறைகளைச் செயல்படுத்துவதன் மூலம், கேச்சிங் ஹிட் விகிதத்தை 5%-லிருந்து 60%-ஆக உயர்த்த Coinbase-ஆல் முடிந்துள்ளது.
சந்தை அழுத்தம் (Market Pressure): மலிவான மாடல்களை நோக்கித் திரும்புவது, மேற்கத்திய ஆய்வகங்களை அவற்றின் அதிக மதிப்பீடுகள் மற்றும் வரவிருக்கும் IPO வாய்ப்புகளை நியாயப்படுத்த ஒரு விலைப்போருக்குத் தள்ளுகிறது.

Coinbase Shifts to Chinese AI Models to Slash API Costs

API செலவுகளைக் குறைக்க Coinbase சீன AI மாடல்களுக்கு மாறுகிறது

சீன மாடல்களுக்கான மாற்றம்: GLM மற்றும் Kimi

புத்திசாலித்தனமான ரூட்டிங் மற்றும் கான்டெக்ஸ்ட் இன்ஜினியரிங் (Context Engineering)

Tokenmaxxing மற்றும் செயல்திறன் பொறுப்புக்கூறல்

மேற்கத்திய ஆய்வகங்களுக்கான விலை அழுத்த சோதனை

முக்கியக் குறிப்புகள்

Continue reading

Snowflake CEO: GLM 5.2 Rivals Claude Opus 4.7 at a Fraction of the Cost

From Tokenmaxxing to Rationing: The Corporate AI Cost Crisis

சீனாவின் AI முன்னேற்றம்: புதிய இணையப் பாதுகாப்பு கருவிகள் அமெரிக்கத் தொழில்நுட்பத்திற்கு சவால் விடுகின்றன