API செலவுகளைக் குறைக்க Coinbase சீன AI மாடல்களுக்கு மாறுகிறது

மேற்கத்திய AI ஆய்வகங்கள் (labs) மிகப்பெரிய கணினிச் செலவுகளையும் (compute costs) லாபத்தையும் சமநிலைப்படுத்த போராடிக்கொண்டிருக்கும் நிலையில், தொழில்துறைத் தலைவர்கள் செயல்திறனுக்காகக் கிழக்கு நோக்கிப் பார்க்கத் தொடங்கியுள்ளனர். தனது செயல்பாட்டுச் செலவுகளை (operational expenditures) மேம்படுத்த, சீன AI மாடல்களை நோக்கித் திரும்பும் தொழில்நுட்ப ஜாம்பவான்களின் குழுவில் Coinbase அதிகாரப்பூர்வமாக இணைந்துள்ளது.

சீன மாடல்களுக்கான மாற்றம்: GLM மற்றும் Kimi

Coinbase CEO Brian Armstrong சமீபத்தில், நிறுவனம் GLM 5.2 மற்றும் Kimi 2.7 போன்ற சீனாவில் உருவாக்கப்பட்ட மாடல்களைத் தனது உள்கட்டமைப்பில் (infrastructure) ஒருங்கிணைத்துள்ளதாகத் தெரிவித்தார். இந்த மூலோபாய மாற்றம், Coinbase அதிக அளவிலான டோக்கன் அளவுகளைக் (token volumes) கையாள அனுமதிப்பதோடு மட்டுமல்லாமல், அதன் AI செலவுகளையும் பாதியாகக் குறைத்துள்ளது.

இந்த நடவடிக்கை கிரிப்டோ துறையுடன் மட்டும் நின்றுவிடவில்லை. Lindy என்ற ஸ்டார்ட்அப் DeepSeek v4-க்கு மாறியுள்ளது, மேலும் தரவுத் துறையின் ஜாம்பவானான Snowflake, OpenAI மற்றும் Anthropic ஆகியவற்றின் அதிக விலையுள்ள சேவைகளுக்கு மாற்றாக, செலவு குறைந்த சீன மாடல்களை தற்போது சோதித்து வருகிறது. இந்த மாற்றம், நிறுவனங்கள் AI-ன் "முன்னணியை" (frontier) எவ்வாறு பார்க்கின்றன என்பதில் ஒரு மிகப்பெரிய மாற்றத்தைக் குறிக்கிறது; அதாவது, பிராண்ட் பெயர்களை விட விலை மற்றும் செயல்திறன் விகிதத்திற்கு (price-to-performance ratio) அவை முன்னுரிமை அளிக்கின்றன.

புத்திசாலித்தனமான ரூட்டிங் மற்றும் கான்டெக்ஸ்ட் இன்ஜினியரிங் (Context Engineering)

இந்தச் சேமிப்பைப் பெருமளவில் அதிகரிக்க, Coinbase ஒரு தானியங்கி ரூட்டிங் அமைப்பை (automated routing system) செயல்படுத்தியுள்ளது. ஒரே ஒரு LLM-ஐ மட்டும் நம்பியிருக்காமல், இந்த அமைப்பு ஒவ்வொரு கோரிக்கையையும் மூன்று முக்கியமான அளவுகோல்களின் அடிப்படையில் மதிப்பீடு செய்கிறது: பணியின் சிக்கல் (task complexity), செலவு மற்றும் கேச்சிங் சாத்தியக்கூறுகள் (caching potential).

இந்த உத்தியின் தொழில்நுட்பச் செயல்பாடானது "கான்டெக்ஸ்ட் இன்ஜினியரிங்" (context engineering) முறையை பெரிதும் நம்பியுள்ளது. டெவலப்பர்கள் கான்டெக்ஸ்ட்டை (context) சுருக்கமாக வைத்திருக்கவும், புதிய பணிகளுக்குப் புதிய செஷன்களைத் தொடங்கவும் ஊக்குவிப்பதன் மூலம், Coinbase தனது கேச்சிங் ஹிட் விகிதத்தை (caching hit rate) வெறும் 5%-லிருந்து 60%-ஆக வெற்றிகரமாக அதிகரித்துள்ளது. இந்தத் திறன், வழக்கமான பணிகளுக்கு மலிவான மாடல்களைப் பயன்படுத்தவும், சிக்கலான செயல்பாடுகளுக்கு உயர்-காரணத் திறன் கொண்ட (high-reasoning) மாடல்களைத் தக்கவைக்கவும் நிறுவனத்திற்கு உதவுகிறது; இந்த நுட்பம் ஏஜென்டிக் பணிப்பாய்வுகளை (agentic workflows) விரிவுபடுத்துவதற்கான ஒரு முன்மாதிரியாக மாறி வருகிறது.

Tokenmaxxing மற்றும் செயல்திறன் பொறுப்புக்கூறல்

எதிர்பார்க்கப்படும் GPT-5.x தொடர் போன்ற "ஏஜென்டிக் ரீசனிங்" (agentic reasoning) மாடல்களின் எழுச்சி, டோக்கன் நுகர்வில் பெரும் அதிகரிப்புக்கு வழிவகுத்துள்ளது. Amazon மற்றும் Meta போன்ற நிறுவனங்களில், ஊழியர்கள் கடுமையான கண்காணிப்பு இன்றி அதிகப்படியான டோக்கன்களைப் பயன்படுத்தும் "tokenmaxxing" போக்கு காணப்பட்டாலும், Coinbase ஒரு மாறுபட்ட தத்துவத்தைச் செயல்படுத்தி வருகிறது.

Armstrong கட்டுப்பாடுகள் இல்லாத வெளிப்படைத்தன்மை கொண்ட ஒரு மாதிரியை அறிமுகப்படுத்தியுள்ளார்: டெவலப்பர்களின் பயன்பாட்டிற்கு வரம்பு இல்லை, ஆனால் அவர்களின் செலவு வெளிப்படையாக இருக்கும். இதன் வழிகாட்டும் கொள்கை "தாக்கத்தின் அடிப்படையிலான பொறுப்புக்கூறல்" (impact-based accountability) ஆகும்—ஒரு டெவலப்பர் AI டோக்கன்களுக்காக எவ்வளவு அதிகமாகச் செலவிடுகிறாரோ, அவ்வளவு அதிகமாக எதிர்பார்க்கப்படும் வெளியீடும் (output) வணிகத் தாக்கமும் இருக்க வேண்டும். இந்த அணுகுமுறை, அதிக கணினித் தேவைகளுக்கும் (heavy compute) முதலீட்டின் மீதான வருவாய்க்கும் (ROI) இடையிலான சமநிலையைப் பேணுகிறது.

மேற்கத்திய ஆய்வகங்களுக்கான விலை அழுத்த சோதனை

மலிவான சீன மாற்றுகளை நோக்கி நிறுவனங்கள் இடம்பெயர்வது, மேற்கத்திய AI ஆய்வகங்களின் மீது பெரும் அழுத்தத்தை ஏற்படுத்துகிறது; குறிப்பாக OpenAI மற்றும் Anthropic போன்ற நிறுவனங்கள் IPO-களை நோக்கியும், நிலையான வளர்ச்சியை நிரூபிக்க வேண்டிய கட்டாயத்திலும் இருக்கும்போது இது நிகழ்கிறது. ஒரு விலைப்போர் ஏற்கனவே உருவாகத் தொடங்கியுள்ளது; OpenAI நிறுவனம் GPT-5.6-Sol போன்ற அதிக டோக்கன் திறன் கொண்ட மாடல்கள் மற்றும் குறைந்த விலையிலான, இலகுரக மாடல்களை வழங்குவதன் மூலம் போட்டியை எதிர்கொள்வதாகக் கூறப்படுகிறது. மேற்கத்திய சேவை வழங்குநர்களுக்கு, சவால் என்பது இனி வெறும் புத்திசாலித்தனம் சார்ந்தது மட்டுமல்ல, நிறுவன வாடிக்கையாளர்கள் சிக்கனமான உலகளாவிய போட்டியாளர்களை நோக்கி இடம்பெயராமல் தடுக்கும் வகையில் விலையைத் தக்கவைப்பதே ஆகும்.

முக்கியக் குறிப்புகள்

  • செலவு மேம்படுத்தல் (Cost Optimization): Coinbase, GLM 5.2 மற்றும் Kimi 2.7 போன்ற சீன மாடல்களை ஒருங்கிணைப்பதன் மூலம், மொத்த டோக்கன் பயன்பாட்டை அதிகரித்த அதே வேளையில், தனது AI செலவுகளை பாதியாகக் குறைத்துள்ளது.
  • தொழில்நுட்பத் திறன் (Technical Efficiency): தானியங்கி ரூட்டிங் மற்றும் கான்டெக்ஸ்ட் இன்ஜினியரிங் முறைகளைச் செயல்படுத்துவதன் மூலம், கேச்சிங் ஹிட் விகிதத்தை 5%-லிருந்து 60%-ஆக உயர்த்த Coinbase-ஆல் முடிந்துள்ளது.
  • சந்தை அழுத்தம் (Market Pressure): மலிவான மாடல்களை நோக்கித் திரும்புவது, மேற்கத்திய ஆய்வகங்களை அவற்றின் அதிக மதிப்பீடுகள் மற்றும் வரவிருக்கும் IPO வாய்ப்புகளை நியாயப்படுத்த ஒரு விலைப்போருக்குத் தள்ளுகிறது.