API খরচ কমাতে চীনা AI মডেলের দিকে ঝুঁকছে Coinbase

পশ্চিমা AI ল্যাবগুলো যখন বিশাল কম্পিউট খরচ এবং মুনাফার মধ্যে ভারসাম্য বজায় রাখতে হিমশিম খাচ্ছে, তখন শিল্পখাতের শীর্ষস্থানীয় প্রতিষ্ঠানগুলো দক্ষতার জন্য পূর্বের দিকে তাকাতে শুরু করেছে। Coinbase আনুষ্ঠানিকভাবে সেই ক্রমবর্ধমান প্রযুক্তি জায়ান্টদের তালিকায় যোগ দিয়েছে যারা তাদের পরিচালন ব্যয় (operational expenditures) অপ্টিমাইজ করার জন্য চীনা AI মডেলের দিকে ঝুঁকছে।

চীনা মডেলের দিকে পরিবর্তন: GLM এবং Kimi

Coinbase-এর CEO Brian Armstrong সম্প্রতি প্রকাশ করেছেন যে কোম্পানিটি তাদের ইনফ্রাস্ট্রাকচারে GLM 5.2 এবং Kimi 2.7-এর মতো চীন-নির্মিত মডেলগুলো যুক্ত করেছে। এই কৌশলগত পরিবর্তনের ফলে Coinbase উল্লেখযোগ্যভাবে বেশি টোকেন ভলিউম হ্যান্ডেল করতে সক্ষম হয়েছে এবং একই সাথে তাদের AI খরচ অর্ধেক কমিয়ে এনেছে।

এই পদক্ষেপটি কেবল ক্রিপ্টো সেক্টরের মধ্যেই সীমাবদ্ধ নয়। Lindy নামক স্টার্টআপটি DeepSeek v4-এ স্থানান্তরিত হয়েছে এবং ডেটা জায়ান্ট Snowflake বর্তমানে OpenAI এবং Anthropic-এর উচ্চমূল্যের বিকল্প হিসেবে সাশ্রয়ী চীনা মডেলগুলো পরীক্ষা করছে। এই পরিবর্তনটি এন্টারপ্রাইজগুলো কীভাবে AI-এর "frontier" বা অগ্রগতির দিকটিকে দেখছে তার একটি বিশাল রূপান্তর নির্দেশ করে, যেখানে ব্র্যান্ডের পরিচিতির চেয়ে 'প্রাইস-টু-পারফরম্যান্স রেশিও' বা মূল্যের বিপরীতে কার্যকারিতাকে বেশি প্রাধান্য দেওয়া হচ্ছে।

ইন্টেলিজেন্ট রাউটিং এবং কনটেক্সট ইঞ্জিনিয়ারিং

এই সাশ্রয়কে সর্বোচ্চ করতে Coinbase একটি স্বয়ংক্রিয় রাউটিং সিস্টেম চালু করেছে। একটি মাত্র LLM-এর ওপর নির্ভর না করে, এই সিস্টেমটি তিনটি গুরুত্বপূর্ণ মেট্রিক্সের ভিত্তিতে প্রতিটি রিকোয়েস্ট মূল্যায়ন করে: কাজের জটিলতা (task complexity), খরচ এবং ক্যাশিং সম্ভাবনা (caching potential)।

এই কৌশলের প্রযুক্তিগত বাস্তবায়নের জন্য "context engineering"-এর ওপর ব্যাপকভাবে নির্ভর করা হয়েছে। ডেভেলপারদের কনটেক্সট হালকা (lean) রাখতে এবং নতুন কাজের জন্য নতুন সেশন শুরু করতে উৎসাহিত করার মাধ্যমে, Coinbase সফলভাবে তাদের ক্যাশিং হিট রেট মাত্র ৫% থেকে বাড়িয়ে ৬০% করেছে। এই দক্ষতা কোম্পানিটিকে রুটিন কাজের জন্য সস্তা মডেল ব্যবহার করতে এবং জটিল কাজের জন্য উচ্চ-রিজনিং (high-reasoning) মডেলগুলো সংরক্ষণ করতে সাহায্য করে, যা বর্তমানে agentic workflows স্কেল করার একটি ব্লুপ্রিন্ট হয়ে উঠছে।

Tokenmaxxing এবং পারফরম্যান্স অ্যাকাউন্টেবিলিটি

"agentic reasoning" মডেলগুলোর উত্থান—যেমন প্রত্যাশিত GPT-5.x সিরিজ—টোকেন ব্যবহারের পরিমাণ বহুগুণ বাড়িয়ে দিয়েছে। Amazon এবং Meta-র মতো কোম্পানিগুলোতে "tokenmaxxing"-এর একটি প্রবণতা দেখা গেছে, যেখানে কঠোর তদারকি ছাড়াই কর্মীরা প্রচুর পরিমাণে টোকেন খরচ করে ফেলেন; তবে Coinbase এখানে ভিন্ন একটি দর্শন প্রয়োগ করছে।

Armstrong কোনো সীমাবদ্ধতা ছাড়াই স্বচ্ছতার একটি মডেল চালু করেছেন: ডেভেলপারদের ব্যবহারের ওপর কোনো ঊর্ধ্বসীমা (cap) নেই, তবে তাদের খরচ সম্পূর্ণ স্বচ্ছ। এর মূল নীতি হলো "impact-based accountability" বা প্রভাব-ভিত্তিক জবাবদিহিতা—একজন ডেভেলপার AI টোকেনে যত বেশি খরচ করবেন, তার প্রত্যাশিত আউটপুট এবং ব্যবসায়িক প্রভাবও তত বেশি হতে হবে। এই পদ্ধতিটি ভারী কম্পিউটেশনের প্রয়োজনীয়তা এবং ROI-এর মধ্যে ভারসাম্য বজায় রাখে।

পশ্চিমা ল্যাবগুলোর জন্য একটি প্রাইসিং স্ট্রেস টেস্ট

সস্তা চীনা বিকল্পগুলোর দিকে এই চলে যাওয়া পশ্চিমা AI ল্যাবগুলোর ওপর প্রচণ্ড চাপ সৃষ্টি করছে, বিশেষ করে যখন OpenAI এবং Anthropic-এর মতো কোম্পানিগুলো IPO-র দিকে তাকিয়ে আছে এবং তাদের টেকসই প্রবৃদ্ধি প্রমাণ করা প্রয়োজন। একটি সম্ভাব্য মূল্য যুদ্ধ (price war) ইতিমধ্যেই স্পষ্ট হয়ে উঠেছে; জানা গেছে যে OpenAI আরও টোকেন-দক্ষ ভ্যারিয়েন্ট, যেমন GPT-5.6-Sol এবং অপেক্ষাকৃত কম দামের হালকা মডেলগুলো অফার করে প্রতিযোগিতাকে মোকাবিলা করার চেষ্টা করছে। পশ্চিমা প্রদানকারীদের জন্য চ্যালেঞ্জটি এখন আর কেবল বুদ্ধিমত্তার নয়, বরং এমন একটি মূল্য বজায় রাখার যেখান থেকে এন্টারপ্রাইজ ক্লায়েন্টরা আরও সাশ্রয়ী বৈশ্বিক প্রতিযোগীদের কাছে চলে না যায়।

মূল বিষয়সমূহ

  • Cost Optimization: GLM 5.2 এবং Kimi 2.7-এর মতো চীনা মডেলগুলো যুক্ত করার মাধ্যমে Coinbase তাদের মোট টোকেন ব্যবহার বৃদ্ধি করেও AI খরচ অর্ধেক কমিয়ে এনেছে।
  • Technical Efficiency: স্বয়ংক্রিয় রাউটিং এবং context engineering ব্যবহারের ফলে Coinbase তাদের ক্যাশিং হিট রেট ৫% থেকে বাড়িয়ে ৬০% করতে সক্ষম হয়েছে।
  • Market Pressure: সস্তা মডেলের দিকে এই পরিবর্তন পশ্চিমা ল্যাবগুলোকে তাদের উচ্চ মূল্যায়ন (valuation) এবং আসন্ন IPO-র সম্ভাবনাকে যুক্তিসঙ্গত করতে একটি মূল্য যুদ্ধে বাধ্য করছে।