এপিআই (API) খরচ কমাতে চীনা এআই মডেলের দিকে ঝুঁকছে Coinbase

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial৬ দিন আগে3min read

এপিআই (API) খরচ কমাতে চীনা এআই মডেলের দিকে ঝুঁকছে Coinbase

In this article

API খরচ কমাতে চীনা AI মডেলের দিকে ঝুঁকছে Coinbase

পশ্চিমা AI ল্যাবগুলো যখন বিশাল কম্পিউট খরচ এবং মুনাফার মধ্যে ভারসাম্য বজায় রাখতে হিমশিম খাচ্ছে, তখন শিল্পখাতের শীর্ষস্থানীয় প্রতিষ্ঠানগুলো দক্ষতার জন্য পূর্বের দিকে তাকাতে শুরু করেছে। Coinbase আনুষ্ঠানিকভাবে সেই ক্রমবর্ধমান প্রযুক্তি জায়ান্টদের তালিকায় যোগ দিয়েছে যারা তাদের পরিচালন ব্যয় (operational expenditures) অপ্টিমাইজ করার জন্য চীনা AI মডেলের দিকে ঝুঁকছে।

চীনা মডেলের দিকে পরিবর্তন: GLM এবং Kimi

Coinbase-এর CEO Brian Armstrong সম্প্রতি প্রকাশ করেছেন যে কোম্পানিটি তাদের ইনফ্রাস্ট্রাকচারে GLM 5.2 এবং Kimi 2.7-এর মতো চীন-নির্মিত মডেলগুলো যুক্ত করেছে। এই কৌশলগত পরিবর্তনের ফলে Coinbase উল্লেখযোগ্যভাবে বেশি টোকেন ভলিউম হ্যান্ডেল করতে সক্ষম হয়েছে এবং একই সাথে তাদের AI খরচ অর্ধেক কমিয়ে এনেছে।

এই পদক্ষেপটি কেবল ক্রিপ্টো সেক্টরের মধ্যেই সীমাবদ্ধ নয়। Lindy নামক স্টার্টআপটি DeepSeek v4-এ স্থানান্তরিত হয়েছে এবং ডেটা জায়ান্ট Snowflake বর্তমানে OpenAI এবং Anthropic-এর উচ্চমূল্যের বিকল্প হিসেবে সাশ্রয়ী চীনা মডেলগুলো পরীক্ষা করছে। এই পরিবর্তনটি এন্টারপ্রাইজগুলো কীভাবে AI-এর "frontier" বা অগ্রগতির দিকটিকে দেখছে তার একটি বিশাল রূপান্তর নির্দেশ করে, যেখানে ব্র্যান্ডের পরিচিতির চেয়ে 'প্রাইস-টু-পারফরম্যান্স রেশিও' বা মূল্যের বিপরীতে কার্যকারিতাকে বেশি প্রাধান্য দেওয়া হচ্ছে।

ইন্টেলিজেন্ট রাউটিং এবং কনটেক্সট ইঞ্জিনিয়ারিং

এই সাশ্রয়কে সর্বোচ্চ করতে Coinbase একটি স্বয়ংক্রিয় রাউটিং সিস্টেম চালু করেছে। একটি মাত্র LLM-এর ওপর নির্ভর না করে, এই সিস্টেমটি তিনটি গুরুত্বপূর্ণ মেট্রিক্সের ভিত্তিতে প্রতিটি রিকোয়েস্ট মূল্যায়ন করে: কাজের জটিলতা (task complexity), খরচ এবং ক্যাশিং সম্ভাবনা (caching potential)।

এই কৌশলের প্রযুক্তিগত বাস্তবায়নের জন্য "context engineering"-এর ওপর ব্যাপকভাবে নির্ভর করা হয়েছে। ডেভেলপারদের কনটেক্সট হালকা (lean) রাখতে এবং নতুন কাজের জন্য নতুন সেশন শুরু করতে উৎসাহিত করার মাধ্যমে, Coinbase সফলভাবে তাদের ক্যাশিং হিট রেট মাত্র ৫% থেকে বাড়িয়ে ৬০% করেছে। এই দক্ষতা কোম্পানিটিকে রুটিন কাজের জন্য সস্তা মডেল ব্যবহার করতে এবং জটিল কাজের জন্য উচ্চ-রিজনিং (high-reasoning) মডেলগুলো সংরক্ষণ করতে সাহায্য করে, যা বর্তমানে agentic workflows স্কেল করার একটি ব্লুপ্রিন্ট হয়ে উঠছে।

Tokenmaxxing এবং পারফরম্যান্স অ্যাকাউন্টেবিলিটি

"agentic reasoning" মডেলগুলোর উত্থান—যেমন প্রত্যাশিত GPT-5.x সিরিজ—টোকেন ব্যবহারের পরিমাণ বহুগুণ বাড়িয়ে দিয়েছে। Amazon এবং Meta-র মতো কোম্পানিগুলোতে "tokenmaxxing"-এর একটি প্রবণতা দেখা গেছে, যেখানে কঠোর তদারকি ছাড়াই কর্মীরা প্রচুর পরিমাণে টোকেন খরচ করে ফেলেন; তবে Coinbase এখানে ভিন্ন একটি দর্শন প্রয়োগ করছে।

Armstrong কোনো সীমাবদ্ধতা ছাড়াই স্বচ্ছতার একটি মডেল চালু করেছেন: ডেভেলপারদের ব্যবহারের ওপর কোনো ঊর্ধ্বসীমা (cap) নেই, তবে তাদের খরচ সম্পূর্ণ স্বচ্ছ। এর মূল নীতি হলো "impact-based accountability" বা প্রভাব-ভিত্তিক জবাবদিহিতা—একজন ডেভেলপার AI টোকেনে যত বেশি খরচ করবেন, তার প্রত্যাশিত আউটপুট এবং ব্যবসায়িক প্রভাবও তত বেশি হতে হবে। এই পদ্ধতিটি ভারী কম্পিউটেশনের প্রয়োজনীয়তা এবং ROI-এর মধ্যে ভারসাম্য বজায় রাখে।

পশ্চিমা ল্যাবগুলোর জন্য একটি প্রাইসিং স্ট্রেস টেস্ট

সস্তা চীনা বিকল্পগুলোর দিকে এই চলে যাওয়া পশ্চিমা AI ল্যাবগুলোর ওপর প্রচণ্ড চাপ সৃষ্টি করছে, বিশেষ করে যখন OpenAI এবং Anthropic-এর মতো কোম্পানিগুলো IPO-র দিকে তাকিয়ে আছে এবং তাদের টেকসই প্রবৃদ্ধি প্রমাণ করা প্রয়োজন। একটি সম্ভাব্য মূল্য যুদ্ধ (price war) ইতিমধ্যেই স্পষ্ট হয়ে উঠেছে; জানা গেছে যে OpenAI আরও টোকেন-দক্ষ ভ্যারিয়েন্ট, যেমন GPT-5.6-Sol এবং অপেক্ষাকৃত কম দামের হালকা মডেলগুলো অফার করে প্রতিযোগিতাকে মোকাবিলা করার চেষ্টা করছে। পশ্চিমা প্রদানকারীদের জন্য চ্যালেঞ্জটি এখন আর কেবল বুদ্ধিমত্তার নয়, বরং এমন একটি মূল্য বজায় রাখার যেখান থেকে এন্টারপ্রাইজ ক্লায়েন্টরা আরও সাশ্রয়ী বৈশ্বিক প্রতিযোগীদের কাছে চলে না যায়।

মূল বিষয়সমূহ

Cost Optimization: GLM 5.2 এবং Kimi 2.7-এর মতো চীনা মডেলগুলো যুক্ত করার মাধ্যমে Coinbase তাদের মোট টোকেন ব্যবহার বৃদ্ধি করেও AI খরচ অর্ধেক কমিয়ে এনেছে।
Technical Efficiency: স্বয়ংক্রিয় রাউটিং এবং context engineering ব্যবহারের ফলে Coinbase তাদের ক্যাশিং হিট রেট ৫% থেকে বাড়িয়ে ৬০% করতে সক্ষম হয়েছে।
Market Pressure: সস্তা মডেলের দিকে এই পরিবর্তন পশ্চিমা ল্যাবগুলোকে তাদের উচ্চ মূল্যায়ন (valuation) এবং আসন্ন IPO-র সম্ভাবনাকে যুক্তিসঙ্গত করতে একটি মূল্য যুদ্ধে বাধ্য করছে।

এপিআই (API) খরচ কমাতে চীনা এআই মডেলের দিকে ঝুঁকছে Coinbase

API খরচ কমাতে চীনা AI মডেলের দিকে ঝুঁকছে Coinbase

চীনা মডেলের দিকে পরিবর্তন: GLM এবং Kimi

ইন্টেলিজেন্ট রাউটিং এবং কনটেক্সট ইঞ্জিনিয়ারিং

Tokenmaxxing এবং পারফরম্যান্স অ্যাকাউন্টেবিলিটি

পশ্চিমা ল্যাবগুলোর জন্য একটি প্রাইসিং স্ট্রেস টেস্ট

মূল বিষয়সমূহ

Continue reading

Snowflake-এর সিইও: অনেক কম খরচে GLM 5.2 এখন Claude Opus 4.7-এর প্রতিদ্বন্দ্বী

টোকেনম্যাক্সিং থেকে রেশন: কর্পোরেট এআই ব্যয় সংকট

চীনের এআই যুগান্তকারী সাফল্য: নতুন সাইবার নিরাপত্তা সরঞ্জাম মার্কিন প্রযুক্তির সাথে পাল্লা দিচ্ছে