Snowflake CEO: GLM-5.2 অত্যন্ত কম খরচে Claude Opus 4.7-এর সাথে পাল্লা দিচ্ছে

Snowflake দ্বারা পরিচালিত একটি সাম্প্রতিক হ্যান্ডস-অন বেঞ্চমার্ক এআই (AI) শিল্পে ব্যাপক আলোড়ন সৃষ্টি করেছে, যা প্রকাশ করেছে যে চীনের GLM-5.2 বিশেষায়িত কোডিং টাস্কগুলোতে শীর্ষস্থানীয় পশ্চিমা মডেলগুলোর সাথে প্রতিদ্বন্দ্বিতা করতে সক্ষম। যদিও Claude Opus 4.7 প্রযুক্তিগতভাবে এগিয়ে রয়েছে, তবে বিশাল মূল্যের পার্থক্য লার্জ ল্যাঙ্গুয়েজ মডেলের (LLM) অর্থনীতিতে একটি আসন্ন পরিবর্তনের ইঙ্গিত দিচ্ছে।

বেঞ্চমার্ক: জটিল পরিবেশে কোডিংয়ের সমতা

Snowflake-এর CEO Sridhar Ramaswamy ১০৩টি স্বতন্ত্র টাস্ক নিয়ে একটি কঠোর পরীক্ষা পরিচালনা করেন, যা DuckDB এবং Snowflake উভয় পরিবেশেই কোড জেনারেশন মূল্যায়নের জন্য ডিজাইন করা হয়েছিল। ফলাফলগুলো আশ্চর্যজনকভাবে কাছাকাছি ছিল: প্রতিটি টাস্কের জন্য তিনটি করে প্রচেষ্টা দেওয়ার ক্ষেত্রে, GLM-5.2 ৬৬% টাস্ক সমাধান করতে পেরেছে, যা Claude Opus 4.7-এর (৬৭% সাফল্যের হার) চেয়ে সামান্য পিছিয়ে রয়েছে।

তবে পারফরম্যান্সের সূক্ষ্ম বিষয়গুলো নির্ভরযোগ্যতার ক্ষেত্রে একটি পার্থক্য প্রকাশ করে। GLM-5.2-এর ৪৭.৬% প্রথম প্রচেষ্টার নির্ভুলতার তুলনায় Opus 4.7 ৫৩.৭% নির্ভুলতার মাধ্যমে উন্নত ধারাবাহিকতা প্রদর্শন করেছে। চীনা মডেলটি "অতিরিক্ত চিন্তা করা" (over-think) বা অপ্রয়োজনীয় প্রক্রিয়ার মাধ্যমে লুপ করার প্রবণতাও দেখিয়েছে। একটি উল্লেখযোগ্য উদাহরণে, GLM-5.2 ২৪ মিনিটে ৪১১টি টুল কল (tool calls) সম্পাদন করেছে—রো কাউন্ট, ডিস্ট্রিবিউশন এবং নাল ভ্যালু পরীক্ষা করার জন্য—তবুও তিনটি প্রচেষ্টাই ব্যর্থ হয়েছে। বিপরীতে, Opus 4.7 মাত্র ৪৯টি কলের মাধ্যমে মাত্র ৯ মিনিটে একই টাস্ক সমাধান করেছে।

এআই-এর অর্থনীতি: চীনের প্রাইসিং প্রেশার

যদিও Opus 4.7 অধিকতর দক্ষ এবং ধারাবাহিক মডেল, আসল বিষয়টি লুকিয়ে আছে এর ইউনিট ইকোনমিক্সে। পশ্চিমা ফ্ল্যাগশিপ মডেল এবং GLM-5.2-এর মধ্যে খরচের পার্থক্য আকাশচুম্বী এবং এটি এন্টারপ্রাইজ এআই ডিপ্লয়মেন্টের জন্য ROI (রিটার্ন অন ইনভেস্টমেন্ট) গণনায় মৌলিক পরিবর্তন আনতে পারে।

Zhipu-এর অফিসিয়াল প্রাইসিং অনুযায়ী, GLM-5.2-এর খরচ প্রতি মিলিয়ন ইনপুট টোকেনের জন্য $1.40 এবং প্রতি মিলিয়ন আউটপুট টোকেনের জন্য $4.40। বিষয়টি পরিষ্কারভাবে বোঝার জন্য:

  • Claude Opus 4.7: $5.00 (Input) / $25.00 (Output)
  • GPT-5.5: $5.00 (Input) / $30.00 (Output)

যদিও GLM-5.2 অধিকতর "টোকেন-ক্ষুধার্ত" (token-hungry)—Opus-এর ৮০টি রানের তুলনায় প্রতি টাস্কে গড়ে ৯৯টি রান করে এবং Opus-এর 439 মিলিয়ন টোকেনের বিপরীতে 860 মিলিয়ন টোকেন ব্যবহার করে—তবুও এটি উল্লেখযোগ্যভাবে সাশ্রয়ী। এই প্রাইসিং মডেলটি বর্তমানে OpenAI এবং Anthropic-এর উচ্চ-মুনাফা (high-margin) কৌশলের জন্য একটি সরাসরি চ্যালেঞ্জ।

কেন এটি এআই ল্যান্ডস্কেপের জন্য গুরুত্বপূর্ণ

GLM-5.2-এর মতো অত্যন্ত সক্ষম এবং স্বল্পমূল্যের মডেলের উত্থান "এআই বাবল" (AI bubble)-এর জন্য একটি স্ট্রেস টেস্ট হিসেবে কাজ করছে। পশ্চিমা এআই ল্যাবগুলোর বিশাল ভ্যালুয়েশন দ্রুত এবং উচ্চ-মুনাফাসম্পন্ন রাজস্ব বৃদ্ধির অনুমানের ওপর ভিত্তি করে দাঁড়িয়ে আছে। যদি ডেভেলপার এবং এন্টারপ্রাইজগুলো কোডিং এবং ডেটা ইঞ্জিনিয়ারিংয়ের মতো উচ্চ-ফ্রিকোয়েন্সি টাস্কগুলোর জন্য অনেক সস্তা বিকল্পের দিকে ঝুঁকে পড়ে, তবে ফ্ল্যাগশিপ মডেলগুলোর জন্য প্রজেক্টেড রেভিনিউ বা রাজস্ব প্রবাহ উল্লেখযোগ্যভাবে হ্রাস পেতে পারে।

Snowflake যখন তার গ্রাহকদের জন্য GLM-5.2 উপলব্ধ করার প্রস্তুতি নিচ্ছে, শিল্পটি এমন এক বাস্তবতার দিকে এগিয়ে যাচ্ছে যেখানে "বুদ্ধিমত্তা" (intelligence) আর কোনো বিলাসদ্রব্য নয়, বরং একটি সাধারণ ইউটিলিটি বা পণ্য হিসেবে গণ্য হবে।

মূল বিষয়সমূহ

  • প্রতিযোগিতামূলক সমতা: জটিল Snowflake/DuckDB কোডিং বেঞ্চমার্কে GLM-5.2 ৬৬% সাফল্যের হার অর্জন করেছে, যা Claude Opus 4.7-এর ৬৭%-এর প্রায় কাছাকাছি।
  • দক্ষতার ব্যবধান: যদিও GLM-5.2 অত্যন্ত সক্ষম, এটি কম দক্ষ; সমাধান পেতে এর আরও বেশি টুল কল এবং উচ্চ টোকেন ব্যবহারের প্রয়োজন হয়।
  • অর্থনৈতিক বিশৃঙ্খলা: GLM-5.2 আউটপুট টোকেনের মূল্য Claude Opus 4.7 বা GPT-5.5-এর তুলনায় প্রায় ১/৫ থেকে ১/৭ অংশ দামে অফার করছে, যা পশ্চিমা এআই প্রদানকারীদের ওপর তীব্র প্রাইসিং প্রেশার তৈরি করছে।