𝗠𝗶𝗻𝗶𝗠𝗮𝘅 𝗠𝟯: 𝗔 𝗡𝗲𝘄 𝗪𝗮𝘆 𝗧𝗼 𝗛𝗮𝗻𝗱𝗹𝗲 𝗟𝗼𝗻𝗴 𝗖𝗼𝗻𝘁𝗲𝘅𝘁

MiniMax M3 হলো সাংহাই থেকে আসা একটি নতুন মাল্টিমোডাল মডেল। এতে ১-মিলিয়ন-টোকেন কনটেক্সট উইন্ডো রয়েছে। এই দৈর্ঘ্যের ক্ষেত্রে বেশিরভাগ মডেলই অত্যন্ত ধীরগতির এবং ব্যয়বহুল হয়ে পড়ে। MiniMax M3 এই সমস্যা সমাধানের জন্য MiniMax Sparse Attention (MSA) নামক একটি নতুন পদ্ধতি ব্যবহার করে।

MSA যেভাবে কাজ করে:

• Index branch: একটি দ্রুত পাসের মাধ্যমে ডেটার সবচেয়ে প্রাসঙ্গিক অংশগুলো খুঁজে বের করা হয়। • Sparse branch: মডেলটি শুধুমাত্র সেই নির্দিষ্ট অংশগুলোর দিকে নজর দেয়। • Memory efficiency: GPU মেমরি বটলেনেক (bottleneck) রোধ করতে এটি কুয়েরিগুলোকে একত্রে গ্রুপ করে।

এর ফলে পূর্ববর্তী সংস্করণগুলোর তুলনায় এই মডেলটি ডেটা প্রসেসিংয়ে ৯ গুণ এবং টেক্সট জেনারেশনে ১৫ গুণ দ্রুততর।

পারফরম্যান্স স্কোর:

• SWE-Bench Pro: 59.0% • Terminal-Bench 2.1: 66.0% • BrowseComp: 83.5% • KernelBench Hard: 28.8% • MCP Atlas: 74.2%

SWE-Bench Pro স্কোরটি GPT-5.5 এবং Gemini 3.1 Pro-এর চেয়ে বেশি। তবে, Claude Opus 4.8 এখনও ৬৯.২% স্কোর নিয়ে এগিয়ে রয়েছে। উল্লেখ্য যে, MiniMax এই পরীক্ষাগুলো তাদের নিজস্ব হার্ডওয়্যারে সম্পন্ন করেছে।

প্রযুক্তিগত বিবরণ:

M3-কে টেক্সট, ইমেজ এবং ভিডিওর সমন্বয়ে প্রশিক্ষণ দেওয়া হয়েছে। এটি ডেস্কটপ কম্পিউটার পরিচালনা করতে পারে। পরীক্ষায় দেখা গেছে, এটি NVIDIA হার্ডওয়্যারে একটি CUDA kernel অপ্টিমাইজ করতে সক্ষম।

আপনি তিনটি উপায়ে M3 ব্যবহার করতে পারেন:

  • MiniMax Platform API: এটি বিদ্যমান OpenAI কোডের সাথে কাজ করে।
  • OpenRouter: আপনি যদি সরাসরি MiniMax অ্যাকাউন্ট না চান, তবে এটি ভালো বিকল্প।
  • Self-hosting: MSA আর্কিটেকচারের জন্য আপনার vLLM বা SGLang সাপোর্ট প্রয়োজন।

মূল্য নির্ধারণ:

প্রতি মিলিয়ন ইনপুট টোকেনের জন্য খরচ $০.৬০ এবং প্রতি মিলিয়ন আউটপুট টোকেনের জন্য $২.৪০। লঞ্চ ডিসকাউন্টের কারণে এই দাম কমে যথাক্রমে $০.৩০ এবং $১.২০ হয়েছে। এটি Claude Opus-এর তুলনায় অনেক সাশ্রয়ী।

মনে রাখার মতো তিনটি বিষয়:

  • কনটেক্সট মানেই মেমরি নয়। দীর্ঘমেয়াদী এজেন্ট টাস্কের জন্য আপনার এখনও এক্সটার্নাল মেমরির প্রয়োজন হবে।
  • বেঞ্চমার্ক যাচাই করুন। আপনার পুরো সিস্টেম পরিবর্তন করার আগে থার্ড-পার্টি পরীক্ষার জন্য অপেক্ষা করুন।
  • ডেটা প্রাইভেসি। MiniMax সাংহাই ভিত্তিক। আপনি যদি সংবেদনশীল ডেটা নিয়ে কাজ করেন, তবে এটি বিবেচনায় রাখুন।

উৎস: https://dev.to/prabhakar_chaudhary_7afe4/minimax-m3-what-a-1m-token-open-weight-model-with-sparse-attention-actually-means-for-developers-i1i

ঐচ্ছিক লার্নিং কমিউনিটি: https://t.me/GyaanSetuAi