MiniMax M3: দীর্ঘ কনটেক্সট সামলানোর একটি নতুন পদ্ধতি

Translated for your language. Read the original.

AI-assisted draft.

৩ দিন আগে2min read

𝗠𝗶𝗻𝗶𝗠𝗮𝘅 𝗠𝟯: 𝗔 𝗡𝗲𝘄 𝗪𝗮𝘆 𝗧𝗼 𝗛𝗮𝗻𝗱𝗹𝗲 𝗟𝗼𝗻𝗴 𝗖𝗼𝗻𝘁𝗲𝘅𝘁

MiniMax M3 হলো সাংহাই থেকে আসা একটি নতুন মাল্টিমোডাল মডেল। এতে ১-মিলিয়ন-টোকেন কনটেক্সট উইন্ডো রয়েছে। এই দৈর্ঘ্যের ক্ষেত্রে বেশিরভাগ মডেলই অত্যন্ত ধীরগতির এবং ব্যয়বহুল হয়ে পড়ে। MiniMax M3 এই সমস্যা সমাধানের জন্য MiniMax Sparse Attention (MSA) নামক একটি নতুন পদ্ধতি ব্যবহার করে।

MSA যেভাবে কাজ করে:

• Index branch: একটি দ্রুত পাসের মাধ্যমে ডেটার সবচেয়ে প্রাসঙ্গিক অংশগুলো খুঁজে বের করা হয়। • Sparse branch: মডেলটি শুধুমাত্র সেই নির্দিষ্ট অংশগুলোর দিকে নজর দেয়। • Memory efficiency: GPU মেমরি বটলেনেক (bottleneck) রোধ করতে এটি কুয়েরিগুলোকে একত্রে গ্রুপ করে।

এর ফলে পূর্ববর্তী সংস্করণগুলোর তুলনায় এই মডেলটি ডেটা প্রসেসিংয়ে ৯ গুণ এবং টেক্সট জেনারেশনে ১৫ গুণ দ্রুততর।

পারফরম্যান্স স্কোর:

• SWE-Bench Pro: 59.0% • Terminal-Bench 2.1: 66.0% • BrowseComp: 83.5% • KernelBench Hard: 28.8% • MCP Atlas: 74.2%

SWE-Bench Pro স্কোরটি GPT-5.5 এবং Gemini 3.1 Pro-এর চেয়ে বেশি। তবে, Claude Opus 4.8 এখনও ৬৯.২% স্কোর নিয়ে এগিয়ে রয়েছে। উল্লেখ্য যে, MiniMax এই পরীক্ষাগুলো তাদের নিজস্ব হার্ডওয়্যারে সম্পন্ন করেছে।

প্রযুক্তিগত বিবরণ:

M3-কে টেক্সট, ইমেজ এবং ভিডিওর সমন্বয়ে প্রশিক্ষণ দেওয়া হয়েছে। এটি ডেস্কটপ কম্পিউটার পরিচালনা করতে পারে। পরীক্ষায় দেখা গেছে, এটি NVIDIA হার্ডওয়্যারে একটি CUDA kernel অপ্টিমাইজ করতে সক্ষম।

আপনি তিনটি উপায়ে M3 ব্যবহার করতে পারেন:

MiniMax Platform API: এটি বিদ্যমান OpenAI কোডের সাথে কাজ করে।
OpenRouter: আপনি যদি সরাসরি MiniMax অ্যাকাউন্ট না চান, তবে এটি ভালো বিকল্প।
Self-hosting: MSA আর্কিটেকচারের জন্য আপনার vLLM বা SGLang সাপোর্ট প্রয়োজন।

মূল্য নির্ধারণ:

প্রতি মিলিয়ন ইনপুট টোকেনের জন্য খরচ $০.৬০ এবং প্রতি মিলিয়ন আউটপুট টোকেনের জন্য $২.৪০। লঞ্চ ডিসকাউন্টের কারণে এই দাম কমে যথাক্রমে $০.৩০ এবং $১.২০ হয়েছে। এটি Claude Opus-এর তুলনায় অনেক সাশ্রয়ী।

মনে রাখার মতো তিনটি বিষয়:

কনটেক্সট মানেই মেমরি নয়। দীর্ঘমেয়াদী এজেন্ট টাস্কের জন্য আপনার এখনও এক্সটার্নাল মেমরির প্রয়োজন হবে।
বেঞ্চমার্ক যাচাই করুন। আপনার পুরো সিস্টেম পরিবর্তন করার আগে থার্ড-পার্টি পরীক্ষার জন্য অপেক্ষা করুন।
ডেটা প্রাইভেসি। MiniMax সাংহাই ভিত্তিক। আপনি যদি সংবেদনশীল ডেটা নিয়ে কাজ করেন, তবে এটি বিবেচনায় রাখুন।

উৎস: https://dev.to/prabhakar_chaudhary_7afe4/minimax-m3-what-a-1m-token-open-weight-model-with-sparse-attention-actually-means-for-developers-i1i

ঐচ্ছিক লার্নিং কমিউনিটি: https://t.me/GyaanSetuAi

MiniMax M3: দীর্ঘ কনটেক্সট সামলানোর একটি নতুন পদ্ধতি

Continue reading

𝗖𝗛𝗜𝗡𝗔'𝗦 𝗖𝗢𝗗𝗜𝗡𝗚 𝗔𝗜 𝗜𝗦 𝗖𝗟𝗢𝗦𝗜𝗡𝗚 𝗧𝗛𝗘 𝗚𝗔𝗣 𝗙𝗔𝗦𝗧

মাইক্রোসফট MAI Thinking 1 প্রকাশ করেছে

𝗧𝗵𝗲 𝗠𝗖𝗣 𝗖𝗼𝗻𝘁𝗲𝘅𝘁 𝗧𝗮𝘅

𝗙𝗹𝗮𝘀𝗵𝗠𝗲𝗺𝗼𝗿𝘆 𝗖𝘂𝘁𝘀 𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝗩𝟰 𝗞𝗩 𝗖𝗮𝗰𝗵𝗲 𝘁𝗼 𝟭𝟯.𝟱%

𝗚𝗲𝗺𝗺𝗮 𝟮 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗲: 𝗠𝗼𝗿𝗲 𝗣𝗲𝗿𝗳𝗼𝗿𝗺𝗮𝗻𝗰𝗲 𝗳𝗿𝗼𝗺 𝗟𝗲𝘀𝘀 𝗠𝗼𝗱𝗲𝗹