𝗠𝗶𝗻𝗶𝗠𝗮𝘅 𝗠𝟯: 𝗔 𝗡𝗲𝘄 𝗪𝗮𝘆 𝗧𝗼 𝗛𝗮𝗻𝗱𝗹𝗲 𝗟𝗼𝗻𝗴 𝗖𝗼𝗻𝘁𝗲𝘅𝘁

MiniMax M3 یک مدل چندوجهی (multimodal) جدید از شانگهای است. این مدل دارای پنجره بافت (context window) ۱ میلیون توکنی است. اکثر مدل‌ها در این طول متن، بسیار کند و گران می‌شوند. MiniMax M3 از روش جدیدی به نام MiniMax Sparse Attention (MSA) برای حل این مشکل استفاده می‌کند.

مکانیزم عملکرد MSA:

• شاخه شاخص (Index branch): یک مرحله سریع، مرتبط‌ترین بخش‌های داده را پیدا می‌کند. • شاخه پراکنده (Sparse branch): مدل فقط به همان بخش‌های خاص نگاه می‌کند. • کارایی حافظه: پرس‌وجوها (queries) را با هم گروه‌بندی می‌کند تا از گلوگاه‌های حافظه GPU جلوگیری کند.

این امر باعث می‌شود مدل در مقایسه با نسخه‌های قبلی، در پردازش داده‌ها ۹ برابر و در تولید متن ۱۵ برابر سریع‌تر باشد.

امتیازات عملکرد:

• SWE-Bench Pro: 59.0% • Terminal-Bench 2.1: 66.0% • BrowseComp: 83.5% • KernelBench Hard: 28.8% • MCP Atlas: 74.2%

امتیاز SWE-Bench Pro از GPT-5.5 و Gemini 3.1 Pro بالاتر است. با این حال، Claude Opus 4.8 همچنان با امتیاز ۶۹.۲٪ پیشتاز است. لازم به ذکر است که MiniMax این آزمایش‌ها را روی سخت‌افزار خود انجام داده است.

جزئیات فنی:

مدل M3 به‌صورت هم‌زمان روی متن، تصویر و ویدیو آموزش دیده است. این مدل می‌تواند با کامپیوترهای دسکتاپ کار کند. در آزمایش‌ها، این مدل یک CUDA kernel را روی سخت‌افزار NVIDIA بهینه‌سازی کرد.

شما می‌توانید از M3 به سه روش استفاده کنید:

  • MiniMax Platform API: با کدهای موجود OpenAI سازگار است.
  • OpenRouter: اگر نمی‌خواهید مستقیماً حساب کاربری MiniMax داشته باشید، گزینه خوبی است.
  • میزبانی شخصی (Self-hosting): برای معماری MSA به پشتیبانی از vLLM یا SGLang نیاز دارید.

قیمت‌گذاری:

هزینه آن ۰.۶۰ دلار به ازای هر میلیون توکن ورودی و ۲.۴۰ دلار به ازای هر میلیون توکن خروجی است. تخفیف زمان عرضه، این قیمت‌ها را به ۰.۳۰ دلار و ۱.۲۰ دلار کاهش می‌دهد. این قیمت بسیار ارزان‌تر از Claude Opus است.

سه نکته که باید به خاطر بسپارید:

  • بافت (Context) همان حافظه نیست. شما همچنان برای وظایف بلندمدت عامل‌ها (agents) به حافظه خارجی نیاز دارید.
  • بنچمارک‌ها را تأیید کنید. قبل از تغییر کل سیستم خود، منتظر آزمایش‌های شخص ثالث بمانید.
  • حریم خصوصی داده‌ها. مقر MiniMax در شانگهای است. اگر با داده‌های حساس سروکار دارید، این موضوع را در نظر بگیرید.

منبع: https://dev.to/prabhakar_chaudhary_7afe4/minimax-m3-what-a-1m-token-open-weight-model-with-sparse-attention-actually-means-for-developers-i1i

انجمن یادگیری اختیاری: https://t.me/GyaanSetuAi