𝗠𝗶𝗻𝗶𝗠𝗮𝘅 𝗠𝟯: 𝗔 𝗡𝗲𝘄 𝗪𝗮𝘆 𝗧𝗼 𝗛𝗮𝗻𝗱𝗹𝗲 𝗟𝗼𝗻𝗴 𝗖𝗼𝗻𝘁𝗲𝘅𝘁
MiniMax M3 हे शांघायमधील एक नवीन मल्टीमोडल (multimodal) मॉडेल आहे. यामध्ये 1-मिलियन-टोकन कॉन्टेक्स्ट विंडो (context window) आहे. इतक्या मोठ्या लांबीवर बहुतेक मॉडेल्स खूप संथ आणि महाग होतात. हे सोडवण्यासाठी MiniMax M3 'MiniMax Sparse Attention (MSA)' नावाच्या नवीन पद्धतीचा वापर करते.
MSA कसे कार्य करते:
• Index branch: एक जलद प्रक्रिया डेटाचे सर्वात संबंधित भाग शोधते. • Sparse branch: मॉडेल फक्त त्या विशिष्ट भागांकडे लक्ष देते. • Memory efficiency: GPU मेमरीमधील अडथळे (bottlenecks) रोखण्यासाठी ते क्वेरीज एकत्रित करते.
यामुळे मॉडेल डेटा प्रक्रिया करण्यात मागील आवृत्त्यांच्या तुलनेत 9 पट अधिक वेगवान आणि मजकूर (text) तयार करण्यात 15 पट अधिक वेगवान बनते.
कामगिरीचे स्कोअर (Performance scores):
• SWE-Bench Pro: 59.0% • Terminal-Bench 2.1: 66.0% • BrowseComp: 83.5% • KernelBench Hard: 28.8% • MCP Atlas: 74.2%
SWE-Bench Pro चा स्कोअर GPT-5.5 आणि Gemini 3.1 Pro पेक्षा जास्त आहे. तथापि, Claude Opus 4.8 अजूनही 69.2% सह आघाडीवर आहे. हे लक्षात घेणे महत्त्वाचे आहे की MiniMax ने हे परीक्षण त्यांच्या स्वतःच्या हार्डवेअरवर केले आहे.
तांत्रिक तपशील (Technical details):
M3 ला मजकूर, प्रतिमा आणि व्हिडिओ या सर्वांवर एकत्रितपणे प्रशिक्षित केले गेले आहे. ते डेस्कटॉप संगणक चालवू शकते. चाचण्यांमध्ये, त्याने NVIDIA हार्डवेअरवर CUDA kernel ऑप्टिमाइझ केले.
तुम्ही M3 तीन प्रकारे वापरू शकता:
- MiniMax Platform API: हे सध्याच्या OpenAI कोडसोबत काम करते.
- OpenRouter: जर तुम्हाला थेट MiniMax खाते नको असेल तर हे उत्तम आहे.
- Self-hosting: MSA आर्किटेक्चरसाठी तुम्हाला vLLM किंवा SGLang सपोर्टची आवश्यकता असेल.
किंमत (Pricing):
याची किंमत प्रति दशलक्ष इनपुट टोकन्ससाठी $0.60 आणि प्रति दशलक्ष आउटपुट टोकन्ससाठी $2.40 आहे. लाँच डिस्काउंटमुळे या किमती $0.30 आणि $1.20 पर्यंत कमी होतात. हे Claude Opus पेक्षा खूपच स्वस्त आहे.
लक्षात ठेवण्यासारख्या तीन गोष्टी:
- कॉन्टेक्स्ट म्हणजे मेमरी नाही. दीर्घकालीन एजंट कार्यांसाठी तुम्हाला अजूनही बाह्य मेमरीची आवश्यकता असेल.
- बेंचमार्क तपासा. तुमची संपूर्ण प्रणाली बदलण्यापूर्वी तृतीय-पक्ष (third-party) चाचण्यांची प्रतीक्षा करा.
- डेटा गोपनीयता (Data privacy). MiniMax शांघायमध्ये स्थित आहे. जर तुम्ही संवेदनशील डेटा हाताळत असाल तर याचा विचार करा.
स्त्रोत (Source): https://dev.to/prabhakar_chaudhary_7afe4/minimax-m3-what-a-1m-token-open-weight-model-with-sparse-attention-actually-means-for-developers-i1i
पर्यायी लर्निंग कम्युनिटी (Optional learning community): https://t.me/GyaanSetuAi