MiniMax M3: लाँग कॉन्टेक्स्ट हाताळण्याची एक नवीन पद्धत

Translated for your language. Read the original.

AI-assisted draft.

३ दिवसांपूर्वी2min read

𝗠𝗶𝗻𝗶𝗠𝗮𝘅 𝗠𝟯: 𝗔 𝗡𝗲𝘄 𝗪𝗮𝘆 𝗧𝗼 𝗛𝗮𝗻𝗱𝗹𝗲 𝗟𝗼𝗻𝗴 𝗖𝗼𝗻𝘁𝗲𝘅𝘁

MiniMax M3 हे शांघायमधील एक नवीन मल्टीमोडल (multimodal) मॉडेल आहे. यामध्ये 1-मिलियन-टोकन कॉन्टेक्स्ट विंडो (context window) आहे. इतक्या मोठ्या लांबीवर बहुतेक मॉडेल्स खूप संथ आणि महाग होतात. हे सोडवण्यासाठी MiniMax M3 'MiniMax Sparse Attention (MSA)' नावाच्या नवीन पद्धतीचा वापर करते.

MSA कसे कार्य करते:

• Index branch: एक जलद प्रक्रिया डेटाचे सर्वात संबंधित भाग शोधते. • Sparse branch: मॉडेल फक्त त्या विशिष्ट भागांकडे लक्ष देते. • Memory efficiency: GPU मेमरीमधील अडथळे (bottlenecks) रोखण्यासाठी ते क्वेरीज एकत्रित करते.

यामुळे मॉडेल डेटा प्रक्रिया करण्यात मागील आवृत्त्यांच्या तुलनेत 9 पट अधिक वेगवान आणि मजकूर (text) तयार करण्यात 15 पट अधिक वेगवान बनते.

कामगिरीचे स्कोअर (Performance scores):

• SWE-Bench Pro: 59.0% • Terminal-Bench 2.1: 66.0% • BrowseComp: 83.5% • KernelBench Hard: 28.8% • MCP Atlas: 74.2%

SWE-Bench Pro चा स्कोअर GPT-5.5 आणि Gemini 3.1 Pro पेक्षा जास्त आहे. तथापि, Claude Opus 4.8 अजूनही 69.2% सह आघाडीवर आहे. हे लक्षात घेणे महत्त्वाचे आहे की MiniMax ने हे परीक्षण त्यांच्या स्वतःच्या हार्डवेअरवर केले आहे.

तांत्रिक तपशील (Technical details):

M3 ला मजकूर, प्रतिमा आणि व्हिडिओ या सर्वांवर एकत्रितपणे प्रशिक्षित केले गेले आहे. ते डेस्कटॉप संगणक चालवू शकते. चाचण्यांमध्ये, त्याने NVIDIA हार्डवेअरवर CUDA kernel ऑप्टिमाइझ केले.

तुम्ही M3 तीन प्रकारे वापरू शकता:

MiniMax Platform API: हे सध्याच्या OpenAI कोडसोबत काम करते.
OpenRouter: जर तुम्हाला थेट MiniMax खाते नको असेल तर हे उत्तम आहे.
Self-hosting: MSA आर्किटेक्चरसाठी तुम्हाला vLLM किंवा SGLang सपोर्टची आवश्यकता असेल.

किंमत (Pricing):

याची किंमत प्रति दशलक्ष इनपुट टोकन्ससाठी $0.60 आणि प्रति दशलक्ष आउटपुट टोकन्ससाठी $2.40 आहे. लाँच डिस्काउंटमुळे या किमती $0.30 आणि $1.20 पर्यंत कमी होतात. हे Claude Opus पेक्षा खूपच स्वस्त आहे.

लक्षात ठेवण्यासारख्या तीन गोष्टी:

कॉन्टेक्स्ट म्हणजे मेमरी नाही. दीर्घकालीन एजंट कार्यांसाठी तुम्हाला अजूनही बाह्य मेमरीची आवश्यकता असेल.
बेंचमार्क तपासा. तुमची संपूर्ण प्रणाली बदलण्यापूर्वी तृतीय-पक्ष (third-party) चाचण्यांची प्रतीक्षा करा.
डेटा गोपनीयता (Data privacy). MiniMax शांघायमध्ये स्थित आहे. जर तुम्ही संवेदनशील डेटा हाताळत असाल तर याचा विचार करा.

स्त्रोत (Source): https://dev.to/prabhakar_chaudhary_7afe4/minimax-m3-what-a-1m-token-open-weight-model-with-sparse-attention-actually-means-for-developers-i1i

पर्यायी लर्निंग कम्युनिटी (Optional learning community): https://t.me/GyaanSetuAi

MiniMax M3: लाँग कॉन्टेक्स्ट हाताळण्याची एक नवीन पद्धत

Continue reading

चीनचे कोडिंग AI वेगाने अंतर कमी करत आहे

𝗠𝗶𝗰𝗿𝗼𝘀𝗼𝗳𝘁 𝗥𝗲𝗹𝗲𝗮𝘀𝗲𝘀 𝗠𝗔𝗜 𝗧𝗵𝗶𝗻𝗸𝗶𝗻𝗴 𝟭

𝗧𝗵𝗲 𝗠𝗖𝗣 𝗖𝗼𝗻𝘁𝗲𝘅𝘁 𝗧𝗮𝘅

FlashMemory ने DeepSeek V4 KV Cache १३.५% पर्यंत कमी केला

𝗚𝗲𝗺𝗺𝗮 𝟮 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗲: 𝗠𝗼𝗿𝗲 𝗣𝗲𝗿𝗳𝗼𝗿𝗺𝗮𝗻𝗰𝗲 𝗳𝗿𝗼𝗺 𝗟𝗲𝘀𝘀 𝗠𝗼𝗱𝗲𝗹