𝗠𝗶𝗻𝗶𝗠𝗮𝘅 𝗠𝟯: సుదీర్ఘ కాంటెక్స్ట్‌ను నిర్వహించడానికి ఒక కొత్త మార్గం

MiniMax M3 అనేది షాంఘై నుండి వచ్చిన ఒక కొత్త మల్టీమోడల్ మోడల్. ఇది 1-మిలియన్-టోకెన్ కాంటెక్స్ట్ విండోను కలిగి ఉంది. ఇంత పెద్ద పరిమాణంలో చాలా మోడల్స్ చాలా నెమ్మదిగా మరియు ఖరీదైనవిగా మారుతాయి. దీనిని పరిష్కరించడానికి MiniMax M3, MiniMax Sparse Attention (MSA) అనే కొత్త పద్ధతిని ఉపయోగిస్తుంది.

MSA ఎలా పనిచేస్తుంది:

• Index branch: ఒక ఫాస్ట్ పాస్ డేటాలోని అత్యంత సంబంధిత భాగాలను కనుగొంటుంది. • Sparse branch: మోడల్ కేవలం ఆ నిర్దిష్ట భాగాలను మాత్రమే చూస్తుంది. • Memory efficiency: GPU మెమరీ అడ్డంకులను (bottlenecks) నివారించడానికి ఇది క్వెరీలను సమూహాలుగా చేస్తుంది.

ఇది మునుపటి వెర్షన్లతో పోలిస్తే డేటా ప్రాసెసింగ్‌లో 9 రెట్లు మరియు టెక్స్ట్ జనరేషన్‌లో 15 రెట్లు వేగంగా పనిచేస్తుంది.

పనితీరు స్కోర్లు:

• SWE-Bench Pro: 59.0% • Terminal-Bench 2.1: 66.0% • BrowseComp: 83.5% • KernelBench Hard: 28.8% • MCP Atlas: 74.2%

SWE-Bench Pro స్కోరు GPT-5.5 మరియు Gemini 3.1 Pro కంటే ఎక్కువగా ఉంది. అయితే, Claude Opus 4.8 ఇంకా 69.2% తో అగ్రస్థానంలో ఉంది. MiniMax ఈ పరీక్షలను తమ స్వంత హార్డ్‌వేర్‌పై నిర్వహించిందని మీరు గమనించాలి.

సాంకేతిక వివరాలు:

M3ని టెక్స్ట్, ఇమేజెస్ మరియు వీడియోలపై కలిపి శిక్షణ ఇచ్చారు. ఇది డెస్క్‌టాప్ కంప్యూటర్లను ఆపరేట్ చేయగలదు. పరీక్షల్లో, ఇది NVIDIA హార్డ్‌వేర్‌పై CUDA కెర్నల్‌ను ఆప్టిమైజ్ చేసింది.

మీరు M3ని మూడు విధాలుగా ఉపయోగించవచ్చు:

  • MiniMax Platform API: ఇది ఇప్పటికే ఉన్న OpenAI కోడ్‌తో పనిచేస్తుంది.
  • OpenRouter: మీకు నేరుగా MiniMax ఖాతా వద్దు అనుకుంటే ఇది మంచిది.
  • Self-hosting: MSA ఆర్కిటెక్చర్ కోసం మీకు vLLM లేదా SGLang సపోర్ట్ అవసరం.

ధరలు:

ప్రతి మిలియన్ ఇన్‌పుట్ టోకెన్లకు $0.60 మరియు ప్రతి మిలియన్ అవుట్‌పుట్ టోకెన్లకు $2.40 ఖర్చవుతుంది. లాంచ్ డిస్కౌంట్ వల్ల ఈ ధరలు $0.30 మరియు $1.20 కి తగ్గుతాయి. ఇది Claude Opus కంటే చాలా చౌక.

గుర్తుంచుకోవలసిన మూడు విషయాలు:

  • కాంటెక్స్ట్ అంటే మెమరీ కాదు. దీర్ఘకాలిక ఏజెంట్ టాస్క్‌ల కోసం మీకు ఇంకా ఎక్స్‌టర్నల్ మెమరీ అవసరం.
  • బెంచ్‌మార్క్‌లను ధృవీకరించుకోండి. మీ పూర్తి సిస్టమ్‌ను మార్చే ముందు థర్డ్-పార్టీ పరీక్షల కోసం వేచి ఉండండి.
  • డేటా ప్రైవసీ. MiniMax షాంఘైలో ఉంది. మీరు సెన్సిటివ్ డేటాను హ్యాండిల్ చేస్తుంటే దీనిని పరిగణనలోకి తీసుకోండి.

మూలం: https://dev.to/prabhakar_chaudhary_7afe4/minimax-m3-what-a-1m-token-open-weight-model-with-sparse-attention-actually-means-for-developers-i1i

ఐచ్ఛిక అభ్యాస కమ్యూనిటీ: https://t.me/GyaanSetuAi