𝗠𝗶𝗻𝗶𝗠𝗮𝘅 𝗠𝟯: 𝗔 𝗡𝗲𝘄 𝗪𝗮𝘆 𝗧𝗼 𝗛𝗮𝗻𝗱𝗹𝗲 𝗟𝗼𝗻𝗴 𝗖𝗼𝗻𝘁𝗲𝘅𝘁

Translated for your language. Read the original.

AI-assisted draft.

3 రోజుల క్రితం2min read

𝗠𝗶𝗻𝗶𝗠𝗮𝘅 𝗠𝟯: సుదీర్ఘ కాంటెక్స్ట్‌ను నిర్వహించడానికి ఒక కొత్త మార్గం

MiniMax M3 అనేది షాంఘై నుండి వచ్చిన ఒక కొత్త మల్టీమోడల్ మోడల్. ఇది 1-మిలియన్-టోకెన్ కాంటెక్స్ట్ విండోను కలిగి ఉంది. ఇంత పెద్ద పరిమాణంలో చాలా మోడల్స్ చాలా నెమ్మదిగా మరియు ఖరీదైనవిగా మారుతాయి. దీనిని పరిష్కరించడానికి MiniMax M3, MiniMax Sparse Attention (MSA) అనే కొత్త పద్ధతిని ఉపయోగిస్తుంది.

MSA ఎలా పనిచేస్తుంది:

• Index branch: ఒక ఫాస్ట్ పాస్ డేటాలోని అత్యంత సంబంధిత భాగాలను కనుగొంటుంది. • Sparse branch: మోడల్ కేవలం ఆ నిర్దిష్ట భాగాలను మాత్రమే చూస్తుంది. • Memory efficiency: GPU మెమరీ అడ్డంకులను (bottlenecks) నివారించడానికి ఇది క్వెరీలను సమూహాలుగా చేస్తుంది.

ఇది మునుపటి వెర్షన్లతో పోలిస్తే డేటా ప్రాసెసింగ్‌లో 9 రెట్లు మరియు టెక్స్ట్ జనరేషన్‌లో 15 రెట్లు వేగంగా పనిచేస్తుంది.

పనితీరు స్కోర్లు:

• SWE-Bench Pro: 59.0% • Terminal-Bench 2.1: 66.0% • BrowseComp: 83.5% • KernelBench Hard: 28.8% • MCP Atlas: 74.2%

SWE-Bench Pro స్కోరు GPT-5.5 మరియు Gemini 3.1 Pro కంటే ఎక్కువగా ఉంది. అయితే, Claude Opus 4.8 ఇంకా 69.2% తో అగ్రస్థానంలో ఉంది. MiniMax ఈ పరీక్షలను తమ స్వంత హార్డ్‌వేర్‌పై నిర్వహించిందని మీరు గమనించాలి.

సాంకేతిక వివరాలు:

M3ని టెక్స్ట్, ఇమేజెస్ మరియు వీడియోలపై కలిపి శిక్షణ ఇచ్చారు. ఇది డెస్క్‌టాప్ కంప్యూటర్లను ఆపరేట్ చేయగలదు. పరీక్షల్లో, ఇది NVIDIA హార్డ్‌వేర్‌పై CUDA కెర్నల్‌ను ఆప్టిమైజ్ చేసింది.

మీరు M3ని మూడు విధాలుగా ఉపయోగించవచ్చు:

MiniMax Platform API: ఇది ఇప్పటికే ఉన్న OpenAI కోడ్‌తో పనిచేస్తుంది.
OpenRouter: మీకు నేరుగా MiniMax ఖాతా వద్దు అనుకుంటే ఇది మంచిది.
Self-hosting: MSA ఆర్కిటెక్చర్ కోసం మీకు vLLM లేదా SGLang సపోర్ట్ అవసరం.

ధరలు:

ప్రతి మిలియన్ ఇన్‌పుట్ టోకెన్లకు $0.60 మరియు ప్రతి మిలియన్ అవుట్‌పుట్ టోకెన్లకు $2.40 ఖర్చవుతుంది. లాంచ్ డిస్కౌంట్ వల్ల ఈ ధరలు $0.30 మరియు $1.20 కి తగ్గుతాయి. ఇది Claude Opus కంటే చాలా చౌక.

గుర్తుంచుకోవలసిన మూడు విషయాలు:

కాంటెక్స్ట్ అంటే మెమరీ కాదు. దీర్ఘకాలిక ఏజెంట్ టాస్క్‌ల కోసం మీకు ఇంకా ఎక్స్‌టర్నల్ మెమరీ అవసరం.
బెంచ్‌మార్క్‌లను ధృవీకరించుకోండి. మీ పూర్తి సిస్టమ్‌ను మార్చే ముందు థర్డ్-పార్టీ పరీక్షల కోసం వేచి ఉండండి.
డేటా ప్రైవసీ. MiniMax షాంఘైలో ఉంది. మీరు సెన్సిటివ్ డేటాను హ్యాండిల్ చేస్తుంటే దీనిని పరిగణనలోకి తీసుకోండి.

మూలం: https://dev.to/prabhakar_chaudhary_7afe4/minimax-m3-what-a-1m-token-open-weight-model-with-sparse-attention-actually-means-for-developers-i1i

ఐచ్ఛిక అభ్యాస కమ్యూనిటీ: https://t.me/GyaanSetuAi

𝗠𝗶𝗻𝗶𝗠𝗮𝘅 𝗠𝟯: 𝗔 𝗡𝗲𝘄 𝗪𝗮𝘆 𝗧𝗼 𝗛𝗮𝗻𝗱𝗹𝗲 𝗟𝗼𝗻𝗴 𝗖𝗼𝗻𝘁𝗲𝘅𝘁

Continue reading

చైనా యొక్క కోడింగ్ AI వేగంగా అంతరాన్ని తగ్గిస్తోంది

𝗠𝗶𝗰𝗿𝗼𝘀𝗼𝗳𝘁 𝗥𝗲𝗹𝗲𝗮𝘀𝗲𝘀 𝗠𝗔𝗜 𝗧𝗵𝗶𝗻𝗸𝗶𝗻𝗴 𝟭

MCP కాంటెక్స్ట్ టాక్స్

FlashMemory, DeepSeek V4 KV Cache ని 13.5% కి తగ్గించింది

Gemma 2 ఆర్కిటెక్చర్: తక్కువ మోడల్ పరిమాణంతో మెరుగైన పనితీరు