𝗠𝗶𝗻𝗶𝗠𝗮𝘅 𝗠𝟯: 𝗔 𝗡𝗲𝘄 𝗪𝗮𝘆 𝗧𝗼 𝗛𝗮𝗻𝗱𝗹𝗲 𝗟𝗼𝗻𝗴 𝗖𝗼𝗻𝘁𝗲𝘅𝘁

Translated for your language. Leggi l'originale.

AI-assisted draft.

3 giorni fa2min di lettura

𝗠𝗶𝗻𝗶𝗠𝗮𝘅 𝗠𝟯: 𝗨𝗻 𝗻𝘂𝗼𝘃𝗼 𝗺𝗼𝗱𝗼 𝗱𝗶 𝗴𝗲𝘀𝘁𝗶𝗿𝗲 𝗰𝗼𝗻𝘁𝗲𝘅𝘁𝗶 𝗽𝗿𝗼𝗹𝗶𝘀𝘀𝗶

MiniMax M3 è un nuovo modello multimodale di Shanghai. Dispone di una finestra di contesto da 1 milione di token. La maggior parte dei modelli diventa troppo lenta ed economica a questa lunghezza. MiniMax M3 utilizza un nuovo metodo chiamato MiniMax Sparse Attention (MSA) per risolvere questo problema.

Come funziona MSA:

• Index branch: Una scansione rapida individua le parti più rilevanti dei dati. • Sparse branch: Il modello analizza solo quelle parti specifiche. • Efficienza della memoria: Raggruppa le query per evitare colli di bottiglia nella memoria della GPU.

Questo rende il modello 9 volte più veloce nell'elaborazione dei dati e 15 volte più veloce nella generazione di testo rispetto alle versioni precedenti.

Punteggi di performance:

• SWE-Bench Pro: 59,0% • Terminal-Bench 2.1: 66,0% • BrowseComp: 83,5% • KernelBench Hard: 28,8% • MCP Atlas: 74,2%

Il punteggio SWE-Bench Pro è superiore a quello

𝗠𝗶𝗻𝗶𝗠𝗮𝘅 𝗠𝟯: 𝗔 𝗡𝗲𝘄 𝗪𝗮𝘆 𝗧𝗼 𝗛𝗮𝗻𝗱𝗹𝗲 𝗟𝗼𝗻𝗴 𝗖𝗼𝗻𝘁𝗲𝘅𝘁

Continua a leggere

𝗖𝗛𝗜𝗡𝗔'𝗦 𝗖𝗢𝗗𝗜𝗡𝗚 𝗔𝗜 𝗜𝗦 𝗖𝗟𝗢𝗦𝗜𝗡𝗚 𝗧𝗛𝗘 𝗚𝗔𝗣 𝗙𝗔𝗦𝗧

𝗠𝗶𝗰𝗿𝗼𝘀𝗼𝗳𝘁 𝗥𝗲𝗹𝗲𝗮𝘀𝗲𝘀 𝗠𝗔𝗜 𝗧𝗵𝗶𝗻𝗸𝗶𝗻𝗴 𝟭

𝗧𝗵𝗲 𝗠𝗖𝗣 𝗖𝗼𝗻𝘁𝗲𝘅𝘁 𝗧𝗮𝘅

𝗙𝗹𝗮𝘀𝗵𝗠𝗲𝗺𝗼𝗿𝘆 𝗖𝘂𝘁𝘀 𝗗𝗲𝗲𝗽𝗦𝗲𝗲𝗸 𝗩𝟰 𝗞𝗩 𝗖𝗮𝗰𝗵𝗲 𝘁𝗼 𝟭𝟯.𝟱%

𝗚𝗲𝗺𝗺𝗮 𝟮 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗲: 𝗠𝗼𝗿𝗲 𝗣𝗲𝗿𝗳𝗼𝗿𝗺𝗮𝗻𝗰𝗲 𝗳𝗿𝗼𝗺 𝗟𝗲𝘀𝘀 𝗠𝗼𝗱𝗲𝗹