𝗠𝗶𝗻𝗶𝗠𝗮𝘅 𝗠𝟯: 𝗔 𝗡𝗲𝘄 𝗪𝗮𝘆 𝗧𝗼 𝗛𝗮𝗻𝗱𝗹𝗲 𝗟𝗼𝗻𝗴 𝗖𝗼𝗻𝘁𝗲𝘅𝘁
MiniMax M3 என்பது ஷாங்காயிலிருந்து வந்த ஒரு புதிய மல்டிமோடல் (multimodal) மாடல் ஆகும். இது 1 மில்லியன் டோக்கன் சூழல் சாளகத்தைக் (context window) கொண்டுள்ளது. பெரும்பாலான மாடல்கள் இவ்வளவு பெரிய அளவில் மிகவும் மெதுவாகவும் செலவு மிகுந்ததாகவும் மாறிவிடும். இதைத் தீர்க்க MiniMax M3, MiniMax Sparse Attention (MSA) எனப்படும் புதிய முறையைப் பயன்படுத்துகிறது.
MSA எவ்வாறு செயல்படுகிறது:
• Index branch: ஒரு வேகமான செயல்முறை தரவின் மிகவும் பொருத்தமான பகுதிகளைக் கண்டறிகிறது. • Sparse branch: மாடல் அந்த குறிப்பிட்ட பகுதிகளை மட்டுமே பார்க்கும். • Memory efficiency: GPU நினைவகத் தடைகளைத் தவிர்க்க, இது வினவல்களை (queries) ஒன்றாகக் குழுவாக்குகிறது.
இது முந்தைய பதிப்புகளை விட தரவைச் செயலாக்குவதில் 9 மடங்கு வேகமாகவும், உரையை உருவாக்குவதில் 15 மடங்கு வேகமாகவும் மாடலை மாற்றுகிறது.
செயல்திறன் மதிப்பெண்கள் (Performance scores):
• SWE-Bench Pro: 59.0% • Terminal-Bench 2.1: 66.0% • BrowseComp: 83.5% • KernelBench Hard: 28.8% • MCP Atlas: 74.2%
SWE-Bench Pro மதிப்பெண் GPT-5.5 மற்றும் Gemini 3.1 Pro ஆகியவற்றை விட அதிகமாக உள்ளது. இருப்பினும், Claude Opus 4.8 இன்னும் 69.2% உடன் முன்னணியில் உள்ளது. MiniMax இந்தச் சோதனைகளைத் தங்களது சொந்த வன்பொருளில் (hardware) நடத்தியதை நீங்கள் கவனத்தில் கொள்ள வேண்டும்.
தொழில்நுட்ப விவரங்கள்:
M3 உரை, படங்கள் மற்றும் வீடியோ ஆகியவற்றை ஒன்றாகப் பயிற்றுவிக்கப்பட்டுள்ளது. இது டெஸ்க்டாப் கணினிகளை இயக்க முடியும். சோதனைகளில், இது NVIDIA வன்பொருளில் ஒரு CUDA kernel-ஐ மேம்படுத்தியது (optimized).
நீங்கள் M3-ஐ மூன்று வழிகளில் பயன்படுத்தலாம்:
- MiniMax Platform API: இது ஏற்கனவே உள்ள OpenAI குறியீட்டுடன் (code) வேலை செய்யும்.
- OpenRouter: உங்களுக்கு நேரடி MiniMax கணக்கு தேவையில்லை என்றால் இது சிறந்தது.
- Self-hosting: MSA கட்டமைப்பிற்கு உங்களுக்கு vLLM அல்லது SGLang ஆதரவு தேவை.
விலை நிர்ணயம் (Pricing):
ஒரு மில்லியன் உள்ளீட்டு டோக்கன்களுக்கு (input tokens) $0.60 மற்றும் ஒரு மில்லியன் வெளியீட்டு டோக்கன்களுக்கு (output tokens) $2.40 ஆகும். அறிமுகத் தள்ளுபடி (launch discount) இந்த விலைகளைக் குறைத்து $0.30 மற்றும் $1.20 ஆக மாற்றுகிறது. இது Claude Opus-ஐ விட மிகவும் மலிவானது.
நினைவில் கொள்ள வேண்டிய மூன்று விஷயங்கள்:
- சூழல் (Context) என்பது நினைவகம் (memory) அல்ல. நீண்ட கால ஏஜென்ட் பணிகளுக்கு (long-term agent tasks) உங்களுக்கு இன்னும் வெளிப்புற நினைவகம் தேவைப்படும்.
- பெஞ்ச்மார்க்ஸ்களை (benchmarks) சரிபார்க்கவும். உங்கள் முழு அமைப்பையும் மாற்றுவதற்கு முன் மூன்றாம் தரப்பு சோதனைகளுக்காகக் காத்திருக்கவும்.
- தரவு தனியுரிமை (Data privacy). MiniMax ஷாங்காயைத் தளமாகக் கொண்டது. நீங்கள் முக்கியமான தரவைக் கையாளுகிறீர்கள் என்றால் இதைக் கருத்தில் கொள்ளவும்.
விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi