𝗠𝗶𝗻𝗶𝗠𝗮𝘅 𝗠𝟯: طویل سیاق و سباق (Long Context) کو سنبھالنے کا ایک نیا طریقہ
MiniMax M3 شنگھائی کا ایک نیا ملٹی موڈل (multimodal) ماڈل ہے۔ اس میں 1 ملین ٹوکن کا کانٹیکسٹ ونڈو (context window) موجود ہے۔ اس طوالت پر زیادہ تر ماڈلز بہت سست اور مہنگے ہو جاتے ہیں۔ MiniMax M3 اس مسئلے کو حل کرنے کے لیے MiniMax Sparse Attention (MSA) نامی ایک نیا طریقہ استعمال کرتا ہے۔
MSA کیسے کام کرتا ہے:
• انڈیکس برانچ (Index branch): ایک تیز رفتار پاس ڈیٹا کے سب سے زیادہ متعلقہ حصوں کو تلاش کرتا ہے۔ • سپارس برانچ (Sparse branch): ماڈل صرف ان مخصوص حصوں پر توجہ دیتا ہے۔ • میموری کی کارکردگی (Memory efficiency): یہ GPU میموری کی رکاوٹوں کو روکنے کے لیے سوالات (queries) کو گروہ بندی کرتا ہے۔
یہ ماڈل کو پچھلے ورژنز کے مقابلے میں ڈیٹا پروسیس کرنے میں 9 گنا اور ٹیکسٹ تیار کرنے میں 15 گنا تیز بنا دیتا ہے۔
کارکردگی کے اسکورز (Performance scores):
• SWE-Bench Pro: 59.0% • Terminal-Bench 2.1: 66.0% • BrowseComp: 83.5% • KernelBench Hard: 28.8% • MCP Atlas: 74.2%
SWE-Bench Pro کا اسکور GPT-5.5 اور Gemini 3.1 Pro سے زیادہ ہے۔ تاہم، Claude Opus 4.8 اب بھی 69.2% کے ساتھ سب سے آگے ہے۔ آپ کو یہ بات ذہن میں رکھنی چاہیے کہ MiniMax نے یہ ٹیسٹ اپنے خود کے ہارڈ ویئر پر کیے ہیں۔
تکنیکی تفصیلات (Technical details):
M3 کو ٹیکسٹ، تصاویر اور ویڈیو پر ایک ساتھ تربیت دی گئی ہے۔ یہ ڈیسک ٹاپ کمپیوٹرز کو چلا سکتا ہے۔ ٹیسٹ کے دوران، اس نے NVIDIA ہارڈ ویئر پر ایک CUDA kernel کو بہتر (optimize) بنایا۔
آپ M3 کو تین طریقوں سے استعمال کر سکتے ہیں:
- MiniMax Platform API: یہ موجودہ OpenAI کوڈ کے ساتھ کام کرتا ہے۔
- OpenRouter: اگر آپ MiniMax کا براہ راست اکاؤنٹ نہیں چاہتے تو یہ بہترین ہے۔
- Self-hosting: MSA آرکیٹیکچر کے لیے آپ کو vLLM یا SGLang کی سپورٹ کی ضرورت ہوگی۔
قیمتیں (Pricing):
اس کی قیمت فی ملین ان پٹ ٹوکنز کے لیے $0.60 اور فی ملین آؤٹ پٹ ٹوکنز کے لیے $2.40 ہے۔ لانچ ڈسکاؤنٹ ان قیمتوں کو کم کر کے $0.30 اور $1.20 کر دیتا ہے۔ یہ Claude Opus کے مقابلے میں بہت سستا ہے۔
تین باتیں جو یاد رکھنی ہیں:
- سیاق و سباق (Context) میموری نہیں ہے۔ طویل مدتی ایجنٹ ٹاسک کے لیے آپ کو اب بھی بیرونی میموری کی ضرورت ہوگی۔
- بینچ مارکس کی تصدیق کریں۔ اپنا پورا سسٹم تبدیل کرنے سے پہلے تھرڈ پارٹی ٹیسٹ کا انتظار کریں۔
- ڈیٹا کی رازداری (Data privacy)۔ MiniMax کا مرکز شنگھائی میں ہے۔ اگر آپ حساس ڈیٹا کو ہینڈل کرتے ہیں تو اس بات پر غور کریں۔
اختیاری لرننگ کمیونٹی (Optional learning community): https://t.me/GyaanSetuAi