Microsoft نے MAI-Thinking-1 ریلیز کر دیا

Microsoft نے ایک نیا reasoning model ریلیز کیا ہے۔ Microsoft اسے MAI-Thinking-1 کہتا ہے۔ یہ mixture-of-experts ڈیزائن استعمال کرتا ہے۔

یہ اسکورز دیکھیں:

  • AIME 2025 ریاضی (math) میں 97%۔
  • LiveCodeBench v6 کوڈنگ (coding) میں 87.7%۔
  • SWE-Bench Pro سافٹ ویئر انجینئرنگ (software engineering) میں 52.8%۔

اس ماڈل کے کل پیرامیٹرز (parameters) 1 trillion ہیں۔ فی ٹوکن صرف 35 billion فعال (active) رہتے ہیں۔ اس سے اخراجات کم رہتے ہیں۔

Microsoft ایک hill-climbing machine استعمال کرتا ہے۔ یہ ایک لوپ (loop) ہے۔ یہ ڈیٹا جنریٹ کرتا ہے۔ یہ ٹریننگ کرتا ہے۔ یہ ٹیسٹ کرتا ہے۔ یہ عمل دہرایا جاتا ہے۔

Microsoft نے اسے 30 trillion انسانی ٹوکنز (human tokens) پر ٹرین کیا ہے۔ انہوں نے دوسرے AI ماڈلز کے ڈیٹا سے پرہیز کیا۔

یہی عمل اس کا سب سے بڑا فائدہ ہے۔ Microsoft ماڈلز کو بہتر بنانے کے لیے ایک لوپ تخلیق کرتا ہے۔ یہ انہیں ٹاپ AI لیبز کے ساتھ مقابلہ کرنے کے قابل بناتا ہے۔

اگلے 6 سے 12 ماہ میں اگلے ورژن کا انتظار کریں۔ دیکھیں کہ کیا اسکورز میں اضافہ ہوتا ہے۔

ماخذ: https://dev.to/gentic_news/microsoft-unveils-mai-thinking-1-35b-active-1t-parameters-97-on-aime-2025-25db اختیاری لرننگ کمیونٹی: https://t.me/GyaanSetuAi