𝗠𝗶𝗰𝗿𝗼𝘀𝗼𝗳𝘁 𝗹𝗮𝗻𝗰𝗲 𝗠𝗔𝗜-𝗧𝗵𝗶𝗻𝗸𝗶𝗻𝗴-𝟭
Microsoft lance un nouveau modèle de raisonnement. Microsoft l'appelle MAI-Thinking-1. Il utilise une architecture de type mixture-of-experts.
Consultez ces scores :
- 97 % en mathématiques sur AIME 2025.
- 87,7 % en programmation sur LiveCodeBench v6.
- 52,8 % en génie logiciel sur SWE-Bench Pro.
Le modèle possède un total de 1 billion de paramètres. Seuls 35 milliards restent actifs par jeton. Cela permet de maintenir des coûts bas.
Microsoft utilise une machine de type hill-climbing. Il s'agit d'une boucle. Elle génère des données. Elle s'entraîne. Elle teste. Elle recommence.
Microsoft l'a entraîné sur 30 billions de jetons humains. Ils ont évité d'utiliser des données provenant d'autres modèles d'IA.
Le processus est l'avantage majeur. Microsoft crée une boucle pour améliorer ses modèles. Cela leur permet de rivaliser avec les meilleurs laboratoires d'IA.
Surveillez la prochaine version d'ici 6 à 12 mois. Vérifiez si les scores augmentent.
Source : https://dev.to/gentic_news/microsoft-unveils-mai-thinking-1-35b-active-1t-parameters-97-on-aime-2025-25db Communauté d'apprentissage optionnelle : https://t.me/GyaanSetuAi