Microsoft 发布 MAI-Thinking-1
Microsoft 发布了一款新的推理模型。 Microsoft 将其命名为 MAI-Thinking-1。 它采用了混合专家(mixture-of-experts)设计。
查看以下评分:
- AIME 2025 数学:97%
- LiveCodeBench v6 编程:87.7%
- SWE-Bench Pro 软件工程:52.8%
该模型拥有 1 万亿个总参数。 每个 token 仅有 350 亿个参数处于激活状态。 这使得成本保持在较低水平。
Microsoft 使用了一种“爬山”机器(hill-climbing machine)。 这是一个循环过程。 它生成数据。 进行训练。 进行测试。 不断重复。
Microsoft 使用了 30 万亿个人类 token 进行训练。 他们避免使用了来自其他 AI 模型的数据。
这种流程就是其优势所在。 Microsoft 通过构建循环来改进模型。 这让他们能够与顶尖的 AI 实验室竞争。
关注 6 到 12 个月内发布的下一个版本。 看看评分是否会提升。
Source: https://dev.to/gentic_news/microsoft-unveils-mai-thinking-1-35b-active-1t-parameters-97-on-aime-2025-25db Optional learning community: https://t.me/GyaanSetuAi