Microsoft, MAI-Thinking-1 출시
Microsoft가 새로운 추론 모델을 출시합니다. Microsoft는 이를 MAI-Thinking-1이라 부릅니다. 이 모델은 전문가 혼합(mixture-of-experts) 설계를 사용합니다.
다음 점수를 확인해 보세요:
- AIME 2025 수학: 97%
- LiveCodeBench v6 코딩: 87.7%
- SWE-Bench Pro 소프트웨어 엔지니어링: 52.8%
이 모델은 총 1조 개의 파라미터를 보유하고 있습니다. 토큰당 350억 개만 활성화됩니다. 이를 통해 비용을 낮게 유지합니다.
Microsoft는 힐 클라이밍(hill-climbing) 머신을 사용합니다. 이는 하나의 루프입니다. 데이터를 생성합니다. 학습합니다. 테스트합니다. 반복합니다.
Microsoft는 30조 개의 인간 토큰으로 이를 학습시켰습니다. 다른 AI 모델의 데이터는 배제했습니다.
이 프로세스가 바로 강점입니다. Microsoft는 모델을 개선하기 위한 루프를 구축합니다. 이를 통해 최고의 AI 연구소들과 경쟁할 수 있습니다.
6개월에서 12개월 내에 출시될 다음 버전을 주목하세요. 점수가 더 높아지는지 확인해 보시기 바랍니다.
출처: https://dev.to/gentic_news/microsoft-unveils-mai-thinking-1-35b-active-1t-parameters-97-on-aime-2025-25db 선택 사항 학습 커뮤니티: https://t.me/GyaanSetuAi