𝗠𝗶𝗰𝗿𝗼𝘀𝗼𝗳𝘁 𝗥𝗲𝗹𝗲𝗮𝘀𝗲𝘀 𝗠𝗔𝗜-𝗧𝗵𝗶𝗻𝗸𝗶𝗻𝗴-𝟭
Microsoft ஒரு புதிய reasoning model-ஐ வெளியிடுகிறது. இதை Microsoft MAI-Thinking-1 என்று அழைக்கிறது. இது mixture-of-experts வடிவமைப்பைப் பயன்படுத்துகிறது.
இந்த மதிப்பெண்களைப் பார்க்கவும்:
- AIME 2025 கணிதத்தில் 97%.
- LiveCodeBench v6 coding-இல் 87.7%.
- SWE-Bench Pro software engineering-இல் 52.8%.
இந்த மாடலில் மொத்தம் 1 டிரில்லியன் பாராமீட்டர்கள் உள்ளன. ஒவ்வொரு டோக்கனுக்கும் 35 பில்லியன் மட்டுமே செயல்பாட்டில் இருக்கும். இது செலவைக் குறைக்க உதவுகிறது.
Microsoft ஒரு hill-climbing machine-ஐப் பயன்படுத்துகிறது. இது ஒரு சுழற்சி (loop). இது தரவை உருவாக்குகிறது. இது பயிற்சி அளிக்கிறது. இது சோதனை செய்கிறது. இது மீண்டும் மீண்டும் நிகழ்கிறது.
Microsoft இதை 30 டிரில்லியன் மனித டோக்கன்களில் பயிற்றுவித்துள்ளது. அவர்கள் மற்ற AI மாடல்களிலிருந்து வந்த தரவைத் தவிர்த்தனர்.
இந்தச் செயல்முறையே இதன் பலமாகும். மாடல்களை மேம்படுத்த Microsoft ஒரு சுழற்சியை உருவாக்குகிறது. இது முன்னணி AI ஆய்வகங்களுடன்