𝗥 𝟰𝗕: 𝗔𝗨𝗧𝗢 𝗧𝗛𝗜𝗡𝗞𝗜𝗡𝗚 𝗜𝗡 𝗠𝗟𝗟𝗠𝗦

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial13 saat önce1min read

𝗥-𝟰𝗕: 𝗠𝗟𝗟𝗠'𝗟𝗘𝗥𝗗𝗘 𝗢𝗧𝗢𝗠𝗔𝗧𝗜𝗞 𝗗ÜŞÜ𝗡𝗠𝗘

Büyük Çok Modlu Modeller (MLLM'ler) genellikle akıl yürütme konusunda zorluk yaşarlar. Görevler derin düşünme gerektirdiğinde başarısız olurlar.

R-4B adı verilen yeni bir yöntem bu sorunu çözüyor. İki ana teknik kullanıyor:

Bi-Mode Annealing
Takviyeli Öğrenme (Reinforcement Learning)

Bu yaklaşım, modellere yanıt vermeden önce düşünmeyi öğretir. Sadece örüntü eşleştirme yerine genel akıl yürütme becerileri geliştirir.

Araştırma, otomatik düşünmeyi nasıl teşvik edilebileceğini gösteriyor. Bu, modellerin karmaşık mantık ve görsel akıl yürütme konularında daha yetenekli olmasını sağlıyor.

Temel faydalar:

Daha iyi akıl yürütme doğruluğu
Daha kararlı eğitim
Zor görevlerde iyileştirilmiş performans

Çok modlu yapay zeka ile çalışıyorsanız buna göz atmalısınız. Modelleri akıl yürütmeleri için nasıl eğittiğimizi değiştiriyor.

Kaynak: https://dev.to/paperium/r-4b-incentivizing-general-purpose-auto-thinking-capability-in-mllms-viabi-mode-annealing-and-1210

İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi

𝗥 𝟰𝗕: 𝗔𝗨𝗧𝗢 𝗧𝗛𝗜𝗡𝗞𝗜𝗡𝗚 𝗜𝗡 𝗠𝗟𝗟𝗠𝗦

Continue reading

𝗨𝗻𝗶𝗳𝗶𝗲𝗱 𝗥𝗲𝘄𝗮𝗿𝗱 𝗠𝗼𝗱𝗲𝗹𝘀 𝗳𝗼𝗿 𝗔𝗜

InternLM Math: Doğrulanabilir Matematiksel Akıl Yürütme

Pekiştirmeli Öğrenme için Denetimsiz Meta Öğrenme

𝗔𝗴𝗲𝗻𝘁 𝗥: 𝗧𝗿𝗮𝗶𝗻𝗶𝗻𝗴 𝗟𝗮𝗻𝗴𝘂𝗮𝗴𝗲 𝗠𝗼𝗱𝗲𝗹 𝗔𝗴𝗲𝗻𝘁𝘀 𝘁𝗼 𝗥𝗲𝗳𝗹𝗲𝗰𝘁

𝗖𝗵𝗮𝗶𝗻 𝗼𝗳 𝗧𝗵𝗼𝘂𝗴𝗵𝘁 𝗥𝗲𝗮𝘀𝗼𝗻𝗶𝗻𝗴 𝗪𝗶𝘁𝗵𝗼𝘂𝘁 𝗣𝗿𝗼𝗺𝗽𝘁𝗶𝗻𝗴