𝗥 𝟰𝗕: 𝗔𝗨𝗧𝗢 𝗧𝗛𝗜𝗡𝗞𝗜𝗡𝗚 𝗜𝗡 𝗠𝗟𝗟𝗠𝗦

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial13 மணிநேரம் முன்1min read

𝗥-𝟰𝗕: 𝗠𝗟𝗟𝗠-களில் ஆட்டோ-திங்கிங் (𝗔𝗨𝗧𝗢-𝗧𝗛𝗜𝗡𝗞𝗜𝗡𝗚)

பெரிய மல்டிமாடல் மாடல்கள் (Large Multimodal Models) பெரும்பாலும் தர்க்கரீதியான சிந்தனையில் (reasoning) சிரமப்படுகின்றன. ஆழமான சிந்தனை தேவைப்படும் பணிகளில் அவை தோல்வியடைகின்றன.

R-4B எனப்படும் புதிய முறை இந்த சிக்கலைத் தீர்க்கிறது. இது இரண்டு முக்கிய நுட்பங்களைப் பயன்படுத்துகிறது:

Bi-Mode Annealing
Reinforcement Learning

இந்த அணுகுமுறை மாடல்கள் பதிலளிப்பதற்கு முன் சிந்திக்கக் கற்றுக்கொடுக்கிறது. இது வெறும் பேட்டர்ன் மேட்சிங்கிற்கு (pattern matching) பதிலாக பொதுவான தர்க்கரீதியான திறன்களை உருவாக்குகிறது.

ஆட்டோ-திங்கிங்கை (auto-thinking) எவ்வாறு ஊக்குவிப்பது என்பதை இந்த ஆராய்ச்சி காட்டுகிறது. இது சிக்கலான தர்க்கம் மற்றும் காட்சி சார்ந்த சிந்தனையை (visual reasoning) கையாளுவதில் மாடல்களை மேம்படுத்துகிறது.

முக்கிய நன்மைகள்:

சிறந்த தர்க்கரீதியான துல்லியம் (reasoning accuracy)
அதிக நிலையான பயிற்சி (stable training)
கடினமான பணிகளில் மேம்பட்ட செயல்பாடு

நீங்கள் மல்டிமாடல் AI-யுடன் பணிபுரிபவர் என்றால், இதை நீங்கள் கவனிக்க வேண்டும். மாடல்களுக்கு தர்க்கரீதியாகச் சிந்திக்கப் பயிற்சி அளிக்கும் முறையை இது மாற்றியமைக்கிறது.

Source: https://dev.to/paperium/r-4b-incentivizing-general-purpose-auto-thinking-capability-in-mllms-viabi-mode-annealing-and-1210

Optional learning community: https://t.me/GyaanSetuAi

𝗥 𝟰𝗕: 𝗔𝗨𝗧𝗢 𝗧𝗛𝗜𝗡𝗞𝗜𝗡𝗚 𝗜𝗡 𝗠𝗟𝗟𝗠𝗦

Continue reading

AI-க்கான ஒருங்கிணைந்த வெகுமதி மாதிரிகள்

𝗜𝗻𝘁𝗲𝗿𝗻𝗟𝗠 𝗠𝗮𝘁𝗵: 𝗩𝗲𝗿𝗶𝗳𝗶𝗮𝗯𝗹𝗲 𝗠𝗮𝘁𝗵 𝗥𝗲𝗮𝘀𝗼𝗻𝗶𝗻𝗴

𝗨𝗻𝘀𝘂𝗽𝗲𝗿𝘃𝗶𝘀𝗲𝗱 𝗠𝗲𝘁𝗮 𝗟𝗲𝗮𝗿𝗻𝗶𝗻𝗴 𝗳𝗼𝗿 𝗥𝗲𝗶𝗻𝗳𝗼𝗿𝗰𝗲𝗺𝗲𝗻𝘁 𝗟𝗲𝗮𝗿𝗻𝗶𝗻𝗴

ஏஜென்ட் R: மொழி மாதிரி ஏஜென்ட்களைச் சிந்திக்கப் பயிற்றுவித்தல்

தூண்டுதல் இல்லாமலேயே சிந்தனைத் தொடர் பகுத்தறிவு