𝗥 𝟰𝗕: 𝗔𝗨𝗧𝗢 𝗧𝗛𝗜𝗡𝗞𝗜𝗡𝗚 𝗜𝗡 𝗠𝗟𝗟𝗠𝗦

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial१३ तासांपूर्वी1min read

𝗥-𝟰𝗕: 𝗠𝗟𝗟𝗠𝘀 मध्ये 𝗔𝗨𝗧𝗢-𝗧𝗛𝗜𝗡𝗞𝗜𝗡𝗚

लार्ज मल्टीमोडल मॉडेल्सना (Large Multimodal Models) अनेकदा तर्क (reasoning) करण्यात अडचणी येतात. जेव्हा कामांसाठी सखोल विचारांची आवश्यकता असते, तेव्हा ती अपयशी ठरतात.

R-4B नावाच्या एका नवीन पद्धतीमुळे ही समस्या सुटते. यामध्ये दोन मुख्य तंत्रांचा वापर केला जातो:

Bi-Mode Annealing
Reinforcement Learning

ही पद्धत मॉडेल्सना प्रतिसाद देण्यापूर्वी विचार करायला शिकवते. हे केवळ पॅटर्न मॅचिंग करण्याऐवजी सामान्य तर्क कौशल्ये (general reasoning skills) विकसित करते.

हे संशोधन ऑटो-थिंकिंगला (auto-thinking) कसे प्रोत्साहित करावे हे दर्शवते. यामुळे मॉडेल्स गुंतागुंतीचे तर्क (complex logic) आणि व्हिज्युअल रिझनिंग (visual reasoning) हाताळण्यात अधिक सक्षम होतात.

मुख्य फायदे:

अधिक अचूक तर्कक्षमता
अधिक स्थिर प्रशिक्षण
कठीण कामांमध्ये सुधारित कामगिरी

जर तुम्ही मल्टीमोडल AI वर काम करत असाल, तर तुम्ही याकडे नक्कीच लक्ष दिले पाहिजे. मॉडेल्सना तर्क करण्यासाठी प्रशिक्षित करण्याच्या पद्धतीत हे बदल घडवून आणते.

Source: https://dev.to/paperium/r-4b-incentivizing-general-purpose-auto-thinking-capability-in-mllms-viabi-mode-annealing-and-1210

Optional learning community: https://t.me/GyaanSetuAi

𝗥 𝟰𝗕: 𝗔𝗨𝗧𝗢 𝗧𝗛𝗜𝗡𝗞𝗜𝗡𝗚 𝗜𝗡 𝗠𝗟𝗟𝗠𝗦

Continue reading

𝗨𝗻𝗶𝗳𝗶𝗲𝗱 𝗥𝗲𝘄𝗮𝗿𝗱 𝗠𝗼𝗱𝗲𝗹𝘀 𝗳𝗼𝗿 𝗔𝗜

InternLM Math: पडताळण्यायोग्य गणितीय तर्कशक्ती

𝗨𝗻𝘀𝘂𝗽𝗲𝗿𝘃𝗶𝘀𝗲𝗱 𝗠𝗲𝘁𝗮 𝗟𝗲𝗮𝗿𝗻𝗶𝗻𝗴 𝗳𝗼𝗿 𝗥𝗲𝗶𝗻𝗳𝗼𝗿𝗰𝗲𝗺𝗲𝗻𝘁 𝗟𝗲𝗮𝗿𝗻𝗶𝗻𝗴

एजंट आर: लँग्वेज मॉडेल एजंट्सना आत्मचिंतनासाठी प्रशिक्षित करणे

𝗖𝗵𝗮𝗶𝗻 𝗼𝗳 𝗧𝗵𝗼𝘂𝗴𝗵𝘁 𝗥𝗲𝗮𝘀𝗼𝗻𝗶𝗻𝗴 𝗪𝗶𝘁𝗵𝗼𝘂𝘁 𝗣𝗿𝗼𝗺𝗽𝘁𝗶𝗻𝗴