𝗛𝗮𝗺𝗶𝗹𝘁𝗼𝗻 𝗝𝗮𝗰𝗼𝗯𝗶 𝗧𝗵𝗲𝗼𝗿𝘆 𝗟𝗶𝗻𝗸𝘀 𝗡𝗲𝘂𝗿𝗮𝗹 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗲𝘀

Translated for your language. Read the original.

AI-assisted draft.

४ दिवसांपूर्वी1min read

𝗛𝗮𝗺𝗶𝗹𝘁𝗼𝗻-𝗝𝗮𝗰𝗼𝗯𝗶 सिद्धांत न्यूरल आर्किटेक्चरला (Neural Architectures) जोडतो

न्यूरल नेटवर्क्स अनेकदा वेगवेगळ्या युक्त्यांचा संच असल्यासारखे वाटतात.

ResNets मध्ये skip connections वापरले जातात. Transformers मध्ये attention वापरले जाते. RNNs मध्ये recurrence वापरले जाते. प्रत्येक मॉडेलचे स्वतःचे नियम आणि गणित असते. यामुळे संपूर्ण चित्र समजून घेणे कठीण होते.

नवीन संशोधन हे बदलत आहे. ते दर्शवते की ResNets, Transformers आणि RNNs हे प्रत्यक्षात एकच गणितीय घटक (mathematical object) आहेत. ते सर्व Hamilton-Jacobi समीकरणांचे पालन करतात.

हे कसे कार्य करते ते येथे दिले आहे:

Gradient descent हा भौतिकशास्त्रातील उत्क्रांतीचा (physics evolution) एक प्रकार आहे.
प्रशिक्षणातील (training) प्रत्येक टप्पा weights ला द्रवाप्रमाणे (fluid) हलवतो.
Depth, attention आणि recurrence हे गणनेतील (calculation) वेळेच्या टप्प्यांसारखे (time steps) कार्य करतात.
एकच पॅरामीटर मॉडेल किती स्मूथ (smooth) किंवा स्पार्स (sparse) होईल हे नियंत्रित करतो.

हा सिद्धांत चार वेगवेगळ्या क्षेत्रांना जोडतो: न्यूरल नेटवर्क्स, tropical algebra, PDEs आणि convex optimization.

हे तुमच्यासाठी का महत्त्वाचे आहे?

सध्याचे बेंचमार्क्स प्रामुख्याने अचूकतेवर (accuracy) लक्ष केंद्रित करतात. हे फ्रेमवर्क मॉडेल्स तयार करण्याची एक नवीन पद्धत सुचवते. फक्त लेयर्स (layers) जोडण्याऐवजी, तुम्ही स्मूथनेस (smoothness) आणि स्थिरता (stability) यांचा समतोल राखण्यासाठी गणिती प्रक्रिया सुधारू शकता.

हा सिद्धांत मॉडेल किती चांगल्या प्रकारे सामान्यीकरण (generalize) करेल, याचेही भाकीत करतो. हे तुमच्या आर्किटेक्चरमध्ये वापरल्या जाणाऱ्या विशिष्ट गणिताचा तुमच्या डेटाच्या गरजेशी संबंध जोडते.

अजूनही काही त्रुटी आहेत. बहुतेक मॉडेल्स ReLU वापरतात, परंतु हे गणित log-sum-exp लेयर्ससोबत सर्वोत्तम काम करते. हे भौतिकशास्त्राचे नियम कामगिरी सुधारतात का, हे पाहण्यासाठी आपल्याला अधिक वास्तववादी चाचण्यांची (real-world tests) आवश्यकता आहे.

आपण आर्किटेक्चरकडे केवळ वेगवेगळ्या प्रकारच्या लेयर्स म्हणून पाहणे थांबवले पाहिजे. त्याऐवजी, आपण त्यांना एकच समीकरण सोडवण्याच्या वेगवेगळ्या पद्धती म्हणून पाहिले पाहिजे.

Source: https://dev.to/olaughter/hamilton-jacobi-view-links-major-neural-architectures-5hln

Optional learning community: https://t.me/GyaanSetuAi

𝗛𝗮𝗺𝗶𝗹𝘁𝗼𝗻 𝗝𝗮𝗰𝗼𝗯𝗶 𝗧𝗵𝗲𝗼𝗿𝘆 𝗟𝗶𝗻𝗸𝘀 𝗡𝗲𝘂𝗿𝗮𝗹 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗲𝘀

Continue reading

𝗧𝗵𝗲 𝗦𝗵𝗮𝗽𝗲 𝗼𝗳 𝗮 𝗡𝗲𝘂𝗿𝗼𝗻

ट्रान्सफॉर्मर्स कसे काम करतात

हेटरोजीनियस इन्फॉर्मेशन नेटवर्क एम्बेडिंग

𝗪𝗵𝘆 𝗦𝘁𝗿𝘂𝗰𝘁𝘂𝗿𝗲𝗱 𝗙𝗲𝗲𝗱𝗯𝗮𝗰𝗸 𝗠𝗮𝘁𝘁𝗲𝗿𝘀 𝗶𝗻 𝗔𝗜 𝗧𝗿𝗮𝗶𝗻𝗶𝗻𝗴

𝗡 𝗕𝗼𝗱𝘆 𝗡𝗲𝘁𝘄𝗼𝗿𝗸𝘀 𝗟𝗲𝗮𝗿𝗻 𝗔𝘁𝗼𝗺𝗶𝗰 𝗣𝗼𝘁𝗲𝗻𝘁𝗶𝗮𝗹𝘀