एम्बेडिंग्स सोप्या भाषेत

संगणकाला संख्या आवडतात. त्याला अर्थाचा तिरस्कार वाटतो.

संगणकासाठी, "happy" आणि "joyful" हे शब्द केवळ वेगवेगळी अक्षरे आहेत. या शब्दांमागे एकच भावना आहे, हे त्याला माहित नसते.

एम्बेडिंग्स (Embeddings) ही समस्या सोडवतात. ते शब्दांचे रूपांतर संख्यांच्या सूचीमध्ये करतात. या संख्या अर्थासाठी GPS कोऑर्डिनेट्सप्रमाणे काम करतात.

जेव्हा तुम्ही शब्दांचे रूपांतर संख्यांमध्ये करता, तेव्हा समान अर्थाचे शब्द एका डिजिटल नकाशावर एकमेकांच्या जवळ येतात.

वेक्टर (Vector) म्हणजे केवळ संख्यांची एक क्रमाने लावलेली सूची आहे. "king" → [0.21, -0.44, 0.88] "queen" → [0.19, -0.41, 0.85]

वास्तविक मॉडेल्स एका शब्दासाठी हजारो संख्यांचा वापर करतात. तुम्हाला त्या सर्व पाहण्याची गरज नाही. दोन बिंदू एकमेकांच्या किती जवळ आहेत, हे जाणून घेणे पुरेसे आहे.

ही जवळीक मोजण्यासाठी आपण cosine similarity वापरतो.

यामुळे अर्थाचे रूपांतर भूमितीमध्ये (geometry) होते. तुम्ही शब्दांशी गणिती क्रिया देखील करू शकता.

जर तुम्ही "king" चा वेक्टर घेतला, त्यातून "man" वजा केला आणि "woman" मिळवला, तर तुम्ही "queen" च्या जवळ पोहोचता. अब्जावधी वाक्ये वाचून मॉडेल हे नमुने (patterns) शिकते.

हे गणित तुम्ही दररोज वापरत असलेल्या AI टूल्सना शक्ती देते:

तुम्ही या संख्या स्वतः मोजत नाही. तुम्ही मॉडेलला मजकूर पाठवता आणि ते तुम्हाला वेक्टर परत करते. त्यानंतर तुम्ही शोध घेण्यासाठी हे वेक्टर्स एका vector database मध्ये साठवता.

एम्बेडिंग्स भाषेतील गूढता भूमितीच्या तर्कात रूपांतरित करतात.

शब्दांचे संबंध कसे जोडले जातात हे पाहण्यासाठी Meaning Map वापरून पहा: https://dev48v.infy.uk/ai/days/day3-embeddings.html

सर्व संकल्पना: https://dev48v.infy.uk/aifromzero.php

स्रोत: https://dev.to/dev48v/embeddings-explained-simply-how-ai-turns-words-into-a-map-of-meaning-36f4