एम्बेडिंग्स सोप्या भाषेत
संगणकाला संख्या आवडतात. त्याला अर्थाचा तिरस्कार वाटतो.
संगणकासाठी, "happy" आणि "joyful" हे शब्द केवळ वेगवेगळी अक्षरे आहेत. या शब्दांमागे एकच भावना आहे, हे त्याला माहित नसते.
एम्बेडिंग्स (Embeddings) ही समस्या सोडवतात. ते शब्दांचे रूपांतर संख्यांच्या सूचीमध्ये करतात. या संख्या अर्थासाठी GPS कोऑर्डिनेट्सप्रमाणे काम करतात.
जेव्हा तुम्ही शब्दांचे रूपांतर संख्यांमध्ये करता, तेव्हा समान अर्थाचे शब्द एका डिजिटल नकाशावर एकमेकांच्या जवळ येतात.
- "Dog" आणि "puppy" चे कोऑर्डिनेट्स जवळ आहेत.
- "Dog" आणि "democracy" चे कोऑर्डिनेट्स एकमेकांपासून खूप दूर आहेत.
वेक्टर (Vector) म्हणजे केवळ संख्यांची एक क्रमाने लावलेली सूची आहे. "king" → [0.21, -0.44, 0.88] "queen" → [0.19, -0.41, 0.85]
वास्तविक मॉडेल्स एका शब्दासाठी हजारो संख्यांचा वापर करतात. तुम्हाला त्या सर्व पाहण्याची गरज नाही. दोन बिंदू एकमेकांच्या किती जवळ आहेत, हे जाणून घेणे पुरेसे आहे.
ही जवळीक मोजण्यासाठी आपण cosine similarity वापरतो.
- एकाच दिशेतील बिंदू = अत्यंत संबंधित.
- काटकोनात असलेले बिंदू = असंबंधित.
यामुळे अर्थाचे रूपांतर भूमितीमध्ये (geometry) होते. तुम्ही शब्दांशी गणिती क्रिया देखील करू शकता.
जर तुम्ही "king" चा वेक्टर घेतला, त्यातून "man" वजा केला आणि "woman" मिळवला, तर तुम्ही "queen" च्या जवळ पोहोचता. अब्जावधी वाक्ये वाचून मॉडेल हे नमुने (patterns) शिकते.
हे गणित तुम्ही दररोज वापरत असलेल्या AI टूल्सना शक्ती देते:
- Semantic search: अचूक कीवर्ड्सऐवजी अर्थावरून निकाल शोधणे.
- Recommendations: समान वेक्टर्सवर आधारित उत्पादने किंवा गाणी सुचवणे.
- RAG: प्रश्नांची उत्तरे देण्यासाठी तुमच्या कागदपत्रांमधील तथ्ये शोधण्यात AI ला मदत करणे.
- Clustering: समान वस्तूंचे आपोआप गट करणे.
तुम्ही या संख्या स्वतः मोजत नाही. तुम्ही मॉडेलला मजकूर पाठवता आणि ते तुम्हाला वेक्टर परत करते. त्यानंतर तुम्ही शोध घेण्यासाठी हे वेक्टर्स एका vector database मध्ये साठवता.
एम्बेडिंग्स भाषेतील गूढता भूमितीच्या तर्कात रूपांतरित करतात.
शब्दांचे संबंध कसे जोडले जातात हे पाहण्यासाठी Meaning Map वापरून पहा: https://dev48v.infy.uk/ai/days/day3-embeddings.html
सर्व संकल्पना: https://dev48v.infy.uk/aifromzero.php
स्रोत: https://dev.to/dev48v/embeddings-explained-simply-how-ai-turns-words-into-a-map-of-meaning-36f4