ایمبیڈنگز کی سادہ وضاحت
کمپیوٹرز کو نمبرز پسند ہیں، لیکن انہیں معنی سے کوئی سروکار نہیں۔
ایک کمپیوٹر کے لیے، "happy" اور "joyful" محض مختلف حروف ہیں۔ وہ یہ نہیں جانتے کہ ان الفاظ میں ایک ہی احساس مشترک ہے۔
ایمبیڈنگز اس مسئلے کو حل کرتی ہیں۔ یہ الفاظ کو نمبروں کی فہرستوں میں تبدیل کر دیتی ہیں۔ یہ نمبر معنی کے لیے GPS کوآرڈینیٹس کی طرح کام کرتے ہیں۔
جب آپ الفاظ کو نمبروں میں تبدیل کرتے ہیں، تو ملتے جلتے الفاظ ایک ڈیجیٹل نقشے میں ایک دوسرے کے قریب آ جاتے ہیں۔
- "Dog" اور "puppy" کے کوآرڈینیٹس قریب ہوتے ہیں۔
- "Dog" اور "democracy" کے کوآرڈینیٹس ایک دوسرے سے بہت دور ہوتے ہیں۔
ویکٹر (vector) محض نمبروں کی ایک ترتیب وار فہرست ہے۔ "king" → [0.21, -0.44, 0.88] "queen" → [0.19, -0.41, 0.85]
حقیقی ماڈلز ایک لفظ کے لیے ہزاروں ایسے نمبر استعمال کرتے ہیں۔ آپ کو ان سب کو دیکھنے کی ضرورت نہیں ہے۔ آپ کو صرف یہ جاننے کی ضرورت ہے کہ دو پوائنٹس ایک دوسرے کے کتنے قریب ہیں۔
ہم اس قربت کو ناپنے کے لیے cosine similarity کا استعمال کرتے ہیں۔
- ایک ہی سمت میں پوائنٹس = انتہائی متعلقہ۔
- قائمہ زاویے (right angles) پر پوائنٹس = غیر متعلقہ۔
یہ معنی کو جیومیٹری (geometry) میں بدل دیتا ہے۔ آپ الفاظ کے ساتھ ریاضی بھی کر سکتے ہیں۔
اگر آپ "king" کا ویکٹر لیں، اس میں سے "man" کو نکال دیں، اور "woman" کو جمع کر دیں، تو آپ "queen" کے قریب پہنچ جائیں گے۔ ماڈل اربوں جملے پڑھ کر یہ پیٹرن سیکھتا ہے۔
یہ ریاضی ان AI ٹولز کو طاقت فراہم کرتی ہے جو آپ روزانہ استعمال کرتے ہیں:
- Semantic search: درست کی ورڈز کے بجائے معنی کی بنیاد پر نتائج تلاش کرنا۔
- Recommendations: ملتے جلتے ویکٹرز کی بنیاد پر مصنوعات یا گانے تجویز کرنا۔
- RAG: سوالات کے جوابات دینے کے لیے AI کو آپ کی دستاویزات میں حقائق تلاش کرنے میں مدد دینا۔
- Clustering: ملتے جلتے آئٹمز کو خودکار طریقے سے گروپس میں تقسیم کرنا۔
آپ یہ نمبر خود کیلکولیٹ نہیں کرتے۔ آپ ٹیکسٹ کو ایک ماڈل کو بھیجتے ہیں اور وہ ویکٹر واپس کرتا ہے۔ پھر آپ ان ویکٹرز کو سرچ کرنے کے لیے ایک ویکٹر ڈیٹا بیس (vector database) میں محفوظ کرتے ہیں۔
ایمبیڈنگز زبان کے اسرار کو جیومیٹری کی منطق میں بدل دیتی ہیں۔
کیسے الفاظ آپس میں جڑے ہوئے ہیں، یہ دیکھنے کے لیے Meaning Map آزمائیں: https://dev48v.infy.uk/ai/days/day3-embeddings.html
تمام تصورات: https://dev48v.infy.uk/aifromzero.php
ماخذ: https://dev.to/dev48v/embeddings-explained-simply-how-ai-turns-words-into-a-map-of-meaning-36f4