ایمبیڈنگز کی سادہ وضاحت

📅3 hours ago⏱1 min read

ایمبیڈنگز کی سادہ وضاحت

کمپیوٹرز کو نمبرز پسند ہیں، لیکن انہیں معنی سے کوئی سروکار نہیں۔

ایک کمپیوٹر کے لیے، "happy" اور "joyful" محض مختلف حروف ہیں۔ وہ یہ نہیں جانتے کہ ان الفاظ میں ایک ہی احساس مشترک ہے۔

ایمبیڈنگز اس مسئلے کو حل کرتی ہیں۔ یہ الفاظ کو نمبروں کی فہرستوں میں تبدیل کر دیتی ہیں۔ یہ نمبر معنی کے لیے GPS کوآرڈینیٹس کی طرح کام کرتے ہیں۔

جب آپ الفاظ کو نمبروں میں تبدیل کرتے ہیں، تو ملتے جلتے الفاظ ایک ڈیجیٹل نقشے میں ایک دوسرے کے قریب آ جاتے ہیں۔

"Dog" اور "puppy" کے کوآرڈینیٹس قریب ہوتے ہیں۔
"Dog" اور "democracy" کے کوآرڈینیٹس ایک دوسرے سے بہت دور ہوتے ہیں۔

ویکٹر (vector) محض نمبروں کی ایک ترتیب وار فہرست ہے۔ "king" → [0.21, -0.44, 0.88] "queen" → [0.19, -0.41, 0.85]

حقیقی ماڈلز ایک لفظ کے لیے ہزاروں ایسے نمبر استعمال کرتے ہیں۔ آپ کو ان سب کو دیکھنے کی ضرورت نہیں ہے۔ آپ کو صرف یہ جاننے کی ضرورت ہے کہ دو پوائنٹس ایک دوسرے کے کتنے قریب ہیں۔

ہم اس قربت کو ناپنے کے لیے cosine similarity کا استعمال کرتے ہیں۔

ایک ہی سمت میں پوائنٹس = انتہائی متعلقہ۔
قائمہ زاویے (right angles) پر پوائنٹس = غیر متعلقہ۔

یہ معنی کو جیومیٹری (geometry) میں بدل دیتا ہے۔ آپ الفاظ کے ساتھ ریاضی بھی کر سکتے ہیں۔

اگر آپ "king" کا ویکٹر لیں، اس میں سے "man" کو نکال دیں، اور "woman" کو جمع کر دیں، تو آپ "queen" کے قریب پہنچ جائیں گے۔ ماڈل اربوں جملے پڑھ کر یہ پیٹرن سیکھتا ہے۔

یہ ریاضی ان AI ٹولز کو طاقت فراہم کرتی ہے جو آپ روزانہ استعمال کرتے ہیں:

Semantic search: درست کی ورڈز کے بجائے معنی کی بنیاد پر نتائج تلاش کرنا۔
Recommendations: ملتے جلتے ویکٹرز کی بنیاد پر مصنوعات یا گانے تجویز کرنا۔
RAG: سوالات کے جوابات دینے کے لیے AI کو آپ کی دستاویزات میں حقائق تلاش کرنے میں مدد دینا۔
Clustering: ملتے جلتے آئٹمز کو خودکار طریقے سے گروپس میں تقسیم کرنا۔

آپ یہ نمبر خود کیلکولیٹ نہیں کرتے۔ آپ ٹیکسٹ کو ایک ماڈل کو بھیجتے ہیں اور وہ ویکٹر واپس کرتا ہے۔ پھر آپ ان ویکٹرز کو سرچ کرنے کے لیے ایک ویکٹر ڈیٹا بیس (vector database) میں محفوظ کرتے ہیں۔

ایمبیڈنگز زبان کے اسرار کو جیومیٹری کی منطق میں بدل دیتی ہیں۔

کیسے الفاظ آپس میں جڑے ہوئے ہیں، یہ دیکھنے کے لیے Meaning Map آزمائیں: https://dev48v.infy.uk/ai/days/day3-embeddings.html

تمام تصورات: https://dev48v.infy.uk/aifromzero.php

ماخذ: https://dev.to/dev48v/embeddings-explained-simply-how-ai-turns-words-into-a-map-of-meaning-36f4

ایمبیڈنگز کی سادہ وضاحت

Continue reading

𝗙𝗿𝗮𝗺𝗲𝘄𝗼𝗿𝗸 𝗟𝗶𝗺𝗯𝗼

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗙𝗶𝘅𝗶𝗻𝗴 𝗔𝗜 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗶𝗼𝗻𝘀

𝗩𝗲𝗰𝘁𝗼𝗿 𝗧𝗮𝗯𝗹𝗲𝘀 𝟭𝟬𝟭: 𝗨𝗻𝗱𝗲𝗿𝘀𝘁𝗮𝗻𝗱𝗶𝗻𝗴 𝗩𝗲𝗰𝘁𝗼𝗿 𝗮𝗻𝗱 𝗣𝗚𝗩𝗲𝗰𝘁𝗼𝗿

پروڈکشن اے آئی کے لیے ویکٹر سرچ کافی نہیں ہے