Embeddings Basitçe Açıklandı

Bilgisayarlar sayıları sever. Anlamdan nefret ederler.

Bir bilgisayar için "mutlu" ve "neşeli" kelimeleri sadece farklı harflerden ibarettir. Bu kelimelerin ortak bir duygu paylaştığını bilmezler.

Embeddings bu sorunu çözer. Kelimeleri sayı listelerine dönüştürürler. Bu sayılar, anlam için GPS koordinatları gibi işlev görür.

Kelimeleri sayılara dönüştürdüğünüzde, benzer kelimeler dijital bir haritada birbirine yakın konumlara düşer.

Vektör, sadece sıralı bir sayı listesidir. "kral" → [0.21, -0.44, 0.88] "kraliçe" → [0.19, -0.41, 0.85]

Gerçek modeller, tek bir kelime için bu sayılardan binlercesini kullanır. Hepsini görmenize gerek yoktur. Sadece iki noktanın birbirine ne kadar yakın olduğunu bilmeniz yeterlidir.

Bu yakınlığı ölçmek için kosinüs benzerliğini (cosine similarity) kullanırız.

Bu, anlamı geometriye dönüştürür. Kelimelerle matematik bile yapabilirsiniz.

Eğer "kral" vektörünü alıp "erkek" kelimesini çıkarır ve "kadın" kelimesini eklerseniz, "kraliçe"ye yakın bir yere ulaşırsınız. Model, bu kalıpları milyarlarca cümleyi okuyarak öğrenir.

Bu matematik, her gün kullandığınız yapay zeka araçlarına güç verir:

Bu sayıları kendiniz hesaplamazsınız. Metni bir modele gönderirsiniz ve o size vektörü döndürür. Daha sonra bu vektörleri, arama yapmak için bir vektör veritabanında (vector database) saklarsınız.

Embeddings, dilin gizemini geometrinin mantığına dönüştürür.

Kelimelerin nasıl bağlandığını görmek için Anlam Haritasını (Meaning Map) deneyin: https://dev48v.infy.uk/ai/days/day3-embeddings.html

Tüm kavramlar: https://dev48v.infy.uk/aifromzero.php

Kaynak: https://dev.to/dev48v/embeddings-explained-simply-how-ai-turns-words-into-a-map-of-meaning-36f4