Embeddings Basitçe Açıklandı
Bilgisayarlar sayıları sever. Anlamdan nefret ederler.
Bir bilgisayar için "mutlu" ve "neşeli" kelimeleri sadece farklı harflerden ibarettir. Bu kelimelerin ortak bir duygu paylaştığını bilmezler.
Embeddings bu sorunu çözer. Kelimeleri sayı listelerine dönüştürürler. Bu sayılar, anlam için GPS koordinatları gibi işlev görür.
Kelimeleri sayılara dönüştürdüğünüzde, benzer kelimeler dijital bir haritada birbirine yakın konumlara düşer.
- "Köpek" ve "yavru köpek" yakın koordinatlara sahiptir.
- "Köpek" ve "demokrasi" birbirinden uzak koordinatlara sahiptir.
Vektör, sadece sıralı bir sayı listesidir. "kral" → [0.21, -0.44, 0.88] "kraliçe" → [0.19, -0.41, 0.85]
Gerçek modeller, tek bir kelime için bu sayılardan binlercesini kullanır. Hepsini görmenize gerek yoktur. Sadece iki noktanın birbirine ne kadar yakın olduğunu bilmeniz yeterlidir.
Bu yakınlığı ölçmek için kosinüs benzerliğini (cosine similarity) kullanırız.
- Aynı yöndeki noktalar = yüksek oranda ilişkili.
- Dik açılı noktalar = ilişkisiz.
Bu, anlamı geometriye dönüştürür. Kelimelerle matematik bile yapabilirsiniz.
Eğer "kral" vektörünü alıp "erkek" kelimesini çıkarır ve "kadın" kelimesini eklerseniz, "kraliçe"ye yakın bir yere ulaşırsınız. Model, bu kalıpları milyarlarca cümleyi okuyarak öğrenir.
Bu matematik, her gün kullandığınız yapay zeka araçlarına güç verir:
- Semantik arama (Semantic search): Sonuçları tam anahtar kelimeler yerine anlamlarına göre bulma.
- Öneriler: Benzer vektörlere dayanarak ürün veya şarkı önerme.
- RAG: Yapay zekanın soruları yanıtlamak için belgelerinizdeki gerçekleri bulmasına yardımcı olma.
- Kümeleme (Clustering): Benzer öğeleri otomatik olarak gruplandırma.
Bu sayıları kendiniz hesaplamazsınız. Metni bir modele gönderirsiniz ve o size vektörü döndürür. Daha sonra bu vektörleri, arama yapmak için bir vektör veritabanında (vector database) saklarsınız.
Embeddings, dilin gizemini geometrinin mantığına dönüştürür.
Kelimelerin nasıl bağlandığını görmek için Anlam Haritasını (Meaning Map) deneyin: https://dev48v.infy.uk/ai/days/day3-embeddings.html
Tüm kavramlar: https://dev48v.infy.uk/aifromzero.php
Kaynak: https://dev.to/dev48v/embeddings-explained-simply-how-ai-turns-words-into-a-map-of-meaning-36f4