𝗘𝗺𝗯𝗲𝗱𝗱𝗶𝗻𝗴𝘀 𝗘𝘅𝗽𝗹𝗮𝗶𝗻𝗲𝗱 𝗦𝗶𝗺𝗽𝗹𝘆

📅3 hours ago⏱1 min read

Penjelasan Embeddings Secara Sederhana

Komputer menyukai angka. Mereka membenci makna.

Bagi komputer, kata "happy" dan "joyful" hanyalah huruf-huruf yang berbeda. Mereka tidak tahu bahwa kata-kata ini berbagi perasaan yang sama.

Embeddings memecahkan masalah ini. Mereka mengubah kata-kata menjadi daftar angka. Angka-angka ini bertindak seperti koordinat GPS untuk makna.

Saat Anda mengubah kata menjadi angka, kata-kata yang serupa akan berada berdekatan dalam sebuah peta digital.

"Dog" dan "puppy" memiliki koordinat yang berdekatan.
"Dog" dan "democracy" memiliki koordinat yang berjauhan.

Vektor hanyalah sebuah daftar angka yang berurutan. "king" → [0.21, -0.44, 0.88] "queen" → [0.19, -0.41, 0.85]

Model asli menggunakan ribuan angka ini untuk satu kata. Anda tidak perlu melihat semuanya. Anda hanya perlu tahu seberapa dekat dua titik tersebut.

Kita menggunakan cosine similarity untuk mengukur kedekatan ini.

Titik-titik dalam arah yang sama = sangat berkaitan.
Titik-titik pada sudut siku-siku = tidak berkaitan.

Ini mengubah makna menjadi geometri. Anda bahkan dapat melakukan perhitungan matematika dengan kata-kata.

Jika Anda mengambil vektor untuk "king," menguranginya dengan "man," dan menambahkannya dengan "woman," Anda akan mendarat di dekat "queen." Model mempelajari pola ini dari membaca miliaran kalimat.

Matematika ini menggerakkan alat-alat AI yang Anda gunakan setiap hari:

Semantic search: Menemukan hasil berdasarkan makna, bukan kata kunci yang tepat.
Recommendations: Menyarankan produk atau lagu berdasarkan vektor yang serupa.
RAG: Membantu AI menemukan fakta dalam dokumen Anda untuk menjawab pertanyaan.
Clustering: Mengelompokkan item serupa secara otomatis.

Anda tidak menghitung angka-angka ini sendiri. Anda mengirimkan teks ke sebuah model dan model tersebut mengembalikan vektornya. Anda kemudian menyimpan vektor-vektor ini dalam database vektor untuk mencarinya.

Embeddings mengubah misteri bahasa menjadi logika geometri.

Coba Meaning Map untuk melihat bagaimana kata-kata terhubung: https://dev48v.infy.uk/ai/days/day3-embeddings.html

Semua konsep: https://dev48v.infy.uk/aifromzero.php

Sumber: https://dev.to/dev48v/embeddings-explained-simply-how-ai-turns-words-into-a-map-of-meaning-36f4

𝗘𝗺𝗯𝗲𝗱𝗱𝗶𝗻𝗴𝘀 𝗘𝘅𝗽𝗹𝗮𝗶𝗻𝗲𝗱 𝗦𝗶𝗺𝗽𝗹𝘆

Continue reading

𝗙𝗿𝗮𝗺𝗲𝘄𝗼𝗿𝗸 𝗟𝗶𝗺𝗯𝗼

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗙𝗶𝘅𝗶𝗻𝗴 𝗔𝗜 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗶𝗼𝗻𝘀

𝗩𝗲𝗰𝘁𝗼𝗿 𝗧𝗮𝗯𝗹𝗲𝘀 𝟭𝟬𝟭: 𝗨𝗻𝗱𝗲𝗿𝘀𝘁𝗮𝗻𝗱𝗶𝗻𝗴 𝗩𝗲𝗰𝘁𝗼𝗿 𝗮𝗻𝗱 𝗣𝗚𝗩𝗲𝗰𝘁𝗼𝗿

Pencarian Vektor Tidaklah Cukup untuk AI Produksi