Netflix, Spotify veya Amazon'da Arama Yaptığınızda Neler Olur?

Birkaç kelime yazarsınız. Milyonlarca hesaplama gerçekleşir.

Her gün, milyarlarca insan bir şeyler aratır.

  • Netflix'te Interstellar
  • Spotify'da Shape of You
  • Amazon'da Kablosuz Fare

Sonuçlar anında görünür. Basitmiş gibi gelir. Ancak o arama kutusunun arkasında devasa bir mühendislik sistemi çalışır.

Modern arama, kelimeleri eşleştirmekten daha fazlasını yapar. Anlamı anlar, niyeti tahmin eder ve milisaniyeler içinde sonuçları kişiselleştirir.

İşte bir arama sorgusunun yolculuğu:

  1. Sorgu Ön İşleme (Query Preprocessing) Sistem, cümlenizi parçalara ayırır. Metni temizler. Yazım hatalarını düzeltir ve eş anlamlı kelimeleri genişletir. Eğer "sneakers" diye aratırsanız, sistem "shoes" demek istediğinizi bilir.

  2. Ters Dizin (The Inverted Index) Amazon'un milyonlarca ürünü vardır. Her ürünü tek tek kontrol etmez. Bu çok uzun sürerdi. Bunun yerine ters bir dizin (inverted index) kullanır. Bu, bir ders kitabının dizini gibi çalışır. Anahtar kelimeleri doğrudan ürün kimlikleriyle (product IDs) eşleştirir. Bu, milyonlarca öğeyi birkaç bin öğeye indirger.

  3. Semantik Arama (Semantic Search) Geleneksel arama tam kelimeleri arar. Modern arama ise anlama bakar. Yapay zeka, kelimeleri "embedding" adı verilen sayılara dönüştürür.

Bu matematiksel uzayda, "dog" kelimesi "puppy" kelimesine yakındır. "Laptop" kelimesi "notebook" kelimesine yakındır. Kelimeler eşleşmese bile, anlamlar yakın olduğu için sistem doğru sonucu bulur.

  1. Sıralama (Ranking) Sistem eşleşmeleri bulur, ardından onları sıralar. Şu sinyalleri kullanır:
  • Alaka düzeyi
  • Popülerlik
  • Puanlar
  • Satın alma geçmişi
  • Teslimat hızı

En yüksek puanlar en üstte görünür.

  1. Kişiselleştirme (Personalization) Aynı arama, farklı kişilere farklı sonuçlar verir. Eğer "shoes" diye aratırsanız ve genellikle futbol ekipmanı alıyorsanız, kramponlar görürsünüz. Eğer "shoes" diye aratırsanız ve maraton koşuyorsanız, koşu ayakkabıları görürsünüz. Sistem geçmişinizi bilir.

  2. Hız ve Ölçek (Speed and Scale) Gecikmeyi (latency) düşük tutmak için şirketler şunları kullanır:

  • Önbelleğe alma (Caching)
  • Dağıtık veritabanları (Distributed databases)
  • Vektör veritabanları (Vector databases)
  • Yük dengeleme (Load balancing)

Pinecone veya Milvus gibi vektör veritabanları, yapay zekanın metin yerine matematik kullanarak benzer öğeleri bulmasına olanak tanır.

Arama artık basit bir veritabanı sorgusu değildir. Yapay zeka, dağıtık bilişim ve akıllı algoritmaların bir karışımıdır.

Kaynak: https://dev.to/vineet_chauhan_a828338181/what-really-happens-when-you-search-on-netflix-spotify-or-amazon-behind-the-scenes-of-modern-p9b

İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi