Vektör Veritabanınız Verilerinizi Görüyorsa, Güven Kiralıyorsunuz Demektir

Özel AI (Private AI) bir popüler terimdir.

Satıcılar her slayta kilit simgeleri koyuyor. Tasarımdan gelen güvenlik (security by design) vaat ediyorlar.

Ancak bir sorun var. Eğer vektör veritabanınız verileri aramak için şifre çözmek zorundaysa, yapay zekanız gizli değildir. Maruz kalmıştır.

Vektör veritabanlarının mevcut durumu:

  • Verileriniz embedding'dir.
  • Sistemler çalışmak için verilerinizi görür.
  • Satıcılar müşteri verilerini incelemediklerini söylüyorlar.

Bu gizlilik değildir. Bu, güven talep etmektir.

Embedding'ler şirket içi bilgileri içerir. Bağlam ve hassas kalıplar barındırırlar. Eğer embedding'ler bir sunucuda şifresi çözülmüş halde duruyorsa, bir veri ihlali felaket olur.

Birçok kişi güvenlik ile hız arasında bir seçim yapmanız gerektiğine inanıyor. Güçlü gizlilik ile yüksek performansa aynı anda sahip olamayacağınızı düşünüyorlar. Bu inanışın sebebi, çoğu sistemin şifrelemeyi veritabanının üzerine eklemesidir. Şifrelemeyi arama sürecinin içine dahil etmezler.

Ekipler genellikle tasarruf etmek için ödün veriyor. Hesaplama maliyetlerini düşürmek için daha düşük doğruluğu kabul ediyorlar.

Gerçekten özel bir AI farklı çalışmalıdır. Gerçek bir özel vektör veritabanı şunları garanti eder:

  • Veriler sisteminizden çıkmadan önce şifreli kalır.
  • Sistem, embedding'leri şifrelerini çözmeden arar.

Bu, gizliliği bir özellik olmaktan çıkarıp bir gereklilik haline getirir.

Güven ölçeklenemez. Ekipler büyüdüğünde veya konfigürasyonlar değiştiğinde sistemler başarısız olur.

Gerçek bir sistem, kötüye kullanım olasılığını ortadan kaldırır. Eğer veritabanı verileri okuyamıyorsa, bir veri ihlali veya mahkeme celbi durumu değiştirir. Bir satıcıya ne kadar güvendiğinizi sormayı bırakırsınız. Verilerinizin güvende olduğunu bilmeye başlarsınız.

Bir sistemin 10M vektörde ne kadar hızlı olduğunu sormayı bırakın.

Sistemin verilerinizi görüp görmediğini sormaya başlayın.

Güvene dayalı gizlilik gerçek dünyada başarısız olur. Eğer veritabanınız verileri aramak için görmeye ihtiyaç duyuyorsa, sadece güven kiralıyorsunuz demektir.

Kaynak: https://dev.to/reenas_27gb/if-your-vector-db-needs-to-see-your-data-to-search-it-youre-not-building-private-ai-youre-1843

İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi