หาก Vector DB ของคุณมองเห็นข้อมูลของคุณ คุณก็แค่กำลังเช่าความมั่นใจมาใช้เท่านั้น

Private AI เป็นเพียงคำที่ใช้เรียกกันให้ดูดี (buzzword)

ผู้ให้บริการต่างพากันใส่ไอคอนรูปแม่กุญแจลงในทุกสไลด์ พวกเขาสัญญาเรื่องความปลอดภัยตั้งแต่ขั้นตอนการออกแบบ (security by design)

แต่มีปัญหาอย่างหนึ่ง หาก Vector Database ของคุณต้องถอดรหัสข้อมูลเพื่อทำการค้นหา AI ของคุณก็ไม่ใช่ Private AI อีกต่อไป แต่มันคือการเปิดเผยข้อมูลออกไปต่างหาก

สถานะปัจจุบันของ Vector Databases:

  • ข้อมูลของคุณถูกทำเป็น Embedding
  • ระบบต้องมองเห็นข้อมูลของคุณเพื่อให้ทำงานได้
  • ผู้ให้บริการบอกว่าพวกเขาไม่ได้ตรวจสอบข้อมูลของลูกค้า

นั่นไม่ใช่ความเป็นส่วนตัว แต่นั่นคือการร้องขอความไว้วางใจ

Embeddings บรรจุความรู้ภายในของบริษัทไว้ ทั้งบริบทและรูปแบบข้อมูลที่ละเอียดอ่อน หาก Embeddings ถูกเก็บไว้ในเซิร์ฟเวอร์ในรูปแบบที่ถอดรหัสแล้ว หากเกิดการรั่วไหลขึ้น ผลกระทบจะรุนแรงมหาศาล

หลายคนเชื่อว่าคุณต้องเลือกระหว่างความปลอดภัยและความเร็ว พวกเขาคิดว่าคุณไม่สามารถมีทั้งความเป็นส่วนตัวที่แข็งแกร่งและประสิทธิภาพที่สูงไปพร้อมกันได้ ความเชื่อนี้เกิดขึ้นเพราะระบบส่วนใหญ่ใช้วิธีเพิ่มการเข้ารหัส (encryption) ทับลงบนฐานข้อมูล แทนที่จะสร้างมันให้เป็นส่วนหนึ่งของกระบวนการค้นหา

บ่อยครั้งที่ทีมงานต้องยอมแลกเพื่อประหยัดงบประมาณ พวกเขายอมรับความแม่นยำที่ลดลงเพื่อลดต้นทุนในการประมวลผล (compute costs)

Private AI ที่แท้จริงต้องทำงานต่างออกไป Vector Database ที่เป็นส่วนตัวอย่างแท้จริงต้องรับประกันสิ่งเหล่านี้:

  • ข้อมูลยังคงถูกเข้ารหัสไว้ก่อนที่จะออกจากระบบของคุณ
  • ระบบสามารถค้นหา Embeddings ได้โดยไม่ต้องถอดรหัส

สิ่งนี้จะเปลี่ยนความเป็นส่วนตัวจาก "ฟีเจอร์" ให้กลายเป็น "ข้อกำหนดพื้นฐาน"

ความไว้วางใจไม่สามารถขยายขนาดได้ (Trust does not scale) ระบบจะล้มเหลวเมื่อทีมขยายใหญ่ขึ้นหรือมีการเปลี่ยนการตั้งค่า (configurations)

ระบบที่แท้จริงจะขจัดโอกาสในการนำข้อมูลไปใช้ในทางที่ผิด หากฐานข้อมูลไม่สามารถอ่านข้อมูลได้ ไม่ว่าจะเกิดการรั่วไหลหรือการถูกเรียกตรวจสอบตามกฎหมาย (subpoena) บทสนทนาก็จะเปลี่ยนไป คุณจะไม่ต้องมานั่งถามว่าคุณไว้ใจผู้ให้บริการแค่ไหน แต่คุณจะมั่นใจได้เลยว่าข้อมูลของคุณปลอดภัย

เลิกถามว่าระบบทำงานเร็วแค่ไหนกับเวกเตอร์ 10 ล้านตัว

แต่เริ่มถามว่าระบบนั้นสามารถมองเห็นข้อมูลของคุณได้หรือไม่

ความเป็นส่วนตัวที่ตั้งอยู่บนพื้นฐานของความไว้วางใจนั้นใช้ไม่ได้จริงในโลกแห่งความเป็นจริง หากฐานข้อมูลของคุณจำเป็นต้องมองเห็นข้อมูลเพื่อทำการค้นหา คุณก็แค่กำลังเช่าความมั่นใจมาใช้เท่านั้น

Source: https://dev.to/reenas_27gb/if-your-vector-db-needs-to-see-your-data-to-search-it-youre-not-building-private-ai-youre-1843

Optional learning community: https://t.me/GyaanSetuAi