หาก Vector DB ของคุณมองเห็นข้อมูลของคุณ คุณก็แค่กำลังเช่าความมั่นใจมาใช้เท่านั้น
Private AI เป็นเพียงคำที่ใช้เรียกกันให้ดูดี (buzzword)
ผู้ให้บริการต่างพากันใส่ไอคอนรูปแม่กุญแจลงในทุกสไลด์ พวกเขาสัญญาเรื่องความปลอดภัยตั้งแต่ขั้นตอนการออกแบบ (security by design)
แต่มีปัญหาอย่างหนึ่ง หาก Vector Database ของคุณต้องถอดรหัสข้อมูลเพื่อทำการค้นหา AI ของคุณก็ไม่ใช่ Private AI อีกต่อไป แต่มันคือการเปิดเผยข้อมูลออกไปต่างหาก
สถานะปัจจุบันของ Vector Databases:
- ข้อมูลของคุณถูกทำเป็น Embedding
- ระบบต้องมองเห็นข้อมูลของคุณเพื่อให้ทำงานได้
- ผู้ให้บริการบอกว่าพวกเขาไม่ได้ตรวจสอบข้อมูลของลูกค้า
นั่นไม่ใช่ความเป็นส่วนตัว แต่นั่นคือการร้องขอความไว้วางใจ
Embeddings บรรจุความรู้ภายในของบริษัทไว้ ทั้งบริบทและรูปแบบข้อมูลที่ละเอียดอ่อน หาก Embeddings ถูกเก็บไว้ในเซิร์ฟเวอร์ในรูปแบบที่ถอดรหัสแล้ว หากเกิดการรั่วไหลขึ้น ผลกระทบจะรุนแรงมหาศาล
หลายคนเชื่อว่าคุณต้องเลือกระหว่างความปลอดภัยและความเร็ว พวกเขาคิดว่าคุณไม่สามารถมีทั้งความเป็นส่วนตัวที่แข็งแกร่งและประสิทธิภาพที่สูงไปพร้อมกันได้ ความเชื่อนี้เกิดขึ้นเพราะระบบส่วนใหญ่ใช้วิธีเพิ่มการเข้ารหัส (encryption) ทับลงบนฐานข้อมูล แทนที่จะสร้างมันให้เป็นส่วนหนึ่งของกระบวนการค้นหา
บ่อยครั้งที่ทีมงานต้องยอมแลกเพื่อประหยัดงบประมาณ พวกเขายอมรับความแม่นยำที่ลดลงเพื่อลดต้นทุนในการประมวลผล (compute costs)
Private AI ที่แท้จริงต้องทำงานต่างออกไป Vector Database ที่เป็นส่วนตัวอย่างแท้จริงต้องรับประกันสิ่งเหล่านี้:
- ข้อมูลยังคงถูกเข้ารหัสไว้ก่อนที่จะออกจากระบบของคุณ
- ระบบสามารถค้นหา Embeddings ได้โดยไม่ต้องถอดรหัส
สิ่งนี้จะเปลี่ยนความเป็นส่วนตัวจาก "ฟีเจอร์" ให้กลายเป็น "ข้อกำหนดพื้นฐาน"
ความไว้วางใจไม่สามารถขยายขนาดได้ (Trust does not scale) ระบบจะล้มเหลวเมื่อทีมขยายใหญ่ขึ้นหรือมีการเปลี่ยนการตั้งค่า (configurations)
ระบบที่แท้จริงจะขจัดโอกาสในการนำข้อมูลไปใช้ในทางที่ผิด หากฐานข้อมูลไม่สามารถอ่านข้อมูลได้ ไม่ว่าจะเกิดการรั่วไหลหรือการถูกเรียกตรวจสอบตามกฎหมาย (subpoena) บทสนทนาก็จะเปลี่ยนไป คุณจะไม่ต้องมานั่งถามว่าคุณไว้ใจผู้ให้บริการแค่ไหน แต่คุณจะมั่นใจได้เลยว่าข้อมูลของคุณปลอดภัย
เลิกถามว่าระบบทำงานเร็วแค่ไหนกับเวกเตอร์ 10 ล้านตัว
แต่เริ่มถามว่าระบบนั้นสามารถมองเห็นข้อมูลของคุณได้หรือไม่
ความเป็นส่วนตัวที่ตั้งอยู่บนพื้นฐานของความไว้วางใจนั้นใช้ไม่ได้จริงในโลกแห่งความเป็นจริง หากฐานข้อมูลของคุณจำเป็นต้องมองเห็นข้อมูลเพื่อทำการค้นหา คุณก็แค่กำลังเช่าความมั่นใจมาใช้เท่านั้น
Optional learning community: https://t.me/GyaanSetuAi