𝗜𝗳 𝗬𝗼𝘂𝗿 𝗩𝗲𝗰𝘁𝗼𝗿 𝗗𝗕 𝗦𝗲𝗲𝘀 𝗬𝗼𝘂𝗿 𝗗𝗮𝘁𝗮, 𝗬𝗼𝘂 𝗔𝗿𝗲 𝗥𝗲𝗻𝘁𝗶𝗻𝗴 𝗖𝗼𝗻𝗳𝗶𝗱𝗲𝗻𝗰𝗲

Private AI हा एक चर्चेचा विषय (buzzword) आहे.

विक्रेते प्रत्येक स्लाईडवर लॉकचे आयकॉन लावतात. ते 'security by design' चे आश्वासन देतात.

पण एक समस्या आहे. जर तुमच्या vector database ला शोध घेण्यासाठी डेटा डिक्रिप्ट (decrypt) करावा लागत असेल, तर तुमचे AI खाजगी (private) नाही. ते असुरक्षित आहे.

Vector databases ची सध्याची स्थिती:

  • तुमचा डेटा एम्बेड (embedded) केलेला असतो.
  • सिस्टिम्स कार्य करण्यासाठी तुमचा डेटा पाहतात.
  • विक्रेते म्हणतात की ते ग्राहकाचा डेटा तपासत नाहीत.

ही गोपनीयता (privacy) नाही. हे केवळ विश्वासाची मागणी करणे आहे.

Embeddings मध्ये कंपनीचे अंतर्गत ज्ञान असते. त्यामध्ये संदर्भ आणि संवेदनशील पॅटर्न असतात. जर embeddings सर्व्हरवर डिक्रिप्टेड स्वरूपात असतील, तर डेटा चोरी (breach) झाल्यास त्याचे परिणाम विनाशकारी असू शकतात.

अनेक लोकांचा असा विश्वास आहे की तुम्हाला सुरक्षा आणि वेग यांपैकी एकाची निवड करावी लागेल. त्यांना वाटते की तुम्ही मजबूत गोपनीयता आणि उच्च कार्यक्षमता (high performance) एकाच वेळी मिळवू शकत नाही. हा समज यासाठी आहे कारण बहुतेक सिस्टिम्स डेटाबेसवर केवळ एन्क्रिप्शन (encryption) जोडतात. त्या शोध प्रक्रियेत (search process) ते अंगभूत (built-in) करत नाहीत.

पैसे वाचवण्यासाठी टीम्स अनेकदा तडजोड करतात. कम्प्युट खर्च (compute costs) कमी करण्यासाठी ते कमी अचूकता (accuracy) स्वीकारतात.

खऱ्या Private AI ने वेगळ्या पद्धतीने काम केले पाहिजे. एक खरा Private vector database या गोष्टींची हमी देतो:

  • तुमचा डेटा तुमच्या सिस्टिममधून बाहेर पडण्यापूर्वी तो एन्क्रिप्टेड राहतो.
  • सिस्टिम त्यांना डिक्रिप्ट न करताच embeddings शोधते.

यामुळे गोपनीयता ही केवळ एक 'feature' न राहता ती एक 'requirement' बनते.

विश्वास स्केल (scale) होऊ शकत नाही. जेव्हा टीम्स वाढतात किंवा कॉन्फिगरेशन बदलतात, तेव्हा सिस्टिम्स निकामी ठरतात.

एक खरी सिस्टिम गैरवापराची शक्यता काढून टाकते. जर डेटाबेस डेटा वाचू शकत नसेल, तर डेटा चोरी किंवा सबपीना (subpoena) आल्यावर परिस्थिती बदलून जाते. तुम्ही विक्रेत्यावर किती विश्वास ठेवायचा, हे विचारणे थांबवता. तुमचा डेटा सुरक्षित आहे, याची खात्री तुम्हाला मिळते.

सिस्टिम 10M vectors वर किती वेगाने काम करते, हे विचारणे थांबवा.

सिस्टिम तुमचा डेटा कधीही पाहू शकते का, हे विचारण्यास सुरुवात करा.

विश्वासावर आधारित गोपनीयता वास्तविक जगात अपयशी ठरते. जर तुमच्या डेटाबेसला शोध घेण्यासाठी तुमचा डेटा पाहण्याची गरज असेल, तर तुम्ही केवळ आत्मविश्वासाचे भाडे घेत आहात.

Source: https://dev.to/reenas_27gb/if-your-vector-db-needs-to-see-your-data-to-search-it-youre-not-building-private-ai-youre-1843

Optional learning community: https://t.me/GyaanSetuAi