𝗜𝗳 𝗬𝗼𝘂𝗿 𝗩𝗲𝗰𝘁𝗼𝗿 𝗗𝗕 𝗦𝗲𝗲𝘀 𝗬𝗼𝘂𝗿 𝗗𝗮𝘁𝗮, 𝗬𝗼𝘂 𝗔𝗿𝗲 𝗥𝗲𝗻𝘁𝗶𝗻𝗴 𝗖𝗼𝗻𝗳𝗶𝗱𝗲𝗻𝗰𝗲
Private AI എന്നത് ഒരു പ്രചാരത്തിലുള്ള വാക്കാണ് (buzzword).
വെണ്ടർമാർ (Vendors) ഓരോ സ്ലൈഡിലും പൂട്ടുകളുടെ (lock icons) ചിത്രങ്ങൾ വെക്കുന്നു. അവർ ഡിസൈൻ അടിസ്ഥാനമാക്കിയുള്ള സുരക്ഷ വാഗ്ദാനം ചെയ്യുന്നു.
എന്നാൽ ഇവിടെ ഒരു പ്രശ്നമുണ്ട്. നിങ്ങളുടെ Vector DB ഡാറ്റ സെർച്ച് ചെയ്യുന്നതിനായി അത് ഡീക്രിപ്റ്റ് (decrypt) ചെയ്യേണ്ടി വരുന്നുണ്ടെങ്കിൽ, നിങ്ങളുടെ AI സ്വകാര്യമായിട്ടല്ല പ്രവർത്തിക്കുന്നത്. അത് വെളിപ്പെട്ട അവസ്ഥയിലാണ്.
നിലവിലെ Vector Databases-ന്റെ അവസ്ഥ:
- നിങ്ങളുടെ ഡാറ്റ എംബെഡ് (embedded) ചെയ്യപ്പെട്ടിരിക്കുന്നു.
- സിസ്റ്റങ്ങൾ പ്രവർത്തിക്കുന്നതിനായി നിങ്ങളുടെ ഡാറ്റ കാണുന്നു.
- ഉപഭോക്താക്കളുടെ ഡാറ്റ പരിശോധിക്കുന്നില്ലെന്ന് വെണ്ടർമാർ പറയുന്നു.
അത് സ്വകാര്യതയല്ല. അത് വിശ്വാസം ആവശ്യപ്പെടലാണ്.
എംബെഡിംഗുകളിൽ (Embeddings) കമ്പനിയുടെ ആന്തരിക അറിവുകൾ അടങ്ങിയിരിക്കുന്നു. അവയിൽ സന്ദർഭങ്ങളും (context) സെൻസിറ്റീവ് ആയ പാറ്റേണുകളും അടങ്ങിയിട്ടുണ്ട്. എംബെഡിംഗുകൾ ഒരു സെർവറിൽ ഡീക്രിപ്റ്റ് ചെയ്ത അവസ്ഥയിൽ ഇരിക്കുകയാണെങ്കിൽ, ഒരു ഡാറ്റാ ചോർച്ച (breach) വലിയ ദുരന്തമായി മാറും.
സുരക്ഷയും വേഗതയും തമ്മിൽ ഒന്നിൽ നിന്ന് മറ്റൊന്ന് തിരഞ്ഞെടുക്കണമെന്ന് പലരും വിശ്വസിക്കുന്നു. ശക്തമായ സ്വകാര്യതയും ഉയർന്ന പ്രകടനവും (high performance) ഒരേസമയം ലഭിക്കില്ലെന്ന് അവർ കരുതുന്നു. മിക്ക സിസ്റ്റങ്ങളും ഡാറ്റാബേസിന് മുകളിൽ എൻക്രിപ്ഷൻ (encryption) ചേർക്കുന്നതുകൊണ്ടാണ് ഈ വിശ്വാസം നിലനിൽക്കുന്നത്. അവർ അത് സെർച്ച് പ്രക്രിയയുടെ ഭാഗമായി നിർമ്മിക്കുന്നില്ല.
പണം ലാഭിക്കാനായി ടീമുകൾ പലപ്പോഴും വിട്ടുവീഴ്ചകൾ ചെയ്യാറുണ്ട്. കമ്പ്യൂട്ട് ചിലവ് (compute costs) കുറയ്ക്കുന്നതിനായി കുറഞ്ഞ കൃത്യത (accuracy) അവർ അംഗീകരിക്കുന്നു.
യഥാർത്ഥ Private AI വ്യത്യസ്തമായിരിക്കണം പ്രവർത്തിക്കുന്നത്. യഥാർത്ഥമായ ഒരു പ്രൈവറ്റ് Vector Database ഇവ ഉറപ്പുനൽകുന്നു:
- നിങ്ങളുടെ സിസ്റ്റത്തിൽ നിന്ന് പുറത്തുപോകുന്നതിന് മുമ്പ് ഡാറ്റ എൻക്രിപ്റ്റ് ചെയ്ത അവസ്ഥയിൽ തന്നെ ഇരിക്കുന്നു.
- ഡീക്രിപ്റ്റ് ചെയ്യാതെ തന്നെ സിസ്റ്റം എംബെഡിംഗുകൾ സെർച്ച് ചെയ്യുന്നു.
ഇത് സ്വകാര്യതയെ ഒരു ഫീച്ചറിൽ നിന്ന് ഒരു അനിവാര്യതയാക്കി മാറ്റുന്നു.
വിശ്വാസം എന്നത് സ്കെയിലബിൾ (scale) ആയ ഒന്നല്ല. ടീമുകൾ വളരുമ്പോഴോ കോൺഫിഗറേഷനുകൾ (configurations) മാറുമ്പോഴോ സിസ്റ്റങ്ങൾ പരാജയപ്പെടുന്നു.
ഒരു യഥാർത്ഥ സിസ്റ്റം ദുരുപയോഗത്തിനുള്ള സാധ്യത ഇല്ലാതാക്കുന്നു. ഡാറ്റാബേസിന് ഡാറ്റ വായിക്കാൻ കഴിയില്ലെങ്കിൽ, ഒരു ഡാറ്റാ ചോർച്ചയോ അല്ലെങ്കിൽ ഒരു കോടതി ഉത്തരവോ (subpoena) വന്നാൽ പോലും കാര്യങ്ങൾ മാറും. നിങ്ങൾ ഒരു വെണ്ടറെ എത്രത്തോളം വിശ്വസിക്കണം എന്ന് ചോദിക്കുന്നത് നിർത്തുന്നു. പകരം നിങ്ങളുടെ ഡാറ്റ സുരക്ഷിതമാണെന്ന് നിങ്ങൾക്ക് ഉറപ്പായിത്തുടങ്ങുന്നു.
10M വെക്റ്ററുകളിൽ ഒരു സിസ്റ്റം എത്ര വേഗത്തിൽ പ്രവർത്തിക്കുന്നു എന്ന് ചോദിക്കുന്നത് നിർത്തുക.
സിസ്റ്റത്തിന് നിങ്ങളുടെ ഡാറ്റ എപ്പോഴെങ്കിലും കാണാൻ കഴിയുമോ എന്ന് ചോദിച്ചു തുടങ്ങുക.
വിശ്വാസത്തെ അടിസ്ഥാനമാക്കിയുള്ള സ്വകാര്യത യഥാർത്ഥ ലോകത്ത് പരാജയപ്പെടുന്നു. സെർച്ച് ചെയ്യുന്നതിനായി നിങ്ങളുടെ ഡാറ്റാബേസിന് നിങ്ങളുടെ ഡാറ്റ കാണേണ്ടതുണ്ടെങ്കിൽ, നിങ്ങൾ ആത്മവിശ്വാസം വാടകയ്ക്കെടുക്കുക മാത്രമാണ് ചെയ്യുന്നത്.
Optional learning community: https://t.me/GyaanSetuAi