𝗜𝗳 𝗬𝗼𝘂𝗿 𝗩𝗲𝗰𝘁𝗼𝗿 𝗗𝗕 𝗦𝗲𝗲𝘀 𝗬𝗼𝘂𝗿 𝗗𝗮𝘁𝗮, 𝗬𝗼𝘂 𝗔𝗿𝗲 𝗥𝗲𝗻𝘁𝗶𝗻𝗴 𝗖𝗼𝗻𝗳𝗶𝗱𝗲𝗻𝗰𝗲

Private AI ಎಂಬುದು ಒಂದು ಪ್ರಚಲಿತ ಪದ (buzzword).

ಮಾರಾಟಗಾರರು (Vendors) ಪ್ರತಿಯೊಂದು ಸ್ಲೈಡ್ ಮೇಲೂ ಲಾಕ್ ಐಕಾನ್‌ಗಳನ್ನು ಹಾಕುತ್ತಾರೆ. ಅವರು ವಿನ್ಯಾಸದ ಮೂಲಕವೇ ಭದ್ರತೆಯನ್ನು ನೀಡುವ ಭರವಸೆ ನೀಡುತ್ತಾರೆ.

ಆದರೆ ಇಲ್ಲಿ ಒಂದು ಸಮಸ್ಯೆಯಿದೆ. ನಿಮ್ಮ vector database ಡೇಟಾವನ್ನು ಹುಡುಕಲು ಅದನ್ನು ಡೀಕ್ರಿಪ್ಟ್ (decrypt) ಮಾಡಬೇಕಾಗಿದ್ದರೆ, ನಿಮ್ಮ AI ಖಾಸಗಿಯಾಗಿಲ್ಲ ಎಂದರ್ಥ. ಅದು ಬಹಿರಂಗವಾಗಿದೆ.

Vector databases ಗಳ ಪ್ರಸ್ತುತ ಸ್ಥಿತಿ:

  • ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಎಂಬೆಡ್ (embed) ಮಾಡಲಾಗುತ್ತದೆ.
  • ವ್ಯವಸ್ಥೆಗಳು ಕಾರ್ಯನಿರ್ವಹಿಸಲು ನಿಮ್ಮ ಡೇಟಾವನ್ನು ನೋಡುತ್ತವೆ.
  • ಗ್ರಾಹಕರ ಡೇಟಾವನ್ನು ನಾವು ಪರಿಶೀಲಿಸುವುದಿಲ್ಲ ಎಂದು ಮಾರಾಟಗಾರರು ಹೇಳುತ್ತಾರೆ.

ಅದು ಗೌಪ್ಯತೆಯಲ್ಲ (privacy). ಅದು ಕೇವಲ ನಂಬಿಕೆಯನ್ನು ಕೇಳುವುದುವಷ್ಟೇ.

Embeddings ಗಳು ಕಂಪನಿಯ ಆಂತರಿಕ ಜ್ಞಾನವನ್ನು ಒಳಗೊಂಡಿರುತ್ತವೆ. ಅವು ಸಂದರ್ಭ ಮತ್ತು ಸೂಕ್ಷ್ಮ ಮಾದರಿಗಳನ್ನು (sensitive patterns) ಹೊಂದಿರುತ್ತವೆ. ಒಂದು ವೇಳೆ embeddings ಸರ್ವರ್‌ನಲ್ಲಿ ಡೀಕ್ರಿಪ್ಟ್ ಆಗಿಟ್ಟರೆ, ಡೇಟಾ ಸೋರಿಕೆಯಾದಾಗ ಅದು ವಿನಾಶಕಾರಿಯಾಗಿರುತ್ತದೆ.

ಭದ್ರತೆ ಮತ್ತು ವೇಗದ ನಡುವೆ ನೀವು ಯಾವುದನ್ನಾದರೂ ಒಂದನ್ನು ಆರಿಸಿಕೊಳ್ಳಬೇಕು ಎಂದು ಅನೇಕರು ನಂಬುತ್ತಾರೆ. ಬಲವಾದ ಗೌಪ್ಯತೆ ಮತ್ತು ಹೆಚ್ಚಿನ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಏಕಕಾಲದಲ್ಲಿ ಹೊಂದಲು ಸಾಧ್ಯವಿಲ್ಲ ಎಂದು ಅವರು ಭಾವಿಸುತ್ತಾರೆ. ಹೆಚ್ಚಿನ ವ್ಯವಸ್ಥೆಗಳು ಡೇಟಾಬೇಸ್ ಮೇಲೆ ಕೇವಲ ಎನ್‌ಕ್ರಿಪ್ಶನ್ (encryption) ಅನ್ನು ಸೇರಿಸುವುದರಿಂದ ಈ ನಂಬಿಕೆ ಮೂಡಿಬಂದಿದೆ. ಅವು ಹುಡುಕಾಟದ ಪ್ರಕ್ರಿಯೆಯಲ್ಲೇ (search process) ಅದನ್ನು ಅಳವಡಿಸುವುದಿಲ್ಲ.

ಹಣ ಉಳಿಸಲು ತಂಡಗಳು ಹೆಚ್ಚಾಗಿ ರಾಜಿ ಮಾಡಿಕೊಳ್ಳುತ್ತವೆ. ಕಂಪ್ಯೂಟ್ ವೆಚ್ಚವನ್ನು (compute costs) ಕಡಿಮೆ ಮಾಡಲು ಅವರು ಕಡಿಮೆ ನಿಖರತೆಯನ್ನು (accuracy) ಒಪ್ಪಿಕೊಳ್ಳುತ್ತಾರೆ.

ನಿಜವಾದ Private AI ವಿಭಿನ್ನವಾಗಿ ಕೆಲಸ ಮಾಡಬೇಕು. ನೈಜವಾದ private vector database ಈ ಕೆಳಗಿನವುಗಳನ್ನು ಖಾತರಿಪಡಿಸುತ್ತದೆ:

  • ನಿಮ್ಮ ವ್ಯವಸ್ಥೆಯಿಂದ ಹೊರಹೋಗುವ ಮೊದಲು ಡೇಟಾ ಎನ್‌ಕ್ರಿಪ್ಟ್ ಆಗಿಯೇ ಇರುತ್ತದೆ.
  • ವ್ಯವಸ್ಥೆಯು ಎಂಬೆಡ್‌ಗಳನ್ನು ಡೀಕ್ರಿಪ್ಟ್ ಮಾಡದೆ ಹುಡುಕುತ್ತದೆ.

ಇದು ಗೌಪ್ಯತೆಯನ್ನು ಕೇವಲ ಒಂದು ವೈಶಿಷ್ಟ್ಯದಿಂದ (feature) ಅಗತ್ಯತೆಯನ್ನಾಗಿ (requirement) ಬದಲಾಯಿಸುತ್ತದೆ.

ನಂಬಿಕೆಯು ವಿಸ್ತರಿಸಲು ಸಾಧ್ಯವಿಲ್ಲ (Trust does not scale). ತಂಡಗಳು ಬೆಳೆದಾಗ ಅಥವಾ ಕಾನ್ಫಿಗರೇಶನ್‌ಗಳು ಬದಲಾದಾಗ ವ್ಯವಸ್ಥೆಗಳು ವಿಫಲವಾಗುತ್ತವೆ.

ನೈಜ ವ್ಯವಸ್ಥೆಯು ದುರುಪಯೋಗದ ಸಾಧ್ಯತೆಯನ್ನು ಹೋಗಲಾಡಿಸುತ್ತದೆ. ಡೇಟಾಬೇಸ್ ಡೇಟಾವನ್ನು ಓದಲು ಸಾಧ್ಯವಾಗದಿದ್ದರೆ, ಡೇಟಾ ಸೋರಿಕೆ ಅಥವಾ ಸಬ್ಪೀನಾ (subpoena - ನ್ಯಾಯಾಲಯದ ಸೂಚನೆ) ಬಂದರೂ ಪರಿಸ್ಥಿತಿ ಬದಲಾಗುತ್ತದೆ. ನೀವು ಮಾರಾಟಗಾರನನ್ನು ಎಷ್ಟು ನಂಬಬೇಕು ಎಂದು ಕೇಳುವುದನ್ನು ನಿಲ್ಲಿಸುತ್ತೀರಿ. ಬದಲಾಗಿ ನಿಮ್ಮ ಡೇಟಾ ಸುರಕ್ಷಿತವಾಗಿದೆ ಎಂಬ ಅರಿವು ನಿಮಗೆ ಇರುತ್ತದೆ.

10M ವೆಕ್ಟರ್‌ಗಳ ಮೇಲೆ ಒಂದು ವ್ಯವಸ್ಥೆ ಎಷ್ಟು ವೇಗವಾಗಿದೆ ಎಂದು ಕೇಳುವುದನ್ನು ನಿಲ್ಲಿಸಿ.

ವ್ಯವಸ್ಥೆಯು ಎಂದಾದರೂ ನಿಮ್ಮ ಡೇಟಾವನ್ನು ನೋಡಲು ಸಾಧ್ಯವೇ ಎಂದು ಕೇಳಲು ಪ್ರಾರಂಭಿಸಿ.

ನಂಬಿಕೆಯ ಆಧಾರಿತ ಗೌಪ್ಯತೆಯು ನೈಜ ಜಗತ್ತಿನಲ್ಲಿ ವಿಫಲವಾಗುತ್ತದೆ. ನಿಮ್ಮ ಡೇಟಾಬೇಸ್ ಡೇಟಾವನ್ನು ಹುಡುಕಲು ಅದನ್ನು ನೋಡಬೇಕಾಗಿದ್ದರೆ, ನೀವು ಕೇವಲ ಭರವಸೆಯನ್ನು ಬಾಡಿಗೆಗೆ ಪಡೆಯುತ್ತಿದ್ದೀರಿ ಎಂದರ್ಥ.

Source: https://dev.to/reenas_27gb/if-your-vector-db-needs-to-see-your-data-to-search-it-youre-not-building-private-ai-youre-1843

Optional learning community: https://t.me/GyaanSetuAi