गुपिते लीक न करता AI चा वापर करणे
तुम्हाला एक एरर येतो. तुम्ही स्टॅक ट्रेस (stack trace) कॉपी करता. तुम्ही AI ला तो दुरुस्त करायला सांगता. त्या मजकुरात तुमचा DATABASE_URL आणि पासवर्ड आहे, हे तुम्ही विसरता. AI चार सेकंदात उत्तर देते. आता तुमचे गुपित एखाद्या रिक्वेस्ट लॉगमध्ये (request log) किंवा ट्रेनिंग सेटमध्ये (training set) गेले आहे. तुम्ही ते आता हटवू शकत नाही.
AI मध्ये गुपिते पेस्ट करणे म्हणजे ती एखाद्या सार्वजनिक साइटवर पेस्ट करण्यासारखे आहे. तुम्ही ती परत घेऊ शकत नाही.
मी कोड शिप (ship) करण्यासाठी दररोज AI वापरतो. मी ते टाळत नाही. मी ते 'थ्रेट मॉडेल' (threat model) वापरून वापरतो.
बहुतेक लोकांना वाटते की प्रॉम्प्ट (prompt) ही एक खाजगी चॅट आहे. तसे नाहीये. ती एक 'आउटबाउंड रिक्वेस्ट' (outbound request) आहे.
- फ्री टियर्स (Free tiers) अनेकदा मॉडेल्सना ट्रेन करण्यासाठी तुमच्या डेटाचा वापर करतात.
- पेड टियर्स (Paid tiers) सहसा तुमच्या डेटावर ट्रेन न करण्याचे आश्वासन देतात.
- पेड टियर्स देखील गैरवापर शोधण्यासाठी आणि मानवी पुनरावलोकनासाठी (human review) लॉग्स साठवतात.
डेटा तीन प्रकारे लीक होतो:
- तुम्ही जे पेस्ट करता: कोड स्निपेट्स (code snippets), कॉन्फिग्स (configs) किंवा ट्रेसेस (traces).
- टूल्स आपोआप जे जोडतात: ओपन फाइल्स, रेपो कॉन्टेक्स्ट (repo context) किंवा टर्मिनल आउटपुट.
- मॉडेल जे परत पाठवते: PR डिस्क्रिप्शन किंवा लॉगमध्ये पुन्हा दिसणारी गुपिते.
AI प्रदाता (provider) हा एक विश्वसनीय तिसरा पक्ष (third party) आहे. तुम्ही त्यांच्या अंतर्गत पाइपलाइन्सची (internal pipelines) तपासणी करू शकत नाही. प्रॉम्प्ट बॉक्सकडे एका 'अनट्रस्टेड नेटवर्क कॉल' (untrusted network call) प्रमाणे पहा.
या गोष्टी पाठवणे थांबवा:
- लाईव्ह API कीज किंवा टोकन्स.
.envफाइल्समधील मजकूर.- प्रायव्हेट कीज किंवा सर्टिफिकेट्स.
- ग्राहकांची खरी नावे, ईमेल किंवा पेमेंट डेटा.
- तुमचा मालकी हक्क असलेला (proprietary) लॉजिक जो तुम्ही ओपन-सोर्स करणार नाही.
त्याऐवजी प्लेसहोल्डर्स (placeholders) वापरा. [API_KEY] किंवा [DB_PASSWORD] वापरा. मास्क (masks) वापरूनही AI तितक्याच चांगल्या प्रकारे काम करते.
या तीन सवयी लावा:
- AI 'इग्नोर फाईल' (ignore file) वापरा.
.envआणि सिक्रेट फोल्डर्स टूलच्या कॉन्टेक्स्टच्या बाहेर ठेवा. - पाठवण्यापूर्वी स्कॅन करा. पेस्ट करण्यापूर्वी तुमच्या मजकुरावर 'सिक्रेट डिटेक्टर' (secret detector) चालवा.
- गुपिते एनक्रिप्टेड (encrypted) ठेवा. जर गुपिते फक्त रनटाइमला मेमरीमध्ये असतील, तर तुम्ही ती पेस्ट करू शकत नाही.
तुमच्या पर्यायांचा सारांश:
- फ्री/कंझ्युमर (Free/Consumer): सार्वजनिक डॉक्युमेंट्स किंवा तात्पुरत्या स्निपेट्ससाठी वापरा.
- पेड प्रो/टीम (Paid Pro/Team): बहुतेक इंजिनिअरिंग कामासाठी वापरा. यामध्ये करारात्मक संरक्षण (contractual protections) असते.
- लोकल/सेल्फ-होस्टेड (Local/Self-hosted): नियमांच्या अधीन असलेल्या डेटासाठी वापरा जो तुमच्या मशीनवरच राहणे आवश्यक आहे.
'नो-ट्रेनिंग गॅरंटी' (no-training guarantee) हा एक करार आहे. तो तांत्रिक कवच (technical shield) नाही. तो धोका कमी करतो पण तो पूर्णपणे संपवत नाही.
AI तुमच्या कोडला स्पर्श करण्यापूर्वी या पायऱ्या फॉलो करा:
- तुमच्या AI टूल्ससाठी एक 'इग्नोर फाईल' जोडा.
- तुम्ही जे काही पेस्ट करता ते स्कॅन करा.
- सर्व क्रेडेंशियल्स (credentials) प्लेसहोल्डर्सने मास्क करा.
- मालकी हक्क असलेल्या (proprietary) कामासाठी पेड टियर्स वापरा.
- गुपिते प्लेनटेक्स्टमधून (plaintext) बाहेर ठेवण्यासाठी KMS वापरा.
- AI आउटपुट तुमच्या लॉग्स किंवा कमिट्समध्ये जाण्यापूर्वी त्याची पुनरावलोकन करा.
चार सेकंदाचे उत्तर अजूनही जलद आहे. फक्त त्याची किंमत तुमच्या सुरक्षिततेच्या रूपाने मोजावी लागू नये.
Optional learning community: https://t.me/GyaanSetuAi
