गुपिते लीक न करता AI चा वापर

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial२ आठवड्यांपूर्वी2min read

गुपिते लीक न करता AI चा वापर करणे

तुम्हाला एक एरर येतो. तुम्ही स्टॅक ट्रेस (stack trace) कॉपी करता. तुम्ही AI ला तो दुरुस्त करायला सांगता. त्या मजकुरात तुमचा DATABASE_URL आणि पासवर्ड आहे, हे तुम्ही विसरता. AI चार सेकंदात उत्तर देते. आता तुमचे गुपित एखाद्या रिक्वेस्ट लॉगमध्ये (request log) किंवा ट्रेनिंग सेटमध्ये (training set) गेले आहे. तुम्ही ते आता हटवू शकत नाही.

AI मध्ये गुपिते पेस्ट करणे म्हणजे ती एखाद्या सार्वजनिक साइटवर पेस्ट करण्यासारखे आहे. तुम्ही ती परत घेऊ शकत नाही.

मी कोड शिप (ship) करण्यासाठी दररोज AI वापरतो. मी ते टाळत नाही. मी ते 'थ्रेट मॉडेल' (threat model) वापरून वापरतो.

बहुतेक लोकांना वाटते की प्रॉम्प्ट (prompt) ही एक खाजगी चॅट आहे. तसे नाहीये. ती एक 'आउटबाउंड रिक्वेस्ट' (outbound request) आहे.

फ्री टियर्स (Free tiers) अनेकदा मॉडेल्सना ट्रेन करण्यासाठी तुमच्या डेटाचा वापर करतात.
पेड टियर्स (Paid tiers) सहसा तुमच्या डेटावर ट्रेन न करण्याचे आश्वासन देतात.
पेड टियर्स देखील गैरवापर शोधण्यासाठी आणि मानवी पुनरावलोकनासाठी (human review) लॉग्स साठवतात.

डेटा तीन प्रकारे लीक होतो:

तुम्ही जे पेस्ट करता: कोड स्निपेट्स (code snippets), कॉन्फिग्स (configs) किंवा ट्रेसेस (traces).
टूल्स आपोआप जे जोडतात: ओपन फाइल्स, रेपो कॉन्टेक्स्ट (repo context) किंवा टर्मिनल आउटपुट.
मॉडेल जे परत पाठवते: PR डिस्क्रिप्शन किंवा लॉगमध्ये पुन्हा दिसणारी गुपिते.

AI प्रदाता (provider) हा एक विश्वसनीय तिसरा पक्ष (third party) आहे. तुम्ही त्यांच्या अंतर्गत पाइपलाइन्सची (internal pipelines) तपासणी करू शकत नाही. प्रॉम्प्ट बॉक्सकडे एका 'अनट्रस्टेड नेटवर्क कॉल' (untrusted network call) प्रमाणे पहा.

या गोष्टी पाठवणे थांबवा:

लाईव्ह API कीज किंवा टोकन्स.
.env फाइल्समधील मजकूर.
प्रायव्हेट कीज किंवा सर्टिफिकेट्स.
ग्राहकांची खरी नावे, ईमेल किंवा पेमेंट डेटा.
तुमचा मालकी हक्क असलेला (proprietary) लॉजिक जो तुम्ही ओपन-सोर्स करणार नाही.

त्याऐवजी प्लेसहोल्डर्स (placeholders) वापरा. [API_KEY] किंवा [DB_PASSWORD] वापरा. मास्क (masks) वापरूनही AI तितक्याच चांगल्या प्रकारे काम करते.

या तीन सवयी लावा:

AI 'इग्नोर फाईल' (ignore file) वापरा. .env आणि सिक्रेट फोल्डर्स टूलच्या कॉन्टेक्स्टच्या बाहेर ठेवा.
पाठवण्यापूर्वी स्कॅन करा. पेस्ट करण्यापूर्वी तुमच्या मजकुरावर 'सिक्रेट डिटेक्टर' (secret detector) चालवा.
गुपिते एनक्रिप्टेड (encrypted) ठेवा. जर गुपिते फक्त रनटाइमला मेमरीमध्ये असतील, तर तुम्ही ती पेस्ट करू शकत नाही.

तुमच्या पर्यायांचा सारांश:

फ्री/कंझ्युमर (Free/Consumer): सार्वजनिक डॉक्युमेंट्स किंवा तात्पुरत्या स्निपेट्ससाठी वापरा.
पेड प्रो/टीम (Paid Pro/Team): बहुतेक इंजिनिअरिंग कामासाठी वापरा. यामध्ये करारात्मक संरक्षण (contractual protections) असते.
लोकल/सेल्फ-होस्टेड (Local/Self-hosted): नियमांच्या अधीन असलेल्या डेटासाठी वापरा जो तुमच्या मशीनवरच राहणे आवश्यक आहे.

'नो-ट्रेनिंग गॅरंटी' (no-training guarantee) हा एक करार आहे. तो तांत्रिक कवच (technical shield) नाही. तो धोका कमी करतो पण तो पूर्णपणे संपवत नाही.

AI तुमच्या कोडला स्पर्श करण्यापूर्वी या पायऱ्या फॉलो करा:

तुमच्या AI टूल्ससाठी एक 'इग्नोर फाईल' जोडा.
तुम्ही जे काही पेस्ट करता ते स्कॅन करा.
सर्व क्रेडेंशियल्स (credentials) प्लेसहोल्डर्सने मास्क करा.
मालकी हक्क असलेल्या (proprietary) कामासाठी पेड टियर्स वापरा.
गुपिते प्लेनटेक्स्टमधून (plaintext) बाहेर ठेवण्यासाठी KMS वापरा.
AI आउटपुट तुमच्या लॉग्स किंवा कमिट्समध्ये जाण्यापूर्वी त्याची पुनरावलोकन करा.

चार सेकंदाचे उत्तर अजूनही जलद आहे. फक्त त्याची किंमत तुमच्या सुरक्षिततेच्या रूपाने मोजावी लागू नये.

Source: https://dev.to/faizahmedfarooqui/using-ai-without-leaking-your-secrets-a-threat-model-for-ai-assisted-development-2l57

Optional learning community: https://t.me/GyaanSetuAi

गुपिते लीक न करता AI चा वापर

गुपिते लीक न करता AI चा वापर करणे

Continue reading

लोक खरोखर पाळतील अशी AI वापराची धोरणे मी कशी तयार करतो

लपवणे म्हणजे सुरक्षित करणे नव्हे

मी एक असा AI इन्सिडेंट कोपायलट बनवला आहे जो तुमचे लॉग्स साठवत नाही

कोड शिप करण्यासाठी मी AI चा वापर कसा करतो