Using AI zonder geheimen te lekken
Je krijgt een foutmelding. Je kopieert de stack trace. Je vraagt de AI om het op te lossen. Je vergeet dat je DATABASE_URL en wachtwoord in die tekst staan. De AI geeft binnen vier seconden antwoord. Nu staat je geheim in een request-log of een trainingset. Je kunt het niet meer verwijderen.
Geheimen in een AI plakken is hetzelfde als ze op een publieke site plakken. Je kunt ze niet meer terugnemen.
Ik gebruik AI elke dag om code te pushen. Ik vermijd het niet. Ik gebruik het met een threat model.
De meeste mensen denken dat een prompt een privéchat is. Dat is het niet. Het is een uitgaand verzoek.
- Gratis versies gebruiken je gegevens vaak om modellen te trainen.
- Betaalde versies beloven meestal niet om op jouw gegevens te trainen.
- Zelfs betaalde versies slaan logs op voor misbruikdetectie en menselijke controle.
Gegevens lekken op drie manieren:
- Wat je plakt: codefragmenten, configuraties of traces.
- Wat tools automatisch toevoegen: open bestanden, repo-context of terminal-output.
- Wat het model terugstuurt: geëchoïde geheimen in een PR-beschrijving of log.
De AI-provider is een vertrouwde derde partij. Je kunt hun interne pipelines niet auditen. Behandel het prompt-veld als een onbetrouwbare netwerkoproep.
Stop met het versturen van dit soort zaken:
- Live API-sleutels of tokens.
- Inhoud van .env-bestanden.
- Private keys of certificaten.
- Echte klantnamen, e-mailadressen of betalingsgegevens.
- Propriëtaire logica die je niet als open source zou publiceren.
Gebruik in plaats daarvan placeholders. Gebruik [API_KEY] of [DB_PASSWORD]. De AI werkt net zo goed met maskering.
Bouw deze drie gewoontes op:
- Gebruik een AI ignore-bestand. Houd .env- en geheime mappen buiten de context van de tool.
- Scan voordat je verstuurt. Draai een secret detector op je tekst voordat je deze plakt.
- Houd geheimen versleuteld. Als geheimen alleen in het geheugen bestaan tijdens runtime, kun je ze niet plakken.
Een samenvatting van je opties:
- Gratis/Consument: Gebruik voor publieke documentatie of tijdelijke codefragmenten.
- Betaald Pro/Team: Gebruik voor het meeste engineeringwerk. Dit biedt contractuele bescherming.
- Lokaal/Self-hosted: Gebruik voor gereguleerde gegevens die op je eigen machine moeten blijven.
Een garantie dat er niet getraind wordt, is een contract. Het is geen technisch schild. Het verlaagt het risico, maar heft het niet op.
Volg deze stappen voordat AI je code aanraakt:
- Voeg een ignore-bestand toe voor je AI-tools.
- Scan alles wat je plakt.
- Maskeer alle inloggegevens met placeholders.
- Gebruik betaalde versies voor propriëtair werk.
- Gebruik een KMS om geheimen uit plaintext te houden.
- Controleer de AI-output voordat deze in je logs of commits terechtkomt.
Het antwoord binnen vier seconden is nog steeds snel. Het kost je alleen niet je veiligheid.
Optional learning community: https://t.me/GyaanSetuAi
