Utiliser l'IA sans divulguer de secrets

Vous rencontrez une erreur. Vous copiez la stack trace. Vous demandez à l'IA de la corriger. Vous oubliez que votre DATABASE_URL et votre mot de passe se trouvent dans ce texte. L'IA répond en quatre secondes. Désormais, votre secret se trouve dans un journal de requêtes ou un ensemble d'entraînement. Vous ne pouvez pas le supprimer.

Coller des secrets dans une IA revient à les coller sur un site public. Vous ne pouvez pas les retirer.

J'utilise l'IA tous les jours pour livrer du code. Je ne l'évite pas. Je l'utilise avec un modèle de menace.

La plupart des gens pensent qu'un prompt est une discussion privée. Ce n'est pas le cas. C'est une requête sortante.

  • Les versions gratuites utilisent souvent vos données pour entraîner des modèles.
  • Les versions payantes promettent généralement de ne pas s'entraîner sur vos données.
  • Même les versions payantes conservent des journaux pour la détection d'abus et la révision humaine.

Les fuites de données se produisent de trois manières :

  • Ce que vous collez : extraits de code, configurations ou traces.
  • Ce que les outils attachent automatiquement : fichiers ouverts, contexte du dépôt ou sortie du terminal.
  • Ce que le modèle renvoie : des secrets répétés dans une description de PR ou un journal.

Le fournisseur d'IA est un tiers de confiance. Vous ne pouvez pas auditer leurs pipelines internes. Traitez la zone de saisie du prompt comme un appel réseau non fiable.

Arrêtez d'envoyer ceci :

  • Clés API ou jetons (tokens) actifs.
  • Contenu des fichiers .env.
  • Clés privées ou certificats.
  • Noms réels de clients, e-mails ou données de paiement.
  • Logique propriétaire que vous ne rendriez pas open-source.

Utilisez des espaces réservés (placeholders) à la place. Utilisez [API_KEY] ou [DB_PASSWORD]. L'IA fonctionne tout aussi bien avec des masques.

Adoptez ces trois habitudes :

  • Utilisez un fichier d'exclusion (ignore file) pour l'IA. Gardez les fichiers .env et les dossiers de secrets hors du contexte de l'outil.
  • Analysez avant d'envoyer. Exécutez un détecteur de secrets sur votre texte avant de le coller.
  • Gardez les secrets chiffrés. Si les secrets n'existent qu'en mémoire lors de l'exécution, vous ne pouvez pas les coller.

Résumé de vos options :

  • Gratuit/Grand public : Utilisez pour de la documentation publique ou des extraits jetables.
  • Payant Pro/Équipe : Utilisez pour la plupart des travaux d'ingénierie. Il offre des protections contractuelles.
  • Local/Auto-hébergé : Utilisez pour les données réglementées qui doivent rester sur votre machine.

Une garantie de non-entraînement est un contrat. Ce n'est pas un bouclier technique. Cela réduit le risque, mais ne l'élimine pas.

Suivez ces étapes avant que l'IA ne touche à votre code :

  • Ajoutez un fichier d'exclusion pour vos outils d'IA.
  • Analysez tout ce que vous collez.
  • Masquez tous les identifiants avec des espaces réservés.
  • Utilisez les versions payantes pour le travail propriétaire.
  • Utilisez un KMS pour éviter que les secrets ne soient en clair.
  • Révisez la sortie de l'IA avant qu'elle n'atteigne vos journaux ou vos commits.

La réponse en quatre secondes est toujours rapide. Elle ne vous coûtera simplement pas votre sécurité.

Source : https://dev.to/faizahmedfarooqui/using-ai-without-leaking-your-secrets-a-threat-model-for-ai-assisted-development-2l57

Communauté d'apprentissage optionnelle : https://t.me/GyaanSetuAi