Usando IA sem vazar segredos

Você encontra um erro. Você copia o stack trace. Você pede para a IA corrigi-lo. Você esquece que sua DATABASE_URL e senha estão naquele texto. A IA responde em quatro segundos. Agora seu segredo está em um log de requisição ou em um conjunto de treinamento. Você não pode apagá-lo.

Colar segredos em uma IA é como colá-los em um site público. Você não pode pegá-los de volta.

Eu uso IA todos os dias para entregar código. Eu não a evito. Eu a utilizo com um modelo de ameaças.

A maioria das pessoas pensa que um prompt é um chat privado. Não é. É uma requisição de saída.

  • Níveis gratuitos costumam usar seus dados para treinar modelos.
  • Níveis pagos geralmente prometem não treinar com seus dados.
  • Mesmo os níveis pagos armazenam logs para detecção de abuso e revisão humana.

Os dados vazam de três maneiras:

  • O que você cola: trechos de código, configurações ou traces.
  • O que as ferramentas anexam automaticamente: arquivos abertos, contexto do repositório ou saída do terminal.
  • O que o modelo envia de volta: segredos repetidos em uma descrição de PR ou log.

O provedor de IA é um terceiro de confiança. Você não pode auditar seus pipelines internos. Trate a caixa de prompt como uma chamada de rede não confiável.

Pare de enviar estes itens:

  • Chaves de API ou tokens ativos.
  • Conteúdo de arquivos .env.
  • Chaves privadas ou certificados.
  • Nomes reais de clientes, e-mails ou dados de pagamento.
  • Lógica proprietária que você não tornaria open-source.

Use placeholders em vez disso. Use [API_KEY] ou [DB_PASSWORD]. A IA funciona tão bem quanto com máscaras.

Crie estes três hábitos:

  • Use um arquivo de ignore para IA. Mantenha arquivos .env e pastas de segredos fora do contexto da ferramenta.
  • Escaneie antes de enviar. Execute um detector de segredos no seu texto antes de colar.
  • Mantenha os segredos criptografados. Se os segredos existirem apenas na memória em tempo de execução, você não poderá colá-los.

Um resumo das suas opções:

  • Gratuito/Consumidor: Use para documentação pública ou trechos descartáveis.
  • Pago Pro/Team: Use para a maior parte do trabalho de engenharia. Possui proteções contratuais.
  • Local/Self-hosted: Use para dados regulamentados que devem permanecer na sua máquina.

Uma garantia de não treinamento é um contrato. Não é um escudo técnico. Ela reduz o risco, mas não o elimina.

Siga estes passos antes que a IA toque no seu código:

  • Adicione um arquivo de ignore para suas ferramentas de IA.
  • Escaneie tudo o que você colar.
  • Mascare todas as credenciais com placeholders.
  • Use níveis pagos para trabalho proprietário.
  • Use um KMS para manter os segredos fora de texto simples.
  • Revise a saída da IA antes que ela chegue aos seus logs ou commits.

A resposta de quatro segundos ainda é rápida. Ela apenas não custará a sua segurança.

Fonte: https://dev.to/faizahmedfarooqui/using-ai-without-leaking-your-secrets-a-threat-model-for-ai-assisted-development-2l57

Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi