Prompt Injection Savunması: Üretim Ortamı Guardrail Rehberi

Prompt injection, yapay zeka için büyük bir tehdittir.

Saldırganlar, talimatları verilerin içine gizlerler. Modelinizin sizin niyetinizi değil, kendi niyetlerini takip etmesini isterler. Bu risk, Büyük Dil Modeli Uygulamaları için OWASP listesinin en başında yer almaktadır.

Sorun basittir. LLM'ler tüm metinleri aynı şekilde görür. Model, sistem talimatlarınız ile işlediği veriler arasındaki farkı ayırt edemez. Model için her şey sadece metindir. Bu durum, güvenlik açığını gidermeyi zorlaştırır.

İki tür saldırı vardır:

  • Doğrudan enjeksiyon (Direct injection): Bir kullanıcı, uygulamanıza doğrudan kötü niyetli talimatlar yazar.
  • Dolaylı enjeksiyon (Indirect injection): Bir saldırgan, modelinizin okuduğu verilerin içine talimatlar gizler.

Üretim ortamınızı korumak için guardrail'lere ihtiyacınız vardır.

Makalenin tamamını AI Tech Connect üzerinden okuyun.

Kaynak: https://dev.to/rishi_kora/prompt-injection-defence-a-production-guardrails-playbook-2pam

İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi