𝗟𝗟𝗠 𝗣𝗿𝗼𝗺𝗽𝘁 𝗜𝗻𝗷𝗲𝗰𝘁𝗶𝗼𝗻 𝘃𝗲 𝗚𝘂𝗮𝗿𝗱𝗿𝗮𝗶𝗹 𝗚ü𝘃𝗲𝗻𝗹𝗶𝗴𝗶

LLM'lerin talimatlar ve veriler arasında kesin bir sınırı yoktur. Bağlam penceresindeki (context window) her şey tek bir token akışıdır. Prompt injection, saldırgan verilerinin talimat gibi hareket etmesiyle gerçekleşir. Sadece filtreleme yaparak güvenliğe ulaşamazsınız. Bunu derinlemesine savunma (defense-in-depth) ile yönetmelisiniz.

Yaygın savunma yöntemlerinin başarısızlığı:

ASCII Smuggling büyük bir tehdittir. Talimatları gizlemek için Unicode Etiketleri veya sıfır genişlikli boşluklar (zero-width spaces) gibi görünmez karakterler kullanır. Model bunları okur ancak insan hiçbir şey görmez. Bu durum, e-posta veya takvimler aracılığıyla kimlik taklidi (identity spoofing) ve veri sızdırmasına (data exfiltration) olanak tanır.

Uygulamanızı nasıl savunursunuz:

Güvenlik sadece bir model hatası değil, bir boru hattı (pipeline) hatasıdır. Çözüm, uygulama kodunuzda yer alır.

Kaynak: https://dev.to/geekaara/llm-prompt-injection-guardrail-security-glm

İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi