𝗟𝗟𝗠 𝗣𝗿𝗼𝗺𝗽𝘁 𝗜𝗻𝗷𝗲𝗰𝘁𝗶𝗼𝗻 𝗲𝗻 𝗚𝘂𝗮𝗿𝗱𝗿𝗮𝗶𝗹 𝗦𝗲𝗰𝘂𝗿𝗶𝘁𝘆

LLM's hebben geen harde grens tussen instructies en data. Alles in het contextvenster is één stroom van tokens. Prompt injection vindt plaats wanneer data van een aanvaller fungeert als instructies. Je kunt niet alleen door te filteren veiligheid bereiken. Je moet het beheren met defense-in-depth.

Het falen van gangbare verdedigingsmechanismen:

ASCII Smuggling is een grote bedreiging. Het maakt gebruik van onzichtbare karakters zoals Unicode Tags of zero-width spaces om instructies te verbergen. Het model leest ze, maar de mens ziet niets. Dit maakt identity spoofing en data-exfiltratie via e-mail of agenda's mogelijk.

Hoe je jouw applicatie kunt verdedigen:

Beveiliging is een fout in de pipeline, niet alleen een fout in het model. De oplossing ligt in je applicatiecode.

Bron: https://dev.to/geekaara/llm-prompt-injection-guardrail-security-glm

Optionele leercommunity: https://t.me/GyaanSetuAi