𝗟𝗟𝗠 𝗣𝗿𝗼𝗺𝗽𝘁 𝗜𝗻𝗷𝗲𝗰𝘁𝗶𝗼𝗻 𝗮𝗻𝗱 𝗚𝘂𝗮𝗿𝗱𝗿𝗮𝗶𝗹 𝗦𝗲𝗰𝘂𝗿𝗶𝘁𝘆

LLMには指示とデータの間に明確な境界がありません。コンテキストウィンドウ内のすべては、単一のトークンストリームです。プロンプトインジェクションは、攻撃者のデータが指示として機能するときに発生します。フィルタリングだけで安全を確保することはできません。多層防御(defense-in-depth)によって管理する必要があります。

一般的な防御策の失敗例:

ASCIIスミグリングは重大な脅威です。これはUnicodeタグやゼロ幅スペースのような不可視文字を使用して指示を隠します。モデルはそれらを読み取りますが、人間には何も見えません。これにより、メールやカレンダーを介したなりすましやデータの持ち出しが可能になります。

アプリケーションを防御する方法:

セキュリティは単なるモデルの欠陥ではなく、パイプラインの欠陥です。解決策はアプリケーションコードの中にあります。

出典: https://dev.to/geekaara/llm-prompt-injection-guardrail-security-glm

オプションの学習コミュニティ: https://t.me/GyaanSetuAi