LLM प्रॉम्प्ट इंजेक्शन और गार्डरेल सुरक्षा

LLMs में निर्देशों (instructions) और डेटा के बीच कोई स्पष्ट सीमा नहीं होती है। कॉन्टेक्स्ट विंडो (context window) में सब कुछ टोकन का एक ही प्रवाह (stream) होता है। प्रॉम्प्ट इंजेक्शन तब होता है जब हमलावर का डेटा निर्देशों के रूप में कार्य करता है। आप केवल फ़िल्टरिंग के माध्यम से सुरक्षा प्राप्त नहीं कर सकते। आपको इसे 'डिफेंस-इन-डेप्थ' (defense-in-depth) के साथ प्रबंधित करना होगा।

सामान्य सुरक्षा उपायों (defenses) की विफलता:

ASCII स्मगलिंग (ASCII Smuggling) एक बड़ा खतरा है। यह निर्देशों को छिपाने के लिए यूनिकोड टैग्स (Unicode Tags) या ज़ीरो-विड्थ स्पेस (zero-width spaces) जैसे अदृश्य वर्णों का उपयोग करता है। मॉडल उन्हें पढ़ लेता है, लेकिन इंसान को कुछ दिखाई नहीं देता। यह ईमेल या कैलेंडर के माध्यम से पहचान की धोखाधड़ी (identity spoofing) और डेटा चोरी (data exfiltration) की अनुमति देता है।

अपने एप्लिकेशन की रक्षा कैसे करें:

सुरक्षा एक पाइपलाइन की खामी है, न कि केवल एक मॉडल की खामी। इसका समाधान आपके एप्लिकेशन कोड में निहित है।

स्रोत: https://dev.to/geekaara/llm-prompt-injection-guardrail-security-glm

वैकल्पिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi