പ്രോംപ്റ്റ് ഇൻജക്ഷൻ പ്രതിരോധം: ഒരു പ്രൊഡക്ഷൻ ഗാർഡ്റെയിൽ പ്ലേബുക്ക്
പ്രോംപ്റ്റ് ഇൻജക്ഷൻ (Prompt injection) AI-ക്ക് വലിയൊരു ഭീഷണിയാണ്.
ആക്രമണകാരികൾ ഡാറ്റയ്ക്കുള്ളിൽ നിർദ്ദേശങ്ങൾ ഒളിപ്പിച്ചു വെക്കുന്നു. നിങ്ങളുടെ മോഡൽ നിങ്ങളുടെ നിർദ്ദേശങ്ങൾക്ക് പകരം അവരുടെ ഉദ്ദേശ്യങ്ങൾ പിന്തുടരണമെന്നാണ് അവർ ആഗ്രഹിക്കുന്നത്. Large Language Model ആപ്ലിക്കേഷനുകൾക്കായുള്ള OWASP പട്ടികയിൽ ഈ റിസ്ക് ഏറ്റവും മുകളിലാണ്.
പ്രശ്നം ലളിതമാണ്. LLM-കൾ എല്ലാ ടെക്സ്റ്റുകളെയും ഒരേപോലെ കാണുന്നു. നിങ്ങളുടെ സിസ്റ്റം നിർദ്ദേശങ്ങളും (system instructions) അത് പ്രോസസ്സ് ചെയ്യുന്ന ഡാറ്റയും തമ്മിലുള്ള വ്യത്യാസം തിരിച്ചറിയാൻ മോഡലിന് കഴിയില്ല. മോഡലിനെ സംബന്ധിച്ചിടത്തോളം ഇതെല്ലാം വെറും ടെക്സ്റ്റ് മാത്രമാണ്. ഇത് ഈ സുരക്ഷാ വീഴ്ച പരിഹരിക്കാൻ പ്രയാസകരമാക്കുന്നു.
രണ്ട് തരത്തിലുള്ള ആക്രമണങ്ങളുണ്ട്:
- ഡയറക്ട് ഇൻജക്ഷൻ (Direct injection): ഒരു ഉപയോക്താവ് നിങ്ങളുടെ ആപ്പിൽ നേരിട്ട് തെറ്റായ നിർദ്ദേശങ്ങൾ ടൈപ്പ് ചെയ്യുന്നു.
- ഇൻഡയ