𝗣𝗿𝗼𝗺𝗽𝘁 𝗜𝗻𝗷𝗲𝗰𝘁𝗶𝗼𝗻 𝗗𝗲𝗳𝗲𝗻𝗰𝗲: 𝗔 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗚𝘂𝗮𝗿𝗱𝗿𝗮𝗶𝗹𝘀 𝗣𝗹𝗮𝘆𝗯𝗼𝗼𝗸

Translated for your language. Read the original.

AI-assisted draft.

ഇന്നലെ1min read

പ്രോംപ്റ്റ് ഇൻജക്ഷൻ പ്രതിരോധം: ഒരു പ്രൊഡക്ഷൻ ഗാർഡ്‌റെയിൽ പ്ലേബുക്ക്

പ്രോംപ്റ്റ് ഇൻജക്ഷൻ (Prompt injection) AI-ക്ക് വലിയൊരു ഭീഷണിയാണ്.

ആക്രമണകാരികൾ ഡാറ്റയ്ക്കുള്ളിൽ നിർദ്ദേശങ്ങൾ ഒളിപ്പിച്ചു വെക്കുന്നു. നിങ്ങളുടെ മോഡൽ നിങ്ങളുടെ നിർദ്ദേശങ്ങൾക്ക് പകരം അവരുടെ ഉദ്ദേശ്യങ്ങൾ പിന്തുടരണമെന്നാണ് അവർ ആഗ്രഹിക്കുന്നത്. Large Language Model ആപ്ലിക്കേഷനുകൾക്കായുള്ള OWASP പട്ടികയിൽ ഈ റിസ്ക് ഏറ്റവും മുകളിലാണ്.

പ്രശ്നം ലളിതമാണ്. LLM-കൾ എല്ലാ ടെക്സ്റ്റുകളെയും ഒരേപോലെ കാണുന്നു. നിങ്ങളുടെ സിസ്റ്റം നിർദ്ദേശങ്ങളും (system instructions) അത് പ്രോസസ്സ് ചെയ്യുന്ന ഡാറ്റയും തമ്മിലുള്ള വ്യത്യാസം തിരിച്ചറിയാൻ മോഡലിന് കഴിയില്ല. മോഡലിനെ സംബന്ധിച്ചിടത്തോളം ഇതെല്ലാം വെറും ടെക്സ്റ്റ് മാത്രമാണ്. ഇത് ഈ സുരക്ഷാ വീഴ്ച പരിഹരിക്കാൻ പ്രയാസകരമാക്കുന്നു.

രണ്ട് തരത്തിലുള്ള ആക്രമണങ്ങളുണ്ട്:

ഡയറക്ട് ഇൻജക്ഷൻ (Direct injection): ഒരു ഉപയോക്താവ് നിങ്ങളുടെ ആപ്പിൽ നേരിട്ട് തെറ്റായ നിർദ്ദേശങ്ങൾ ടൈപ്പ് ചെയ്യുന്നു.
ഇൻഡയ

𝗣𝗿𝗼𝗺𝗽𝘁 𝗜𝗻𝗷𝗲𝗰𝘁𝗶𝗼𝗻 𝗗𝗲𝗳𝗲𝗻𝗰𝗲: 𝗔 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗚𝘂𝗮𝗿𝗱𝗿𝗮𝗶𝗹𝘀 𝗣𝗹𝗮𝘆𝗯𝗼𝗼𝗸

Continue reading

𝗚𝘂𝗮𝗿𝗱𝗿𝗮𝗶𝗹𝘀 𝗳𝗼𝗿 𝗘𝗻𝘁𝗲𝗿𝗽𝗿𝗶𝘀𝗲 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

LLM പ്രോംപ്റ്റ് ഇൻജക്ഷനും ഗാർഡ്‌റെയിൽ സുരക്ഷയും

𝗟𝗟𝗠 𝗩𝘂𝗹𝗻𝗲𝗿𝗮𝗯𝗶𝗹𝗶𝘁𝗶𝗲𝘀 𝟭𝟬𝟭

𝗟𝗟𝗠 𝗚𝘂𝗮𝗿𝗱𝗿𝗮𝗶𝗹𝘀 𝗶𝗻 𝗣𝗿𝗮𝗰𝘁𝗶𝗰𝗲: 𝗪𝗵𝗮𝘁 𝗪𝗼𝗿𝗸𝘀

നിങ്ങളുടെ AI ഏജന്റ് ഒരു പേജ് സ്ക്രാപ്പ് ചെയ്തു. ആ പേജ് അതിനോട് എന്ത് ചെയ്യണമെന്ന് നിർദ്ദേശിച്ചു.