LLM પ્રોમ્પ્ટ ઇન્જેક્શન અને ગાર્ડરેલ સુરક્ષા

LLMs માં સૂચનાઓ (instructions) અને ડેટા વચ્ચે કોઈ સ્પષ્ટ સીમા હોતી નથી. કોન્ટેક્સ્ટ વિન્ડોમાં રહેલી દરેક વસ્તુ ટોકન્સનો એક જ પ્રવાહ છે. જ્યારે હુમલાખોરનો ડેટા સૂચના તરીકે કામ કરે છે, ત્યારે પ્રોમ્પ્ટ ઇન્જેક્શન થાય છે. તમે માત્ર ફિલ્ટર કરીને સુરક્ષિત બની શકતા નથી. તમારે 'ડિફેન્સ-ઇન-ડેપ્થ' (defense-in-depth) સાથે તેનું સંચાલન કરવું આવશ્યક છે.

સામાન્ય સુરક્ષા પદ્ધતિઓની નિષ્ફળતા:

ASCII સ્મગલિંગ (ASCII Smuggling) એ એક મોટો ખતરો છે. તે સૂચનાઓને છુપાવવા માટે યુનિકોડ ટેગ્સ (Unicode Tags) અથવા ઝીરો-વિડ્થ સ્પેસ (zero-width spaces) જેવા અદ્રશ્ય અક્ષરોનો ઉપયોગ કરે છે. મોડેલ તેને વાંચે છે, પરંતુ માણસને કંઈ દેખાતું નથી. આનાથી ઈમેલ અથવા કેલેન્ડર દ્વારા ઓળખની છેતરપિંડી (identity spoofing) અને ડેટા એક્સફિલ્ટ્રેશન (data exfiltration) શક્ય બને છે.

તમારા એપ્લિકેશનનું રક્ષણ કેવી રીતે કરવું:

સુરક્ષા એ પાઇપલાઇનનો ખામી છે, માત્ર મોડેલની ખામી નથી. તેનો ઉકેલ તમારા એપ્લિકેશન કોડમાં રહેલો છે.

Source: https://dev.to/geekaara/llm-prompt-injection-guardrail-security-glm

Optional learning community: https://t.me/GyaanSetuAi