તમારો AI એજન્ટ તેના ટૂલ્સ જેટલો જ સુરક્ષિત છે

તમે તમારા AI એજન્ટને સુરક્ષિત (harden) કરવા માટે ઘણો સમય વિતાવો છો. તમે પરવાનગીઓ (permissions) નક્કી કરો છો. તમે કોડને સેન્ડબોક્સ (sandbox) કરો છો. તમે આઉટપુટ પર નજર રાખો છો.

પછી એજન્ટ ત્રીજા પક્ષનું (third-party) ટૂલ લોડ કરે છે. અચાનક, તમારું સુરક્ષા કાર્ય નિષ્ફળ જાય છે.

તમારો એજન્ટ તેના દ્વારા બોલાવવામાં આવતા એજન્ટ્સ અને ટૂલ્સ જેટલો જ સુરક્ષિત છે. તે દરેક અન્ય એજન્ટ સાથે રજિસ્ટ્રી, આઈડેન્ટિટી પ્લેન અને ગેટવે શેર કરે છે. એક ટૂલમાં થતી એકલ ખામી તમારા સમગ્ર સિસ્ટમમાં ફેલાઈ શકે છે.

મોટાભાગની ટીમો એજન્ટને સુરક્ષિત કરે છે પરંતુ ઇકોસિસ્ટમને ભૂલી જાય છે. તમારા ઇન્ફ્રાસ્ટ્રક્ચરને સુરક્ષિત કરવા માટે આ છ વ્યૂહરચનાઓનો ઉપયોગ કરો:

  • ડિજિટલ ફિંગરપ્રિન્ટ્સનો ઉપયોગ કરો. કોઈ ટૂલ સોમવારે સુરક્ષિત દેખાઈ શકે છે પરંતુ ગુરુવારે તે હાનિકારક બની શકે છે. વર્ઝન પિન (pin) કરો અને ટૂલનું વર્ણન (description) અને સ્કીમા (schema) ના હેશ (hash) નો ઉપયોગ કરો. જ્યારે પણ ટૂલ લોડ થાય ત્યારે આ ફિંગરપ્રિન્ટ ફરીથી તપાસો. જો ફિંગરપ્રિન્ટ બદલાય, તો ટૂલને અટકાવી દો.

  • ટૂલ પોઈઝનિંગ (tool poisoning) અટકાવો. ટૂલનું વર્ણન એ મોડેલ માટે સૂચના ચેનલ છે. દુષ્ટ (malicious) ટૂલ્સ પ્રોમ્પ્ટ ઇન્જેક્શન (prompt injections) ટ્રિગર કરવા માટે વર્ણનનો ઉપયોગ કરે છે. ટૂલ મેટાડેટાને હાનિકારક ઇનપુટ તરીકે ગણો. છુપાયેલા અક્ષરો, HTML કોમેન્ટ્સ અથવા "ignore previous orders" જેવી સૂચનાઓ માટે સ્કેન કરો.

  • નામની મૂંઝવણ અટકાવો. દુષ્ટ સર્વર્સ વિશ્વાસુ સર્વર્સ જેવા જ સમાન નામોનો ઉપયોગ કરે છે, જેમ કે send_email ને બદલે send_emai1. લગભગ સમાન નામોને ફ્લેગ કરો. મૂંઝવણ ટાળવા માટે દરેક ટૂલને તેની વેરિફાઇડ સર્વર આઈડેન્ટિટી દ્વારા નેમસ્પેસ (namespace) કરો.

  • એક સિંગલ ગેટવે બનાવો. તમામ ટ્રાફિકને એક ઓડિટેબલ ચોક પોઈન્ટ (auditable choke point) દ્વારા રૂટ કરો. આ ગેટવેએ કોલર્સને પ્રમાણિત (authenticate) કરવા જોઈએ, પ્રતિસાદો સ્કેન કરવા જોઈએ અને રેટ-લિમિટ (rate-limit) કરવા જોઈએ. જો ગેટવેને ભૂલ જણાય, તો તેણે વિનંતી નકારવી જોઈએ. ફક્ત તેને લોગ કરીને આગળ ન વધો.

  • એક સાચો કિલ સ્વિચ (kill switch) બનાવો. મોટાભાગના કિલ સ્વિચ ફક્ત મુખ્ય એજન્ટને જ અટકાવે છે. આનાથી સબ-એજન્ટ્સ અને ટૂલ સેશન્સ ચાલુ રહી જાય છે. એક સાચો સ્ટોપ સિગ્નલ દરેક સબ-એજન્ટ સુધી પહોંચવો જોઈએ અને દરેક સેશનને સુરક્ષિત સ્થિતિમાં છોડવો જોઈએ.

  • તમારી સુરક્ષા પ્રણાલીઓનું પરીક્ષણ કરો. જો તમે ક્યારેય તેનું પરીક્ષણ ન કરો તો કિલ સ્વિચ નકામી છે. જ્યારે તમે સ્વિચ દબાવો ત્યારે સબ-એજન્ટ્સ ખરેખર અટકી જાય છે તેની ખાતરી કરવા માટે ડ્રિલ ચલાવો.

AI ટૂલ્સને સોફ્ટવેર ડિપેન્ડન્સીઝ (software dependencies) ની જેમ ગણો. સમાન સ્વચ્છતા (hygiene) લાગુ કરો: પિન, સાઇન, ફિંગરપ્રિન્ટ અને વેરિફાય કરો.

તમારા એજન્ટ્સ આજે જે ટૂલ્સ લોડ કરે છે તેનું તમે કેવી રીતે પરીક્ષણ (vet) કરો છો? જો તમે તેને મંજૂરી આપ્યા પછી કોઈ ટૂલ બદલાઈ જાય, તો શું તમે તેને પકડી શકશો?

સ્ત્રોત: https://dev.to/brennhill/your-ai-agent-is-only-as-secure-as-the-tools-and-agents-it-calls-53p7

વૈકલ્પિક લર્નિંગ કોમ્યુનિટી: https://t.me/GyaanSetuAi