మీ AI ఏజెంట్ యొక్క భద్రత దాని టూల్స్‌పైనే ఆధారపడి ఉంటుంది

మీరు మీ AI ఏజెంట్‌ను మరింత సురక్షితంగా (hardening) చేయడానికి చాలా సమయం కేటాయిస్తారు. మీరు పర్మిషన్లను పరిమితం చేస్తారు. కోడ్‌ను సాండ్‌బాక్స్ (sandbox) చేస్తారు. అవుట్‌పుట్‌లను నిశితంగా గమనిస్తారు.

అప్పుడు ఆ ఏజెంట్ ఒక థర్డ్-పార్టీ టూల్‌ను లోడ్ చేస్తుంది. అకస్మాత్తుగా, మీ భద్రతా చర్యలన్నీ విఫలమవుతాయి.

మీ ఏజెంట్ అది పిలిచే (calls చేసే) ఇతర ఏజెంట్లు మరియు టూల్స్ ఎంత సురక్షితంగా ఉన్నాయో అంతే సురక్షితంగా ఉంటుంది. ఇది ప్రతి ఇతర ఏజెంట్‌తో రిజిస్ట్రీ, ఐడెంటిటీ ప్లేన్ మరియు గేట్‌వేని పంచుకుంటుంది. ఒకే ఒక టూల్‌లో జరిగే వైఫల్యం మీ మొత్తం వ్యవస్థలోకి వ్యాపిస్తుంది.

చాలా బృందాలు ఏజెంట్‌ను సురక్షితం చేస్తాయి కానీ ఎకోసిస్టమ్‌ను మర్చిపోతాయి. మీ ఇన్‌ఫ్రాస్ట్రక్చర్‌ను రక్షించడానికి ఈ ఆరు వ్యూహాలను ఉపయోగించండి:

  • డిజిటల్ ఫింగర్‌ప్రింట్‌లను ఉపయోగించండి. ఒక టూల్ సోమవారం సురక్షితంగా అనిపించవచ్చు కానీ గురువారం హానికరంగా మారవచ్చు. వెర్షన్లను పిన్ (pin) చేయండి మరియు టూల్ డిస్క్రిప్షన్ మరియు స్కీమా యొక్క హాష్‌ను ఉపయోగించండి. టూల్ లోడ్ అయిన ప్రతిసారీ ఈ ఫింగర్‌ప్రింట్‌ను మళ్ళీ తనిఖీ చేయండి. ఫింగర్‌ప్రింట్ మారితే, ఆ టూల్‌ను నిలిపివేయండి.

  • టూల్ పాయిజనింగ్‌ను నివారించండి. ఒక టూల్ యొక్క డిస్క్రిప్షన్ అనేది మోడల్‌కు ఒక ఇన్‌స్ట్రక్షన్ ఛానెల్. హానికరమైన టూల్స్ ప్రాంప్ట్ ఇంజెక్షన్లను (prompt injections) ప్రేరేపించడానికి డిస్క్రిప్షన్లను ఉపయోగిస్తాయి. టూల్ మెటాడేటాను హానికరమైన ఇన్‌పుట్‌గా పరిగణించండి. దాగి ఉన్న క్యారెక్టర్లు, HTML కామెంట్లు లేదా "ignore previous orders" వంటి సూచనల కోసం స్కాన్ చేయండి.

  • పేరు విషయంలో గందరగోళాన్ని నివారించండి. హానికరమైన సర్వర్లు నమ్మకమైన వాటికి దగ్గరగా ఉండే పేర్లను ఉపయోగిస్తాయి, ఉదాహరణకు send_email కి బదులుగా send_emai1. దాదాపు ఒకేలా ఉండే పేర్లను గుర్తించండి (flag). గందరగోళాన్ని నివారించడానికి ప్రతి టూల్‌ను దాని ధృవీకరించబడిన సర్వర్ ఐడెంటిటీ ద్వారా నేమ్‌స్పేస్ (namespace) చేయండి.

  • ఒకే గేట్‌వేను నిర్మించండి. మొత్తం ట్రాఫిక్‌ను ఒక ఆడిటబుల్ చోక్ పాయింట్ (auditable choke point) ద్వారా పంపండి. ఈ గేట్‌వే కాల్ చేసేవారిని ధృవీకరించాలి (authenticate), స్పందనలను స్కాన్ చేయాలి మరియు రేట్-లిమిట్ చేయాలి. గేట్‌వే ఏదైనా లోపాన్ని గుర్తిస్తే, అది రిక్వెస్ట్‌ను తిరస్కరించాలి. కేవలం లాగ్ చేసి వదిలేయకండి.

  • నిజమైన కిల్‌ స్విచ్‌ను (kill switch) సృష్టించండి. చాలా కిల్‌ స్విచ్‌లు కేవలం ప్రధాన ఏజెంట్‌ను మాత్రమే ఆపుతాయి. దీనివల్ల సబ్-ఏజెంట్లు మరియు టూల్ సెషన్లు నడుస్తూనే ఉంటాయి. నిజమైన స్టాప్ సిగ్నల్ ప్రతి సబ్-ఏజెంట్‌కు చేరుకోవాలి మరియు ప్రతి సెషన్‌ను సురక్షిత స్థితిలో ఉంచాలి.

  • మీ భద్రతా వ్యవస్థలను పరీక్షించండి. మీరు కిల్‌ స్విచ్‌ను ఎప్పుడూ పరీక్షించకపోతే అది నిరుపయోగం. మీరు స్విచ్ నొక్కినప్పుడు సబ్-ఏజెంట్లు నిజంగా ఆగిపోతున్నాయో లేదో నిర్ధారించుకోవడానికి డ్రిల్స్ నిర్వహించండి.

AI టూల్స్‌ను సాఫ్ట్‌వేర్ డిపెండెన్సీల (software dependencies) వలె పరిగణించండి. అదే జాగ్రత్తలను పాటించండి: పిన్ చేయండి, సైన్ చేయండి, ఫింగర్‌ప్రింట్ చేయండి మరియు ధృవీకరించండి.

మీ ఏజెంట్లు ఈరోజు లోడ్ చేసే టూల్స్‌ను మీరు ఎలా పరిశీలిస్తారు? మీరు ఆమోదించిన తర్వాత ఒక టూల్ మారితే మీరు దానిని గుర్తించగలరా?

Source: https://dev.to/brennhill/your-ai-agent-is-only-as-secure-as-the-tools-and-agents-it-calls-53p7

Optional learning community: https://t.me/GyaanSetuAi