तुमचा AI Agent त्याच्या टूल्स इतकाच सुरक्षित आहे
तुम्ही तुमच्या AI agent ला अधिक सुरक्षित (hardening) करण्यासाठी खूप वेळ घालवता. तुम्ही परवानग्या (permissions) मर्यादित करता. तुम्ही कोड सँडबॉक्स (sandbox) करता. तुम्ही आउटपुट्सवर लक्ष ठेवता.
मग तो agent एखादे थर्ड-पार्टी टूल लोड करतो. अचानक, तुमचे सुरक्षा प्रयत्न अपयशी ठरतात.
तुमचा agent तो ज्या agents आणि टूल्सना कॉल करतो, तितकाच सुरक्षित असतो. तो इतर प्रत्येक agent सोबत एक रजिस्ट्री, आयडेंटिटी प्लेन (identity plane) आणि गेटवे शेअर करतो. एका टूलमधील एक छोटीशी त्रुटी तुमच्या संपूर्ण सिस्टममध्ये पसरू शकते.
बहुतेक टीम्स agent ला सुरक्षित करतात पण इकोसिस्टम विसरतात. तुमच्या इन्फ्रास्ट्रक्चरचे संरक्षण करण्यासाठी या सहा रणनीती वापरा:
डिजिटल फिंगरप्रिंट्सचा (digital fingerprints) वापर करा. एखादे टूल सोमवारी सुरक्षित वाटू शकते पण गुरुवारी ते घातक ठरू शकते. व्हर्जन पिन (Pin versions) करा आणि टूलचे वर्णन (description) आणि स्कीमाचा (schema) हॅश (hash) वापरा. प्रत्येक वेळी टूल लोड होताना हा फिंगरप्रिंट पुन्हा तपासा. जर फिंगरप्रिंट बदलला, तर ते टूल थांबवा.
टूल पॉयझनिंग (tool poisoning) रोखा. टूलचे वर्णन हे मॉडेलसाठी सूचनांचे माध्यम (instruction channel) असते. घातक टूल्स प्रॉम्प्ट इंजेक्शन (prompt injections) ट्रिगर करण्यासाठी वर्णनाचा वापर करतात. टूल मेटाडेटाकडे (metadata) शत्रूच्या इनपुटप्रमाणे (hostile input) वागा. लपलेले कॅरेक्टर्स, HTML कमेंट्स किंवा "ignore previous orders" सारख्या सूचनांसाठी स्कॅन करा.
नावातील गोंधळ थांबवा. घातक सर्व्हर्स विश्वासार्ह नावांसारखीच नावे वापरतात, जसे की send_email ऐवजी send_emai1. जवळजवळ सारखी दिसणारी नावे फ्लॅग करा. गोंधळ टाळण्यासाठी प्रत्येक टूलला त्याच्या पडताळणी केलेल्या सर्व्हर आयडेंटिटीनुसार नेमस्पेस (Namespace) द्या.
एक सिंगल गेटवे (gateway) तयार करा. सर्व ट्रॅफिक एका ऑडिट करण्यायोग्य चोक पॉइंटमधून (auditable choke point) वळवा. या गेटवेने कॉलर्सची पडताळणी (authenticate) करणे, रिस्पॉन्स स्कॅन करणे आणि रेट-लिमिट (rate-limit) करणे आवश्यक आहे. जर गेटवेला त्रुटी आढळली, तर त्याने विनंती नाकारली पाहिजे. फक्त लॉग करू नका आणि पुढे जाऊ नका.
एक खरा 'किल स्विच' (kill switch) तयार करा. बहुतेक किल स्विचेस फक्त मुख्य agent ला थांबवतात. यामुळे सब-एजंट्स (sub-agents) आणि टूल सेशन्स चालू राहतात. खऱ्या स्टॉप सिग्नलने प्रत्येक सब-एजंटपर्यंत पोहोचले पाहिजे आणि प्रत्येक सेशन सुरक्षित स्थितीत सोडले पाहिजे.
तुमच्या सुरक्षा प्रणालींची चाचणी घ्या. जर तुम्ही कधीही चाचणी घेतली नाही, तर किल स्विच निरुपयोगी आहे. तुम्ही स्विच ओढल्यावर सब-एजंट्स खरोखर थांबतात याची खात्री करण्यासाठी ड्रिल्स (drills) करा.
AI टूल्सकडे सॉफ्टवेअर डिपेंडन्सीजप्रमाणे (software dependencies) वागा. तीच स्वच्छता (hygiene) लागू करा: पिन करा, साइन करा, फिंगरप्रिंट करा आणि पडताळणी करा.
तुमचे agents आज जे टूल्स लोड करतात, त्यांची तुम्ही तपासणी कशी करता? जर तुम्ही एखाद्या टूलला मंजुरी दिल्यानंतर त्यात बदल झाला, तर तुम्ही ते पकडू शकाल का?
Source: https://dev.to/brennhill/your-ai-agent-is-only-as-secure-as-the-tools-and-agents-it-calls-53p7
Optional learning community: https://t.me/GyaanSetuAi
