तुमची AI सुरक्षा धोरणे ठीक आहेत. तुमचे आर्किटेक्चर नाही.
तुमच्याकडे AI सुरक्षा धोरणे आहेत. तुमच्याकडे नियम आहेत. तुमच्याकडे टेस्टिंग आहे. तुमचे आर्किटेक्चर या नियमांची अंमलबजावणी करत नाही.
AI जोखीम वेगळ्या पद्धतीने हालचाल करते. ती एकाच ठिकाणी स्थिर राहत नाही. जुनी साधने फक्त एका मार्गाची तपासणी करतात. ती पूर्ण एक्झिक्यूशन (execution) पाहण्यात अपयशी ठरतात. AI जोखीम सामान्य कामासारखीच दिसते.
सॅमसंग (Samsung) एक धडा देते. कोणीही त्यांना हॅक केले नाही. साधन (tool) व्यवस्थित काम करत होते. डेटा मुख्य दरवाज्यातून (front door) बाहेर गेला.
तुम्ही रनटाइमवर (runtime) लक्ष केंद्रित केले पाहिजे. रनटाइम ही अशी जागा आहे जिथे प्रत्यक्ष वर्तन (behavior) घडते.
- एक प्रॉम्प्ट (prompt) टूलला कॉल करते.
- एक टूल डेटा बदलते.
- एक रेकॉर्ड वर्कफ्लो (workflow) ट्रिगर करते.
अलर्ट खूप उशिरा येतो.
तुमचे कंट्रोल्स एक्झिक्यूशन पाथवर (execution path) हलवा. मॉडेल काय आउटपुट देते हे विचारणे थांबवा. मॉडेल नेमके कुठे पोहोचते (reaches) हे विचारा.
तुमच्या 'reach' च्या आधारे तुमची सुरक्षा तयार करा.