𝗧𝗵𝗲 𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗔𝗜 𝗚𝗼𝘃𝗲𝗿𝗻𝗮𝗻𝗰𝗲 𝗙𝗿𝗮𝗺𝗲𝘄𝗼𝗿𝗸
स्थिर (Static) PDF धोरणे गतिमान (dynamic) AI एजंट्सवर नियंत्रण ठेवू शकत नाहीत. जर तुम्हाला प्रत्येक एजंटच्या कृतीसाठी मॅन्युअल मंजुरीची आवश्यकता असेल, तर तुमची गती कमी होईल.
स्केल करण्यासाठी, तुम्हाला Human-in-the-Loop (HITL) कडून Human-on-the-Loop (HOTL) कडे वळावे लागेल. HITL मध्ये, मनुष्य हे अडथळे (bottlenecks) ठरतात. HOTL मध्ये, मनुष्य आर्किटेक्ट म्हणून काम करतात जे गार्डरेल्स (guardrails) तयार करतात आणि सिस्टमवर देखरेख ठेवतात.
The Autonomy Spectrum
तुम्ही प्रोक्युरमेंट एजंटला (procurement agent) DevOps एजंटप्रमाणे वागवू नये. तुमच्या एजंट्सचे त्यांच्या निर्णय घेण्याच्या अधिकारांनुसार वर्गीकरण करा:
• सल्लागार (कमी स्वायत्तता/Low Autonomy): एजंट कृती सुचवतो. मनुष्य त्या कृतीची अंमलबजावणी करतो. • अर्ध-स्वायत्त (मध्यम स्वायत्तता/Medium Autonomy): एजंट एका सुरक्षित क्षेत्रात (safe zone) काम करतो. जेव्हा तो मर्यादेपर्यंत पोहोचतो, तेव्हाच तो मदतीसाठी विचारतो. • पूर्णपणे स्वायत्त (उच्च स्वायत्तता/High Autonomy): एजंट सँडबॉक्समध्ये (sandbox) सुरुवातीपासून शेवटपर्यंत उद्दिष्टे व्यवस्थापित करतो.
उदाहरण: एक सपोर्ट एजंट $५० पर्यंत रिफंड देऊ शकतो. जर विनंती $५१ ची असेल, तर एजंटला थांबून मानवी मदतीची मागणी करावी लागेल. यामुळे अधिकारांचे विचलन (authority drift) रोखले जाते.
सुरक्षेसाठी केवळ प्रॉम्प्ट्सवर अवलंबून राहणे थांबवा
सिस्टम प्रॉम्प्ट्स (System prompts) या केवळ सूचना आहेत, नियम नाहीत. ते संभाव्य (probabilistic) असतात. प्रोडक्शनमध्ये, केवळ सूचना असणे ही एक असुरक्षितता (vulnerability) आहे. तुम्हाला तर्क (reasoning) आणि अंमलबजावणी (enforcement) वेगळी करावी लागेल.
स्तरित संरक्षण (layered defense) वापरा:
- प्रॉम्प्ट लेयर (Prompt Layer): हे हेतू आणि मार्गदर्शक तत्त्वे प्रदान करते.
- गार्डरेल लेयर (Guardrail Layer): हे एक डिटरमिनिस्टिक (deterministic) मिडलवेअर आहे जे कठोर नियमांच्या आधारे कृतींची पडताळणी करते.
- API लेयर (API Layer): हे रिसोर्स लेव्हलवर ओळख आणि प्रवेश व्यवस्थापन (identity and access management) लागू करते.
ही रचना प्रॉम्प्ट इंजेक्शन (prompt injection) रोखते. जर गार्डरेल मिडलवेअर लेव्हलवर असेल, तर प्रॉम्प्टमधील कोणताही फसवणुकीचा प्रयत्न यशस्वी होणार नाही.
Observability आणि Kill Switch
मानक लॉग्स (Standard logs) पुरेसे नाहीत. तुम्हाला Chain-of-Thought (CoT) लॉग करण्याची आवश्यकता आहे. एजंटने एखादी कृती योग्य का मानली, हे तुम्हाला माहित असणे आवश्यक आहे.
मल्टी-एजंट वर्कफ्लोमध्ये (multi-agent workflows) साखळी पद्धतीने होणारे अपयश (cascading failures) रोखण्यासाठी, 'Kill Switch Protocol' लागू करा. त्यात खालील गोष्टी असणे आवश्यक आहे:
- सर्व सक्रिय टोकन्स रद्द करणे.
- सर्व एक्झिक्यूशन थ्रेड्स (execution threads) थांबवणे.
- ऑडिटसाठी स्थिती (state) गोठवणे (freeze करणे).
- शेवटच्या पाच तर्क प्रक्रियेच्या (reasoning steps) पायऱ्यांसह इंजिनिअरला सूचित करणे.
Dynamic Permissioning
एजंट्सना कोणतेही कायमस्वरूपी अधिकार (standing privileges) नसावेत. Just-in-Time (JIT) ॲक्सेस वापरा. जेव्हा एजंटला विशिष्ट API कॉल करण्याची गरज असते, तेव्हाच तो अल्पकाळासाठी टोकनची विनंती करतो. यामुळे एजंटची ओळख मानवी-मंजूर हेतूशी (human-approved intent) जोडलेली राहते याची खात्री होते.
प्लॅटफॉर्म इंजिनिअर्ससाठी महत्त्वाचे मुद्दे:
- नियमन प्रॉम्प्ट्सकडून मिडलवेअरकडे हलवा.
- सुरक्षा त्रुटी रोखण्यासाठी JIT ॲक्सेस लागू करा.
- केवळ इनपुट्स आणि आउटपुट्सच नाही, तर तर्कसंगत पायऱ्या देखील लॉग करा.
- रिकर्सिव्ह लूप फेल्युअर रोखण्यासाठी हार्ड टोकन कॅप्सचा वापर करा.
स्त्रोत: https://dev.to/omnithium/the-agentic-ai-governance-framework-balancing-autonomy-and-control-2occ
पर्यायी शिक्षण समुदाय: https://t.me/GyaanSetuAi