چارچوب حاکمیت هوش مصنوعی عامل‌محور

سیاست‌های ایستا در قالب PDF نمی‌توانند عامل‌های هوش مصنوعی پویا را مدیریت کنند. اگر برای هر اقدام عامل به تایید دستی نیاز داشته باشید، سرعت خود را از دست خواهید داد.

برای مقیاس‌پذیری، باید از مدل «انسان در چرخه» (Human-in-the-Loop یا HITL) به سمت «انسان بر چرخه» (Human-on-the-Loop یا HOTL) حرکت کنید. در HITL، انسان‌ها گلوگاه هستند. در HOTL، انسان‌ها در نقش معمارانی عمل می‌کنند که نرده‌های حفاظتی (guardrails) را می‌سازند و سیستم‌ها را نظارت می‌کنند.

طیف خودمختاری

نباید با یک عامل تدارکات (procurement agent) مانند یک عامل DevOps برخورد کنید. عامل‌های خود را بر اساس سطح اختیار تصمیم‌گیری‌شان دسته‌بندی کنید:

• مشاوره‌ای (خودمختاری پایین): عامل اقدامات را پیشنهاد می‌دهد. انسان آن‌ها را اجرا می‌کند. • نیمه‌خودمختار (خودمختاری متوسط): عامل در یک محدوده امن عمل می‌کند. تنها زمانی که به محدودیت برسد، درخواست کمک می‌کند. • کاملاً خودمختار (خودمختاری بالا): عامل اهداف را از ابتدا تا انتها در یک محیط ایزوله (sandbox) مدیریت می‌کند.

مثال: یک عامل پشتیبانی می‌تواند تا سقف ۵۰ دلار بازپرداخت انجام دهد. اگر درخواستی ۵۱ دلار باشد، عامل باید متوقف شده و از یک انسان سوال کند. این کار از لغزش در سطح اختیارات (authority drift) جلوگیری می‌کند.

تکیه بر پرامپت‌ها برای امنیت را متوقف کنید

پرامپت‌های سیستم پیشنهاد هستند، نه قانون. آن‌ها احتمالی (probabilistic) هستند. در محیط عملیاتی، یک پیشنهاد می‌تواند یک آسیب‌پذیری باشد. شما باید استدلال (reasoning) را از اجرا (enforcement) جدا کنید.

از یک دفاع لایه‌بندی شده استفاده کنید:

این ساختار از تزریق پرامپت (prompt injection) جلوگیری می‌کند. اگر نرده حفاظتی در سطح میان‌افزار باشد، ترفندهای موجود در پرامپت کار نخواهند کرد.

مشاهده‌پذیری و کلید قطع اضطراری

لاگ‌های استاندارد کافی نیستند. شما باید زنجیره تفکر (Chain-of-Thought یا CoT) را ثبت کنید. باید بدانید چرا یک عامل فکر کرده است که یک اقدام درست بوده است.

برای جلوگیری از شکست‌های زنجیره‌ای در جریان‌های کاری چندعاملی، یک پروتکل کلید قطع اضطراری (Kill Switch Protocol) پیاده‌سازی کنید. این پروتکل باید:

تعیین سطح دسترسی پویا

عامل‌ها نباید هیچ امتیاز دسترسی دائمی داشته باشند. از دسترسی به‌موقع (Just-in-Time یا JIT) استفاده کنید. یک عامل تنها زمانی که نیاز به فراخوانی یک API خاص دارد، یک توکن کوتاه‌مدت درخواست می‌کند. این کار تضمین می‌کند که هویت عامل همچنان به قصد و نیت تایید شده توسط انسان وابسته باشد.

نکات کلیدی برای مهندسان پلتفرم:

منبع: https://dev.to/omnithium/the-agentic-ai-governance-framework-balancing-autonomy-and-control-2occ

انجمن یادگیری اختیاری: https://t.me/GyaanSetuAi