Khung Quản trị AI Agentic

Các chính sách PDF tĩnh không thể quản trị được các AI agent năng động. Nếu bạn yêu cầu phê duyệt thủ công cho mọi hành động của agent, bạn sẽ bị mất tốc độ.

Để mở rộng quy mô, bạn phải chuyển từ mô hình Human-in-the-Loop (HITL) sang Human-on-the-Loop (HOTL). Trong HITL, con người là nút thắt cổ chai. Trong HOTL, con người đóng vai trò là những kiến trúc sư xây dựng các rào chắn (guardrails) và giám sát hệ thống.

Phổ Tự trị

Bạn không nên đối xử với một procurement agent giống như một DevOps agent. Hãy phân loại các agent của bạn dựa trên quyền ra quyết định của chúng:

• Tư vấn (Tự trị thấp): Agent đề xuất các hành động. Con người thực hiện chúng. • Bán tự trị (Tự trị trung bình): Agent hoạt động trong một vùng an toàn. Nó chỉ yêu cầu trợ giúp khi chạm đến giới hạn. • Tự trị hoàn toàn (Tự trị cao): Agent quản lý các mục tiêu từ đầu đến cuối trong một môi trường cô lập (sandbox).

Ví dụ: Một support agent có thể thực hiện hoàn tiền lên đến 50 USD. Nếu yêu cầu là 51 USD, agent phải dừng lại và hỏi ý kiến con người. Điều này giúp ngăn chặn sự lệch lạc về thẩm quyền (authority drift).

Ngừng dựa vào Prompt để bảo mật

System prompt chỉ là những gợi ý, không phải là quy tắc. Chúng mang tính xác suất. Trong môi trường vận hành thực tế (production), một lời gợi ý chính là một lỗ hổng. Bạn phải tách biệt giữa quá trình suy luận (reasoning) và việc thực thi (enforcement).

Sử dụng phòng thủ đa lớp:

Thiết lập này giúp ngăn chặn prompt injection. Nếu guardrail nằm ở cấp độ middleware, các thủ thuật trong prompt sẽ không có tác dụng.

Khả năng quan sát và Nút ngắt khẩn cấp (Kill Switch)

Các bản ghi (logs) tiêu chuẩn là không đủ. Bạn cần ghi lại Chuỗi suy nghĩ (Chain-of-Thought - CoT). Bạn phải biết tại sao một agent lại cho rằng một hành động là đúng.

Để ngăn chặn các lỗi dây chuyền trong quy trình làm việc đa agent (multi-agent workflows), hãy triển khai Giao thức Nút ngắt khẩn cấp (Kill Switch Protocol). Nó phải:

Phân quyền động

Các agent nên có quyền hạn thường trực bằng không (zero standing privileges). Hãy sử dụng truy cập Just-in-Time (JIT). Một agent chỉ yêu cầu một token có thời hạn ngắn khi nó cần gọi một API cụ thể. Điều này đảm bảo danh tính của agent luôn gắn liền với ý định đã được con người phê duyệt.

Những điểm chính dành cho Kỹ sư Nền tảng (Platform Engineers):

Nguồn: https://dev.to/omnithium/the-agentic-ai-governance-framework-balancing-autonomy-and-control-2occ

Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi