Khung Quản trị AI Agentic
Các chính sách PDF tĩnh không thể quản trị được các AI agent năng động. Nếu bạn yêu cầu phê duyệt thủ công cho mọi hành động của agent, bạn sẽ bị mất tốc độ.
Để mở rộng quy mô, bạn phải chuyển từ mô hình Human-in-the-Loop (HITL) sang Human-on-the-Loop (HOTL). Trong HITL, con người là nút thắt cổ chai. Trong HOTL, con người đóng vai trò là những kiến trúc sư xây dựng các rào chắn (guardrails) và giám sát hệ thống.
Phổ Tự trị
Bạn không nên đối xử với một procurement agent giống như một DevOps agent. Hãy phân loại các agent của bạn dựa trên quyền ra quyết định của chúng:
• Tư vấn (Tự trị thấp): Agent đề xuất các hành động. Con người thực hiện chúng. • Bán tự trị (Tự trị trung bình): Agent hoạt động trong một vùng an toàn. Nó chỉ yêu cầu trợ giúp khi chạm đến giới hạn. • Tự trị hoàn toàn (Tự trị cao): Agent quản lý các mục tiêu từ đầu đến cuối trong một môi trường cô lập (sandbox).
Ví dụ: Một support agent có thể thực hiện hoàn tiền lên đến 50 USD. Nếu yêu cầu là 51 USD, agent phải dừng lại và hỏi ý kiến con người. Điều này giúp ngăn chặn sự lệch lạc về thẩm quyền (authority drift).
Ngừng dựa vào Prompt để bảo mật
System prompt chỉ là những gợi ý, không phải là quy tắc. Chúng mang tính xác suất. Trong môi trường vận hành thực tế (production), một lời gợi ý chính là một lỗ hổng. Bạn phải tách biệt giữa quá trình suy luận (reasoning) và việc thực thi (enforcement).
Sử dụng phòng thủ đa lớp:
- Lớp Prompt: Cung cấp ý định và các hướng dẫn.
- Lớp Guardrail: Một middleware mang tính xác định (deterministic) giúp xác thực các hành động dựa trên các quy tắc cứng.
- Lớp API: Thực thi quản lý danh tính và truy cập ở cấp độ tài nguyên.
Thiết lập này giúp ngăn chặn prompt injection. Nếu guardrail nằm ở cấp độ middleware, các thủ thuật trong prompt sẽ không có tác dụng.
Khả năng quan sát và Nút ngắt khẩn cấp (Kill Switch)
Các bản ghi (logs) tiêu chuẩn là không đủ. Bạn cần ghi lại Chuỗi suy nghĩ (Chain-of-Thought - CoT). Bạn phải biết tại sao một agent lại cho rằng một hành động là đúng.
Để ngăn chặn các lỗi dây chuyền trong quy trình làm việc đa agent (multi-agent workflows), hãy triển khai Giao thức Nút ngắt khẩn cấp (Kill Switch Protocol). Nó phải:
- Thu hồi tất cả các token đang hoạt động.
- Chấm dứt tất cả các luồng thực thi (execution threads).
- Đóng băng trạng thái để kiểm toán.
- Thông báo cho kỹ sư kèm theo năm bước suy luận cuối cùng.
Phân quyền động
Các agent nên có quyền hạn thường trực bằng không (zero standing privileges). Hãy sử dụng truy cập Just-in-Time (JIT). Một agent chỉ yêu cầu một token có thời hạn ngắn khi nó cần gọi một API cụ thể. Điều này đảm bảo danh tính của agent luôn gắn liền với ý định đã được con người phê duyệt.
Những điểm chính dành cho Kỹ sư Nền tảng (Platform Engineers):
- Chuyển việc quản trị từ các câu lệnh (prompts) sang lớp trung gian (middleware).
- Triển khai truy cập JIT để ngăn chặn các lỗ hổng bảo mật.
- Ghi lại các bước lập luận, thay vì chỉ ghi lại đầu vào và đầu ra.
- Sử dụng giới hạn token cứng để ngăn chặn các lỗi vòng lặp đệ quy.
Nguồn: https://dev.to/omnithium/the-agentic-ai-governance-framework-balancing-autonomy-and-control-2occ
Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi