Khung Quản trị AI Tác nhân

📅3 hours ago⏱2 min read

Khung Quản trị AI Agentic

Các chính sách PDF tĩnh không thể quản trị được các AI agent năng động. Nếu bạn yêu cầu phê duyệt thủ công cho mọi hành động của agent, bạn sẽ bị mất tốc độ.

Để mở rộng quy mô, bạn phải chuyển từ mô hình Human-in-the-Loop (HITL) sang Human-on-the-Loop (HOTL). Trong HITL, con người là nút thắt cổ chai. Trong HOTL, con người đóng vai trò là những kiến trúc sư xây dựng các rào chắn (guardrails) và giám sát hệ thống.

Phổ Tự trị

Bạn không nên đối xử với một procurement agent giống như một DevOps agent. Hãy phân loại các agent của bạn dựa trên quyền ra quyết định của chúng:

• Tư vấn (Tự trị thấp): Agent đề xuất các hành động. Con người thực hiện chúng. • Bán tự trị (Tự trị trung bình): Agent hoạt động trong một vùng an toàn. Nó chỉ yêu cầu trợ giúp khi chạm đến giới hạn. • Tự trị hoàn toàn (Tự trị cao): Agent quản lý các mục tiêu từ đầu đến cuối trong một môi trường cô lập (sandbox).

Ví dụ: Một support agent có thể thực hiện hoàn tiền lên đến 50 USD. Nếu yêu cầu là 51 USD, agent phải dừng lại và hỏi ý kiến con người. Điều này giúp ngăn chặn sự lệch lạc về thẩm quyền (authority drift).

Ngừng dựa vào Prompt để bảo mật

System prompt chỉ là những gợi ý, không phải là quy tắc. Chúng mang tính xác suất. Trong môi trường vận hành thực tế (production), một lời gợi ý chính là một lỗ hổng. Bạn phải tách biệt giữa quá trình suy luận (reasoning) và việc thực thi (enforcement).

Sử dụng phòng thủ đa lớp:

Lớp Prompt: Cung cấp ý định và các hướng dẫn.
Lớp Guardrail: Một middleware mang tính xác định (deterministic) giúp xác thực các hành động dựa trên các quy tắc cứng.
Lớp API: Thực thi quản lý danh tính và truy cập ở cấp độ tài nguyên.

Thiết lập này giúp ngăn chặn prompt injection. Nếu guardrail nằm ở cấp độ middleware, các thủ thuật trong prompt sẽ không có tác dụng.

Khả năng quan sát và Nút ngắt khẩn cấp (Kill Switch)

Các bản ghi (logs) tiêu chuẩn là không đủ. Bạn cần ghi lại Chuỗi suy nghĩ (Chain-of-Thought - CoT). Bạn phải biết tại sao một agent lại cho rằng một hành động là đúng.

Để ngăn chặn các lỗi dây chuyền trong quy trình làm việc đa agent (multi-agent workflows), hãy triển khai Giao thức Nút ngắt khẩn cấp (Kill Switch Protocol). Nó phải:

Thu hồi tất cả các token đang hoạt động.
Chấm dứt tất cả các luồng thực thi (execution threads).
Đóng băng trạng thái để kiểm toán.
Thông báo cho kỹ sư kèm theo năm bước suy luận cuối cùng.

Phân quyền động

Các agent nên có quyền hạn thường trực bằng không (zero standing privileges). Hãy sử dụng truy cập Just-in-Time (JIT). Một agent chỉ yêu cầu một token có thời hạn ngắn khi nó cần gọi một API cụ thể. Điều này đảm bảo danh tính của agent luôn gắn liền với ý định đã được con người phê duyệt.

Những điểm chính dành cho Kỹ sư Nền tảng (Platform Engineers):

Chuyển việc quản trị từ các câu lệnh (prompts) sang lớp trung gian (middleware).
Triển khai truy cập JIT để ngăn chặn các lỗ hổng bảo mật.
Ghi lại các bước lập luận, thay vì chỉ ghi lại đầu vào và đầu ra.
Sử dụng giới hạn token cứng để ngăn chặn các lỗi vòng lặp đệ quy.

Nguồn: https://dev.to/omnithium/the-agentic-ai-governance-framework-balancing-autonomy-and-control-2occ

Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi

Khung Quản trị AI Tác nhân

Continue reading

𝗛𝗼𝘄 𝘁𝗼 𝗕𝘂𝗶𝗹𝗱 𝗮𝗻 𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗪𝗼𝗿𝗸𝘀𝗽𝗮𝗰𝗲 𝗳𝗼𝗿 𝗠𝗮𝗿𝗸𝗲𝘁𝗶𝗻𝗴

𝗧𝗵𝗲 𝗕𝗹𝗶𝗻𝗱 𝗦𝗽𝗼𝘁 𝗢𝗳 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁 𝗗𝗲𝗽𝗹𝗼𝘆𝗺𝗲𝗻𝘁 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗲 𝗚𝘂𝗶𝗱𝗲 (𝟮𝟬𝟮𝟲)

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁 𝗗𝗲𝗽𝗹𝗼𝘆𝗺𝗲𝗻𝘁 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗲 𝗚𝘂𝗶𝗱𝗲 (𝟮𝟬𝟮𝟲)

𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗔𝗜 𝗜𝗻𝗰𝗶𝗱𝗲𝗻𝘁 𝗥𝗲𝘀𝗽𝗼𝗻𝘀𝗲: 𝗥𝗼𝗹𝗹 𝗕𝗮𝗰𝗸 𝗥𝗼𝗴𝘂𝗲 𝗔𝗴𝗲𝗻𝘁𝘀