Bariery ochronne dla agentów AI w przedsiębiorstwach
Większość porad dotyczących barier ochronnych (guardrails) dla AI brzmi jak oferta sprzedażowa. Skupiają się one na efektownych diagramach i listach kontrolnych.
Prawdziwe bezpieczeństwo produkcyjne jest mniej efektowne. Opiera się na rzeczach, które istniały na długo przed LLM.
Spędziłem dwa lata na budowaniu agentów AI dla firmy z listy Fortune 100. Agenci ci obsługują awarie CI/CD, incydenty Kubernetes i dokumentację infrastruktury.
Oto warstwowy stos (stack), którego używamy, aby zapewnić im bezpieczeństwo.
Tożsamość na granicy agenta. Każdy agent korzysta z tożsamości obciążenia (workload identity). Nigdy nie używa współdzielonych poświadczeń. Zakres IAM to Twój limit bezpieczeństwa. Jeśli agent nie potrzebuje dostępu do bazy danych, rola IAM nie może go posiadać. To Twoja najważniejsza kontrola.
Białe listy narzędzi (tool allow-lists). Platforma decyduje, jakie narzędzia może widzieć agent. Agent do przeszukiwania kodu nie powinien mieć narzędzia do e-maila. Używamy do tego statycznych konfiguracji. Nigdy nie stosujemy dynamicznej rejestracji narzędzi.
Kontrola ruchu wychodzącego (network egress). Agenci mogą
Zadbaj o rozbudowany ślad audytowy. Rejestrowanie samego promptu i odpowiedzi to za mało. Potrzebujesz również pośrednich wywołań narzędzi i argumentów. Logowanie na wczesnym etapie jest tanie, ale naprawianie błędów później jest kosztowne.
Ogranicz komunikację agentów. W systemach wieloagentowych ustal sztywny limit wywołań między agentami. Zapobiega to awariom kaskadowym.
Bezpieczeństwo AI w dużej skali to nie problem modelu. To problem platformy. Traktuj swoich agentów z taką samą dyscypliną operacyjną, jak każdy inny system produkcyjny.
Opcjonalna społeczność edukacyjna: https://t.me/GyaanSetuAi