Plan rollbacku agenta AI: Cofnij błędne działania, zanim użytkownicy stracą zaufanie
Niezawodny agent AI nie musi być doskonały. Musi wiedzieć, jak się zatrzymać, wyjaśnić swój błąd i odzyskać sprawność.
Jeśli Twój agent zaktualizuje niewłaściwe pole w CRM lub wyśle duplikat płatności, zwykłe ponowienie próby nie naprawi szkód. Potrzebujesz planu rollbacku, zanim dojdzie do prawdziwego incydentu.
W miarę jak agenci przechodzą od czatu do realnej pracy, zaczynają zmieniać stan (mutate state). Sprawia to, że rollback staje się funkcją produktu, a nie tylko zadaniem backendowym.
Typowe tryby awarii:
- Agent używa niewłaściwego identyfikatora rekordu (record ID).
- Ponowienie próby powoduje dwukrotne wykonanie akcji.
- Zmiana modelu zmienia sposób działania narzędzia.
- Workflow wznawia się z nieaktualną pamięcią.
- Częściowa sekwencja pozostawia niespójne dane.
Jak zbudować warstwę odzyskiwania (recovery layer):
Użyj rejestru akcji (Action Ledger) Nie polegaj na logach. Stwórz rejestr, który zapisuje każdą zmianę stanu. Każde wywołanie narzędzia musi tworzyć wpis przed i po wykonaniu. To Twoje źródło prawdy (source of truth) w procesie odzyskiwania.
Klasyfikuj swoje akcje Nie każda akcja jest taka sama.
- Tylko do odczytu: Brak potrzeby rollbacku.
- Aktualizacje wewnętrzne: Przywróć poprzednią wartość ze migawki (snapshot).
- Zewnętrzne odwracalne: Usuń zdarzenie lub zaktualizuj status.
- Zewnętrzne nieodwracalne: Zastosuj kompensację zamiast prawdziwego "undo". W przypadku e-maili lub płatności nie można ich "cofnąć". Musisz wysłać sprostowanie lub zwrot.
Wymuszaj idempotentność Model nie wymusza idempotentności. Musi to robić środowisko uruchomieniowe Twoich narzędzi (tool runtime). Używaj kluczy idempotentności, aby upewnić się, że jeśli agent ponowi zadanie, nie wywoła on duplikujących się efektów ubocznych.
Użyj wzorca Saga (Saga Pattern) W przypadku długich workflow każda akcja do przodu wymaga akcji kompensującej.
- Utworzenie zadania? Kompensacją jest jego usunięcie lub anulowanie.
- Aktualizacja pola? Kompensacją jest przywrócenie starej wartości.
- Wysłanie e-maila? Kompensacją jest wysłanie sprostowania.
Wdróż punkty kontrolne (Checkpoints) Przestań prosić model, aby „rozgryzł, gdzie skończyliśmy” po awarii. Używaj punktów kontrolnych do przechowywania aktualnego stanu, ukończonych akcji i oczekujących zadań. System powinien wczytać punkt kontrolny, aby wznowić pracę.
Zbuduj kolejkę odzyskiwania (Recovery Queue) Gdy krok weryfikacji zawiedzie, przenieś zadanie do kolejki odzyskiwania. Pozwala to na wznowienie, skompensowanie lub zamknięcie zadania. W przypadku błędów wysokiego ryzyka zawsze proś człowieka o zatwierdzenie.
Zaufanie buduje się poprzez widoczne procesy odzyskiwania. Gdy agent popełni błąd, nie używaj ogólnikowego języka. Powiedz użytkownikowi dokładnie, co się zmieniło, dlaczego tak się stało i jak to naprawiłeś.
Przygotuj plan rollbacku, zanim dojdzie do pierwszego incydentu.
Optional learning community: https://t.me/GyaanSetuAi
