Plano de Rollback para Agentes de IA: Desfaça Ações Erradas Antes que os Usuários Percam a Confiança
Um agente de IA confiável não precisa ser perfeito. Ele precisa saber como parar, explicar seu erro e se recuperar.
Se o seu agente atualizar o campo errado no CRM ou enviar um pagamento duplicado, uma simples tentativa de repetição (retry) não corrigirá o dano. Você precisa de um plano de rollback antes de enfrentar um incidente real.
À medida que os agentes passam do chat para o trabalho real, eles agora alteram o estado (mutate state). Isso torna o rollback um recurso de produto, não apenas uma tarefa de backend.
Modos de falha comuns:
- O agente usa o ID de registro errado.
- Uma tentativa de repetição (retry) repete uma ação duas vezes.
- Uma troca de modelo altera a forma como uma ferramenta funciona.
- Um fluxo de trabalho é retomado com uma memória antiga.
- Uma sequência parcial deixa os dados inconsistentes.
Como construir uma camada de recuperação:
Use um Registro de Ações (Action Ledger) Não dependa apenas de logs. Crie um registro (ledger) que grave cada mudança de estado. Cada chamada de ferramenta deve criar uma entrada antes e depois da execução. Esta é a sua fonte da verdade para a recuperação.
Classifique Suas Ações Nem toda ação é igual.
- Somente leitura: Nenhum rollback necessário.
- Atualizações internas: Restaure o valor anterior a partir de um snapshot.
- Externas reversíveis: Exclua o evento ou atualize o status.
- Externas irreversíveis: Use compensação em vez de um "desfazer" real. Para e-mails ou pagamentos, você não pode "desenviar". Você deve enviar uma correção ou um reembolso.
Imponha a Idempotência O modelo não impõe a idempotência. O tempo de execução (runtime) da sua ferramenta deve. Use chaves de idempotência para garantir que, se um agente tentar repetir uma tarefa, ele não crie efeitos colaterais duplicados.
Use o Padrão Saga (Saga Pattern) Para fluxos de trabalho longos, cada ação progressiva precisa de uma ação compensatória.
- Criar uma tarefa? A compensação é excluí-la ou cancelá-la.
- Atualizar um campo? A compensação é restaurar o valor antigo.
- Enviar um e-mail? A compensação é enviar uma correção.
Implemente Checkpoints Pare de pedir ao modelo para "descobrir onde estávamos" após uma falha. Use checkpoints para armazenar o estado atual, as ações concluídas e as tarefas pendentes. O sistema deve carregar o checkpoint para retomar o trabalho.
Construa uma Fila de Recuperação Quando uma etapa de verificação falhar, mova a tarefa para uma fila de recuperação. Isso permite que você retome, compense ou encerre a tarefa. Para erros de alto risco, sempre peça aprovação de um humano.
A confiança é construída por meio de uma recuperação visível. Quando um agente comete um erro, não use linguagem vaga. Diga ao usuário exatamente o que mudou, por que aconteceu e como você corrigiu.
Construa seu plano de rollback antes que o primeiro incidente aconteça.
Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi
