Pare de Despejar a Memória do Agente no Prompt

A maioria dos desenvolvedores constrói loops de agentes anexando tudo ao próximo prompt.

Você adiciona observações anteriores, chamadas de ferramentas (tool calls) e rastros de raciocínio. Você continua adicionando dados até que o prompt se torne uma gaveta de bagunça. O modelo vê mais, mas você perde o controle. Você não sabe mais qual parte da memória causou uma decisão específica.

Um novo artigo chamado AgenticSTS sugere um caminho diferente. Ele trata a memória como uma interface, em vez de uma disputa pela maior janela de contexto.

O artigo utiliza o jogo Slay the Spire 2 como base de testes. Este ambiente exige centenas de decisões estratégicas. Não é um simples chatbot.

A ideia central é esta: a memória é um contrato sobre o que uma decisão futura tem permissão para ver.

Em vez de transcrições brutas, os autores compõem novos prompts usando cinco camadas específicas:

  • Instruções de protocolo fixas
  • Esquemas de estado atual e de ação
  • Regras de jogo recuperadas
  • Resumos de execuções anteriores
  • Habilidades estratégicas acionadas

Essa estrutura muda tudo. Você pode inspecionar, congelar ou desativar cada camada. Você transforma a memória de um monte de dados em evidências selecionadas.

Muitas falhas de agentes em produção não são falhas do modelo. São falhas de contexto. O agente mistura o estado antigo com o novo ou carrega reflexões desatualizadas para frente. Se sua única política é anexar mais texto, a depuração parece arqueologia.

Uma interface de memória tipada oferece algo para comparar.

Para agentes de longa duração, uma janela de contexto enorme é uma armadilha. Ela se torna uma mistura de fatos, fatos desatualizados e tentativas fracassadas. Quanto maior a janela, mais fácil é confundir sedimento com memória.

Para construir agentes melhores, siga estes padrões:

  • Separe instruções estáveis do estado atual
  • Mantenha as regras em uma camada de recuperação (retrieval)
  • Armazene a experiência como registros explícitos, não como resíduos de chat
  • Transforme correções repetidas em habilidades acionadas
  • Torne cada camada de memória removível para testes

Se você não consegue desligar uma camada de memória, você não sabe se ela realmente ajuda. Você só sabe que o monte inteiro funciona às vezes.

Pare de tratar a memória do agente como uma camada de "vibes". Mova-se em direção a um sistema onde você saiba exatamente o que entra na próxima decisão, de onde veio e como desativá-lo.

Se o seu agente não consegue explicar o que tinha permissão para lembrar, ele não tem memória. Ele apenas tem um prompt com um porão.

Fonte: https://dev.to/komo/stop-dumping-agent-memory-into-the-prompt-58ka

Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi