Pare de Despejar a Memória do Agente no Prompt
A maioria dos desenvolvedores constrói loops de agentes anexando tudo ao próximo prompt.
Você adiciona observações anteriores, chamadas de ferramentas (tool calls) e rastros de raciocínio. Você continua adicionando dados até que o prompt se torne uma gaveta de bagunça. O modelo vê mais, mas você perde o controle. Você não sabe mais qual parte da memória causou uma decisão específica.
Um novo artigo chamado AgenticSTS sugere um caminho diferente. Ele trata a memória como uma interface, em vez de uma disputa pela maior janela de contexto.
O artigo utiliza o jogo Slay the Spire 2 como base de testes. Este ambiente exige centenas de decisões estratégicas. Não é um simples chatbot.
A ideia central é esta: a memória é um contrato sobre o que uma decisão futura tem permissão para ver.
Em vez de transcrições brutas, os autores compõem novos prompts usando cinco camadas específicas:
- Instruções de protocolo fixas
- Esquemas de estado atual e de ação
- Regras de jogo recuperadas
- Resumos de execuções anteriores
- Habilidades estratégicas acionadas
Essa estrutura muda tudo. Você pode inspecionar, congelar ou desativar cada camada. Você transforma a memória de um monte de dados em evidências selecionadas.
Muitas falhas de agentes em produção não são falhas do modelo. São falhas de contexto. O agente mistura o estado antigo com o novo ou carrega reflexões desatualizadas para frente. Se sua única política é anexar mais texto, a depuração parece arqueologia.
Uma interface de memória tipada oferece algo para comparar.
Para agentes de longa duração, uma janela de contexto enorme é uma armadilha. Ela se torna uma mistura de fatos, fatos desatualizados e tentativas fracassadas. Quanto maior a janela, mais fácil é confundir sedimento com memória.
Para construir agentes melhores, siga estes padrões:
- Separe instruções estáveis do estado atual
- Mantenha as regras em uma camada de recuperação (retrieval)
- Armazene a experiência como registros explícitos, não como resíduos de chat
- Transforme correções repetidas em habilidades acionadas
- Torne cada camada de memória removível para testes
Se você não consegue desligar uma camada de memória, você não sabe se ela realmente ajuda. Você só sabe que o monte inteiro funciona às vezes.
Pare de tratar a memória do agente como uma camada de "vibes". Mova-se em direção a um sistema onde você saiba exatamente o que entra na próxima decisão, de onde veio e como desativá-lo.
Se o seu agente não consegue explicar o que tinha permissão para lembrar, ele não tem memória. Ele apenas tem um prompt com um porão.
Fonte: https://dev.to/komo/stop-dumping-agent-memory-into-the-prompt-58ka
Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi
