Eu Fiz um Teste de Estresse na Minha Configuração do OpenClaw por 48 Horas
A maioria das pessoas testa o OpenClaw por cinco minutos. Elas enviam algumas mensagens. Se funcionar, dizem que está pronto para produção.
Eu fiz algo diferente. Deixei meu agente rodando durante um fim de semana inteiro.
Encontrei três falhas silenciosas. Elas não derrubaram o sistema. Apenas me custaram dinheiro e tempo.
Aqui está o que quebrou e como eu consertei.
- Decaimento de Contexto Após 18 horas, as respostas do modelo tornaram-se superficiais e curtas. Não houve erro. Ele simplesmente ficou sem espaço de contexto. O histórico da sessão cresceu demais. O modelo começou a economizar palavras para poupar espaço.
A solução: Defina uma política de limpeza de sessão.
- Limite o histórico a 50 mensagens.
- Reinicie a sessão a cada 12 horas. Isso mantém o contexto atualizado sem necessidade de trabalho manual.
- Acúmulo de Tarefas Eu usei um cron job para executar tarefas a cada 15 minutos. Às vezes, uma tarefa levava mais de 15 minutos devido a APIs lentas. A próxima tarefa começava enquanto a primeira ainda estava rodando. Isso criou uma fila crescente de jobs.
A solução: Adicione uma proteção de mutex com um lockfile.
- Verifique se um lockfile existe.
- Se o lockfile tiver menos de 15 minutos, pule a nova execução.
- Isso evita que as tarefas se acumulem.
- Custos Invisíveis Quando meu modelo principal atingiu um limite de taxa (rate limit), o OpenClaw mudou para um modelo de fallback. A tarefa foi concluída com sucesso. No entanto, o modelo de fallback custou 4x mais por token. Os logs diziam que estava tudo bem, mas meu orçamento estava acabando rápido.
A solução: Adicione um rastreamento de custos explícito.
- Registre o uso de tokens e o custo após cada execução.
- Revise os custos por modelo semanalmente.
O OpenClaw é confiável até que não seja. As falhas geralmente acontecem quando você não está observando.
Gastei 2 horas corrigindo esses problemas. O teste de 48 horas me custou 20 dólares em tokens. É uma troca justa para garantir que meu sistema funcione por dias sem supervisão.
Se você não fizer um teste de estresse na sua configuração por pelo menos um dia inteiro, você não está pronto para a produção.
Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi
