Sometí mi configuración de OpenClaw a una prueba de estrés de 48 horas

La mayoría de la gente prueba OpenClaw durante cinco minutos. Envían unos pocos mensajes. Si funciona, dicen que está listo para producción.

Yo hice algo diferente. Dejé mi agente funcionando durante todo un fin de semana.

Encontré tres fallos silenciosos. No hicieron que el sistema fallara. Simplemente me costaron dinero y tiempo.

Esto es lo que falló y cómo lo solucioné.

  1. Degradación del contexto Después de 18 horas, las respuestas del modelo se volvieron escuetas y cortas. No dio error. Simplemente se quedó sin espacio de contexto. El historial de la sesión creció demasiado. El modelo empezó a ser económico con sus palabras para ahorrar espacio.

La solución: Establecer una política de purga de sesiones.

  • Limitar el historial a 50 mensajes.
  • Reiniciar la sesión cada 12 horas. Esto mantiene el contexto actualizado sin necesidad de trabajo manual.
  1. Acumulación de tareas Utilicé un cron job para ejecutar tareas cada 15 minutos. A veces, una tarea tardaba más de 15 minutos debido a la lentitud de las APIs. La siguiente tarea comenzaba mientras la primera aún se estaba ejecutando. Esto creó una cola de trabajos cada vez mayor.

La solución: Añadir un guard mutex con un lockfile.

  • Comprobar si existe un lockfile.
  • Si el lockfile tiene menos de 15 minutos, omitir la nueva ejecución.
  • Esto evita que las tareas se acumulen.
  1. Costes invisibles Cuando mi modelo principal alcanzó un rate limit, OpenClaw cambió a un modelo de fallback. La tarea finalizó con éxito. Sin embargo, el modelo de fallback costaba 4 veces más por token. Los logs decían que todo estaba bien, pero mi presupuesto se agotaba rápidamente.

La solución: Añadir un seguimiento de costes explícito.

  • Registrar el uso de tokens y el coste después de cada ejecución.
  • Revisar los costes por modelo semanalmente.

OpenClaw es fiable hasta que deja de serlo. Los fallos suelen ocurrir cuando no estás mirando.

Pasé 2 horas solucionando estos problemas. La prueba de 48 horas me costó 20 dólares en tokens. Es un trato justo para asegurar que mi sistema funcione durante días sin supervisión.

Si no sometes tu configuración a una prueba de estrés de al menos un día completo, no estás listo para producción.

Fuente: https://dev.to/mrclaw207/i-stress-tested-my-openclaw-config-for-48-hours-heres-what-actually-broke-3ikk

Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi