Saya Melakukan Stress-Test pada Konfigurasi OpenClaw Saya Selama 48 Jam
Kebanyakan orang menguji OpenClaw selama lima menit. Mereka mengirim beberapa pesan. Jika berhasil, mereka menyebutnya siap untuk produksi.
Saya melakukan sesuatu yang berbeda. Saya membiarkan agen saya berjalan selama satu akhir pekan penuh.
Saya menemukan tiga kegagalan senyap (silent failures). Kegagalan tersebut tidak merusak sistem. Mereka hanya membuang-buang uang dan waktu saya.
Berikut adalah apa yang rusak dan bagaimana saya memperbaikinya.
- Penurunan Konteks (Context Decay) Setelah 18 jam, respons model menjadi tipis dan singkat. Tidak ada error yang muncul. Ia hanya kehabisan ruang konteks. Riwayat sesi tumbuh terlalu besar. Model mulai berhemat dalam penggunaan kata untuk menghemat ruang.
Solusinya: Tetapkan kebijakan pembersihan sesi.
- Batasi riwayat hingga 50 pesan.
- Reset sesi setiap 12 jam. Ini menjaga konteks tetap segar tanpa perlu pekerjaan manual.
- Penumpukan Tugas (Task Backlogs) Saya menggunakan cron job untuk menjalankan tugas setiap 15 menit. Terkadang sebuah tugas memakan waktu lebih dari 15 menit karena API yang lambat. Tugas berikutnya akan dimulai saat tugas pertama masih berjalan. Hal ini menciptakan antrean pekerjaan yang terus menumpuk.
Solusinya: Tambahkan mutex guard dengan lockfile.
- Periksa apakah lockfile ada.
- Jika lockfile berusia kurang dari 15 menit, lewati eksekusi baru.
- Ini mencegah tugas menumpuk.
- Biaya Tak Terlihat (Invisible Costs) Ketika model utama saya mencapai rate limit, OpenClaw beralih ke model fallback. Tugas selesai dengan sukses. Namun, model fallback tersebut memakan biaya 4x lebih mahal per token. Log menunjukkan semuanya baik-baik saja, tetapi anggaran saya terkuras dengan cepat.
Solusinya: Tambahkan pelacakan biaya secara eksplisit.
- Catat penggunaan token dan biaya setelah setiap eksekusi.
- Tinjau biaya per model setiap minggu.
OpenClaw dapat diandalkan sampai akhirnya tidak. Kegagalan biasanya terjadi saat Anda tidak sedang mengawasinya.
Saya menghabiskan 2 jam untuk memperbaiki masalah ini. Tes 48 jam tersebut menghabiskan biaya 20 dolar untuk token. Itu adalah pertukaran yang sepadan untuk memastikan sistem saya berjalan selama berhari-hari tanpa pengawasan.
Jika Anda tidak melakukan stress-test pada konfigurasi Anda setidaknya selama satu hari penuh, Anda belum siap untuk produksi.
Optional learning community: https://t.me/GyaanSetuAi
