मी माझ्या OpenClaw कॉन्फिगचे (Config) ४८ तासांसाठी स्ट्रेस-टेस्ट (Stress-Test) केले
बहुतेक लोक OpenClaw पाच मिनिटांसाठी टेस्ट करतात. ते काही मेसेज पाठवतात. जर ते काम करत असेल, तर ते त्याला 'प्रोडक्शन-रेडी' (production-ready) म्हणतात.
मी काहीतरी वेगळे केले. मी माझा एजंट (agent) पूर्ण वीकेंडसाठी चालू ठेवला.
मला तीन 'सायलेंट फेलियर्स' (silent failures) आढळले. त्यामुळे सिस्टम क्रॅश झाली नाही, पण यामुळे माझे पैसे आणि वेळ दोन्ही वाया गेले.
काय बिघडले आणि मी ते कसे दुरुस्त केले, ते खाली दिले आहे.
१. कॉन्टेक्स्ट डिके (Context Decay) १८ तासांनंतर, मॉडेलची उत्तरे कमी आणि संक्षिप्त होऊ लागली. यात कोणताही एरर (error) आला नाही, फक्त कॉन्टेक्स्ट स्पेस (context space) संपली होती. सेशन हिस्ट्री (session history) खूप मोठी झाली होती. जागा वाचवण्यासाठी मॉडेलने शब्दांचा वापर मर्यादित करण्यास सुरुवात केली.
उपाय: सेशन पर्ज पॉलिसी (session purge policy) सेट करा.
- हिस्ट्री ५० मेसेजपर्यंत मर्यादित ठेवा.
- दर १२ तासांनी सेशन रिसेट करा. यामुळे मानवी हस्तक्षेपाशिवाय कॉन्टेक्स्ट ताजे राहतो.
२. टास्क बॅकलॉग्स (Task Backlogs) मी दर १५ मिनिटांनी टास्क चालवण्यासाठी 'क्रॉन जॉब' (cron job) वापरला होता. कधीकधी स्लो APIs मुळे एका टास्कला १५ मिनिटांपेक्षा जास्त वेळ लागायचा. पहिला टास्क अजून चालू असतानाच पुढचा टास्क सुरू व्हायचा. यामुळे कामांची रांग (queue) वाढत गेली.
उपाय: लॉकफाइलसह (lockfile) म्युटेक्स गार्ड (mutex guard) जोडा.
- लॉकफाइल अस्तित्वात आहे का ते तपासा.
- जर लॉकफाइल १५ मिनिटांपेक्षा जुनी नसेल, तर नवीन रन वगळा.
- यामुळे टास्क साचून जाण्यापासून रोखले जातात.
३. अदृश्य खर्च (Invisible Costs) जेव्हा माझ्या प्रायमरी मॉडेलने (primary model) रेट लिमिट (rate limit) गाठली, तेव्हा OpenClaw ने फॉलबॅक मॉडेलवर (fallback model) स्विच केले. टास्क यशस्वीरित्या पूर्ण झाला. मात्र, फॉलबॅक मॉडेलचा प्रति टोकन (per token) खर्च ४ पटीने जास्त होता. लॉग्समध्ये सर्व काही ठीक असल्याचे दिसत होते, पण माझा बजेट वेगाने संपत होता.
उपाय: स्पष्ट कॉस्ट ट्रॅकिंग (cost tracking) जोडा.
- प्रत्येक रननंतर टोकन वापर आणि खर्च लॉग करा.
- दर आठवड्याला मॉडेलनुसार खर्चाचा आढावा घ्या.
OpenClaw जोपर्यंत व्यवस्थित चालते तोपर्यंत विश्वासार्ह आहे, पण कधीकधी ते फेल होऊ शकते. सहसा जेव्हा तुम्ही लक्ष देत नसता, तेव्हाच अशा चुका होतात.
या समस्या सोडवण्यासाठी मी २ तास खर्च केले. ४८ तासांच्या टेस्टमुळे माझे २० डॉलर्सचे टोकन्स खर्च झाले. माझे सिस्टम कोणत्याही देखरेखीशिवाय अनेक दिवस चालेल याची खात्री करण्यासाठी हा एक योग्य व्यवहार आहे.
जर तुम्ही तुमच्या कॉन्फिगचे किमान एक पूर्ण दिवस स्ट्रेस-टेस्ट केले नसेल, तर तुम्ही प्रोडक्शनसाठी तयार नाही आहात.
पर्यायी लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi
