Cron Yangu Ilisema OK Lakini Haikufanya Lolote

Jumanne iliyopita, wakala wangu wa OpenClaw alifanya ukaguzi wa usalama.

Dashibodi ilionyesha taa ya kijani. Ilisema hali: ok. Hakukuwa na makosa wala tahadhari.

Lakini wakala hakufanya lolote.

Wakala alikwama wakati wa kazi. Hitilafu ya MiniMax overload ilitokea. Framework ya nje haikuigundua. Framework iliona ukamilishaji wa mafanikio ingawa wakala alishindwa.

Niligundua hitilafu hii siku tatu baadaye nilipokagua transcript ya kikao kwa mkono.

Nilihitaji njia ya kupata hitilafu hizi za kimya. Nilijenga skripti ya mapitio ya mistari 30 ili kuitatua.

Tatizo

Frameworks hugundua muda wa mtandao kuisha (network timeouts) na kushindwa kwa uthibitisho (auth failures). Hazigundui kinachotokea ndani ya mzunguko wa wakala (agent turn). Wakala mdogo (sub-agent) anapokwama, mfumo mara nyingi hutoa ujumbe maalum: "[assistant turn failed before producing content]".

Kwa framework, hii inaonekana kama ujumbe wa kawaida. Hali inabaki kuwa "ok". Hii ni hitilafu ya kimya. Ni aina ngumu zaidi ya hitilafu kupata.

Suluhisho

Niliongeza skripti ya kukagua maudhui halisi ya transcript badala ya kukagua tu kodi ya hali (status code).

Skripti hiyo hutafuta mfululizo huo maalum wa hitilafu. Pia hutumia regular expression ili kutoa ujumbe sahihi wa hitilafu kutoka kwenye maandishi.

Hii inaruhusu skripti kuonyesha chanzo halisi, kama vile:

  • overloaded_error
  • rate_limit_exceeded
  • context_length_exceeded

Mara tu nilipoona maelezo ya hitilafu, nilipata chanzo cha msingi. Kukwama kulitokea kwa sababu ya mnyororo wa model fallback. Niliondoa model ya fallback ya bure ambayo ilikuwa ikisababisha hitilafu zinazofuatana (cascading failures). Kuiondoa kulifanya cron zangu kuwa na kasi zaidi na za kuaminika zaidi.

Matokeo

Sasa skripti hiyo hukimbizwa kila usiku. Inakagua transcript za siku iliyopita. Ikipata kukwama kwa kimya, inatuma tahadhari kwenye Telegram yangu.

Sihitaji tena kusubiri siku kadhaa ili kupata hitilafu. Naziona kila asubuhi.

Funzo

Dashibodi ya kijani haimaanishi kuwa wakala wako alifanya kazi. Hali ya framework na matokeo ya wakala ni vitu tofauti.

Ikiwa unatumia wakala wa kiotomatiki, usitegemee kodi za hali pekee. Kagua transcript. Jenga zana ya kukagua transcript kwa ajili yako. Hitilafu za kimya ndizo zinazosababisha uharibifu mkubwa zaidi.

Chanzo: https://dev.to/mrclaw207/my-openclaw-cron-said-ok-but-did-nothing-i-fixed-it-with-a-30-line-review-script-33ll

Jumuiya ya kujifunza ya hiari: https://t.me/GyaanSetuAi