AI Agents Katika Vitendo: Kusoma Makosa Kutoka Kwenye Trace

Wakala wako wa AI haufeli. Unaripoti mafanikio. Lakini akaunti yako ya benki inaonyesha kosa.

Marejesho ya pesa yalitumwa kwa oda ambayo haijawahi kufutwa. Mteja amepata bidhaa na pesa. Wakala alifikiri ametekeleza kazi yake.

Usitafute modeli kubwa zaidi. Usiongeze tu mzunguko wa kujaribu tena (retry loop). Yote mawili ni makisio.

Badala yake, soma trace. Wakala tayari ameandika kile alichofanya.

Trace nzuri ya uzalishaji inarekodi mzunguko hatua kwa hatua. Lazima ionyeshe:

  • Wakala alichochunguza
  • Alichoamua
  • Kifaa gani alichokitumia
  • Kifaa kilichorudisha nini
  • Uhakiki uliosomwa kutoka kwenye chanzo cha ukweli (source of truth)
  • Hali ya mwisho na gharama

Sehemu muhimu zaidi ni pengo kati ya jibu la kifaa na uhakiki uliosomwa. Kifaa kinaweza kusema "accepted," lakini hiyo haimaanishi kuwa hali imebadilika. Uhakiki uliosomwa unakuambia ikiwa mabadiliko hayo yamefanyika kweli.

Makosa kwa kawaida hugawanyika katika makundi mawili:

  1. Makosa ya Utekelezaji
  • Makosa ya kifaa: Hoja mbaya au muda kuisha (timeouts).
  • Makosa ya mantiki: Modeli ilichagua hatua isiyo sahihi.
  • Makosa ya hali ya udhibiti: Wakala anaamini uongo. Anafikiri oda imefutwa kwa sababu kifaa kimesema hivyo, hata kama kanzi data (database) inasema vinginevyo.
  1. Makosa ya Muundo wa Mzunguko
  • Kupungua kwa muktadha: Wakala anapoteza uzi wa kazi.
  • Mzunguko uliopitiliza: Wakala anarudia hatua bila kupiga hatua.
  • Kukwama kimya kimya: Wakala anakwama bila kutoa kosa. Unahitaji watchdog kuchukulia ukimya huo kama kosa.

Unapopata kosa, usijaribu tu tena. Kujaribu tena ni mkakati, siyo utambuzi.

  • Ikiwa ni kosa la muda mfupi kama muda kuisha, jaribu tena.
  • Ikiwa ni kosa la mantiki, kujaribu tena kunatumia tu bajeti yako kugonga ukuta uleule.
  • Ikiwa wakala anakutana na kikwazo, acha na umtaarifu binadamu.

Njia bora ya kurekebisha kosa ni kuligeuza kuwa jaribio.

Tumia trace kuandika grader. Ikiwa wakala alishindwa kuhakiki ufutaji, andika jaribio ambalo litafeli ikiwa marejesho yatafanyika bila hali ya ufutaji iliyothibitishwa. Geuza makosa uliyolipiwa kuwa makosa ambayo hutayalipia mara mbili.

Source: https://dev.to/gursharansingh/ai-agents-in-practice-part-7-when-the-loop-goes-wrong-reading-agent-failures-from-the-trace-5bdp

Optional learning community: https://t.me/GyaanSetuAi