Muuaji wa Kimyakimya wa ROI ya Agentic AI

Pod zako za Kubernetes ni za kijani. Latency ya API yako ni ndogo. Mtoa huduma wako wa LLM anaonyesha uptime ya 99.9%.

Hata hivyo, mfumo wako wa mikopo wa kiotomatiki umetumia bajeti yake yote ya mwezi ya API ndani ya saa tatu. Wakala (agents) wawili walinaswa kwenye mzunguko (loop).

Hii ndiyo kitendawili cha "Afya lakini Inatengeneza Maelezo ya Uongo" (Healthy but Hallucinating).

Katika programu za jadi, mfumo ama upo hai au umepotea. Katika mtandao wa mawakala (agentic mesh), mfumo unaweza kuonekana kuwa na afya lakini ukashindwa kabisa. Ikiwa unatumia Site Reliability Engineering (SRE) ya kawaida kwa ajili ya mawakala, unatazama ishara zisizo sahihi. Unapima mapigo ya moyo ya mgonjwa ambaye kiuhalisia amekufa ubongo.

Kwa nini miundombinu ya kawaida inashindwa kuzuia kuporomoka kwa mawakala (agentic collapse)?

SRE ya jadi imejengwa kwa ajili ya mifumo inayotabirika (deterministic systems). Huduma inapofeli, inatoa kosa (error). Ni binary. Makosa ya mawakala ni tofauti. Wakala hauanguki (crash). Unateleza (drifts). Haipotezi muda (time out). Inatengeneza parameter ya uongo (hallucinates) ambayo husababisha kufeli kimyakimya hatua kadhaa baadaye.

Tunaona pengo hili wakati wa kuhama kutoka kwa bot moja hadi mifumo ya mawakala ya kampuni (enterprise agent fabrics). Timu inaripoti usahihi wa 95% kwenye kipimo (benchmark), lakini mfumo unashindwa wakati wa matumizi halisi (production). Vipimo (benchmarks) hupima ikiwa modeli inaweza kujibu swali. Havipimi ikiwa mfumo unaweza kudumisha hali (state) katika mchakato wa hatua 12 unaohusisha mawakala wanne.

Unahitaji Agent Reliability Engineering (ARE).

SRE ya jadi inadhibiti hali za binary. ARE inadhibiti usambazaji wa uwezekano (probability distributions). Ikiwa unafuatilia CPU na kumbukumbu (memory) pekee, huoni makosa ya mawakala.

Makosa katika mifumo ya mawakala wengi (multi-agent systems) hayajikusanyi tu. Yanazidishwa. Kwa sababu mawakala hutumia matokeo ya mawakala wengine kama ukweli, kosa dogo katika hatua ya kwanza linakuwa janga kufikia hatua ya tano.

Njia za kawaida za kufeli ni pamoja na:

  • Mizunguko isiyo na mwisho ya mawakala (Agentic infinite loops)
  • Mtelezo wa hali (State drift)
  • Mfululizo wa uingizaji wa maelekezo (Prompt injection cascades)
  • Hallucinations za wito wa zana (Tool-call hallucinations)

Mfano hatari: Wakala anaita zana ya kusasisha (update tool). Anabuni parameter ambayo haipo. API inapuuza parameter hiyo ya ziada na kurudisha 200 OK. Wakala anadhani amefanikiwa, lakini mantiki ya biashara (business logic) imefeli kimyakimya.

ARE inajikita kwenye mzunguko wa "nia-tendo-matokeo" (intent-action-outcome). Haufanyi ufuatiliaji tu ikiwa wakala ameiita zana. Unafuatilia ikiwa wito huo uliendana na nia ya awali na ikiwa matokeo yalifikia lengo.

Nafasi ya Mhandisi wa Uhakika wa Wakala (Agent Reliability Engineer - ARE) inashughulikia:

  • Uchambuzi wa Nia (Intent Analysis): Kutambua wakati wakala unateleza kutoka kwenye lengo.
  • Marekebisho ya Kinga (Guardrail Tuning): Kurekebisha vizuizi ili kusitisha mizunguko.
  • Upangaji wa Utegemevu (Dependability Mapping): Kuamua wakati wakala lazima amkabidhi kazi binadamu.
  • Usanifu wa Ukaguzi (Audit Architecture): Kunasa mantiki ya ndani na mabadiliko ya hali.

Acha kuzungumzia usahihi. Anza kuzungumzia Utegemevu wa Mfumo (System Dependability).

Unaweza kuuelezea huu uamuzi kwa CFO kwa kukadiria gharama ya uingiliaji kati wa binadamu. Kila wakati binadamu anaporekebisha kosa la wakala, hiyo ni kushindwa kwa uhakika. Zidisha saa hizo kwa mishahara ya wataalamu wako. Gharama ya kutokuwa na uhakika inakuwa wazi.

Tumia Bajeti za Makosa za Wakala (Agentic Error Budgets). Kwa kifupisho rahisi cha barua pepe, bajeti yako ya makosa ni kubwa. Kwa mfumo unaohamisha $10M, bajeti yako ya makosa ni sifuri.

Usichukulie AI kama kipengele cha programu. Ichukulie kama hatari ya kimfumo. Washindi katika enzi hii hawatawa na modeli zenye akili zaidi. Watakuwa na mifumo inayotegemewa zaidi.

Chanzo: https://dev.to/omnithium/the-silent-killer-of-agentic-ai-roi-why-multi-agent-reliability-needs-a-new-sre-discipline-5h7e

Jumuiya ya kujifunza ya hiari: https://t.me/GyaanSetuAi