Wakati Wakala Wako Unapofanya Makosa, Je, Unajua Ni Yupi Aliyefanya?

Wakala hufuta rekodi ambayo hapaswi kuigusa. Hutuma ujumbe kwa mpangaji (tenant) asiyekuwa sahihi. Huita API katika mzunguko (loop) na kusababisha gharama zako kupanda ghafla.

Dakika kumi baada ya tukio kutokea, unauliza swali moja: ni wakala yupi aliyefanya hivi?

Ikiwa hujui, huwezi kuirekebisha. Huwezi kusitisha ujenzi (build). Huwezi kukagua kosa. Huwezi kujifunza kutokana na kosa.

Hili ni tatizo la utambulisho.

Timu nyingi hukumbana na mifumo mitatu inayoficha vitendo vya wakala:

  • Akaunti za huduma zinazoshirikiwa: Wakala kumi wanatumia seti moja ya utambulisho (credentials). Kila kitendo kinaonekana kuwa sawa kwenye kumbukumbu (logs) zako.
  • Utambulisho wa binadamu: Wakala hutumia jina lako la kuingia (login). Kumbukumbu zinaonyesha jina lako, si jina la wakala. Hii inatengeneza hatari kubwa ya usalama.
  • Mabadiliko ya siri (Silent drift): Ujenzi (builds) miwili tofauti unatumia jina moja. Moja inatumia modeli mpya au maelekezo (prompt) mapya, lakini kumbukumbu zinaonyesha utambulisho ule ule.

Ili kurekebisha hili, fuata hatua hizi:

  1. Mpe kila wakala utambulisho wake binafsi. Usitumie utambulisho wa binadamu. Usitumie akaunti zinazoshirikiwa. Wakala lazima ajitambulishe kama yeye mwenyewe.

  2. Weka nyanja (fields) sita mahususi kwenye kila kitendo:

  • Accountable party: Nani anahusika na wakala huyu?
  • Operational owner: Nani anayemtunza kila siku?
  • Tenant: Hii ni kwa ajili ya mteja yupi?
  • Agent-type-id: Je, huu ni ujenzi (build) gani mahususi?
  • Agent-instance-id: Je, huu ni mkimbio (run) gani mahususi?
  • Trace context: Hii iko wapi katika mnyororo wa mawasiliano?
  1. Tumia 'hashes' kwa ajili ya utoaji toleo (versioning). Usiupe wakala wako jina "support-agent-v2." Ukibadilisha maelekezo ya mfumo (system prompt), jina linabaki vilevile, lakini tabia inabadilika. Badala yake, tumia 'content hash.' Tengeneza 'hash' kulingana na picha ya kontena (container image), maelekezo (prompt), modeli, na usanidi (config). Ukibadilisha mstari mmoja wa kodi, ID inabadilika. Hii inafanya mabadiliko ya siri yaonekane.

  2. Rekodi asili (lineage). Wakala huunda wakala wadogo (sub-agents). Lazima urekodi ni wakala mzazi gani aliyeanzisha wakala mdogo. Lazima pia urekodi maelekezo (prompt) ambayo mzazi alimpa wakala mdogo. Hii ndiyo njia pekee ya kupata maelekezo yaliyoingizwa au data iliyochafuliwa.

Utambulisho ndio msingi wa ukarabati wako. Unakuwezesha kutumia 'kill switch' na kujenga njia ya ukaguzi (audit trail). Lazima uandae hili kabla ya tukio kutokea. Kuongeza utambulisho wakati wa mgogoro ni kuchelewa mno.

Kagua kumbukumbu (logs) zako sasa hivi. Angalia kitendo cha saa moja iliyopita. Je, unaweza kutaja ujenzi (build) mahususi uliokata kitendo hicho? Ikiwa huwezi, una pengo la kuziba.

Source: https://dev.to/brennhill/when-your-agent-does-something-bad-can-you-tell-which-agent-did-it-37a2

Optional learning community: https://t.me/GyaanSetuAi