When Your Agent Misbehaves, Do You Know Which One Did It?

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialwiki 2 zilizopita2min read

When Your Agent Misbehaves, Do You Know Which One Did It?

Wakati Wakala Wako Unapofanya Makosa, Je, Unajua Ni Yupi Aliyefanya?

Wakala hufuta rekodi ambayo hapaswi kuigusa. Hutuma ujumbe kwa mpangaji (tenant) asiyekuwa sahihi. Huita API katika mzunguko (loop) na kusababisha gharama zako kupanda ghafla.

Dakika kumi baada ya tukio kutokea, unauliza swali moja: ni wakala yupi aliyefanya hivi?

Ikiwa hujui, huwezi kuirekebisha. Huwezi kusitisha ujenzi (build). Huwezi kukagua kosa. Huwezi kujifunza kutokana na kosa.

Hili ni tatizo la utambulisho.

Timu nyingi hukumbana na mifumo mitatu inayoficha vitendo vya wakala:

Akaunti za huduma zinazoshirikiwa: Wakala kumi wanatumia seti moja ya utambulisho (credentials). Kila kitendo kinaonekana kuwa sawa kwenye kumbukumbu (logs) zako.
Utambulisho wa binadamu: Wakala hutumia jina lako la kuingia (login). Kumbukumbu zinaonyesha jina lako, si jina la wakala. Hii inatengeneza hatari kubwa ya usalama.
Mabadiliko ya siri (Silent drift): Ujenzi (builds) miwili tofauti unatumia jina moja. Moja inatumia modeli mpya au maelekezo (prompt) mapya, lakini kumbukumbu zinaonyesha utambulisho ule ule.

Ili kurekebisha hili, fuata hatua hizi:

Mpe kila wakala utambulisho wake binafsi. Usitumie utambulisho wa binadamu. Usitumie akaunti zinazoshirikiwa. Wakala lazima ajitambulishe kama yeye mwenyewe.
Weka nyanja (fields) sita mahususi kwenye kila kitendo:

Accountable party: Nani anahusika na wakala huyu?
Operational owner: Nani anayemtunza kila siku?
Tenant: Hii ni kwa ajili ya mteja yupi?
Agent-type-id: Je, huu ni ujenzi (build) gani mahususi?
Agent-instance-id: Je, huu ni mkimbio (run) gani mahususi?
Trace context: Hii iko wapi katika mnyororo wa mawasiliano?

Tumia 'hashes' kwa ajili ya utoaji toleo (versioning). Usiupe wakala wako jina "support-agent-v2." Ukibadilisha maelekezo ya mfumo (system prompt), jina linabaki vilevile, lakini tabia inabadilika. Badala yake, tumia 'content hash.' Tengeneza 'hash' kulingana na picha ya kontena (container image), maelekezo (prompt), modeli, na usanidi (config). Ukibadilisha mstari mmoja wa kodi, ID inabadilika. Hii inafanya mabadiliko ya siri yaonekane.
Rekodi asili (lineage). Wakala huunda wakala wadogo (sub-agents). Lazima urekodi ni wakala mzazi gani aliyeanzisha wakala mdogo. Lazima pia urekodi maelekezo (prompt) ambayo mzazi alimpa wakala mdogo. Hii ndiyo njia pekee ya kupata maelekezo yaliyoingizwa au data iliyochafuliwa.

Utambulisho ndio msingi wa ukarabati wako. Unakuwezesha kutumia 'kill switch' na kujenga njia ya ukaguzi (audit trail). Lazima uandae hili kabla ya tukio kutokea. Kuongeza utambulisho wakati wa mgogoro ni kuchelewa mno.

Kagua kumbukumbu (logs) zako sasa hivi. Angalia kitendo cha saa moja iliyopita. Je, unaweza kutaja ujenzi (build) mahususi uliokata kitendo hicho? Ikiwa huwezi, una pengo la kuziba.

Source: https://dev.to/brennhill/when-your-agent-does-something-bad-can-you-tell-which-agent-did-it-37a2

Optional learning community: https://t.me/GyaanSetuAi

When Your Agent Misbehaves, Do You Know Which One Did It?

Continue reading

𝟳 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀 𝗧𝗵𝗮𝘁 𝗕𝗿𝗲𝗮𝗸 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

𝗧𝗵𝗲 𝗦𝗮𝗳𝗲𝘀𝘁 𝗕𝗼𝘂𝗻𝗱𝗮𝗿𝘆 𝗜𝘀 𝗧𝗵𝗲 𝗢𝗻𝗲 𝗧𝗵𝗲 𝗔𝗴𝗲𝗻𝘁 𝗖𝗮𝗻'𝘁 𝗥𝗲𝗮𝗰𝗵 𝗔𝗰𝗿𝗼𝘀𝘀

Mpango wa Kurudisha Nyuma wa Wakala wa AI: Batilisha Vitendo Vibaya Kabla Watumiaji Hawajapoteza Imani

Your Agents Are Fine. The Handoff Between Them Isn't.

Your Agent Didn't Break Prod. Your Pipeline Did.