Hakuna Pull Request kwa Ajili ya Wakala Huru (Autonomous Agent)
Mapitio ya usalama ya kimapokeo yanategemea diff. Mtu anafungua pull request. Mtu mwingine anaisoma. Kodo lililo kwenye uzalishaji (production) linafanana na kodo ulilolipitia.
Wakala huru (autonomous agents) vinavunja mfumo huu.
Wakala hupanga na kuitumia zana wakati wa utendaji (runtime). Haupakui vitendo kwenye commit. Unaamua vitendo wakati unatembea. Ukipitia kodo la programu pekee, unakosa hatari halisi.
Wakala si kodo tu. Ni usanidi wa wakati wa utendaji (runtime configuration). Usanidi huu unajumuisha:
• System prompt • Harness au loop • Uso wa zana (tool surface) • Kumbukumbu na utambulisho • Sera za kutoa data kwenye mtandao (network egress policies) • Picha za kontena (container images)
Wakala wawili wanaotumia modeli moja yanaweza kutenda tofauti kulingana na mipangilio hii. Modeli inabaki vilevile. Usanidi unabadilisha kila kitu.
Timu nyingi huchukulia system prompts kama mipangilio rahisi ya kisanduku cha maandishi. Wanazihariri kwenye dashboard. Hili ni kosa. Mabadiliko ya mstari mmoja yanaweza kuondoa kinga (guardrail). Prompt inayoweza kuhaririwa ni njia ya kodo ambayo haijapitiwa.
Matukio halisi yanathibitisha hili:
• Bot ilitoa ushauri haramu kwa wenye nyumba kwa wiki kadhaa. • Bot ya msaada ilianza kutukana wateja kutokana na sasisho la prompt. • Faili zenye nia mbaya zilitumia herufi zisizoonekana ili kukwepa sheria.
Haya hayakuwa makosa ya modeli. Yalikuwa mabadiliko ya usanidi ambayo hakuna aliyeyapitia.
Lazima uchukulie usanidi kama kodo.
Weka system prompts na usanidi wa harness kwenye udhibiti wa toleo (version control). Zibadilishe kupitia pull request pekee. Tumia diffs kuona nini kimebadilika.
Tumia content hash kwa usanidi wako uliowekwa (deployed configuration). Hash hii inapaswa kujumuisha toleo la prompt, ID ya modeli, na digest ya kontena. Ukibadilisha prompt, utambulisho wa wakala unabadilika. Huwezi kubadilisha prompt kimyakimya.
Tumia utambuzi wa mabadiliko (drift detection) kwenye uso wa wakala. Usifuatilie tu mwenyeji (host). Fuatilia orodha za seva za MCP na sera mahususi za kutoa data (egress policies) kwa wakala huyo.
Unapofanya uandikishaji (logging), fuatilia mambo haya mawili:
• Ukubwa wa muktadha wakati wa uamuzi (Decision-time context size): Modeli ilikuwa na habari kiasi gani ilipotenda? • Prompt mama (The parent prompt): Katika mifumo ya wakala wengi (multi-agent systems), wakala aliyeita alituma nini?
Hauhitaji zana mpya. Tumia udhibiti wako wa toleo (version control) na uandikishaji uliopangwa (structured logging) uliopo. Unahitaji tu kuelekeza kwenye sehemu sahihi.
Je, unatumia udhibiti wa toleo na kupitia system prompts zako? Au mtu yeyote mwenye ufikiaji wa console anaweza kuzibadilisha bila kuacha alama?
Jumuia ya kujifunza ya hiari: https://t.me/GyaanSetuAi
