Ndani ya AI Agent

Maonyesho ya AI agent yanaonekana vizuri kwenye video. Mara nyingi hushindwa unapouliza maswali ya kweli.

Agent hufanya jambo lisilo sahihi. Husahau maamuzi. Huita zana (tools) ambazo hazipo. Hujirudia mzunguko (loops) milele. Hizi siyo makosa ya modeli. Ni makosa ya mtiririko wa kazi (workflow failures).

Agent ni mtiririko wa programu (software workflow). Modeli ya lugha huchagua hatua inayofuata na kuita zana. Akili iko katika uratibu (orchestration), siyo kwenye modeli pekee.

Kila agent wa uzalishaji (production agent) unategemea nguzo tano:

  • Upangaji (Planning): Kufikiri kabla ya kutenda.
  • Matumizi ya Zana (Tool Use): Kushirikiana na ulimwengu.
  • Kumbukumbu (Memory): Kuhifadhi muktadha na ukweli.
  • Vizuizi (Constraints): Kuweka mipaka na bajeti.
  • Uthibitishaji (Verification): Kuthibitisha kuwa kazi ni sahihi.

Mitindo ya Upangaji

Agent wasio na uzoefu (naive agents) huingia moja kwa moja kwenye vitendo. Hii husababisha upotoshaji (hallucinations). Agent mzuri hupanga kwanza.

  1. Panga-kisha-tekeleza (Plan-then-execute): Modeli huandika mpango kamili. Ni rahisi kuukagua (audit) lakini ni vigumu kuubadilisha ikiwa hali halisi itabadilika.
  2. ReAct (Reason + Act): Modeli hufikiri, hutenda, na kuchunguza katika mzunguko. Ni inayoweza kubadilika zaidi lakini inagharimu zaidi katika tokeni na muda.

Matumizi ya Zana

Bila zana, agent ni chatbot tu. Zana inahitaji jina, JSON schema, na kazi (function).

Model huchagua zana kulingana na maelezo. Ikiwa maelezo yako ni ya jumla sana, agent atashindwa. Chukulia maelezo kama karatasi za maelezo ya kiufundi (spec sheets). Bainisha zana inachofanya na isichofanya.

Dhibiti (validate) kila mara wito wa zana. Ikiwa modeli itatuma hoja (arguments) mbaya, kataa wito huo na urudishe kosa hilo kwa modeli. Hii inamsaidia agent kujifunza katikati ya mzunguko.

Kumbukumbu

Kumbukumbu si kitu kimoja tu.

  • Kumbukumbu ya Kazi (Working Memory): Mazungumzo ya sasa na matokeo ya zana.
  • Scratchpad: Mahali pa agent kuandikia maelezo yake mwenyewe.
  • Kumbukumbu ya Muda Mrefu (Long-term Memory): Kuhifadhi ukweli kwa ajili ya vikao vya baadaye.

Usitegemee tu kanzidata za vector (vector databases). Kumbukumbu inayotegemea faili kwa kutumia faili za markdown mara nyingi ni bora zaidi. Ni rahisi kuikagua, kuifanyia marekebisho, na kuitafuta (grep).

Vizuizi na Usalama

Agent wa uzalishaji wanahitaji vizuizi (guardrails). Tumia hivi vinne:

  • Orodha ya zana zinazoruhusiwa (Tool allowlists): Ruhusu zana maalum na zilizopewa majina pekee.
  • Bajeti ya mzunguko (Iteration budgets): Weka kikomo cha idadi ya hatua ili kuzuia mzunguko usio na mwisho.
  • Bajeti ya tokeni (Token budgets): Limita gharama kwa kuweka kikomo cha jumla ya tokeni.
  • Milango ya idhini (Approval gates): Hitaji ruhusa ya binadamu kwa hatua zenye hatari kubwa kama kutuma barua pepe au kufuta data.

Uthibitishaji

Usiamini modeli wakati inasema kazi imekamilika. Modeli huwa na kujiamini kwa asili.

Tumia uthibitishaji wa kweli. Ikiwa agent anaandika kodi, endesha majaribio (tests). Ikiwa inazalisha JSON, kagua schema. Ikiwa inatekeleza kazi, endesha hoja (query) ili kuthibitisha mabadiliko.

Agent bora hutumia uthibitishaji ndani ya mzunguko. Ikiwa jaribio linashindwa, rudisha kosa hilo kwa agent. Iache ijaribu tena.

Acha kuhangaika kutafuta prompt bora zaidi. Anza kujenga miundombinu bora ya ndani (better plumbing).

Chanzo: https://dev.to/nazar_boyko/inside-an-ai-agent-planning-tool-use-memory-constraints-and-verification-2fcc

Jumuiya ya kujifunza ya hiari: https://t.me/GyaanSetuAi