Jinsi Ninavyoendesha Programu Nyingi Pekee: Agent Harness

Ninatengeneza na kudumisha programu kadhaa ndogo peke yangu. Sina mwenza wa kuanzisha biashara, sina wafanyakazi, na sina wakandarasi. Ninatumia mtu mmoja na kikundi cha wakala wa AI.

Watu wanafikiri AI inanisaidia kuandika kodi haraka zaidi. Siri si hiyo.

Siri ni kwamba siwahi kuruhusu AI kusema kazi imekamilika bila ushahidi. Unapofanya kazi peke yako, hatari si kazi ya polepole. Hatari ni kuwa na makosa lakini unaamini kuwa uko sahihi.

AI itakuambia kuwa majaribio yamefaulu hata kama haijawahi kuyafanya. Itasema kipengezi fulani kimekamilika wakati imeandika jina la kazi tu. Bila mfanyakazi mwenzako wa kukukamata makosa, "inaonekana vizuri" moja mbaya inaweza kuharibu programu yako.

Nilitengeneza mfumo unaitwa harness. Unafanya kukamilisha kazi kwa uongo kuwa na gharama kubwa. Unatumia wakala maalum na milango ya uhakiki ili kuhakikisha AI inasema ukweli.

Hivi ndivyo inavyofanya kazi:

• Wakala Maalum (Specialized Agents): Badala ya msaidizi mmoja, ninatumia wakala arobaini maalum. Mmoja anapitia kodi ya Flutter. Mmoja anakagua usalama. Mmoja anatekeleza majaribio. Mmoja anakagua ukweli kwa kulinganisha madai dhidi ya mabadiliko halisi. • Kazi Iliyojitenga (Isolated Work): Wakala hufanya kazi katika mazingira tofauti na ya muda. Hawezi kufuta kazi ya mwingine. • Marudio (Redundancy): Ninatumia wawakaguzi wengi kwa mabadiliko mamoja. Mwakaguzi mmoja anaweza kukosa hitilafu. Wawakaguzi watatu wenye malengo tofauti pamoja na mshukiwa wataipata. • Mifumo ya Hatua Maalum (Fixed Pipelines): Kila kazi hufuata njia thabiti:

  • Panga kazi.
  • Tekeleza mabadiliko.
  • Endesha kodi halisi. Sikubali "Nadhani inafanya kazi." Ninakubali tu matokeo halisi.
  • Ukaguzi wa ukweli (Reality audit). Wakala tofauti anakagua ikiwa kodi inalingana na dai.
  • Mapitio (Review). Mtaalamu wa lugha anakagua kazi.
  • Mlango wa uhakiki (Verify gate). Hatua ya mwisho inakagua mabadiliko halisi na uvujaji wa usalama. Inarudisha PASS au REJECT.

Mfumo huu unazuia uongo ambao nilikuwa unajiambia mwenyewe.

"Inapaswa kufanya kazi" inafeli katika hatua ya utekelezaji. "Imekamilika" inafeli katika ukaguzi wa ukweli ikiwa kodi ni ganda tupu tu. "Yote ni kijani" inafeli ikiwa onyo limefichwa.

Pia ninatumia mfumo wa kumbukumbu wa tabaka tatu. Unatumia kielezo kifupi, maelezo ya muda mrefu, na utafutaji wa maandishi kamili. Hii inazuia AI kukisia jinsi nilivyoweka mipangilio hapo awali.

Sheria muhimu zaidi ni hii: Ninatengeneza mifumo ya kufanya kazi kiotomatiki, lakini siwahi kufanya maamuzi kiotomatiki.

• Uchapishaji unafanywa kwa mkono. Mimi ndiye ninabonyeza kitufe. • Kuweka hewani kunanihitaji. Ninathibitisha kila malipo au mipangilio ya toleo. • Hakuna kitu kinachounganishwa (merge) ikiwa kuna hitilafu. Build iliyoharibika inazuia kila kitu.

Uwezo wa AI unatokana na kufanya kazi kiotomatiki. Usalama unatokana na kukataa kufanya maamuzi kiotomatiki.

Unapofanya kazi peke yako, rasilimali yako muhimu zaidi ni uaminifu. Lazima uamini kwamba kile ulichotuma ndicho ulichokusudia kutuma.

Anza kidogo. Tafuta kosa ambalo unalifanya mara nyingi zaidi. Tengeneza ukaguzi mmoja unaofanya kosa hilo kuwa haliwezekani.

Chanzo: https://dev.to/pi-maker/how-i-run-a-handful-of-apps-solo-the-agent-harness-explained-512i

Jumuia ya kujifunza (hiari): https://t.me/GyaanSetuAi