𝗔𝗴𝗲𝗻𝘁-𝗥: 𝗞𝘂𝘄𝗮𝗳𝘂𝗻𝗱𝗶𝘀𝗵𝗮 𝗪𝗮𝗸𝗮𝗹𝗮 𝘄𝗮 𝗠𝗶𝗳𝘂𝗺𝗼 𝘆𝗮 𝗟𝘂𝗴𝗵𝗮 𝗞𝘂𝗷𝗶𝘁𝗮𝘁𝗵𝗺𝗶𝗻𝗶

Wakala wa mifumo ya lugha mara nyingi hufanya makosa. Wanafuata maelekezo lakini hushindwa kazi zinapokuwa ngumu.

Agent-R hutatua tatizo hili. Inatumia mafunzo ya kujifunza ya mfululizo (iterative self-training) ili kuwafundisha wakala jinsi ya kujitathmini.

Mchakato huu una hatua tatu:

  • Wakala anatekeleza kazi.
  • Wakala anachunguza kazi yake mwenyewe ili kupata makosa.
  • Wakala anatumia marekebisho haya kuboresha jaribio lake linalofuata.

Mbinu hii hujenga uwezo bora wa kufikiri. Wakala hujifunza kutokana na makosa yake mwenyewe bila kuhitaji msaada wa mara kwa mara kutoka kwa binadamu.

Kujirekebisha kunafanya wakala kuwa waaminifu zaidi kwa michakato tata ya kazi. Inatuvusha karibu zaidi na mifumo inayojitegemea inayojirekebisha makosa yake yenyewe.

Chanzo: https://dev.to/paperium/agent-r-training-language-model-agents-to-reflect-via-iterative-self-training-5ggk

Jumuiya ya hiari ya kujifunza: https://t.me/GyaanSetuAi