Kutatua Makosa ya Encoding katika Upimaji wa Utendaji wa LLM za Ndani

📅4 hours ago⏱1 min read

Kutatua Makosa ya Encoding katika Upimaji wa LLM wa Ndani

Nilitaka kutengeneza zana ya kubadilisha na kupima (benchmark) modeli za LLM za ndani. Pia niliongeza maswali mengi ya upimaji ya Kikorea ili kuzijaribu vizuri zaidi.

Kila kitu kilikuwa kinafanya kazi vizuri hadi nilipofanya upimaji. Nilikuwa nikiendelea kuona kosa hili: UnicodeEncodeError: 'cp949' codec can't encode characters.

Nilidhani tatizo lilikuwa kwenye kodi yangu ya Python. Nilijaribu kubadilisha mipangilio yangu ya encoding kuwa utf-8. Nilijaribu kutafsiri (decode) maandishi (strings) kwa mkono. Hakuna kilichofanya kazi kwa saa kadhaa.

Tatizo halisi halikuwa kwenye skripti yangu. Local LLM worker ilikuwa ikijaribu kuhifadhi majibu ya modeli kwa kutumia encoding ya mfumo (system default encoding). Kwenye Windows, hii mara nyingi huwa ni CP949. Wakati worker ilipojaribu kuhifadhi herufi za Kikorea kwa kutumia CP949, ilishindwa.

Suluhisho lilikuwa rahisi. Nilibadilisha worker itumie utf-8 waziwazi wakati wa kuhifadhi faili.

Pia nilitengeneza mfumo wa kiotomatiki wa kusimamia mchakato huu. Unafuata hatua hizi:

Inapakua modeli zinazofuzu (candidate models).
Inafanya upimaji kwenye modeli bora ya sasa.
Inajaribu modeli zote mpya zinazofuzu.
Inachagua na kupendekeza modeli bora kulingana na alama.

Kupitia otomatiki hii, niligundua kuwa Gemma2:2b inafanya kazi vizuri zaidi kuliko modeli ya EXAONE kwa kazi za lugha ya Kikorea. Inatoa majibu ya asili zaidi na matokeo bora ya ubunifu kwa kasi inayofanana.

Mafunzo niliyopata:

Usitegemee encoding ya mfumo kwa asili. Tumia utf-8 kila wakati kwa I/O ya faili.
Unapotumia json.dump na maandishi ya Kikorea, tumia ensure_ascii=False na uainishe utf-8.
Ukiona makosa ya encoding, kagua mfumo mzima na mantiki ya kuhifadhi faili, si kodi yako ya karibu tu.
Tumia otomatiki ili kupata modeli bora kwa mahitaji yako maalum.

Chanzo: https://dev.to/junhee916/resolving-cp949-errors-in-local-llm-benchmarking-and-building-an-automatic-model-recommendation-128g

Jumuia ya hiari ya kujifunza: https://t.me/GyaanSetuAi

Kutatua Makosa ya Encoding katika Upimaji wa Utendaji wa LLM za Ndani

Continue reading

𝗦𝘁𝗼𝗽 𝗔𝘀𝗸𝗶𝗻𝗴 𝗪𝗵𝗶𝗰𝗵 𝗟𝗟𝗠 𝗜𝘀 𝗕𝗲𝘀𝘁

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗔𝗻 𝗜𝗻𝘁𝗲𝗿𝗻𝗮𝗹 𝗔𝗜 𝗖𝗵𝗮𝘁𝗯𝗼𝘁: 𝗟𝗲𝘀𝘀𝗼𝗻𝘀 𝗟𝗲𝗮𝗿𝗻𝗲𝗱

𝗟𝗹𝗮𝗺𝗮.𝗰𝗽𝗽 𝗡𝗼𝘄 𝗠𝗮𝘁𝗰𝗵𝗲𝘀 𝘃𝗟𝗟𝗠 𝗦𝗽𝗲𝗲𝗱

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗗𝗼𝗺𝗮𝗶𝗻 𝗦𝗽𝗲𝗰𝗶𝗳𝗶𝗰 𝗟𝗟𝗠 𝗘𝘃𝗮𝗹 𝗦𝗲𝘁𝘀

𝗟𝗼𝗰𝗮𝗹 𝗟𝗟𝗠𝘀 𝗮𝗿𝗲 𝗶𝗻 𝟮𝟬𝟮𝟲, 𝗯𝘂𝘁 𝘁𝗵𝗲 𝗗𝗲𝘃 𝗘𝘅𝗽𝗲𝗿𝗶𝗲𝗻𝗰𝗲 𝗶𝘀 𝗦𝘁𝘂𝗰𝗸 𝗶𝗻 𝟮𝟬𝟭𝟬