ਲੋਕਲ LLM ਬੈਂਚਮਾਰਕਿੰਗ ਵਿੱਚ ਇਨਕੋਡਿੰਗ ਗਲਤੀਆਂ ਨੂੰ ਸੁਲਝਾਉਣਾ

📅4 hours ago⏱1 min read

𝗥𝗲𝘀𝗼𝗹𝘃𝗶𝗻𝗴 𝗘𝗻𝗰𝗼𝗱𝗶𝗻𝗴 𝗘𝗿𝗿𝗼𝗿𝘀 𝗶𝗻 𝗟𝗼𝗰𝗮𝗹 𝗟𝗟𝗠 𝗕𝗲𝗻𝗰𝗵𝗺𝗮𝗿𝗸𝗶𝗻𝗴 -> ਲੋਕਲ LLM ਬੈਂਚਮਾਰਕਿੰਗ ਵਿੱਚ ਐਨਕੋਡਿੰਗ ਗਲਤੀਆਂ (Encoding Errors) ਨੂੰ ਸੁਲਝਾਉਣਾ

ਮੈਂ ਲੋਕਲ LLM ਮਾਡਲਾਂ ਨੂੰ ਬਦਲਣ ਅਤੇ ਉਹਨਾਂ ਦੀ ਬੈਂਚਮਾਰਕਿੰਗ ਕਰਨ ਲਈ ਇੱਕ ਟੂਲ ਬਣਾਉਣਾ ਚਾਹੁੰਦਾ ਸੀ। ਮੈਂ ਉਹਨਾਂ ਨੂੰ ਬਿਹਤਰ ਤਰੀਕੇ ਨਾਲ ਟੈਸਟ ਕਰਨ ਲਈ ਕਈ ਕੋਰੀਅਨ ਬੈਂਚਮਾਰਕ ਸਵਾਲ ਵੀ ਜੋੜੇ।

ਬੈਂਚਮਾਰਕ ਚਲਾਉਣ ਤੱਕ ਸਭ ਕੁਝ ਠੀਕ ਚੱਲ ਰਿਹਾ ਸੀ। ਪਰ ਮੈਨੂੰ ਵਾਰ-ਵਾਰ ਇਹ ਗਲਤੀ ਦਿਖਾਈ ਦੇ ਰਹੀ ਸੀ: UnicodeEncodeError: 'cp949' codec can't encode characters.

ਮੈਨੂੰ ਲੱਗਿਆ ਕਿ ਸਮੱਸਿਆ ਮੇਰੇ Python ਕੋਡ ਵਿੱਚ ਹੈ। ਮੈਂ ਆਪਣੀਆਂ ਐਨਕੋਡਿੰਗ ਸੈਟਿੰਗਾਂ ਨੂੰ utf-8 ਵਿੱਚ ਬਦਲਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕੀਤੀ। ਮੈਂ ਸਟ੍ਰਿੰਗਾਂ ਨੂੰ ਮੈਨੂਅਲੀ ਡੀਕੋਡ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕੀਤੀ। ਕਈ ਘੰਟਿਆਂ ਤੱਕ ਕੁਝ ਵੀ ਕੰਮ ਨਹੀਂ ਕਰਿਆ।

ਅਸਲ ਸਮੱਸਿਆ ਮੇਰਾ ਸਕ੍ਰਿਪਟ ਨਹੀਂ ਸੀ। ਲੋਕਲ LLM ਵਰਕਰ ਸਿਸਟਮ ਦੀ ਡਿਫੌਲਟ ਐਨਕੋਡਿੰਗ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਮਾਡਲ ਦੇ ਜਵਾਬਾਂ ਨੂੰ ਸੇਵ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਿਹਾ ਸੀ। Windows 'ਤੇ, ਇਹ ਅਕਸਰ CP949 ਹੁੰਦੀ ਹੈ। ਜਦੋਂ ਵਰਕਰ ਨੇ CP949 ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਕੋਰੀਅਨ ਅੱਖਰਾਂ ਨੂੰ ਸੇਵ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕੀਤੀ, ਤਾਂ ਇਹ ਫੇਲ੍ਹ ਹੋ ਗਿਆ।

ਇਸਦਾ ਹੱਲ ਸਧਾਰਨ ਸੀ। ਮੈਂ ਫਾਈਲਾਂ ਸੇਵ ਕਰਦੇ ਸਮੇਂ ਵਰਕਰ ਨੂੰ ਸਪੱਸ਼ਟ ਤੌਰ 'ਤੇ utf-8 ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ ਬਦਲ ਦਿੱਤਾ।

ਮੈਂ ਇਸ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਪ੍ਰਬੰਧਿਤ ਕਰਨ ਲਈ ਇੱਕ ਆਟੋਮੇਟਡ ਸਿਸਟਮ ਵੀ ਬਣਾਇਆ। ਇਹ ਇਹਨਾਂ ਕਦਮਾਂ ਦੀ ਪਾਲਣਾ ਕਰਦਾ ਹੈ:

ਉਮੀਦਵਾਰ ਮਾਡਲਾਂ ਨੂੰ ਡਾਊਨਲੋਡ ਕਰਦਾ ਹੈ।
ਮੌਜੂਦਾ ਸਭ ਤੋਂ ਵਧੀਆ ਮਾਡਲ 'ਤੇ ਬੈਂਚਮਾਰਕ ਚਲਾਉਂਦਾ ਹੈ।
ਸਾਰੇ ਨਵੇਂ ਉਮੀਦਵਾਰ ਮਾਡਲਾਂ ਦਾ ਟੈਸਟ ਕਰਦਾ ਹੈ।
ਸਕੋਰਾਂ ਦੇ ਅਧਾਰ 'ਤੇ ਸਭ ਤੋਂ ਵਧੀਆ ਮਾਡਲ ਦੀ ਚੋਣ ਅਤੇ ਸਿਫਾਰਸ਼ ਕਰਦਾ ਹੈ।

ਇਸ ਆਟੋਮੇਸ਼ਨ ਰਾਹੀਂ, ਮੈਂ ਪਾਇਆ ਕਿ ਕੋਰੀਅਨ ਭਾਸ਼ਾ ਦੇ ਕੰਮਾਂ ਲਈ Gemma2:2b, EXAONE ਮਾਡਲ ਨਾਲੋਂ ਕਿਤੇ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ। ਇਹ ਸਮਾਨ ਰਫ਼ਤਾਰ 'ਤੇ ਵਧੇਰੇ ਕੁਦਰਤੀ ਜਵਾਬ ਅਤੇ ਬਿਹਤਰ ਰਚਨਾਤਮਕ ਨਤੀਜੇ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।

ਸਿੱਖੇ ਗਏ ਸਬਕ:

ਕਦੇ ਵੀ ਡਿਫੌਲਟ ਸਿਸਟਮ ਐਨਕੋਡਿੰਗ 'ਤੇ ਭਰੋਸਾ ਨਾ ਕਰੋ। ਫਾਈਲ I/O ਲਈ ਹਮੇਸ਼ਾ utf-8 ਦੀ ਵਰਤੋਂ ਕਰੋ।
ਕੋਰੀਅਨ ਟੈਕਸਟ ਦੇ ਨਾਲ json.dump ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਸਮੇਂ, ensure_ascii=False ਦੀ ਵਰਤੋਂ ਕਰੋ ਅਤੇ utf-8 ਦੱਸੋ।
ਜੇਕਰ ਤੁਹਾਨੂੰ ਐਨਕੋਡਿੰਗ ਗਲਤੀਆਂ ਦਿਖਾਈ ਦਿੰਦੀਆਂ ਹਨ, ਤਾਂ ਸਿਰਫ਼ ਆਪਣੇ ਕੋਡ ਦੀ ਹੀ ਨਹੀਂ, ਸਗੋਂ ਪੂਰੇ ਸਿਸਟਮ ਅਤੇ ਫਾਈਲ ਸੇਵ ਕਰਨ ਦੇ ਲੌਜਿਕ ਦੀ ਜਾਂਚ ਕਰੋ।
ਆਪਣੀਆਂ ਖਾਸ ਲੋੜਾਂ ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ ਮਾਡਲ ਲੱਭਣ ਲਈ ਆਟੋਮੇਸ਼ਨ ਦੀ ਵਰਤੋਂ ਕਰੋ।

Source: https://dev.to/junhee916/resolving-cp949-errors-in-local-llm-benchmarking-and-building-an-automatic-model-recommendation-128g

Optional learning community: https://t.me/GyaanSetuAi

ਲੋਕਲ LLM ਬੈਂਚਮਾਰਕਿੰਗ ਵਿੱਚ ਇਨਕੋਡਿੰਗ ਗਲਤੀਆਂ ਨੂੰ ਸੁਲਝਾਉਣਾ

Continue reading

𝗦𝘁𝗼𝗽 𝗔𝘀𝗸𝗶𝗻𝗴 𝗪𝗵𝗶𝗰𝗵 𝗟𝗟𝗠 𝗜𝘀 𝗕𝗲𝘀𝘁

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗔𝗻 𝗜𝗻𝘁𝗲𝗿𝗻𝗮𝗹 𝗔𝗜 𝗖𝗵𝗮𝘁𝗯𝗼𝘁: 𝗟𝗲𝘀𝘀𝗼𝗻𝘀 𝗟𝗲𝗮𝗿𝗻𝗲𝗱

𝗟𝗹𝗮𝗺𝗮.𝗰𝗽𝗽 𝗡𝗼𝘄 𝗠𝗮𝘁𝗰𝗵𝗲𝘀 𝘃𝗟𝗟𝗠 𝗦𝗽𝗲𝗲𝗱

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗗𝗼𝗺𝗮𝗶𝗻 𝗦𝗽𝗲𝗰𝗶𝗳𝗶𝗰 𝗟𝗟𝗠 𝗘𝘃𝗮𝗹 𝗦𝗲𝘁𝘀

𝗟𝗼𝗰𝗮𝗹 𝗟𝗟𝗠𝘀 𝗮𝗿𝗲 𝗶𝗻 𝟮𝟬𝟮𝟲, 𝗯𝘂𝘁 𝘁𝗵𝗲 𝗗𝗲𝘃 𝗘𝘅𝗽𝗲𝗿𝗶𝗲𝗻𝗰𝗲 𝗶𝘀 𝗦𝘁𝘂𝗰𝗸 𝗶𝗻 𝟮𝟬𝟭𝟬