𝗥𝗲𝘀𝗼𝗹𝘃𝗶𝗻𝗴 𝗘𝗻𝗰𝗼𝗱𝗶𝗻𝗴 𝗘𝗿𝗿𝗼𝗿𝘀 𝗶𝗻 𝗟𝗼𝗰𝗮𝗹 𝗟𝗟𝗠 𝗕𝗲𝗻𝗰𝗵𝗺𝗮𝗿𝗸𝗶𝗻𝗴

📅4 hours ago⏱1 min read

Resolución de errores de codificación en el benchmarking de LLM locales

Quería construir una herramienta para cambiar y realizar benchmarks de modelos LLM locales. También añadí muchas preguntas de benchmark en coreano para probarlos mejor.

Todo funcionaba bien hasta que ejecuté los benchmarks. No dejaba de ver este error: UnicodeEncodeError: 'cp949' codec can't encode characters.

Pensé que el problema estaba en mi código de Python. Intenté cambiar mi configuración de codificación a utf-8. Intenté decodificar cadenas manualmente. Nada funcionó durante horas.

El problema real no era mi script. El worker del LLM local estaba intentando guardar las respuestas del modelo utilizando la codificación predeterminada del sistema. En Windows, esto suele ser CP949. Cuando el worker intentó guardar caracteres coreanos usando CP949, falló.

La solución fue sencilla. Cambié el worker para que utilizara utf-8 explícitamente al guardar archivos.

También construí un sistema automatizado para gestionar este proceso. Sigue estos pasos:

Descarga modelos candidatos.
Ejecuta benchmarks en el mejor modelo actual.
Prueba todos los nuevos modelos candidatos.
Selecciona y recomienda el mejor modelo basándose en las puntuaciones.

Gracias a esta automatización, descubrí que Gemma2:2b funciona mucho mejor que el modelo EXAONE para tareas en idioma coreano. Proporciona respuestas más naturales y mejores resultados creativos a una velocidad similar.

Lecciones aprendidas:

Nunca confíes en la codificación predeterminada del sistema. Utiliza siempre utf-8 para la E/S de archivos.
Al usar json.dump con texto en coreano, utiliza ensure_ascii=False y especifica utf-8.
Si ves errores de codificación, comprueba todo el sistema y la lógica de guardado de archivos, no solo tu código inmediato.
Utiliza la automatización para encontrar los mejores modelos para tus necesidades específicas.

Fuente: https://dev.to/junhee916/resolving-cp949-errors-in-local-llm-benchmarking-and-building-an-automatic-model-recommendation-128g

Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi

𝗥𝗲𝘀𝗼𝗹𝘃𝗶𝗻𝗴 𝗘𝗻𝗰𝗼𝗱𝗶𝗻𝗴 𝗘𝗿𝗿𝗼𝗿𝘀 𝗶𝗻 𝗟𝗼𝗰𝗮𝗹 𝗟𝗟𝗠 𝗕𝗲𝗻𝗰𝗵𝗺𝗮𝗿𝗸𝗶𝗻𝗴

Continue reading

𝗦𝘁𝗼𝗽 𝗔𝘀𝗸𝗶𝗻𝗴 𝗪𝗵𝗶𝗰𝗵 𝗟𝗟𝗠 𝗜𝘀 𝗕𝗲𝘀𝘁

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗔𝗻 𝗜𝗻𝘁𝗲𝗿𝗻𝗮𝗹 𝗔𝗜 𝗖𝗵𝗮𝘁𝗯𝗼𝘁: 𝗟𝗲𝘀𝘀𝗼𝗻𝘀 𝗟𝗲𝗮𝗿𝗻𝗲𝗱

𝗟𝗹𝗮𝗺𝗮.𝗰𝗽𝗽 𝗡𝗼𝘄 𝗠𝗮𝘁𝗰𝗵𝗲𝘀 𝘃𝗟𝗟𝗠 𝗦𝗽𝗲𝗲𝗱

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗗𝗼𝗺𝗮𝗶𝗻 𝗦𝗽𝗲𝗰𝗶𝗳𝗶𝗰 𝗟𝗟𝗠 𝗘𝘃𝗮𝗹 𝗦𝗲𝘁𝘀

𝗟𝗼𝗰𝗮𝗹 𝗟𝗟𝗠𝘀 𝗮𝗿𝗲 𝗶𝗻 𝟮𝟬𝟮𝟲, 𝗯𝘂𝘁 𝘁𝗵𝗲 𝗗𝗲𝘃 𝗘𝘅𝗽𝗲𝗿𝗶𝗲𝗻𝗰𝗲 𝗶𝘀 𝗦𝘁𝘂𝗰𝗸 𝗶𝗻 𝟮𝟬𝟭𝟬