حل أخطاء الترميز في اختبار أداء نماذج LLM المحلية

📅4 hours ago⏱1 min read

حل مشكلات الترميز في اختبارات أداء نماذج LLM المحلية

أردت بناء أداة للتبديل بين نماذج LLM المحلية واختبار أدائها. كما أضفت العديد من أسئلة الاختبار الكورية لاختبارها بشكل أفضل.

سار كل شيء على ما يرام حتى بدأت بتشغيل اختبارات الأداء. استمر ظهور هذا الخطأ: UnicodeEncodeError: 'cp949' codec can't encode characters.

اعتقدت أن المشكلة تكمن في كود Python الخاص بي. حاولت تغيير إعدادات الترميز إلى utf-8 وحاولت فك ترميز النصوص يدويًا، لكن دون جدوى لساعات.

لم تكن المشكلة في السكربت الخاص بي، بل كانت في "عامل" (worker) الـ LLM المحلي الذي كان يحاول حفظ استجابات النموذج باستخدام ترميز النظام الافتراضي. في نظام Windows، غالبًا ما يكون هذا الترميز هو CP949. وعندما حاول العامل حفظ أحرف كورية باستخدام CP949، فشل الأمر.

كان الحل بسيطًا؛ قمت بتغيير العامل ليستخدم utf-8 بشكل صريح عند حفظ الملفات.

كما قمت ببناء نظام مؤتمت لإدارة هذه العملية، وهو يتبع الخطوات التالية:

تحميل النماذج المرشحة.
تشغيل اختبارات الأداء على أفضل نموذج حالي.
اختبار جميع النماذج المرشحة الجديدة.
اختيار وترشيح أفضل نموذج بناءً على النتائج.

من خلال هذه الأتمتة، وجدت أن Gemma2:2b يتفوق بكثير على نموذج EXAONE في مهام اللغة الكورية، حيث يقدم إجابات أكثر طبيعية ونتائج إبداعية أفضل وبسرعة مماثلة.

الدروس المستفادة:

لا تعتمد أبدًا على ترميز النظام الافتراضي. استخدم دائمًا utf-8 لعمليات الإدخال والإخراج للملفات (file I/O).
عند استخدام json.dump مع نصوص كورية، استخدم ensure_ascii=False وحدد utf-8.
إذا واجهت أخطاء في الترميز، فافحص النظام بالكامل ومنطق حفظ الملفات، وليس الكود المباشر الذي تكتبه فقط.
استخدم الأتمتة للعثور على أفضل النماذج لاحتياجاتك الخاصة.

المصدر: https://dev.to/junhee916/resolving-cp949-errors-in-local-llm-benchmarking-and-building-an-automatic-model-recommendation-128g

مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi

حل أخطاء الترميز في اختبار أداء نماذج LLM المحلية

Continue reading

𝗦𝘁𝗼𝗽 𝗔𝘀𝗸𝗶𝗻𝗴 𝗪𝗵𝗶𝗰𝗵 𝗟𝗟𝗠 𝗜𝘀 𝗕𝗲𝘀𝘁

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗔𝗻 𝗜𝗻𝘁𝗲𝗿𝗻𝗮𝗹 𝗔𝗜 𝗖𝗵𝗮𝘁𝗯𝗼𝘁: 𝗟𝗲𝘀𝘀𝗼𝗻𝘀 𝗟𝗲𝗮𝗿𝗻𝗲𝗱

𝗟𝗹𝗮𝗺𝗮.𝗰𝗽𝗽 𝗡𝗼𝘄 𝗠𝗮𝘁𝗰𝗵𝗲𝘀 𝘃𝗟𝗟𝗠 𝗦𝗽𝗲𝗲𝗱

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗗𝗼𝗺𝗮𝗶𝗻 𝗦𝗽𝗲𝗰𝗶𝗳𝗶𝗰 𝗟𝗟𝗠 𝗘𝘃𝗮𝗹 𝗦𝗲𝘁𝘀

𝗟𝗼𝗰𝗮𝗹 𝗟𝗟𝗠𝘀 𝗮𝗿𝗲 𝗶𝗻 𝟮𝟬𝟮𝟲, 𝗯𝘂𝘁 𝘁𝗵𝗲 𝗗𝗲𝘃 𝗘𝘅𝗽𝗲𝗿𝗶𝗲𝗻𝗰𝗲 𝗶𝘀 𝗦𝘁𝘂𝗰𝗸 𝗶𝗻 𝟮𝟬𝟭𝟬