تشغيل GLM 5.2 محلياً على جهاز الكمبيوتر الخاص بك
يمكنك الآن تشغيل نموذج برمجة متطور على أجهزتك الخاصة. أصدرت Zhipu أوزان GLM 5.2 بموجب ترخيص MIT. وهذا يغير الهدف من مجرد تحميل نموذج إلى التحقق مما إذا كان جهازك الحالي قادراً على تشغيله.
يحتوي النموذج على 753 مليار معلمة (parameters). وبدقة كاملة، يتطلب 1.5 تيرابايت من ذاكرة الوصول العشوائي (RAM). لا يمكنك تشغيل ذلك على جهاز كمبيوتر مكتبي. لتشغيله محلياً، يجب عليك استخدام تقنية التكميم (quantization)، والتي تضحي بجزء من الجودة مقابل تقليل استهلاك الذاكرة.
إليك كيف تتعامل الإعدادات المختلفة مع النموذج:
• Mac Studio M3 Ultra (512 GB): استخدم تكميم 4-bit. يوفر هذا أفضل جودة وسرعة قابلة للاستخدام. • Mac Studio M3 Ultra (256 GB): استخدم تكميم 2-bit. هذا هو الإعداد الأكثر واقعية لمطور واحد. ستحصل على 3-9 توكن (tokens) في الثانية. • جهاز مكتبي مع 4090 + 256 GB DDR5: استخدم تكميم 2-bit. سيعمل عبر تقنية offload ولكنه سيظل بطيئاً. • MacBook أو جهاز بذاكرة 64-128 GB: لا تحاول القيام بذلك. استخدم API مستضافاً بدلاً من ذلك.
لماذا تشغله محلياً؟
- الخصوصية: كود البرمجة والمطالبات (prompts) الخاصة بك لا تغادر جهازك أبداً.
- العمل دون اتصال: استخدمه في البيئات المعزولة (air-gapped).
- الأجهزة الحالية: استخدم جهاز Mac Studio الذي اشتريته بالفعل لأعمال أخرى.
- التعلم: اختبر إعدادات أخذ العينات (sampling) ونقاط النهاية (endpoints) المحلية دون قيود على معدل الاستخدام.
قواعد النجاح:
- الذاكرة هي الحد الأدنى. تحتاج إلى 256 جيجابايت على الأقل من ذاكرة RAM. إذا كان لديك أقل من ذلك، فتوقف هنا واستخدم خطة مستضافة.
- استخدم المستودع (repo) الصحيح. قم بتنزيل نسخ GGUF quants من Unsloth على HuggingFace. المستودع الرسمي كبير جداً للاستخدام المحلي.
- انتبه لسياق النص (context). تواجه الإعدادات المحلية صعوبة في التعامل مع نافذة الـ 1 مليون توكن كاملة. توقع ما بين 16K إلى 64K في الممارسة العملية.
- اضبط المعلمات (parameters) بشكل صحيح. استخدم temperature 1.0، و top-p 0.95، و min-p 0.01. الإعدادات الخاطئة تجعل النموذج يبدو "غبياً".
الجهاز المحلي الواحد هو أداة لشخص واحد. إذا استخدمه مطوران في وقت واحد، فسيكون بطيئاً جداً. بالنسبة للفرق، ستحتاج إلى وحدات معالجة رسومات (GPUs) لمراكز البيانات أو API مستضاف.
المصدر: https://dev.to/owen_fox/run-glm-52-locally-2026-2-bit-on-a-256gb-mac-or-4090-box-1apn
مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi
