Qwen 3.6 27B: دليل المهندس للذكاء الاصطناعي المحلي

لقد تفوق نموذج 27B للتو على نموذج 397B.

هذا ليس انتصاراً صغيراً، بل هو تحول هائل في مجال الذكاء الاصطناعي المحلي.

يتطلب نموذج Qwen 3.5 397B القديم مساحة تخزين تبلغ 807 جيجابايت، وتحتاج إلى خادم متعدد المعالجات الرسومية (multi-GPU server) لتشغيله.

أما نموذج Qwen 3.6 27B الجديد فلا يزن سوى 55.6 جيجابايت. وفي صيغة 8-bit، فإنه يستخدم 28 جيجابايت فقط، مما يتيح لك تشغيله على جهاز MacBook M5 Max واحد.

على الرغم من فرق الحجم، يتفوق نموذج 27B في اختبارات الأداء (benchmarks) الرئيسية:

• SWE-bench Verified: 77.2% (يتفوق على نموذج 397B الذي حقق 76.2%) • AIME 2026: 94.1% • GPQA Diamond: 87.8% (يتفوق على Claude 4.5 Opus)

لماذا يعمل هذا؟

تعتمد البنية التحتية على تصميم انتباه هجين (hybrid attention design)، حيث تستخدم نسبة 3:1 من طبقات الانتباه الخطي (linear attention) إلى طبقات الانتباه التربيعي (quadratic attention).

  • 48 طبقة تستخدم Gated DeltaNet (Linear attention)؛ وهذا يتميز بالسرعة وتوفير الذاكرة.
  • 16 طبقة تستخدم Gated Attention (Quadratic attention)؛ وهذا يوفر الدقة.

يسمح هذا النمط للنموذج بالتعامل مع السياقات الطويلة (long contexts) دون تكاليف الحوسبة الهائلة التي تتطلبها نماذج transformers القياسية.

فوز آخر يتمثل في تقنية التنبؤ متعدد الرموز (Multi-Token Prediction - MTP). تتيح هذه الميزة للنموذج التنبؤ بـ 3 إلى 4 رموز (tokens) في وقت واحد.

على أجهزة Apple M5 Max، ترفع تقنية MTP السرعة من 18 رمزاً في الثانية إلى 32 رمزاً في الثانية، مما يعني زيادة بنسبة 77% في معدل الإنتاجية (throughput).

كيفية نشره محلياً:

استخدم llama.cpp لتشغيل النموذج على أجهزتك الخاصة.

  1. تثبيت الأداة: brew install llama.cpp

  2. تشغيل الخادم مع تفعيل MTP للحصول على أقصى سرعة: llama-server -hf unsloth/Qwen3.6-27B-MTP-GGUF:Q8_0 --spec-type draft-mtp -ngl 999 -fa on -c 65536 --port 8080

  3. قم بتوجيه أدواتك الحالية (مثل Cursor أو سكربتات Python) إلى http://localhost:8080/v1.

لقد تغيرت اقتصاديات الذكاء الاصطناعي.

استخدام واجهات برمجة التطبيقات (APIs) مثل Claude أو GPT-5 يكلف مالاً في كل مرة ترسل فيها أمراً (prompt). أما الذكاء الاصطناعي المحلي فتكلفته صفر لكل رمز (token). كما أنه يوفر خصوصية بنسبة 100%، ولا يعتمد على مزود خدمة خارجي قد يغير قواعده أو أسعاره.

لم يعد الذكاء الاصطناعي المحلي مجرد حل وسط، بل أصبح أداة احترافية.

المصدر: https://dev.to/monuminu/qwen-36-27b-how-a-27b-dense-model-beats-a-397b-giant-the-engineers-complete-local-ai-4m36

مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi