تعتمد مراجعات الأكواد في GLM-5.2 على صياغة مطالباتك
يُعد GLM-5.2 من Z.ai نموذجاً شائعاً مفتوح الأوزان (open-weight). لقد قمنا باختباره لمعرفة مدى جودة مراجعته للأكواد، ووجدنا أن جودته تتغير بناءً على كيفية صياغة مطالباتك (prompts) والتحدث إليه.
أجرينا اختبارين؛ في الاختبار الأول، استخدمنا خلفية برمجية (backend) بسيطة بلغة TypeScript تحتوي على 16 خطأً برمجياً. وفي الاختبار الثاني، قمنا ببناء نظام معقد يحتوي على 10 أخطاء خفية، وتطلبت هذه الأخطاء فهماً لكيفية عمل الأجزاء المختلفة من التطبيق معاً.
إليكم ما تعلمناه:
- صياغة المطالبة أهم من جهد الاستنتاج (reasoning effort). فقد أدى تغيير صياغة المطالبة إلى تغيير النتائج بشكل أكبر من التبديل بين أنماط الاستنتاج المنخفضة والعالية.
- المطالبات الصارمة قد تأتي بنتائج عكسية. إذا طلبت من النموذج "حظر أو الموافقة على طلب سحب (PR) للإنتاج"، فإنه سيركز على الأمن؛ حيث سيجد الأسرار المكتوبة مباشرة في الكود (hardcoded secrets) وعمليات التجزئة (hashing) الضعيفة، لكنه سيفوت أخطاء المنطق الفعلية التي تريد منه العثور عليها.
- الأخطاء المحلية سهلة على GLM-5.2. فهو يكتشف الأخطاء داخل دالة (function) واحدة، مثل حارس أذونات (permission guard) معطل أو متغير خاطئ.
- الأخطاء التي تشمل النظام بأكمله صعبة على GLM-5.2. فهو يواجه صعوبة في التعامل مع القواعد التي تنتشر عبر ملفات متعددة. على سبيل المثال، فشل في اكتشاف تسرب المهام المؤرشفة إلى نتائج البحث وعمليات التصدير.
- النماذج الرائدة (Frontier models) أكثر موثوقية. فقد اكتشفت نماذج GPT-5.5 و Opus 4.8 الأخطاء المعقدة والعابرة للمسارات (cross-route) في تمريرة واحدة، بينما يتسم GLM-5.2 بعدم الاتساق في هذه المهام.
كيفية استخدام GLM-5.2 بفعالية:
- استخدمه للمنطق المحلي. فهو رائع في العثور على الأخطاء داخل دالة واحدة.
- كن محدداً في تعليماتك. بدلاً من طلب مراجعة "صارمة"، اطلب منه التحقق من الاتساق عبر المسارات (routes) المختلفة.
- حدد السلوكيات التي تريد التحقق منها. اطلب منه التحقق مما إذا كانت عمليات البحث والتصدير والقوائم تتعامل مع البيانات بنفس الطريقة.
- لا تعتمد على تمريرة واحدة للأكواد ذات الأهمية العالية. نظراً لأن النتائج تختلف، يجب عليك تشغيله عدة مرات أو استخدام نموذج أقوى للتغييرات المعقدة.
يُعد GLM-5.2 أداة قادرة، ولكن يجب عليك مواءمة المطالبة مع المهمة.
Source: https://dev.to/kilocode/glm-52s-code-reviews-are-only-as-good-as-your-prompt-5233
Optional learning community: https://t.me/GyaanSetuAi
