GLM-5.2 کوڈ ریویوز آپ کے پرامپٹس پر منحصر ہیں

Z.ai کا GLM-5.2 ایک مقبول اوپن ویٹ (open-weight) ماڈل ہے۔ ہم نے یہ جاننے کے لیے اس کا تجربہ کیا کہ یہ کوڈ کا ریویو کتنی اچھی طرح کرتا ہے۔ ہم نے پایا کہ اس کے معیار میں تبدیلی اس بات پر منحصر ہے کہ آپ اس سے کس طرح بات کرتے ہیں۔

ہم نے دو ٹیسٹ کیے۔ پہلے ٹیسٹ میں، ہم نے 16 بگ (bugs) کے ساتھ ایک سادہ TypeScript بیک اینڈ استعمال کیا۔ دوسرے ٹیسٹ میں، ہم نے 10 باریک بگ کے ساتھ ایک پیچیدہ سسٹم بنایا۔ ان بگز کو سمجھنے کے لیے یہ جاننا ضروری تھا کہ ایپ کے مختلف حصے ایک ساتھ کیسے کام کرتے ہیں۔

ہم نے یہ سیکھا:

  • پرامپٹ کی الفاظ کی ترتیب (wording) ریژوننگ کی کوشش (reasoning effort) سے زیادہ اہمیت رکھتی ہے۔ پرامپٹ کو تبدیل کرنے سے نتائج میں اتنی ہی تبدیلی آئی جتنی کہ ریژوننگ موڈ کو لو (low) سے ہائی (high) پر سوئچ کرنے سے آئی۔
  • سخت پرامپٹس الٹا اثر بھی کر سکتے ہیں۔ اگر آپ ماڈل کو "پروڈکشن PR کو بلاک یا اپروو کرنے" کا کہیں گے، تو وہ سیکیورٹی پر توجہ مرکوز کر دے گا۔ یہ ہارڈ کوڈڈ سیکرٹس (hardcoded secrets) اور کمزور ہیشنگ (weak hashing) کو تو ڈھونڈ لے گا، لیکن ان اصل لاجک بگز کو نظر انداز کر دے گا جنہیں آپ ڈھونڈنا چاہتے ہیں۔
  • لوکل بگز GLM-5.2 کے لیے آسان ہیں۔ یہ ایک ہی فنکشن کے اندر غلطیاں پکڑ لیتا ہے، جیسے کہ کوئی خراب پرمیشن گارڈ (permission guard) یا غلط ویری ایبل۔
  • سسٹم کے پیمانے پر موجود بگز GLM-5.2 کے لیے مشکل ہیں۔ اسے ان قوانین کو سمجھنے میں دشواری ہوتی ہے جو متعدد فائلوں میں پھیلے ہوئے ہوں۔ مثال کے طور پر، جب آرکائیو شدہ ٹاسک سرچ رزلٹس اور ایکسپورٹس میں نظر آنے لگے، تو یہ اسے پکڑنے میں ناکام رہا۔
  • فرنٹیر ماڈلز (Frontier models) زیادہ قابل اعتماد ہیں۔ GPT-5.5 اور Opus 4.8 نے پیچیدہ اور کراس روٹ بگز کو ایک ہی بار میں پکڑ لیا۔ GLM-5.2 ان کاموں میں غیر مستقل مزاج ہے۔

GLM-5.2 کو مؤثر طریقے سے کیسے استعمال کریں:

  • اسے لوکل لاجک کے لیے استعمال کریں۔ یہ ایک ہی فنکشن کے اندر غلطیاں تلاش کرنے کے لیے بہترین ہے۔
  • اپنی ہدایات میں مخصوص رہیں۔ "سخت" ریویو مانگنے کے بجائے، اسے مختلف روٹس (routes) میں تسلسل (consistency) چیک کرنے کا کہیں۔
  • ان رویوں (behaviors) کا نام لیں جنہیں آپ چیک کرنا چاہتے ہیں۔ اسے بتائیں کہ وہ تصدیق کرے کہ آیا سرچ، ایکسپورٹس اور لسٹس تمام ڈیٹا کو ایک ہی طریقے سے ہینڈل کرتے ہیں۔
  • حساس کوڈ کے لیے صرف ایک بار کے ریویو پر بھروسہ نہ کریں۔ چونکہ نتائج مختلف ہو سکتے ہیں، اس لیے آپ کو اسے کئی بار چلانا چاہیے یا پیچیدہ تبدیلیوں کے لیے کسی زیادہ طاقتور ماڈل کا استعمال کرنا چاہیے۔

GLM-5.2 ایک قابل ٹول ہے، لیکن آپ کو کام کے مطابق پرامپٹ تیار کرنا ہوگا۔

ماخذ: https://dev.to/kilocode/glm-52s-code-reviews-are-only-as-good-as-your-prompt-5233

اختیاری لرننگ کمیونٹی: https://t.me/GyaanSetuAi