GLM-5.2 కోడ్ రివ్యూలు మీ ప్రాంప్ట్‌లపై ఆధారపడి ఉంటాయి

Z.ai నుండి వచ్చిన GLM-5.2 ఒక ప్రసిద్ధ ఓపెన్-వెయిట్ మోడల్. ఇది కోడ్‌ను ఎంత బాగా రివ్యూ చేయగలదో తెలుసుకోవడానికి మేము దీనిని పరీక్షించాము. మీరు దానితో ఎలా సంభాషిస్తారు అనే దానిపై దాని నాణ్యత మారుతుందని మేము కనుగొన్నాము.

మేము రెండు పరీక్షలు నిర్వహించాము. మొదటి పరీక్షలో, 16 బగ్‌లతో కూడిన ఒక సాధారణ TypeScript బ్యాకెండ్‌ను ఉపయోగించాము. రెండవ పరీక్షలో, 10 సూక్ష్మమైన బగ్‌లతో కూడిన ఒక సంక్లిష్టమైన వ్యవస్థను రూపొందించాము. ఈ బగ్‌లను గుర్తించాలంటే యాప్‌లోని వివిధ భాగాలు ఒకదానితో ఒకటి ఎలా కలిసి పనిచేస్తాయో అర్థం చేసుకోవడం అవసరం.

మేము నేర్చుకున్న విషయాలు ఇక్కడ ఉన్నాయి:

  • రీజనింగ్ ప్రయత్నం కంటే ప్రాంప్ట్ పదజాలం (wording) చాలా ముఖ్యం. రీజనింగ్ మోడ్‌లను లో నుండి హైకి మార్చడం కంటే, ప్రాంప్ట్‌ను మార్చడం వల్ల ఫలితాల్లో ఎక్కువ మార్పు వచ్చింది.
  • కఠినమైన ప్రాంప్ట్‌లు రివర్స్ అయ్యే అవకాశం ఉంది. మీరు మోడల్‌కు "ప్రొడక్షన్ PRని బ్లాక్ చేయండి లేదా అప్రూవ్ చేయండి" అని చెబితే, అది భద్రత (security) పైనే దృష్టి పెడుతుంది. అది హార్డ్‌కోడ్ చేసిన సీక్రెట్స్ మరియు బలహీనమైన హాషింగ్‌ను కనుగొంటుంది. కానీ మీరు వెతకాలనుకుంటున్న అసలైన లాజిక్ బగ్‌లను మాత్రం వదిలేస్తుంది.
  • లోకల్ బగ్‌లను GLM-5.2 సులభంగా గుర్తిస్తుంది. ఒకే ఫంక్షన్‌లో ఉండే లోపాలను, ఉదాహరణకు బ్రోకెన్ పర్మిషన్ గార్డ్ లేదా తప్పు వేరియబుల్ వంటి వాటిని ఇది పట్టుకోగలదు.
  • సిస్టమ్-వైడ్ బగ్‌లు GLM-5.2కి కష్టతరమైనవి. బహుళ ఫైళ్లలో విస్తరించి ఉన్న రూల్స్‌తో ఇది ఇబ్బంది పడుతుంది. ఉదాహరణకు, ఆర్కైవ్ చేసిన టాస్క్‌లు సెర్చ్ రిజల్ట్స్ మరియు ఎక్స్‌పోర్ట్స్‌లోకి లీక్ అయినప్పుడు ఇది గుర్తించలేకపోయింది.
  • ఫ్రాంటియర్ మోడల్స్ (Frontier models) మరింత నమ్మదగినవి. GPT-5.5 మరియు Opus 4.8 సంక్లిష్టమైన, క్రాస్-రూట్ బగ్‌లను ఒకేసారి గుర్తించాయి. కానీ ఈ పనుల విషయంలో GLM-5.2 స్థిరంగా లేదు.

GLM-5.2ని సమర్థవంతంగా ఎలా ఉపయోగించాలి:

  • లోకల్ లాజిక్ కోసం ఉపయోగించండి. ఒకే ఫంక్షన్‌లో లోపాలను కనుగొనడానికి ఇది చాలా బాగుంటుంది.
  • మీ సూచనలు స్పష్టంగా ఉండాలి. "కఠినమైన" (strict) రివ్యూ అడిగే బదులు, వివిధ రూట్‌ల మధ్య స్థిరత్వాన్ని (consistency) తనిఖీ చేయమని అడగండి.
  • మీరు తనిఖీ చేయాలనుకుంటున్న ప్రవర్తనలను (behaviors) పేర్కొనండి. సెర్చ్, ఎక్స్‌పోర్ట్స్ మరియు లిస్ట్‌లు అన్నీ డేటాను ఒకే విధంగా హ్యాండిల్ చేస్తున్నాయో లేదో వెరిఫై చేయమని చెప్పండి.
  • కీలకమైన కోడ్ (high-stakes code) కోసం ఒకేసారి రివ్యూపై ఆధారపడకండి. ఫలితాలు మారుతూ ఉంటాయి కాబట్టి, మీరు దానిని ఒకటి కంటే ఎక్కువసార్లు రన్ చేయాలి లేదా సంక్లిష్టమైన మార్పుల కోసం మరింత శక్తివంతమైన మోడల్‌ను ఉపయోగించాలి.

GLM-5.2 ఒక సామర్థ్యం ఉన్న సాధనం, కానీ మీరు చేసే పనికి తగినట్లుగా ప్రాంప్ట్‌ను రూపొందించాలి.

Source: https://dev.to/kilocode/glm-52s-code-reviews-are-only-as-good-as-your-prompt-5233

Optional learning community: https://t.me/GyaanSetuAi