GLM-5.2 ಕೋಡ್ ವಿಮರ್ಶೆಗಳು ನಿಮ್ಮ ಪ್ರಾಂಪ್ಟ್ಗಳ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿವೆ
Z.ai ನ GLM-5.2 ಒಂದು ಜನಪ್ರಿಯ ಓಪನ್-ವೇಟ್ ಮಾಡೆಲ್ ಆಗಿದೆ. ಇದು ಕೋಡ್ ಅನ್ನು ಎಷ್ಟು ಚೆನ್ನಾಗಿ ವಿಮರ್ಶಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ನೋಡಲು ನಾವು ಇದನ್ನು ಪರೀಕ್ಷಿಸಿದೆವು. ನೀವು ಅದರೊಂದಿಗೆ ಹೇಗೆ ಸಂವಹನ ನಡೆಸುತ್ತೀರಿ ಎಂಬುದರ ಮೇಲೆ ಅದರ ಗುಣಮಟ್ಟವು ಬದಲಾಗುತ್ತದೆ ಎಂದು ನಾವು ಕಂಡುಕೊಂಡಿದ್ದೇವೆ.
ನಾವು ಎರಡು ಪರೀಕ್ಷೆಗಳನ್ನು ನಡೆಸಿದೆವು. ಮೊದಲ ಪರೀಕ್ಷೆಯಲ್ಲಿ, ನಾವು 16 ಬಗ್ಗಳಿರುವ ಸರಳ TypeScript ಬ್ಯಾಕೆಂಡ್ ಅನ್ನು ಬಳಸಿದೆವು. ಎರಡನೇ ಪರೀಕ್ಷೆಯಲ್ಲಿ, ನಾವು 10 ಸೂಕ್ಷ್ಮ ಬಗ್ಗಳಿರುವ ಸಂಕೀರ್ಣ ವ್ಯವಸ್ಥೆಯನ್ನು ನಿರ್ಮಿಸಿದೆವು. ಈ ಬಗ್ಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಅಪ್ಲಿಕೇಶನ್ನ ವಿವಿಧ ಭಾಗಗಳು ಹೇಗೆ ಒಟ್ಟಾಗಿ ಕೆಲಸ ಮಾಡುತ್ತವೆ ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವುದು ಅಗತ್ಯವಾಗಿತ್ತು.
ನಾವು ಕಲಿತ ವಿಷಯಗಳು ಇಲ್ಲಿವೆ:
- ತಾರ್ಕಿಕ ಪ್ರಯತ್ನಕ್ಕಿಂತ (reasoning effort) ಪ್ರಾಂಪ್ಟ್ನ ಪದಬಳಕೆ ಹೆಚ್ಚು ಮುಖ್ಯವಾಗಿದೆ. ಕಡಿಮೆ ಇಂದ ಹೆಚ್ಚಿನ ರೀಸನಿಂಗ್ ಮೋಡ್ಗಳಿಗೆ ಬದಲಾಯಿಸುವುದಕ್ಕಿಂತ, ಪ್ರಾಂಪ್ಟ್ ಅನ್ನು ಬದಲಾಯಿಸುವುದು ಫಲಿತಾಂಶಗಳಲ್ಲಿ ಹೆಚ್ಚಿನ ವ್ಯತ್ಯಾಸವನ್ನು ತರುತ್ತದೆ.
- ಕಟ್ಟುನಿಟ್ಟಾದ ಪ್ರಾಂಪ್ಟ್ಗಳು ವಿಫಲವಾಗಬಹುದು. ನೀವು ಮಾಡೆಲ್ಗೆ "production PR ಅನ್ನು ಬ್ಲಾಕ್ ಅಥವಾ ಅಪ್ರೂವ್ ಮಾಡಿ" ಎಂದು ಹೇಳಿದರೆ, ಅದು ಕೇವಲ ಭದ್ರತೆಯ ಮೇಲೆ ಗಮನ ಹರಿಸುತ್ತದೆ. ಅದು ಹಾರ್ಡ್ಕೋಡ್ ಮಾಡಲಾದ ಸೀಕ್ರೆಟ್ಗಳು ಮತ್ತು ದುರ್ಬಲ ಹ್ಯಾಶಿಂಗ್ ಅನ್ನು ಪತ್ತೆಹಚ್ಚುತ್ತದೆ. ಆದರೆ ನೀವು ಪತ್ತೆಹಚ್ಚಲು ಬಯಸುವ ನಿಜವಾದ ಲಾಜಿಕ್ ಬಗ್ಗಳನ್ನು ಅದು ಮಿಸ್ ಮಾಡಿಕೊಳ್ಳುತ್ತದೆ.
- ಲೋಕಲ್ ಬಗ್ಗಳು GLM-5.2 ಗೆ ಸುಲಭವಾಗಿವೆ. ಇದು ಒಂದು ಸಿಂಗಲ್ ಫಂಕ್ಷನ್ ಒಳಗಿರುವ ದೋಷಗಳನ್ನು, ಉದಾಹರಣೆಗೆ ತಪ್ಪಾದ ಪರ್ಮಿಷನ್ ಗಾರ್ಡ್ ಅಥವಾ ತಪ್ಪು ವೇರಿಯಬಲ್ ಅನ್ನು ಪತ್ತೆಹಚ್ಚುತ್ತದೆ.
- ಸಿಸ್ಟಮ್-ವೈಡ್ ಬಗ್ಗಳು GLM-5.2 ಗೆ ಕಷ್ಟಕರವಾಗಿವೆ. ಇದು ಹಲವಾರು ಫೈಲ್ಗಳಲ್ಲಿ ಹರಡಿರುವ ನಿಯಮಗಳೊಂದಿಗೆ ಹೋರಾಡುತ್ತದೆ. ಉದಾಹರಣೆಗೆ, ಆರ್ಕೈವ್ ಮಾಡಲಾದ ಕಾರ್ಯಗಳು (archived tasks) ಸರ್ಚ್ ರಿಸಲ್ಟ್ಗಳು ಮತ್ತು ಎಕ್ಸ್ಪೋರ್ಟ್ಗಳಿಗೆ ಸೋರಿಕೆಯಾದಾಗ ಅದು ಪತ್ತೆಹಚ್ಚಲು ವಿಫಲವಾಯಿತು.
- ಫ್ರಾಂಟಿಯರ್ ಮಾಡೆಲ್ಗಳು ಹೆಚ್ಚು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿವೆ. GPT-5.5 ಮತ್ತು Opus 4.8 ಸಂಕೀರ್ಣವಾದ, ಕ್ರಾಸ್-ರೂಟ್ ಬಗ್ಗಳನ್ನು ಒಂದೇ ಬಾರಿಗೆ ಪತ್ತೆಹಚ್ಚಿದವು. GLM-5.2 ಈ ಕಾರ್ಯಗಳಲ್ಲಿ ಅಸ್ಥಿರವಾಗಿದೆ.
GLM-5.2 ಅನ್ನು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಬಳಸುವುದು ಹೇಗೆ:
- ಇದನ್ನು ಲೋಕಲ್ ಲಾಜಿಕ್ ಗಾಗಿ ಬಳಸಿ. ಒಂದು ಫಂಕ್ಷನ್ ಒಳಗಿನ ದೋಷಗಳನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಇದು ಉತ್ತಮವಾಗಿದೆ.
- ನಿಮ್ಮ ಸೂಚನೆಗಳು ನಿರ್ದಿಷ್ಟವಾಗಿರಲಿ. "strict" ರಿವ್ಯೂ ಕೇಳುವ ಬದಲು, ವಿವಿಧ ರೂಟ್ಗಳಲ್ಲಿನ ಸ್ಥಿರತೆಯನ್ನು (consistency) ಪರಿಶೀಲಿಸಲು ಕೇಳಿ.
- ನೀವು ಪರಿಶೀಲಿಸಲು ಬಯಸುವ ವರ್ತನೆಗಳನ್ನು ಹೆಸರಿಸಿ. ಸರ್ಚ್, ಎಕ್ಸ್ಪೋರ್ಟ್ಗಳು ಮತ್ತು ಲಿಸ್ಟ್ಗಳು ಎಲ್ಲಾ ಡೇಟಾವನ್ನು ಒಂದೇ ರೀತಿಯಲ್ಲಿ ನಿರ್ವಹಿಸುತ್ತವೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸಲು ಅದಕ್ಕೆ ತಿಳಿಸಿ.
- ಹೆಚ್ಚಿನ ಪ್ರಾಮುಖ್ಯತೆಯಿರುವ (high-stakes) ಕೋಡ್ಗಾಗಿ ಕೇವಲ ಒಂದು ಬಾರಿ ಪರೀಕ್ಷಿಸುವುದರ ಮೇಲೆ ಅವಲಂಬಿತರಾಗಬೇಡಿ. ಫಲಿತಾಂಶಗಳು ಬದಲಾಗುವುದರಿಂದ, ನೀವು ಇದನ್ನು ಹಲವಾರು ಬಾರಿ ರನ್ ಮಾಡಬೇಕು ಅಥವಾ ಸಂಕೀರ್ಣ ಬದಲಾವಣೆಗಳಿಗಾಗಿ ಬಲವಾದ ಮಾಡೆಲ್ ಅನ್ನು ಬಳಸಬೇಕು.
GLM-5.2 ಒಂದು ಸಮರ್ಥ ಸಾಧನವಾಗಿದೆ, ಆದರೆ ನೀವು ಪ್ರಾಂಪ್ಟ್ ಅನ್ನು ಕಾರ್ಯಕ್ಕೆ ಅನುಗುಣವಾಗಿ ಹೊಂದಿಸಬೇಕು.
ಮೂಲ: https://dev.to/kilocode/glm-52s-code-reviews-are-only-as-good-as-your-prompt-5233
ಐಚ್ಛಿಕ ಕಲಿಕಾ ಸಮುದಾಯ: https://t.me/GyaanSetuAi
