GLM-5.2 Kod İncelemeleri Promptlarınıza Bağlıdır
Z.ai'den GLM-5.2 popüler bir açık ağırlıklı (open-weight) modeldir. Kodları ne kadar iyi incelediğini görmek için test ettik. Kalitesinin, ona nasıl hitap ettiğinize bağlı olarak değiştiğini gördük.
İki test gerçekleştirdik. İlk testte, 16 hata içeren basit bir TypeScript backend'i kullandık. İkinci testte ise 10 ince (subtle) hata içeren karmaşık bir sistem kurduk. Bu hatalar, uygulamanın farklı bölümlerinin birlikte nasıl çalıştığının anlaşılmasını gerektiriyordu.
İşte öğrendiklerimiz:
- Prompt ifadesi, muhakeme (reasoning) çabasından daha önemlidir. Prompt'u değiştirmek, sonuçları düşükten yükseğe muhakeme modları arasında geçiş yapmaktan daha fazla değiştirdi.
- Katı promptlar ters tepebilir. Eğer modele "bir production PR'ını engelle veya onayla" derseniz, güvenliğe odaklanır. Hardcoded sırlar ve zayıf hashing işlemlerini bulur. Ancak bulmasını istediğiniz asıl mantık hatalarını gözden kaçırır.
- Yerel hatalar GLM-5.2 için kolaydır. Bozuk bir izin koruması (permission guard) veya yanlış bir değişken gibi tek bir fonksiyon içindeki hataları yakalar.
- Sistem genelindeki hatalar GLM-5.2 için zordur. Birden fazla dosyaya yayılan kurallar konusunda zorlanır. Örneğin, arşivlenmiş görevlerin arama sonuçlarına ve dışa aktarmalara sızdığını fark edemedi.
- Frontier modeller daha güvenilirdir. GPT-5.5 ve Opus 4.8, karmaşık ve rotalar arası (cross-route) hataları tek seferde yakaladı. GLM-5.2 bu görevlerde tutarsızdır.
GLM-5.2'yi etkili bir şekilde nasıl kullanırsınız:
- Yerel mantık için kullanın. Tek bir fonksiyon içindeki hataları bulmak için harikadır.
- Talimatlarınızda spesifik olun. "Katı" bir inceleme istemek yerine, farklı rotalar arasında tutarlılığı kontrol etmesini isteyin.
- Kontrol etmek istediğiniz davranışları isimlendirin. Arama, dışa aktarma ve listelerin verileri aynı şekilde işleyip işlemediğini doğrulamasını söyleyin.
- Kritik kodlar için tek bir geçişe güvenmeyin. Sonuçlar değişebileceği için, karmaşık değişiklikler için modeli birkaç kez çalıştırmalı veya daha güçlü bir model kullanmalısınız.
GLM-5.2 yetenekli bir araçtır, ancak prompt'u göreve uygun hale getirmelisiniz.
Kaynak: https://dev.to/kilocode/glm-52s-code-reviews-are-only-as-good-as-your-prompt-5233
İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi
