No Agent Grades Its Own Homework

आपकी भाषा के लिए अनुवादित. मूल पढ़ें.

AI-सहायता प्राप्त ड्राफ़्ट.

GyaanSetu Editorial6 दिन पहले2मिनट पढ़ें

कोई भी एजेंट अपना होमवर्क खुद नहीं जांचता

आप Claude से अपने कोड की समीक्षा करने के लिए कहते हैं। वह कहता है कि कोड साफ-सुथरा दिख रहा है। ज़ाहिर है, वह ऐसा ही कहेगा। उसने वह कोड पाँच मिनट पहले ही लिखा था। आपने लेखक से ही अपने पेपर को ग्रेड करने के लिए कहा। उसने खुद को 'A' ग्रेड दे दिया।

AI कोड समीक्षाएं काम करती हैं। वे तब विफल हो जाती हैं जब आप लेखक से ही अपने काम की समीक्षा करने के लिए कहते हैं। गुणवत्ता एक ऐसे आर्किटेक्चर से आती है जहाँ कोई भी भूमिका स्वयं की जाँच नहीं करती है।

2024 के शोध से 'सेल्फ-प्रेफरेंस बायस' (self-preference bias) का पता चलता है। एक मॉडल अपने स्वयं के आउटपुट को समान गुणवत्ता वाले अन्य आउटपुट की तुलना में अधिक रेटिंग देता है। मॉडल अपनी स्वयं की शैली को पहचानता है और उसे प्राथमिकता देता है।

"लिखें, फिर जो लिखा है उसकी समीक्षा करें" वाला लूप टूटा हुआ है। आपको समीक्षा नहीं मिलती, बल्कि औचित्य (justification) मिलता है। एजेंट पहले ही तय कर चुका है कि कोड अच्छा था। दोबारा पूछने से केवल उसी निर्णय की पुष्टि होती है।

बेहतर एजेंट वर्कफ़्लो बनाने के लिए इन नियमों का पालन करें:

समीक्षक कभी भी लेखक नहीं होना चाहिए। शैली की पहचान को तोड़ने के लिए समीक्षक के लिए एक अलग मॉडल फैमिली का उपयोग करें।
एक साफ कॉन्टेक्स्ट (context) का उपयोग करें। समीक्षक को मूल कार्यान्वयन प्रॉम्प्ट (implementation prompt) या लेखक द्वारा निर्धारित बाधाएं (constraints) नहीं देखनी चाहिए।
पहचान हटा दें। समीक्षक को यह न बताएं कि कोड किसने लिखा है। लेखक की पहचान पूर्वाग्रह (bias) को जन्म देती है।
ओवर-फ्लैगिंग (over-flagging) से बचें। AI समीक्षक अक्सर उपयोगी दिखने के लिए समस्याओं को गढ़ लेते हैं। इससे आप उनकी बात सुनना बंद कर देते हैं।

गलत चेतावनियों को रोकने के लिए 'रसीद नियम' (receipt rule) का उपयोग करें। आपके देखने से पहले हर निष्कर्ष (finding) में प्रमाण शामिल होना चाहिए।

यदि कोई समीक्षक SQL injection जोखिम का दावा करता है, तो उन्हें निम्नलिखित प्रदान करना चाहिए:

यूजर इनपुट का एक grep।
क्वेरी फ्लो का एक trace।

यदि मान (value) एक कांस्टेंट (constant) है, तो उस निष्कर्ष को छोड़ दें। यदि यह एक HTTP request से आता है, तो इसे रखें। निर्णय से पहले प्रमाण आना चाहिए।

महत्वपूर्ण निष्कर्षों के लिए, संशयवादियों (skeptics) के एक पैनल का उपयोग करें। उनका काम बग की पुष्टि करना नहीं है। उनका काम उसे गलत साबित करना है। उन्हें यह साबित करने की कोशिश करनी चाहिए कि निष्कर्ष बग क्यों नहीं है। यदि बहुमत उस निष्कर्ष को खारिज नहीं कर पाता है, तभी वह पास होता है।

सत्य विरोधाभास से आता है, आत्म-घोषणा से नहीं।

एक ऐसा सिस्टम बनाएं जहाँ भूमिकाएं कभी आपस में न मिलें:

लेखक कोड लिखता है।
टेस्टर केवल स्पेसिफिकेशन (spec) से टेस्ट लिखता है।
समीक्षक ने कोड नहीं लिखा है।
किसी भी इंसान या LLM के देखने से पहले लिंटिंग (linting) और टेस्ट जैसे वस्तुनिष्ठ गेट्स (objective gates) पास होने चाहिए।

एक सुधारक जो खुद को ही सुधारता है, वह कुछ भी नहीं सुधारता। AI समीक्षा की गुणवत्ता इस बात पर निर्भर करती है कि आप उसे खुद का मूल्यांकन करने से कितनी बार रोकते हैं।

Source: https://dev.to/ohugonnot/no-agent-grades-its-own-homework-8lb

Optional learning community: https://t.me/GyaanSetuAi

No Agent Grades Its Own Homework

कोई भी एजेंट अपना होमवर्क खुद नहीं जांचता

पढ़ना जारी रखें

My AI Coding Agent Kept Breaking — What I Changed

कोई आपके रोबोट के PRs की समीक्षा नहीं कर रहा है