ब्रेकिंग बिल्ड: निर्देश और इरादे के बीच का अंतर

आपकी भाषा के लिए अनुवादित. मूल पढ़ें.

AI-सहायता प्राप्त ड्राफ़्ट.

GyaanSetu Editorial3 दिन पहले2मिनट पढ़ें

𝗕𝗿𝗲𝗮𝗸𝗶𝗻𝗴 𝗕𝘂𝗶𝗹𝗱: निर्देश और इरादे के बीच का अंतर

AI एजेंट्स ने बिल्कुल वही किया जो मैंने उनसे कहा। उन्होंने वह नहीं किया जो मैं चाहता था।

मैं AI एजेंट्स के साथ निर्माण करता हूँ। मैं निर्देश देता हूँ, और वे जनरेट करते हैं। एक एजेंट इंफ्रास्ट्रक्चर लिखता है। दूसरा उसका ऑडिट करता है। मैं कोड को मर्ज करता हूँ। यह तेज़ है। यह अच्छा है। लेकिन विफलता का तरीका (failure mode) अजीब है।

एजेंट्स गलतियाँ नहीं करते। वे निर्देशों का पूरी तरह से पालन करते हैं। बग मेरे निर्देश और मेरे इरादे के बीच के अंतर में छिपा होता है। एजेंट उस अंतर को शाब्दिक सत्य (literal truth) से भर देता है।

मैंने एक ही सप्ताह में चार बार इसका सामना किया:

द घोस्ट डिप्लॉयमेंट (The Ghost Deployment): मेरे डिप्लॉय पाइपलाइन ने "success" कहा। उसने कहा भी। लेकिन उसने मई का एक पुराना वर्ज़न डिप्लॉय कर दिया। मैंने पूछा कि क्या डिप्लॉय हुआ। हुआ। मैं यह पूछना भूल गया कि क्या उसने वह कोड डिप्लॉय किया जो मैंने वास्तव में लिखा था।
द एम्प्टी टैब्स (The Empty Tabs): मेरे UI में तीन टैब दिख रहे थे। स्पेसिफिकेशन (spec) में तीन टैब की आवश्यकता थी। दो टैब एक डेड एंड (dead end) पर ले जाते थे क्योंकि मैंने उन्हें कभी पूरा ही नहीं किया था। एजेंट ने स्पेसिफिकेशन के अनुसार UI बनाया, लेकिन स्पेसिफिकेशन पुराना हो चुका था।
द टेक्निकल वॉल (The Technical Wall): मैंने सटीक निष्कर्षों (findings) की मांग की थी। एजेंट ने मुझे तकनीकी शब्दावली (technical jargon) दे दी। वह सही था, लेकिन मेरे उपयोगकर्ता उसे पढ़ नहीं सकते थे। मैंने एक इंजीनियर के लिए निर्माण किया था, किसी इंसान के लिए नहीं।
द साइलेंट फेलियर (The Silent Failure): एक सोशल कार्ड रूट ने ज़ीरो-बाइट फ़ाइल बना दी। एक खाली फ़ॉन्ट फ़ाइल ने कोई एरर ट्रिगर नहीं किया। कोड ने उस एरर को हैंडल किया जिसकी उसे उम्मीद थी, लेकिन उसने उस एरर को मिस कर दिया जो वास्तव में हुआ था।

इनमें से हर एक ने अपना टेस्ट पास कर लिया था। कोड तकनीकी रूप से एकदम सही था।

अगर मैंने केवल "यह काम करता है" पर भरोसा किया होता, तो चारों विफलताएं शिप (ship) हो जातीं।

समाधान बेहतर प्रॉम्प्टिंग (prompting) नहीं है। यह कोई स्मार्ट एजेंट नहीं है। यह मानवीय निरीक्षण (human oversight) है।

एजेंट्स उस चीज़ के लिए ऑप्टिमाइज़ करते हैं जो आप कहते हैं। आपका काम यह जाँचना है कि आपने जो कहा वह आपके इरादे के अनुरूप है या नहीं। एक एजेंट इस अंतर को नहीं देख सकता। केवल आप ही ऐसा कर सकते हैं।

निर्देश देना कोई एक बार का कमांड नहीं है। यह अपने लक्ष्य के सामने काम को लगातार परखने की प्रक्रिया है। आपको यह पूछना चाहिए: "क्या यह वही चीज़ है जो मैं चाहता था?" बजाय इसके कि "क्या यह रन हुआ?"

एजेंट्स काम करते हैं। इंसान इरादा (intent) प्रदान करते हैं।

Source: https://dev.to/earlgreyhot1701d/breaking-build-kiro-and-claude-delivered-exactly-what-i-asked-and-it-wasnt-what-i-wanted-27l5

Optional learning community: https://t.me/GyaanSetuAi

ब्रेकिंग बिल्ड: निर्देश और इरादे के बीच का अंतर

पढ़ना जारी रखें

मैंने अपना खुद का AI एजेंट बनाया। यहाँ वह बातें हैं जो कोई आपको नहीं बताता।

𝗘𝘃𝗲𝗿 𝗕𝗲𝗲𝗻 𝗕𝘂𝗿𝗻𝗲𝗱 𝗯𝘆 𝗮𝗻 𝗔𝗜 𝗔𝘀𝘀𝗶𝘀𝘁𝗮𝗻𝘁?

एजेंट ने बिल्कुल वही किया जो मैंने उससे कहा था और यही समस्या थी

𝗙𝗿𝗼𝗺 𝗖𝗵𝗮𝘁𝗚𝗣𝗧 𝘁𝗼 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀: 𝗧𝘄𝗼 𝗬𝗲𝗮𝗿𝘀 𝗮𝘀 𝗮𝗻 𝗘𝗻𝗴𝗶𝗻𝗲𝗲𝗿

AI एजेंट्स को सर्किट ब्रेकर्स की आवश्यकता है