𝗕𝗿𝗲𝗮𝗸𝗶𝗻𝗴 𝗕𝘂𝗶𝗹𝗱: निर्देश और इरादे के बीच का अंतर
AI एजेंट्स ने बिल्कुल वही किया जो मैंने उनसे कहा। उन्होंने वह नहीं किया जो मैं चाहता था।
मैं AI एजेंट्स के साथ निर्माण करता हूँ। मैं निर्देश देता हूँ, और वे जनरेट करते हैं। एक एजेंट इंफ्रास्ट्रक्चर लिखता है। दूसरा उसका ऑडिट करता है। मैं कोड को मर्ज करता हूँ। यह तेज़ है। यह अच्छा है। लेकिन विफलता का तरीका (failure mode) अजीब है।
एजेंट्स गलतियाँ नहीं करते। वे निर्देशों का पूरी तरह से पालन करते हैं। बग मेरे निर्देश और मेरे इरादे के बीच के अंतर में छिपा होता है। एजेंट उस अंतर को शाब्दिक सत्य (literal truth) से भर देता है।
मैंने एक ही सप्ताह में चार बार इसका सामना किया:
- द घोस्ट डिप्लॉयमेंट (The Ghost Deployment): मेरे डिप्लॉय पाइपलाइन ने "success" कहा। उसने कहा भी। लेकिन उसने मई का एक पुराना वर्ज़न डिप्लॉय कर दिया। मैंने पूछा कि क्या डिप्लॉय हुआ। हुआ। मैं यह पूछना भूल गया कि क्या उसने वह कोड डिप्लॉय किया जो मैंने वास्तव में लिखा था।
- द एम्प्टी टैब्स (The Empty Tabs): मेरे UI में तीन टैब दिख रहे थे। स्पेसिफिकेशन (spec) में तीन टैब की आवश्यकता थी। दो टैब एक डेड एंड (dead end) पर ले जाते थे क्योंकि मैंने उन्हें कभी पूरा ही नहीं किया था। एजेंट ने स्पेसिफिकेशन के अनुसार UI बनाया, लेकिन स्पेसिफिकेशन पुराना हो चुका था।
- द टेक्निकल वॉल (The Technical Wall): मैंने सटीक निष्कर्षों (findings) की मांग की थी। एजेंट ने मुझे तकनीकी शब्दावली (technical jargon) दे दी। वह सही था, लेकिन मेरे उपयोगकर्ता उसे पढ़ नहीं सकते थे। मैंने एक इंजीनियर के लिए निर्माण किया था, किसी इंसान के लिए नहीं।
- द साइलेंट फेलियर (The Silent Failure): एक सोशल कार्ड रूट ने ज़ीरो-बाइट फ़ाइल बना दी। एक खाली फ़ॉन्ट फ़ाइल ने कोई एरर ट्रिगर नहीं किया। कोड ने उस एरर को हैंडल किया जिसकी उसे उम्मीद थी, लेकिन उसने उस एरर को मिस कर दिया जो वास्तव में हुआ था।
इनमें से हर एक ने अपना टेस्ट पास कर लिया था। कोड तकनीकी रूप से एकदम सही था।
अगर मैंने केवल "यह काम करता है" पर भरोसा किया होता, तो चारों विफलताएं शिप (ship) हो जातीं।
समाधान बेहतर प्रॉम्प्टिंग (prompting) नहीं है। यह कोई स्मार्ट एजेंट नहीं है। यह मानवीय निरीक्षण (human oversight) है।
एजेंट्स उस चीज़ के लिए ऑप्टिमाइज़ करते हैं जो आप कहते हैं। आपका काम यह जाँचना है कि आपने जो कहा वह आपके इरादे के अनुरूप है या नहीं। एक एजेंट इस अंतर को नहीं देख सकता। केवल आप ही ऐसा कर सकते हैं।
निर्देश देना कोई एक बार का कमांड नहीं है। यह अपने लक्ष्य के सामने काम को लगातार परखने की प्रक्रिया है। आपको यह पूछना चाहिए: "क्या यह वही चीज़ है जो मैं चाहता था?" बजाय इसके कि "क्या यह रन हुआ?"
एजेंट्स काम करते हैं। इंसान इरादा (intent) प्रदान करते हैं।
Optional learning community: https://t.me/GyaanSetuAi