𝗖𝗹𝗮𝘂𝗱𝗲 𝗗𝘆𝗻𝗮𝗺𝗶𝗰 𝗪𝗼𝗿𝗸𝗳𝗹𝗼𝘄𝘀: कोरियोग्राफ्ड सिमेंटिक बिहेवियर्स के रूप में
पारंपरिक वर्कफ़्लो हर चरण को प्रबंधित करने के लिए एक केंद्रीय कंट्रोलर का उपयोग करते हैं। कंट्रोलर को अनुक्रम (sequence) पता होता है: वर्गीकृत करना (classify), टूल कॉल करना, प्रतीक्षा करना, ब्रांच करना और समाप्त करना। यह पूर्वानुमान (predictability) के लिए तो ठीक है, लेकिन यह कठोर (rigid) है।
मैं एक अलग दृष्टिकोण अपनाता हूँ। मेरा सिस्टम कोरियोग्राफ्ड सिमेंटिक बिहेवियर्स (choreographed semantic behaviors) का उपयोग करता है। एक कंट्रोलर के बजाय, एजेंट्स इवेंट्स को पब्लिश और सब्सक्राइब करते हैं। एक एजेंट को पूरे सिस्टम को जानने की आवश्यकता नहीं होती है। उसे केवल सिमेंटिक कॉन्ट्रैक्ट (semantic contract) जानने की आवश्यकता होती है।
यह एक हाइब्रिड मॉडल बनाता है:
- IntentGraph मैक्रो इरादे (macro intention) को परिभाषित करता है।
- QuarkBehavior सबसे छोटी सिमेंटिक इकाई को परिभाषित करता है।
- SubAgents इवेंट्स पर प्रतिक्रिया देते हैं।
- ProofAgents शुद्धता (correctness) को सत्यापित करते हैं।
- HealingAgents अमान्य स्थितियों (invalid states) को ठीक करते हैं।
- BenchmarkAgents लागत और लेटेंसी (latency) को मापते हैं।
- Governor तय करता है कि परिणाम स्वीकार्य है या नहीं।
इस मॉडल में, ऑर्केस्ट्रेशन (orchestration) उच्च-स्तरीय इरादे को संभालता है। कोरियोग्राफी (choreography) स्थानीय अनुकूलन (local adaptation) को संभालती है। ऑर्केस्ट्रेटर बताता है कि क्या हासिल करना है। एजेंट्स यह खोजते हैं कि इवेंट्स पर कैसे प्रतिक्रिया देनी है।
मैं इसे सिमेंटिक रूटिंग (semantic routing) कहता हूँ। जब कोई संदेश आता है, तो सिस्टम इरादे को वर्गीकृत करता है। यह केवल एक फंक्शन कॉल नहीं करता है। यह एक बिहेवियर चुनता है, डेटा को मान्य करता है, और सफलता या त्रुटि (error) इवेंट्स जारी करता है।
यह आर्किटेक्चर कई उन्नत पैटर्न सक्षम बनाता है:
एडवर्सरियल वेरिफिकेशन (Adversarial Verification) एजेंट द्वारा आउटपुट देने के बाद, दूसरा एजेंट यह साबित करने की कोशिश करता है कि वह गलत है। एडवर्सरी (adversary) एक हमलावर, एक कंपाइलर, या एक दुर्भावनापूर्ण उपयोगकर्ता के रूप में कार्य करता है। यह मददगार होने की कोशिश नहीं करता है। यह कैंडिडेट को तोड़ने की कोशिश करता है।
जनरेट-एंड-फ़िल्टर (Generate-and-Filter) सिस्टम कई समाधान उत्पन्न करता है। फिर यह उन्हें डिटरमिनिस्टिक गेट्स (deterministic gates) के माध्यम से चलाता है। ये गेट्स स्कीमा, प्रकार (types), यूनिट टेस्ट और सुरक्षा नीतियों की जाँच करते हैं। जनरेशन सस्ता है। स्वीकृति सख्त होनी चाहिए।
टूर्नामेंट (Tournament) यदि कोई एक समाधान सबसे अच्छा नहीं है, तो मैं एक टूर्नामेंट आयोजित करता हूँ। मैं कई प्रतिस्पर्धी समाधान उत्पन्न करता हूँ और उन्हें एक रूब्रिक (rubric) के आधार पर स्कोर करता हूँ। हम CPU लागत, मेमोरी उपयोग और सुरक्षा के आधार पर उनकी तुलना करते हैं। एक टूर्नामेंट केवल विजेता ही नहीं, बल्कि एक स्कोरकार्ड भी प्रदान करता है।
इंटेंट-आधारित हीलिंग (Intent-based Healing) अधिकांश सिस्टम त्रुटि (error) लौटाते हैं और रुक जाते हैं। मेरा सिस्टम त्रुटि को एक नए इवेंट के रूप में मानता है। एक हीलिंग एजेंट त्रुटि को सब्सक्राइब करता है, ट्रेस प्राप्त करता है, और पेलोड को ठीक करने का प्रयास करता है। यह अभिसरण (convergence) का एक लूप है।
लक्ष्य त्रुटियों से बचना नहीं है। लक्ष्य हर त्रुटि को एक नए सिमेंटिक व्यवहार में बदलना है। यदि कोई विफलता होती है, तो इसका अर्थ है कि हमारे पास ज्ञान की कमी है। हम उस विफलता का उपयोग एक नया नियम बनाने के लिए करते हैं ताकि वह त्रुटि दोबारा कभी न हो।
यह कोडिंग को एक अंदाज़े के खेल से इंजीनियरिंग में बदल देता है।
वैकल्पिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi