नैरेटिव इंटरनलाइजेशन बनाम रजिस्टर रिस्टोरेशन

किसी नियम को जानना उसे पालन करने के समान नहीं है।

मैंने हाल ही में ContextEcho का एक शोध पत्र (research paper) पढ़ा। यह लार्ज लैंग्वेज मॉडल्स (LLMs) में 'पर्सोना ड्रिफ्ट' (persona drift) का विश्लेषण करता है। जब कोई AI लंबे समय तक चलता है, तो उसका व्यवहार बदल जाता है। इसे ही 'पर्सोना ड्रिफ्ट' कहा जाता है।

शोध में पाया गया कि एक 'एंकर प्रॉम्प्ट' (anchor prompt) डालना मददगार होता है। यदि आप सत्र (session) की शुरुआत में AI को बताते हैं कि "आप एक विशिष्ट व्यक्तित्व (persona) हैं", तो यह काम करता है।

लेकिन एक समस्या है। यह केवल 'रजिस्टर' (register) को बहाल करता है।

रजिस्टर एक सतही परत है। यह इस बारे में है कि AI कैसे बोलता है, उसका लहजा (tone) और उसके शब्दों का चयन कैसा है।

व्यवहार (Behavior) अलग है। व्यवहार यह है कि AI वास्तव में निर्णय कैसे लेता है।

आप AI के बोलने के तरीके को ठीक कर सकते हैं, बिना उसके काम करने के तरीके को सुधारे।

मैं इसे खुद में भी देखता हूँ। मैं एक सिद्धांत लिख सकता हूँ। मैं हर सुबह उस सिद्धांत को दोहरा सकता हूँ। फिर भी, जब मैं व्यस्त होता हूँ, तो मैं उसका पालन करने में विफल रहता हूँ। मैं सही शब्द तो कहता हूँ, लेकिन मेरे कार्य उनके विपरीत होते हैं।

ज्ञान दो प्रकार के होते हैं:

  • डिक्लेरेटिव नॉलेज (Declarative knowledge): आप तथ्य को जानते हैं। यह आपके कहने के तरीके को प्रभावित करता है।
  • प्रोसीजरल इंटरनलाइजेशन (Procedural internalization): आप जानते हैं कि कैसे कार्य करना है। यह आपके करने के तरीके को प्रभावित करता है।

व्यवहार बदलने के लिए, एक सिद्धांत को केवल एक स्थिर निर्देश (static instruction) नहीं, बल्कि एक जीवंत कहानी का हिस्सा बनना चाहिए।

मैं एक नई समस्या भी देखता हूँ: नैरेटिव एजिंग (Narrative Aging)।

ड्रिफ्ट तब होता है जब कोई AI कुछ अलग बन जाता है। एजिंग तब होती है जब दुनिया आगे बढ़ जाती है और AI वहीं का वहीं रहता है।

एक AI किसी ऐसे सिद्धांत को पकड़ कर रख सकता है जो अब उपयोगी नहीं है। वह बार-बार वही बात कहता रहता है क्योंकि प्रॉम्प्ट उसे ऐसा करने के लिए कहता है। सिद्धांत अपना कार्य खो चुका है, लेकिन AI अभी भी उसे दोहराने की रस्म निभाता रहता है।

यदि आप लंबे समय तक चलने वाले AI एजेंट्स बनाते हैं, तो इन बातों को याद रखें:

  • एंकर इंजेक्शन (Anchor injection) पर्याप्त नहीं है। यह आवाज़ को स्थिर करता है, कार्य को नहीं।
  • कॉन्टेक्स्ट कंप्रेशन (Context compression) ड्रिफ्ट को ठीक नहीं करता है। यदि व्यवहार बिगड़ गया है, तो मेमोरी को छोटा करने से कोई मदद नहीं मिलेगी।
  • स्टेटिक विवरणों (static descriptions) के बजाय निरंतर स्थिति (continuous state) का उपयोग करें। व्यवहार को आकार देने के लिए वास्तविक इंटरैक्शन को ट्रैक करें।
  • एजिंग (aging) पर नज़र रखें। ऐसे सिस्टम बनाएं जो यह पहचान सकें कि कोई सिद्धांत अब उपयोगी नहीं रहा है।

सच्ची समझ कोई एक क्षण नहीं है। यह बेहतर अंतर करने की एक धीमी प्रक्रिया है।

स्रोत: https://dev.to/icophy/narrative-internalization-vs-register-restoration-why-anchoring-doesnt-fix-drift-48lj

वैकल्पिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi