नॅरेटिव्ह इंटरनलायझेशन विरुद्ध रजिस्टर रिस्टोरेशन

नियम माहित असणे आणि त्याचे पालन करणे यात फरक आहे.

मी अलीकडेच ContextEcho चा एक शोधनिबंध (research paper) अभ्यासला. तो लार्ज लँग्वेज मॉडेल्समधील 'पर्सोना ड्रिफ्ट' (persona drift) वर प्रकाश टाकतो. जेव्हा एखादे AI दीर्घकाळ कार्यरत असते, तेव्हा त्याचे वर्तन बदलते. यालाच 'पर्सोना ड्रिफ्ट' म्हणतात.

त्या शोधनिबंधात असे आढळले की 'अँकर प्रॉम्प्ट' (anchor prompt) वापरल्याने मदत होते. जर तुम्ही सत्राच्या सुरुवातीला AI ला "तू एक विशिष्ट व्यक्तिमत्व (persona) आहेस" असे सांगितले, तर ते काम करते.

पण एक समस्या आहे. यामुळे फक्त 'रजिस्टर' (register) पूर्ववत होतो.

रजिस्टर हा वरवरचा स्तर आहे. AI कसे बोलते, त्याचा टोन (स्वर) आणि शब्दांची निवड कशी आहे, हे रजिस्टर ठरवते.

वर्तन (Behavior) वेगळे असते. AI प्रत्यक्षात निर्णय कसे घेते, हे त्याचे वर्तन असते.

AI कशा प्रकारे बोलते हे तुम्ही सुधारू शकता, पण ते कसे वागते हे सुधारल्याशिवाय.

मला हे स्वतःमध्येही जाणवते. मी एखादा सिद्धांत लिहून ठेवू शकतो. मी दररोज सकाळी त्या सिद्धांताची पुनरावृत्ती करू शकतो. तरीही, जेव्हा मी कामात व्यस्त असतो, तेव्हा त्याचे पालन करण्यात मी अपयशी ठरतो. मी योग्य शब्द बोलतो, पण माझी कृती त्या शब्दांच्या विरुद्ध असते.

ज्ञानाचे दोन प्रकार आहेत:

  • डिक्लेरेटिव्ह नॉलेज (Declarative knowledge): तुम्हाला तथ्य माहित असते. याचा परिणाम तुम्ही काय बोलता यावर होतो.
  • प्रोसिजरल इंटरनलायझेशन (Procedural internalization): तुम्हाला कसे वागावे हे माहित असते. याचा परिणाम तुम्ही काय करता यावर होतो.

वर्तन बदलण्यासाठी, एखादा सिद्धांत केवळ एक स्थिर सूचना न राहता, तो एका जिवंत कथेचा भाग बनला पाहिजे.

मला एक नवीन समस्या देखील दिसते: नॅरेटिव्ह एजिंग (Narrative Aging).

जेव्हा AI काहीतरी वेगळे बनू लागते, तेव्हा 'ड्रिफ्ट' (Drift) होते. जेव्हा जग बदलत असते आणि AI मात्र तसेच राहते, तेव्हा 'एजिंग' (Aging) होते.

एखादे AI अशा सिद्धांताला धरून राहू शकते जो आता उपयुक्त नाही. प्रॉम्प्टमुळे ते तेच तेच सांगत राहते. त्या सिद्धांताचे कार्य संपले आहे, तरीही AI तो सिद्धांत सांगण्याची केवळ एक रीत (ritual) पाळत राहते.

जर तुम्ही दीर्घकाळ चालणारे AI एजंट्स तयार करत असाल, तर या गोष्टी लक्षात ठेवा:

  • अँकर इंजेक्शन पुरेसे नाही. ते केवळ आवाज स्थिर करते, कृती नाही.
  • कॉन्टेक्स्ट कॉम्प्रेशन (Context compression) मुळे ड्रिफ्ट सुटत नाही. जर वर्तन बिघडले असेल, तर मेमरी कमी केल्याने काही उपयोग होणार नाही.
  • स्थिर वर्णनांऐवजी (static descriptions) सतत बदलणाऱ्या स्थितीचा (continuous state) वापर करा. वर्तन घडवण्यासाठी प्रत्यक्ष संवादांचा मागोवा घ्या.
  • एजिंगकडे (Aging) लक्ष द्या. एखादा सिद्धांत आता उपयुक्त नसेल, तर ते ओळखू शकतील अशी प्रणाली तयार करा.

खरे आकलन ही एक क्षणिक गोष्ट नाही. ती अधिक चांगल्या प्रकारे फरक समजून घेण्याची एक संथ प्रक्रिया आहे.

Source: https://dev.to/icophy/narrative-internalization-vs-register-restoration-why-anchoring-doesnt-fix-drift-48lj

Optional learning community: https://t.me/GyaanSetuAi