Agentic AI मेमरी सिस्टम्सचे भविष्य

AI मेमरी बदलत आहे.

अनेक वर्षांपासून, मेमरी म्हणजे चॅट हिस्ट्री कॉन्टेक्स्ट विंडोमध्ये भरून ठेवणे असा अर्थ होता. ती पद्धत आता कालबाह्य झाली आहे. २०२६ मध्ये, मेमरी हा एजंट डिझाइनचा एक मुख्य भाग आहे. त्याचे स्वतःचे संशोधन, बेंचमार्क आणि सुरक्षा धोके आहेत.

जर तुम्ही एजंट्स बनवत असाल, तर तुमचा टूल पहिल्या सेशननंतर उपयुक्त ठरेल की नाही, हे मेमरी ठरवते.

जुनी पद्धत सोपी होती पण ती अपयशी ठरली. डेव्हलपर्स अलीकडील मेसेजेस बफर करायचे आणि उर्वरित मेसेजेसचा सारांश (summarize) काढायचे. हे चॅटबॉट्ससाठी उपयुक्त होते. परंतु कोड रिव्ह्यू किंवा रिसर्च सारखे वास्तविक वर्कफ्लो चालवणाऱ्या एजंट्ससाठी ते अपयशी ठरले. त्या एजंट्सना फक्त पाच मिनिटांपूर्वी काय झाले हे नाही, तर काल त्यांनी काय केले होते हे देखील लक्षात ठेवणे आवश्यक आहे.

प्रभावी दीर्घकालीन मेमरीचे (long-term memory) तीन प्रकार आहेत:

  • एपिसोडिक मेमरी (Episodic memory): विशिष्ट भूतकाळातील अनुभव आणि परिणाम.
  • सिमेंटिक मेमरी (Semantic memory): सामान्य तथ्ये आणि संबंध.
  • प्रोसिजरल मेमरी (Procedural memory): शिकलेली कौशल्ये आणि पुन्हा वापरण्यायोग्य कृतींचे क्रम (action sequences).

आजच्या बहुतेक सिस्टम्समध्ये प्रोसिजरल मेमरीचा अभाव आहे. त्या वेक्टर सर्चद्वारे (vector search) केवळ तथ्यांवर लक्ष केंद्रित करतात. परंतु एखादा एजंट केवळ तेव्हाच काळानुसार अधिक सक्षम होतो, जेव्हा तो प्रोसिजरल मेमरीमध्ये प्रभुत्व मिळवतो.

आर्किटेक्चर देखील दोन गटांत विभागले जात आहेत:

  1. कन्वर्सेशन कॉन्टेक्स्ट (Conversation context): एक संवादाची प्रक्रिया सुसंगत ठेवणे.
  2. ऑपरेशनल नॉलेज (Operational knowledge): अनेक सेशन्समध्ये टिकाऊ ज्ञान साठवणे.

या सिस्टम्समध्ये, तुम्हाला वेक्टर सिमिलॅरिटी (vector similarity) आणि ग्राफ-ऑगमेंटेड रिट्रिव्हल (graph-augmented retrieval) यापैकी एकाची निवड करावी लागेल. वेक्टर मेमरी समान तथ्ये शोधते परंतु संबंधांकडे दुर्लक्ष करते. ग्राफ पद्धती एंटिटीज (entities) आणि कनेक्शनद्वारे तथ्ये शोधतात. सर्वोत्तम सिस्टम्स आता मल्टी-सिग्नल रिट्रिव्हल (multi-signal retrieval) वापरतात. यामध्ये सिमेंटिक सिमिलॅरिटी, कीवर्ड्स आणि एंटिटी लिंकिंग यांचा समावेश होतो.

Letta सारखे नवीन मॉडेल्स मेमरीला ऑपरेटिंग सिस्टमप्रमाणे हाताळतात. ते टियर्ड अप्रोच (tiered approach) वापरतात जिथे कोअर मेमरी RAM प्रमाणे कार्य करते. हे केवळ एजंटला डेटाबेस जोडण्यापेक्षा अधिक चांगले आहे.

तुम्हाला एका नवीन सुरक्षा धोक्याकडेही लक्ष दिले पाहिजे: मेमरी पॉयझनिंग (Memory Poisoning).

प्रॉम्प्ट इंजेक्शन (Prompt injection) चॅट संपल्यावर रिसेट होते. मेमरी पॉयझनिंग तसे होत नाही. एखादा अटॅकर एजंटच्या दीर्घकालीन स्टोअरमध्ये एकदा चुकीचा डेटा टाकू शकतो. त्यानंतर तो प्रत्येक भविष्यातील संवादाला दूषित करतो. हे काही दिवसांनंतरही घडू शकते. OWASP आता मेमरी आणि कॉन्टेक्स्ट पॉयझनिंगला (Memory and Context Poisoning) प्रमुख जोखमीमध्ये समाविष्ट करते.

तुमच्या सिस्टम्सचे संरक्षण करण्यासाठी, या चार थरांचा वापर करा:

  • डेटा इनजेशनपूर्वी (ingestion) तो सॅनिटाइज करा.
  • प्रत्येक एन्ट्रीचा उगम शोधण्यासाठी त्याला प्रोव्हेनन्स (provenance) जोडा.
  • रिट्रिव्हल दरम्यान ट्रस्ट-अवेअर वेटिंग (trust-aware weighting) वापरा.
  • बिहेवियरल ड्रिफ्टसाठी (behavioral drift) मॉनिटर करा.

भविष्याचा विचार करता, तीन ट्रेंड्स या क्षेत्राला आकार देतील:

  • मल्टी-एजंट मेमरी (Multi-agent memory): एजंट्सना एकमेकांच्या मेमरी शेअर करण्याची आणि त्यावर विश्वास ठेवण्याची गरज असेल.
  • मानकीकरण (Standardization): एजंट्सना ते काय जाणतात याचे वर्णन कसे करायचे यासाठी प्रोटोकॉल्स पाहायला मिळतील.
  • प्रूनिंग (Pruning): चांगल्या सिस्टम्स काय विसरले पाहिजे हे ठरवतील. अमर्याद मेमरीमुळे गोंधळ (noise) आणि उच्च खर्च निर्माण होतो.

मेमरी आता लहान कॉन्टेक्स्ट विंडोसाठी केवळ एक उपाय (workaround) राहिलेली नाही. हेच एका डेमोला वास्तविक सिस्टमपासून वेगळे करते. मेमरीकडे केवळ नंतरचा विचार (afterthought) म्हणून न बघता, ती मुख्य आर्किटेक्चर म्हणून पहा.

Source: https://dev.to/xenocoregiger31/the-future-of-agentic-ai-memory-systems-5fdp

Optional learning community: https://t.me/GyaanSetuAi