ஏஜென்டிக் AI நினைவக அமைப்புகளின் எதிர்காலம்

AI நினைவகம் மாறிவருகிறது.

பல ஆண்டுகளாக, நினைவகம் என்பது உரையாடல் வரலாற்றை ஒரு context window-க்குள் திணிப்பதாகவே இருந்தது. அந்த அணுகுமுறை இப்போது காலாவதியாகிவிட்டது. 2026-இல், நினைவகம் என்பது ஏஜென்ட் வடிவமைப்பின் ஒரு முக்கிய அங்கமாக இருக்கும். இதற்கெனத் தனிப்பட்ட ஆராய்ச்சி, benchmarks மற்றும் பாதுகாப்பு அபாயங்கள் உள்ளன.

நீங்கள் ஏஜென்ட்களை உருவாக்குகிறீர்கள் என்றால், முதல் அமர்வுக்குப் பிறகும் உங்கள் கருவி பயனுள்ளதாக இருக்குமா என்பதை நினைவகமே தீர்மானிக்கிறது.

பழைய முறை எளிமையானது ஆனால் தோல்வியடைந்தது. டெவலப்பர்கள் சமீபத்திய செய்திகளை buffer செய்து, மற்றவற்றைச் சுருக்கி (summarize) வைத்திருப்பார்கள். இது சாட்பாட்களுக்கு (chatbots) வேலை செய்தது. ஆனால் கோட் ரிவியூ (code reviews) அல்லது ஆராய்ச்சி போன்ற நிஜமான பணிப்பாய்வுகளை (workflows) இயக்கும் ஏஜென்ட்களுக்கு இது தோல்வியடைந்தது. அந்த ஏஜென்ட்கள் ஐந்து நிமிடங்களுக்கு முன்பு மட்டும் செய்ததை அல்லாமல், நேற்று செய்தவற்றையும் நினைவில் கொள்ள வேண்டும்.

பயனுள்ள நீண்டகால நினைவகத்தில் மூன்று வகைகள் உள்ளன:

  • Episodic memory: குறிப்பிட்ட கடந்த கால அனுபவங்கள் மற்றும் முடிவுகள்.
  • Semantic memory: பொதுவான உண்மைகள் மற்றும் உறவுகள்.
  • Procedural memory: கற்ற திறன்கள் மற்றும் மீண்டும் பயன்படுத்தக்கூடிய செயல் வரிசைகள்.

இன்றைய பெரும்பாலான அமைப்புகளில் procedural memory இல்லை. அவை vector search மூலம் உண்மைகளில் மட்டுமே கவனம் செலுத்துகின்றன. ஆனால் ஒரு ஏஜென்ட் procedural memory-இல் தேர்ச்சி பெற்றால் மட்டுமே காலப்போக்கில் மேம்படும்.

கட்டமைப்புகளும் (Architectures) இரண்டு பிரிவுகளாகப் பிரிகின்றன:

  1. Conversation context: ஒரு உரையாடலைத் தொடர்ச்சியாக வைத்திருப்பது.
  2. Operational knowledge: பல அமர்வுகளுக்கு அப்பால் நிலையான அறிவைச் சேமிப்பது.

இந்த அமைப்புகளுக்குள், நீங்கள் vector similarity அல்லது graph-augmented retrieval ஆகியவற்றில் ஒன்றைத் தேர்ந்தெடுக்க வேண்டும். Vector memory ஒத்த உண்மைகளைக் கண்டறியும் ஆனால் உறவுகளைத் தவறவிடும். Graph அணுகுமுறைகள் entities மற்றும் இணைப்புகள் மூலம் உண்மைகளைக் கண்டறிகின்றன. சிறந்த அமைப்புகள் இப்போது multi-signal retrieval முறையைப் பயன்படுத்துகின்றன. இது semantic similarity, keywords மற்றும் entity linking ஆகியவற்றை ஒருங்கிணைக்கிறது.

Letta போன்ற புதிய மாடல்கள் நினைவகத்தை ஒரு operating system போலக் கையாளுகின்றன. அவை ஒரு அடுக்கு முறையைப் (tiered approach) பயன்படுத்துகின்றன, இதில் முக்கிய நினைவகம் RAM போலச் செயல்படுகிறது. இது ஒரு ஏஜென்ட்டுடன் வெறும் தரவுத்தளத்தை (database) இணைப்பதை விடச் சிறந்தது.

நீங்கள் ஒரு புதிய பாதுகாப்பு அச்சுறுத்தலையும் கவனிக்க வேண்டும்: Memory Poisoning.

Prompt injection என்பது ஒரு உரையாடல் முடிந்ததும் முடிந்துவிடும். ஆனால் Memory poisoning அப்படி அல்ல. ஒரு தாக்குதல் நடத்துபவர் ஒரு ஏஜென்ட்டின் நீண்டகால சேமிப்பகத்தில் ஒருமுறை தவறான தரவைச் செலுத்த முடியும். அது பின்வரும் ஒவ்வொரு உரையாடலையும் சிதைக்கும். இது பல நாட்களுக்குப் பிறகும் நிகழலாம். OWASP இப்போது Memory and Context Poisoning-ஐ ஒரு முக்கிய அபாயமாகப் பட்டியலிட்டுள்ளது.

உங்கள் அமைப்புகளைப் பாதுகாக்க, இந்த நான்கு அடுக்குகளைப் பயன்படுத்தவும்:

  • தரவை உள்ளிடுவதற்கு (ingestion) முன் சுத்திகரிக்கவும் (Sanitize).
  • அதன் மூலத்தைக் கண்டறிய ஒவ்வொரு பதிவிற்கும் provenance-ஐ இணைக்கவும்.
  • மீட்டெடுப்பின் போது (retrieval) trust-aware weighting முறையைப் பயன்படுத்தவும்.
  • நடத்தை மாற்றங்களைக் (behavioral drift) கண்காணிக்கவும்.

எதிர்காலத்தைப் பார்க்கும்போது, மூன்று போக்குகள் இந்தத் துறையை வடிவமைக்கும்:

  • Multi-agent memory: ஏஜென்ட்கள் ஒருவருக்கொருவர் நினைவகத்தைப் பகிர்ந்து கொள்ளவும் நம்பவும் வேண்டியிருக்கும்.
  • Standardization: ஏஜென்ட்கள் தாங்கள் அறிந்தவற்றை எவ்வாறு விவரிக்கின்றன என்பதற்கான நெறிமுறைகளை (protocols) நாம் காண்போம்.
  • Pruning: சிறந்த அமைப்புகள் எதை மறக்க வேண்டும் என்பதைத் தீர்மானிக்கும். எல்லையற்ற நினைவகம் தேவையற்ற இரைச்சலையும் (noise) அதிக செலவையும் உருவாக்கும்.

நினைவகம் என்பது இனி சிறிய context windows-க்கான ஒரு தற்காலிகத் தீர்வு (workaround) அல்ல. இதுதான் ஒரு டெமோவிற்கும் (demo) ஒரு உண்மையான அமைப்பிற்கும் இடையிலான வேறுபாடு. நினைவகத்தை ஒரு முக்கியக் கட்டமைப்பாகக் கருதுங்கள், அது ஒரு கூடுதல் விஷயமாக மட்டும் இருக்கக்கூடாது.

Source: https://dev.to/xenocoregiger31/the-future-of-agentic-ai-memory-systems-5fdp

Optional learning community: https://t.me/GyaanSetuAi