The Future of Agentic AI Memory Systems

Translated for your language. Read the original.

AI-assisted draft.

Agentic AI ਮੈਮੋਰੀ ਸਿਸਟਮਜ਼ ਦਾ ਭਵਿੱਖ

AI ਮੈਮੋਰੀ ਬਦਲ ਰਹੀ ਹੈ।

ਸਾਲਾਂ ਤੋਂ, ਮੈਮੋਰੀ ਦਾ ਮਤਲਬ ਚੈਟ ਹਿਸਟਰੀ ਨੂੰ context window ਵਿੱਚ ਭਰਨਾ ਸੀ। ਉਹ ਤਰੀਕਾ ਹੁਣ ਖ਼ਤਮ ਹੋ ਚੁੱਕਾ ਹੈ। 2026 ਵਿੱਚ, ਮੈਮੋਰੀ agent ਡਿਜ਼ਾਈਨ ਦਾ ਇੱਕ ਮੁੱਖ ਹਿੱਸਾ ਹੈ। ਇਸ ਦੀ ਆਪਣੀ ਖੋਜ, benchmarks, ਅਤੇ ਸੁਰੱਖਿਆ ਜੋਖਮ ਹਨ।

ਜੇਕਰ ਤੁਸੀਂ agents ਬਣਾਉਂਦੇ ਹੋ, ਤਾਂ ਮੈਮੋਰੀ ਇਹ ਤੈਅ ਕਰਦੀ ਹੈ ਕਿ ਤੁਹਾਡਾ ਟੂਲ ਪਹਿਲੇ ਸੈਸ਼ਨ ਤੋਂ ਬਾਅਦ ਵੀ ਉਪਯੋਗੀ ਹੈ ਜਾਂ ਨਹੀਂ।

ਪੁਰਾਣਾ ਤਰੀਕਾ ਸਧਾਰਨ ਸੀ ਪਰ ਅਸਫਲ ਰਿਹਾ। ਡਿਵੈਲਪਰ ਹਾਲੀਆ ਸੁਨੇਹਿਆਂ ਨੂੰ buffer ਕਰਦੇ ਸਨ ਅਤੇ ਬਾਕੀ ਦਾ ਸਾਰ (summarize) ਕੱਢ ਲੈਂਦੇ ਸਨ। ਇਹ chatbots ਲਈ ਕੰਮ ਕਰਦਾ ਸੀ। ਪਰ code reviews ਜਾਂ ਖੋਜ (research) ਵਰਗੇ ਅਸਲ workflows ਚਲਾਉਣ ਵਾਲੇ agents ਲਈ ਇਹ ਅਸਫਲ ਰਿਹਾ। ਉਹਨਾਂ agents ਨੂੰ ਇਹ ਯਾਦ ਰੱਖਣ ਦੀ ਲੋੜ ਹੈ ਕਿ ਉਹਨਾਂ ਨੇ ਕੱਲ੍ਹ ਕੀ ਕੀਤਾ ਸੀ, ਨਾ ਕਿ ਸਿਰਫ਼ ਪੰਜ ਮਿੰਟ ਪਹਿਲਾਂ ਕੀ ਕੀਤਾ ਸੀ।

ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਲੰਬੇ ਸਮੇਂ ਦੀ ਮੈਮੋਰੀ ਦੇ ਤਿੰਨ ਪ੍ਰਕਾਰ ਹਨ:

Episodic memory: ਖਾਸ ਪੁਰਾਣੇ ਅਨੁਭਵ ਅਤੇ ਨਤੀਜੇ।
Semantic memory: ਆਮ ਤੱਥ ਅਤੇ ਸਬੰਧ।
Procedural memory: ਸਿੱਖੀਆਂ ਹੋਈਆਂ ਕੌਸ਼ਲਤਾਵਾਂ ਅਤੇ ਮੁੜ ਵਰਤੋਂ ਯੋਗ ਐਕਸ਼ਨ ਸੀਕੁਇੰਸ।

ਅੱਜ ਦੇ ਜ਼ਿਆਦਾਤਰ ਸਿਸਟਮਾਂ ਵਿੱਚ procedural memory ਦੀ ਕਮੀ ਹੈ। ਉਹ vector search ਰਾਹੀਂ ਤੱਥਾਂ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਦੇ ਹਨ। ਪਰ ਇੱਕ agent ਸਮੇਂ ਦੇ ਨਾਲ ਉਦੋਂ ਹੀ ਬਿਹਤਰ ਬਣਦਾ ਹੈ ਜੇਕਰ ਉਹ procedural memory ਵਿੱਚ ਮਾਹਰ ਹੋ ਜਾਵੇ।

ਆਰਕੀਟੈਕਚਰ ਵੀ ਦੋ ਹਿੱਸਿਆਂ ਵਿੱਚ ਵੰਡੇ ਜਾ ਰਹੇ ਹਨ:

Conversation context: ਇੱਕ ਸਿੰਗਲ ਇੰਟਰੈਕਸ਼ਨ ਨੂੰ ਸੁਸੰਗਤ ਰੱਖਣਾ।
Operational knowledge: ਕਈ ਸੈਸ਼ਨਾਂ ਵਿੱਚ ਟਿਕਾਊ ਗਿਆਨ ਨੂੰ ਸਟੋਰ ਕਰਨਾ।

ਇਹਨਾਂ ਸਿਸਟਮਾਂ ਦੇ ਅੰਦਰ, ਤੁਹਾਨੂੰ vector similarity ਅਤੇ graph-augmented retrieval ਵਿੱਚੋਂ ਕਿਸੇ ਇੱਕ ਨੂੰ ਚੁਣਨਾ ਪਵੇਗਾ। Vector memory ਸਮਾਨ ਤੱਥ ਲੱਭਦੀ ਹੈ ਪਰ ਸਬੰਧਾਂ ਨੂੰ miss ਕਰ ਦਿੰਦੀ ਹੈ। Graph ਤਰੀਕੇ entities ਅਤੇ ਕਨੈਕਸ਼ਨਾਂ ਰਾਹੀਂ ਤੱਥ ਲੱਭਦੇ ਹਨ। ਸਭ ਤੋਂ ਵਧੀਆ ਸਿਸਟਮ ਹੁਣ multi-signal retrieval ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ। ਇਹ semantic similarity, keywords, ਅਤੇ entity linking ਨੂੰ ਜੋੜਦਾ ਹੈ।

Letta ਵਰਗੇ ਨਵੇਂ ਮਾਡਲ ਮੈਮੋਰੀ ਨੂੰ ਇੱਕ operating system ਵਾਂਗ ਮੰਨਦੇ ਹਨ। ਉਹ ਇੱਕ tiered approach ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ ਜਿੱਥੇ core memory RAM ਵਾਂਗ ਕੰਮ ਕਰਦੀ ਹੈ। ਇਹ ਸਿਰਫ਼ ਇੱਕ agent ਨਾਲ database ਜੋੜਨ ਨਾਲੋਂ ਬਿਹਤਰ ਹੈ।

ਤੁਹਾਨੂੰ ਇੱਕ ਨਵੇਂ ਸੁਰੱਖਿਆ ਖਤਰੇ 'ਤੇ ਵੀ ਨਜ਼ਰ ਰੱਖਣੀ ਚਾਹੀਦੀ ਹੈ: Memory Poisoning।

Prompt injection ਚੈਟ ਖਤਮ ਹੋਣ 'ਤੇ ਰੀਸੈੱਟ ਹੋ ਜਾਂਦਾ ਹੈ। Memory poisoning ਨਹੀਂ ਹੁੰਦਾ। ਇੱਕ ਹਮਲਾਵਰ ਇੱਕ ਵਾਰ agent ਦੇ long-term store ਵਿੱਚ ਗਲਤ ਡੇਟਾ ਪਾ ਸਕਦਾ ਹੈ। ਫਿਰ ਇਹ ਹਰ ਭਵਿੱਖ ਦੇ ਇੰਟਰੈਕਸ਼ਨ ਨੂੰ ਖਰਾਬ ਕਰ ਦਿੰਦਾ ਹੈ। ਇਹ ਦਿਨਾਂ ਬਾਅਦ ਵੀ ਹੋ ਸਕਦਾ ਹੈ। OWASP ਹੁਣ Memory ਅਤੇ Context Poisoning ਨੂੰ ਇੱਕ ਵੱਡੇ ਜੋਖਮ ਵਜੋਂ ਸੂਚੀਬੱਧ ਕਰਦਾ ਹੈ।

ਆਪਣੇ ਸਿਸਟਮਾਂ ਦੀ ਰੱਖਿਆ ਲਈ, ਇਹਨਾਂ ਚਾਰ ਪਰਤਾਂ ਦੀ ਵਰਤੋਂ ਕਰੋ:

Ingestion ਤੋਂ ਪਹਿਲਾਂ ਡੇਟਾ ਨੂੰ sanitize ਕਰੋ।
ਇਸਦੇ ਮੂਲ (origin) ਨੂੰ ਟ੍ਰੈਕ ਕਰਨ ਲਈ ਹਰ ਐਂਟਰੀ ਨਾਲ provenance ਜੋੜੋ।
Retrieval ਦੌਰਾਨ trust-aware weighting ਦੀ ਵਰਤੋਂ ਕਰੋ।
Behavioral drift ਲਈ ਨਿਗਰਾਨੀ ਕਰੋ।

ਅੱਗੇ ਦੇਖਦੇ ਹੋਏ, ਤਿੰਨ ਰੁਝਾਨ (trends) ਇਸ ਖੇਤਰ ਨੂੰ ਰੂਪ ਦੇਣਗੇ:

Multi-agent memory: Agents ਨੂੰ ਇੱਕ ਦੂਜੇ ਦੀ ਮੈਮੋਰੀ ਸਾਂਝੀ ਕਰਨ ਅਤੇ ਉਸ 'ਤੇ ਭਰੋਸਾ ਕਰਨ ਦੀ ਲੋੜ ਹੋਵੇਗੀ।
Standardization: ਅਸੀਂ ਉਹਨਾਂ ਪ੍ਰੋਟੋਕੋਲਸ ਨੂੰ ਦੇਖਾਂਗੇ ਕਿ agents ਇਹ ਦੱਸਣ ਕਿ ਉਹ ਕੀ ਜਾਣਦੇ ਹਨ।
Pruning: ਚੰਗੇ ਸਿਸਟਮ ਫੈਸਲਾ ਕਰਨਗੇ ਕਿ ਕੀ ਭੁੱਲਣਾ ਹੈ। ਅਸੀਮਤ (Unbounded) ਮੈਮੋਰੀ ਸ਼ੋਰ (noise) ਅਤੇ ਉੱਚ ਲਾਗਤ ਪੈਦਾ ਕਰਦੀ ਹੈ।

ਮੈਮੋਰੀ ਹੁਣ ਛੋਟੇ context windows ਲਈ ਕੋਈ ਜੁਗਾੜ (workaround) ਨਹੀਂ ਰਹੀ। ਇਹ ਉਹ ਚੀਜ਼ ਹੈ ਜੋ ਇੱਕ demo ਨੂੰ ਅਸਲ ਸਿਸਟਮ ਤੋਂ ਵੱਖ ਕਰਦੀ ਹੈ। ਮੈਮੋਰੀ ਨੂੰ ਇੱਕ ਮੁੱਖ ਆਰਕੀਟੈਕਚਰ ਵਜੋਂ ਮੰਨੋ, ਨਾ ਕਿ ਕਿਸੇ ਬਾਅਦ ਦੀ ਸੋਚ ਵਜੋਂ।

Source: https://dev.to/xenocoregiger31/the-future-of-agentic-ai-memory-systems-5fdp

Optional learning community: https://t.me/GyaanSetuAi

The Future of Agentic AI Memory Systems

Continue reading

Agent Memory: 7 Types, and 2 don't actually remember

Inside An AI Agent

Stop Dumping Agent Memory Into The Prompt