ಏಜೆಂಟಿಕ್ AI ಮೆಮೊರಿ ಸಿಸ್ಟಮ್‌ಗಳ ಭವಿಷ್ಯ

AI ಮೆಮೊರಿ ಬದಲಾಗುತ್ತಿದೆ.

ವರ್ಷಗಳಿಂದ, ಮೆಮೊರಿ ಎಂದರೆ ಚಾಟ್ ಇತಿಹಾಸವನ್ನು (chat history) ಕಾಂಟೆಕ್ಸ್ಟ್ ವಿಂಡೋಗೆ (context window) ತುಂಬುವುದು ಎಂದರ್ಥವಾಗಿತ್ತು. ಆ ವಿಧಾನ ಈಗ ಹಳೆಯದಾಗಿದೆ. 2026 ರಲ್ಲಿ, ಮೆಮೊರಿಯು ಏಜೆಂಟ್ ವಿನ್ಯಾಸದ ಒಂದು ಪ್ರಮುಖ ಭಾಗವಾಗಿದೆ. ಇದು ತನ್ನದೇ ಆದ ಸಂಶೋಧನೆ, ಬೆಂಚ್‌ಮಾರ್ಕ್‌ಗಳು ಮತ್ತು ಭದ್ರತಾ ಅಪಾಯಗಳನ್ನು ಹೊಂದಿದೆ.

ನೀವು ಏಜೆಂಟ್‌ಗಳನ್ನು ನಿರ್ಮಿಸುತ್ತಿದ್ದರೆ, ನಿಮ್ಮ ಸಾಧನವು ಮೊದಲ ಸೆಷನ್ ನಂತರವೂ ಉಪಯುಕ್ತವಾಗಿದೆಯೇ ಎಂಬುದನ್ನು ಮೆಮೊರಿಯೇ ನಿರ್ಧರಿಸುತ್ತದೆ.

ಹಳೆಯ ವಿಧಾನವು ಸರಳವಾಗಿತ್ತು ಆದರೆ ವಿಫಲವಾಯಿತು. ಡೆವಲಪರ್‌ಗಳು ಇತ್ತೀಚಿನ ಸಂದೇಶಗಳನ್ನು ಬಫರ್ ಮಾಡುತ್ತಿದ್ದರು ಮತ್ತು ಉಳಿದವುಗಳನ್ನು ಸಾರಾಂಶಗೊಳಿಸುತ್ತಿದ್ದರು. ಇದು ಚಾಟ್‌ಬಾಟ್‌ಗಳಿಗೆ ಕೆಲಸ ಮಾಡಿತು. ಆದರೆ ಕೋಡ್ ರಿವ್ಯೂ ಅಥವಾ ಸಂಶೋಧನೆಯಂತಹ ನೈಜ ವರ್ಕ್‌ಫ್ಲೋಗಳನ್ನು (workflows) ನಡೆಸುವ ಏಜೆಂಟ್‌ಗಳಿಗೆ ಇದು ವಿಫಲವಾಯಿತು. ಅಂತಹ ಏಜೆಂಟ್‌ಗಳಿಗೆ ಕೇವಲ ಐದು ನಿಮಿಷಗಳ ಹಿಂದಿನದ್ದಲ್ಲದೆ, ನಿನ್ನೆ ತಾವು ಮಾಡಿದ್ದನ್ನು ನೆನಪಿಟ್ಟುಕೊಳ್ಳುವ ಅಗತ್ಯವಿದೆ.

ಪರಿಣಾಮಕಾರಿ ದೀರ್ಘಕಾಲೀನ ಮೆಮೊರಿಯು ಮೂರು ವಿಧಗಳನ್ನು ಹೊಂದಿದೆ:

  • ಎಪಿಸೋಡಿಕ್ ಮೆಮೊರಿ (Episodic memory): ನಿರ್ದಿಷ್ಟ ಹಿಂದಿನ ಅನುಭವಗಳು ಮತ್ತು ಫಲಿತಾಂಶಗಳು.
  • ಸೆಮ್ಯಾಂಟಿಕ್ ಮೆಮೊರಿ (Semantic memory): ಸಾಮಾನ್ಯ ಸತ್ಯಗಳು ಮತ್ತು ಸಂಬಂಧಗಳು.
  • ಪ್ರೊಸೀಜರಲ್ ಮೆಮೊರಿ (Procedural memory): ಕಲಿತ ಕೌಶಲಗಳು ಮತ್ತು ಮರುಬಳಕೆ ಮಾಡಬಹುದಾದ ಕ್ರಿಯೆಗಳ ಅನುಕ್ರಮಗಳು.

ಇಂದಿನ ಹೆಚ್ಚಿನ ಸಿಸ್ಟಮ್‌ಗಳಲ್ಲಿ ಪ್ರೊಸೀಜರಲ್ ಮೆಮೊರಿಯ ಕೊರತೆಯಿದೆ. ಅವು ವೆಕ್ಟರ್ ಸರ್ಚ್ (vector search) ಮೂಲಕ ಸತ್ಯಗಳ ಮೇಲೆ ಗಮನ ಹರಿಸುತ್ತವೆ. ಆದರೆ ಏಜೆಂಟ್ ಪ್ರೊಸೀಜರಲ್ ಮೆಮೊರಿಯಲ್ಲಿ ಪರಿಣತಿಯನ್ನು ಹೊಂದಿದ್ದರೆ ಮಾತ್ರ ಕಾಲಾನಂತರದಲ್ಲಿ ಉತ್ತಮಗೊಳ್ಳುತ್ತದೆ.

ಆರ್ಕಿಟೆಕ್ಚರ್‌ಗಳು ಸಹ ಎರಡು ಗುಂಪುಗಳಾಗಿ ವಿಭಜನೆಯಾಗುತ್ತಿವೆ:

  1. ಸಂಭಾಷಣೆಯ ಕಾಂಟೆಕ್ಸ್ಟ್ (Conversation context): ಒಂದೇ ಸಂವಹನವನ್ನು ಸುಸಂಬದ್ಧವಾಗಿ ಇರಿಸಿಕೊಳ್ಳುವುದು.
  2. ಕಾರ್ಯಾಚರಣೆಯ ಜ್ಞಾನ (Operational knowledge): ಅನೇಕ ಸೆಷನ್‌ಗಳಾದ್ಯಂತ ಬಾಳಿಕೆ ಬರುವ ಜ್ಞಾನವನ್ನು ಸಂಗ್ರಹಿಸುವುದು.

ಈ ಸಿಸ್ಟಮ್‌ಗಳ ಒಳಗೆ, ನೀವು ವೆಕ್ಟರ್ ಸಿಮಿಲಾರಿಟಿ (vector similarity) ಮತ್ತು ಗ್ರಾಫ್-ಆಗ್ಮೆಂಟೆಡ್ ರಿಟ್ರಿೀವಲ್ (graph-augmented retrieval) ನಡುವೆ ಒಂದನ್ನು ಆರಿಸಿಕೊಳ್ಳಬೇಕು. ವೆಕ್ಟರ್ ಮೆಮೊರಿಯು ಸಮಾನವಾದ ಸತ್ಯಗಳನ್ನು ಕಂಡುಕೊಳ್ಳುತ್ತದೆ ಆದರೆ ಸಂಬಂಧಗಳನ್ನು ಕಳೆದುಕೊಳ್ಳುತ್ತದೆ. ಗ್ರಾಫ್ ವಿಧಾನಗಳು ಎಂಟಿಟಿಗಳು (entities) ಮತ್ತು ಸಂಪರ್ಕಗಳ ಮೂಲಕ ಸತ್ಯಗಳನ್ನು ಕಂಡುಕೊಳ್ಳುತ್ತವೆ. ಅತ್ಯುತ್ತಮ ಸಿಸ್ಟಮ್‌ಗಳು ಈಗ ಮಲ್ಟಿ-ಸಿಗ್ನಲ್ ರಿಟ್ರಿೀವಲ್ ಅನ್ನು ಬಳಸುತ್ತವೆ. ಇದು ಸೆಮ್ಯಾಂಟಿಕ್ ಸಿಮಿಲಾರಿಟಿ, ಕೀವರ್ಡ್‌ಗಳು ಮತ್ತು ಎಂಟಿಟಿ ಲಿಂಕಿಂಗ್ ಅನ್ನು ಸಂಯೋಜಿಸುತ್ತದೆ.

Letta ನಂತಹ ಹೊಸ ಮಾಡೆಲ್‌ಗಳು ಮೆಮೊರಿಯನ್ನು ಒಂದು ಆಪರೇಟಿಂಗ್ ಸಿಸ್ಟಮ್‌ನಂತೆ ಪರಿಗಣಿಸುತ್ತವೆ. ಅವು ಹಂತದ ವಿಧಾನವನ್ನು (tiered approach) ಬಳಸುತ್ತವೆ, ಅಲ್ಲಿ ಕೋರ್ ಮೆಮೊರಿಯು RAM ನಂತೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ಇದು ಏಜೆಂಟ್‌ಗೆ ಕೇವಲ ಡೇಟಾಬೇಸ್ ಅನ್ನು ಜೋಡಿಸುವುದಕ್ಕಿಂತ ಉತ್ತಮವಾಗಿದೆ.

ನೀವು ಹೊಸ ಭದ್ರತಾ ಬೆದರಿಕೆಯ ಬಗ್ಗೆಯೂ ಎಚ್ಚರವಿರಲಿ: ಮೆಮೊರಿ ಪಾಯಿಸನಿಂಗ್ (Memory Poisoning).

ಚಾಟ್ ಮುಗಿದಾಗ ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ (Prompt injection) ಮರುಹೊಂದಿಕೊಳ್ಳುತ್ತದೆ (resets). ಆದರೆ ಮೆಮೊರಿ ಪಾಯಿಸನಿಂಗ್ ಹಾಗಲ್ಲ. ದಾಳಿಕೋರನು ಏಜೆಂಟ್‌ನ ದೀರ್ಘಕಾಲೀನ ಸಂಗ್ರಹದಲ್ಲಿ ಒಮ್ಮೆ ಕೆಟ್ಟ ಡೇಟಾವನ್ನು ಬಿತ್ತಬಹುದು. ಇದು ನಂತರದ ಪ್ರತಿಯೊಂದು ಸಂವಹನವನ್ನೂ ಹಾಳುಮಾಡುತ್ತದೆ. ಇದು ದಿನಗಳ ನಂತರವೂ ಸಂಭವಿಸಬಹುದು. OWASP ಈಗ ಮೆಮೊರಿ ಮತ್ತು ಕಾಂಟೆಕ್ಸ್ಟ್ ಪಾಯಿಸನಿಂಗ್ ಅನ್ನು ಪ್ರಮುಖ ಅಪಾಯ ಎಂದು ಪಟ್ಟಿ ಮಾಡಿದೆ.

ನಿಮ್ಮ ಸಿಸ್ಟಮ್‌ಗಳನ್ನು ರಕ್ಷಿಸಲು, ಈ ನಾಲ್ಕು ಪದರಗಳನ್ನು ಬಳಸಿ:

  • ಡೇಟಾವನ್ನು ಬಳಸುವ ಮೊದಲು ಅದನ್ನು ಶುದ್ಧೀಕರಿಸಿ (Sanitize).
  • ಅದರ ಮೂಲವನ್ನು ಪತ್ತೆಹಚ್ಚಲು ಪ್ರತಿ ಎಂಟ್ರಿಗೂ ಪ್ರೊವಿನೆನ್ಸ್ (provenance) ಅನ್ನು ಜೋಡಿಸಿ.
  • ರಿಟ್ರಿೀವಲ್ ಸಮಯದಲ್ಲಿ ನಂಬಿಕೆ-ಅರಿವಿರುವ ವೇಯ್ಟಿಂಗ್ (trust-aware weighting) ಬಳಸಿ.
  • ವರ್ತನೆಯ ಬದಲಾವಣೆಗಾಗಿ (behavioral drift) ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡಿ.

ಭವಿಷ್ಯದ ದೃಷ್ಟಿಯಿಂದ, ಮೂರು ಪ್ರವೃತ್ತಿಗಳು ಈ ಕ್ಷೇತ್ರವನ್ನು ರೂಪಿಸುತ್ತವೆ:

  • ಮಲ್ಟಿ-ಏಜೆಂಟ್ ಮೆಮೊರಿ: ಏಜೆಂಟ್‌ಗಳು ಪರಸ್ಪರರ ಮೆಮೊರಿಯನ್ನು ಹಂಚಿಕೊಳ್ಳುವ ಮತ್ತು ನಂಬುವ ಅಗತ್ಯವಿರುತ್ತದೆ.
  • ಪ್ರಮಾಣೀಕರಣ (Standardization): ಏಜೆಂಟ್‌ಗಳು ತಮಗೆ ತಿಳಿದಿರುವುದನ್ನು ಹೇಗೆ ವಿವರಿಸುತ್ತವೆ ಎಂಬುದಕ್ಕೆ ಪ್ರೊಟೊಕಾಲ್‌ಗಳನ್ನು ನಾವು ನೋಡುತ್ತೇವೆ.
  • ಪ್ರೂನಿಂಗ್ (Pruning): ಉತ್ತಮ ಸಿಸ್ಟಮ್‌ಗಳು ಏನನ್ನು ಮರೆಯಬೇಕು ಎಂಬುದನ್ನು ನಿರ್ಧರಿಸುತ್ತವೆ. ಮಿತಿಯಿಲ್ಲದ ಮೆಮೊರಿಯು ಗೊಂದಲ (noise) ಮತ್ತು ಹೆಚ್ಚಿನ ವೆಚ್ಚವನ್ನು ಉಂಟುಮಾಡುತ್ತದೆ.

ಮೆಮೊರಿಯು ಇನ್ನು ಮುಂದೆ ಸಣ್ಣ ಕಾಂಟೆಕ್ಸ್ಟ್ ವಿಂಡೋಗಳಿಗೆ ಕೇವಲ ಪರಿಹಾರವಲ್ಲ. ಇದು ಒಂದು ಡೆಮೊ ಮತ್ತು ನೈಜ ಸಿಸ್ಟಮ್ ನಡುವಿನ ವ್ಯತ್ಯಾಸವಾಗಿದೆ. ಮೆಮೊರಿಯನ್ನು ಕೇವಲ ನಂತರದ ಆಲೋಚನೆಯಾಗಿ ನೋಡದೆ, ಅದನ್ನು ಕೋರ್ ಆರ್ಕಿಟೆಕ್ಚರ್ ಆಗಿ ಪರಿಗಣಿಸಿ.

Source: https://dev.to/xenocoregiger31/the-future-of-agentic-ai-memory-systems-5fdp

Optional learning community: https://t.me/GyaanSetuAi