Mémoire des agents : 7 types, et 2 ne sont pas de véritables mémoires

Votre agent n'a pas un problème de mémoire. Il possède sept types de mémoire différents. La plupart des équipes n'en construisent que deux.

La première chose à comprendre est la suivante : le modèle ne se souvient de rien. Un LLM est une fonction pure. Il prend une entrée et donne une sortie. Il ne conserve aucun état entre les appels. Ce qui ressemble à de la mémoire n'est qu'une couche qui renvoie l'historique à chaque requête. Vous payez ces tokens à chaque fois.

La plupart des efforts d'ingénierie se résument à deux modèles : l'historique de conversation et le RAG. Ce sont deux des sept types. Le problème ? Ils ne rendent pas votre agent plus intelligent avec le temps.

Voici les sept types de mémoire :

• Mémoire de travail : Tout ce qui se trouve dans la fenêtre de contexte actuelle. • Sémantique : Faits, préférences et connaissances métier. • Épisodique : Un journal des événements passés et de ce qui a fonctionné ou échoué. • Procédurale : Compétences, flux de travail et modèles d'outils. • Récupération (Retrieval) : Extraction de connaissances via une recherche de similarité. • Paramétrique : Connaissances intégrées dans les poids du modèle. • Prospective : Intentions futures et tâches planifiées.

Deux d'entre elles ne sont pas de véritables mémoires. Le RAG n'est qu'un mécanisme de distribution. C'est la plomberie, pas l'eau. Il déplace les données d'un stockage vers la mémoire de travail. Si vous n'utilisez qu'une base de données vectorielle, vous avez construit un tuyau en oubliant le liquide.

Pour construire un agent qui apprend réellement, vous avez besoin d'une boucle de consolidation. Cela signifie transformer la mémoire épisodique en mémoire sémantique.

Le processus fonctionne comme suit :

  1. L'agent vit un événement (Épisodique).
  2. L'agent voit le même schéma se répéter plusieurs fois.
  3. L'agent abstrait ce schéma en une règle permanente (Sémantique).

Désormais, l'agent n'a plus besoin de raisonner à travers douze exemples. Il applique simplement un fait.

Comment prioriser votre développement :

  • Gérez la mémoire de travail comme un budget. C'est votre coût le plus élevé. Utilisez la synthèse et l'éviction dès le début.
  • Séparez vos stockages. Gardez les faits, les événements et les règles dans des endroits différents.
  • Utilisez un ordonnanceur pour la mémoire prospective. N'utilisez pas de base de données vectorielle pour des éléments devant se produire à une date précise.
  • Tracez une limite stricte pour la mémoire paramétrique. Utilisez le modèle pour le raisonnement, mais utilisez vos propres stockages pour les données volatiles comme les taux d'intérêt ou les règles de produits.

La plupart des agents actuels ne sont qu'une fenêtre de contexte et une base de données vectorielle. Les agents qui l'emportent sont ceux qui parviennent à transformer les erreurs d'hier en règles pour demain.

Source: https://dev.to/shudiptotrafder/agent-memory-7-types-and-2-of-them-arent-memory-6oi

Optional learning community: https://t.me/GyaanSetuAi