J'ai arrêté de traiter la mémoire de l'IA comme des résumés

J'ai arrêté de traiter la mémoire de l'IA comme un résumé. Je la traite désormais comme un passage de relais.

La plupart des systèmes de mémoire se concentrent sur la synthèse. Ils compressent une conversation à la fin d'une session. Ils sauvegardent les éléments importants pour plus tard.

C'est une erreur. Un résumé tente de tout compresser pour personne en particulier. Il manque d'un lecteur défini.

Un passage de relais est différent. Un passage de relais prépare l'interaction suivante. Il écrit pour une session future qui doit reprendre le travail sans prétendre qu'elle était présente tout au long du processus.

Si vous construisez une mémoire d'IA, vous devriez vous concentrer sur quatre points spécifiques :

  • Changements de cadrage : la façon dont le point de vue de l'utilisateur a évolué au cours de la session.
  • Limites : des règles telles que « Ne prenez pas cette décision à ma place » ou « Demandez avant de rouvrir ce sujet ».
  • Tensions non résolues : les éléments que l'utilisateur a choisi de laisser en suspens délibérément.
  • Corrections de l'utilisateur : lorsque le système a échoué et que l'utilisateur a apporté la correction.

Un passage de relais nécessite un schéma. Il doit séparer ce qui doit être transmis de ce qui doit être laissé de côté. Il doit également suivre si l'utilisateur a approuvé les données.

L'objectif n'est pas de tout mémoriser. L'objectif est de préserver les quelques éléments qui rendront la session suivante plus précise et moins répétitive.

Le plus grand risque est de laisser le modèle tout décider. Si le modèle rédige seul le passage de relais, il pourrait sauvegarder une version de l'utilisateur facile à comprendre mais qui n'est pas fidèle à la réalité. Il pourrait transformer une humeur passagère en un trait de caractère permanent.

La solution est un juste milieu : le modèle rédige un brouillon, et l'utilisateur ratifie.

L'utilisateur doit avoir l'autorité. Il doit pouvoir conserver, supprimer ou modifier rapidement ce qui est transmis. Si le système transmet la mauvaise chose, l'utilisateur perd du temps à devoir l'annuler.

La mémoire n'est pas un problème de stockage. C'est un problème de gouvernance.

Vous devez décider :

  • Qui décide de ce qui est mémorisé ?
  • Qui peut le corriger ?
  • Quand le système doit-il choisir d'oublier ?

La mémoire de l'IA ne devrait pas être un tas de résumés. Elle devrait être un ensemble de passages de relais gouvernés.

Source : https://dev.to/woshiliyana/i-stopped-treating-ai-memory-as-summaries-i-now-think-in-handoffs-1gcb

Communauté d'apprentissage optionnelle : https://t.me/GyaanSetuAi