Cessez d'injecter toute la mémoire de l'agent dans le prompt

Translated for your language. Lire l'original.

AI-assisted draft.

Cessez d'injecter toute la mémoire de l'agent dans le prompt

Arrêtez de déverser la mémoire de l'agent dans le prompt

La plupart des développeurs construisent des boucles d'agents en ajoutant tout au prompt suivant.

Vous ajoutez les observations précédentes, les appels d'outils et les traces de raisonnement. Vous continuez à ajouter des données jusqu'à ce que le prompt devienne un tiroir à bric-à-brac. Le modèle voit plus de choses, mais vous perdez le contrôle. Vous ne savez plus quel élément de mémoire a provoqué une décision spécifique.

Un nouvel article intitulé AgenticSTS suggère une approche différente. Il traite la mémoire comme une interface plutôt que comme une compétition pour obtenir la fenêtre de contexte la plus large.

L'article utilise le jeu Slay the Spire 2 comme banc d'essai. Cet environnement nécessite des centaines de décisions stratégiques. Il ne s'agit pas d'un simple chatbot.

L'idée centrale est la suivante : la mémoire est un contrat définissant ce qu'une décision future est autorisée à voir.

Au lieu de transcriptions brutes, les auteurs composent de nouveaux prompts en utilisant cinq couches spécifiques :

Instructions de protocole fixes
État actuel et schémas d'action
Règles de jeu récupérées
Résumés des exécutions précédentes
Compétences stratégiques déclenchées

Cette structure change tout. Vous pouvez inspecter, figer ou désactiver chaque couche. Vous transformez la mémoire, passant d'un tas de données à des preuves sélectionnées.

De nombreux échecs d'agents en production ne sont pas des échecs du modèle. Ce sont des échecs de contexte. L'agent mélange l'ancien état avec le nouvel état ou prolonge des réflexions obsolètes. Si votre seule politique consiste à ajouter du texte, le débogage ressemble à de l'archéologie.

Une interface de mémoire typée vous donne un élément de comparaison.

Pour les agents de longue durée, une fenêtre de contexte immense est un piège. Elle devient un mélange de faits, de faits obsolètes et de tentatives infructueuses. Plus la fenêtre est grande, plus il est facile de confondre les sédiments avec la mémoire.

Pour construire de meilleurs agents, suivez ces modèles :

Séparez les instructions stables de l'état actuel
Gardez les règles dans une couche de récupération
Stockez l'expérience sous forme d'enregistrements explicites, et non comme des résidus de chat
Transformez les corrections répétées en compétences déclenchées
Rendez chaque couche de mémoire supprimable pour les tests

Si vous ne pouvez pas désactiver une couche de mémoire, vous ne savez pas si elle aide réellement. Vous savez seulement que l'ensemble du tas fonctionne parfois.

Arrêtez de traiter la mémoire de l'agent comme une couche de « vibes ». Passez à un système où vous savez exactement ce qui alimente la décision suivante, d'où cela vient et comment le désactiver.

Si votre agent ne peut pas expliquer ce qu'il était autorisé à mémoriser, il n'a pas de mémoire. Il a simplement un prompt avec un sous-sol.

Source: https://dev.to/komo/stop-dumping-agent-memory-into-the-prompt-58ka

Communauté d'apprentissage optionnelle: https://t.me/GyaanSetuAi

Cessez d'injecter toute la mémoire de l'agent dans le prompt

Continuer la lecture

Des prompts aux agents IA : Un guide pour les développeurs frontend

La mémoire des agents : 7 types, et 2 ne se souviennent pas réellement

Au-delà des sandboxes : construire des agents IA durables

La boucle agentique : un guide pratique de terrain

L'avenir des systèmes de mémoire de l'IA agentique