Mon agent de codage se souvenait des sessions, pas du travail
Un agent de codage peut maintenir un fil de discussion actif tout en semblant oublier.
J'ai rencontré ce problème en développant CliGate. J'ai corrigé la continuité des sessions, mais les tâches répétées restaient lentes.
L'agent se souvenait de la conversation, mais pas du travail.
La continuité de la session résout un problème. Elle permet des commandes de suivi telles que :
- continue
- fais la même chose pour ce fichier
- réessaie cela
- explique l'erreur
C'est important pour le flux de travail. Mais cela échoue lorsque vous répétez un workflow plusieurs jours plus tard.
Si un agent apprend quel bouton fonctionne ou quelle étape est une impasse, une seule session ouverte ne suffit pas. L'agent doit se rappeler ce qui a permis au dernier essai de réussir.
Le premier essai est le plus coûteux. C'est à ce moment que l'agent découvre de petits détails :
- un menu spécifique cache une action
- un éditeur est une iframe
- un projet nécessite des styles de réponse spécifiques
- l'URL d'un environnement diffère de la production
Avant ma correction, ces détails n'étaient que des logs bruts. L'agent avait un historique, mais pas une mémoire réutilisable. Il devait redécouvrir les mêmes faits à chaque fois. Ce n'est pas de l'intelligence. C'est payer deux fois le même coût.
La mauvaise approche consiste à enregistrer plus d'historique en espérant que le modèle l'utilise. Cela crée du bruit.
J'avais besoin d'une couche plus petite et réutilisable. Je suis passé de l'enregistrement de tout à l'enregistrement de :
- procédures : les meilleures étapes et les impasses connues
- faits : URLs, règles ou paramètres
- directives : comment vous voulez que les choses soient faites
- références : l'emplacement de la documentation
Cela a changé le système. Au lieu de lire une transcription géante, l'assistant utilise une couche de mémoire basée sur des fichiers.
Je ne voulais pas une relecture parfaite car les interfaces changent et les boutons se déplacent. Je voulais une boucle :
- rappeler la meilleure procédure précédente
- l'essayer en premier
- vérifier chaque étape
- si cela échoue, revenir à l'exploration
- mettre à jour la mémoire après succès
J'ai également séparé les règles permanentes de l'historique de la session. Les règles comme « ne touchez pas aux données de production » ne sont pas du contexte de conversation. Ce sont des règles opérationnelles. Les séparer rend l'assistant prévisible.
Le résultat : les tâches répétitives sont devenues plus courtes. L'assistant va plus vite car il ne commence pas avec un modèle tactique vide.
Si vous construisez des agents de codage, ne confondez pas un fil de discussion avec l'apprentissage.
- Une session aide à la continuité.
- La mémoire aide pour le travail répétitif.
La session maintient la conversation active. La couche de mémoire maintient les leçons vivantes.
Votre système se souvient-il du fil de discussion, ou se souvient-il de la procédure réussie ?
Source : https://dev.to/codekingai/my-coding-agent-remembered-sessions-not-work-that-was-the-bug-2fig
