Mein Coding-Agent hat sich an Sessions erinnert, nicht an die Arbeit

Ein Coding-Agent kann einen Thread am Leben erhalten und sich trotzdem vergesslich anfühlen.

Ich bin bei der Entwicklung von CliGate auf dieses Problem gestoßen. Ich habe die Sitzungskontinuität behoben, aber wiederholte Aufgaben waren immer noch zu langsam.

Der Agent erinnerte sich an das Gespräch, aber nicht an die Arbeit.

Sitzungskontinuität löst ein Problem. Sie hilft bei Folgebefehlen wie:

  • fortfahren
  • dasselbe für diese Datei tun
  • das noch einmal versuchen

Das ist nützlich. Aber es hilft nicht, wenn man einen Workflow Tage später wiederholt.

Ein Agent muss sich daran erinnern können, was den letzten Durchlauf erfolgreich gemacht hat. Er muss wissen:

  • welcher Button funktioniert
  • welcher Schritt eine Sackgasse ist
  • welches Feld eine spezielle Behandlung benötigt
  • welche Regel immer angewendet werden soll

Der erste Durchlauf ist der teuerste. Das ist der Moment, in dem der Agent exploriert und Details findet, die nicht in deinem Prompt stehen.

Vor meiner Korrektur existierten diese Details nur in den Rohprotokollen. Der Agent hatte zwar eine Historie, aber kein wiederverwendbares Gedächtnis. Er musste jedes Mal alles neu entdecken.

Das ist keine Intelligenz. Das ist, als würde man die gleichen Debugging-Kosten doppelt bezahlen.

Der falsche Ansatz ist es, mehr Historie zu speichern und zu hoffen, dass das Modell sie nutzt. Das erzeugt Rauschen.

Stattdessen habe ich eine kleinere, wiederverwendbare Memory-Schicht aufgebaut. Ich habe mich auf Folgendes konzentriert:

  • Prozeduren
  • Fakten
  • Direktiven
  • Referenzen

Ich habe aufgehört zu versuchen, alles zu speichern, was passiert ist. Ich habe angefangen zu speichern, was man sich merken sollte.

Jetzt nutzt der Assistent eine dateibasierte Memory-Schicht, um sich zu erinnern an:

  • eine Prozedur: die besten Schritte und bekannte Sackgassen
  • einen Fakt: eine URL oder eine spezifische Einstellung
  • eine Direktive: wie Dinge erledigt werden sollen
  • eine Referenz: wo die Dokumentation zu finden ist

So arbeiten Menschen.

Ich möchte kein perfektes Replay der Vergangenheit, weil sich Schnittstellen ändern und Buttons verschieben. Ich möchte, dass der Agent:

  1. Die bestbekannte Prozedur abruft
  2. Sie zuerst versucht
  3. Jeden Schritt verifiziert
  4. Auf Exploration zurückgreift, falls es fehlschlägt
  5. Das Gedächtnis nach Erfolg aktualisiert

Dies verwandelt brüchige Automatisierung in nützliches operationelles Gedächtnis.

Ich habe zudem dauerhafte Regeln von der Konversationshistorie getrennt. Regeln wie „antworte immer auf Chinesisch“ oder „berühre keine Produktionsdaten“ sind kein Sitzungskontext. Sie sind Betriebsregeln.

Sobald ich diese getrennt hatte, wurde der Assistent berechenbar. Er muss deine Präferenzen nicht mehr mitten in einer Aufgabe neu entdecken.

Wiederholte Aufgaben sind jetzt kürzer. Der Assistent arbeitet schneller, weil er nicht jedes Mal mit einem leeren Modell beginnt.

Verwechsle einen kontinuierlichen Thread nicht mit einem System, das lernt.

Eine Session hält die Konversation am Leben. Das Gedächtnis hält die nützlichen Lektionen am Leben.

Wenn du Coding-Agents baust, frage dich: Merkt sich dein System den Thread oder merkt es sich die erfolgreiche Prozedur?

Quelle: https://dev.to/codekingai/my-coding-agent-remembered-sessions-not-work-that-was-the-bug-2fig