Mein Coding-Agent erinnerte sich an Sessions, nicht an die Arbeit

Translated for your language. Original lesen.

AI-assisted draft.

GyaanSetu Editorialgestern2Min. Lesezeit

Mein Coding-Agent erinnerte sich an Sessions, nicht an die Arbeit

Mein Coding-Agent hat sich an Sessions erinnert, nicht an die Arbeit

Ein Coding-Agent kann einen Thread am Leben erhalten und sich trotzdem vergesslich anfühlen.

Ich bin bei der Entwicklung von CliGate auf dieses Problem gestoßen. Ich habe die Sitzungskontinuität behoben, aber wiederholte Aufgaben waren immer noch zu langsam.

Der Agent erinnerte sich an das Gespräch, aber nicht an die Arbeit.

Sitzungskontinuität löst ein Problem. Sie hilft bei Folgebefehlen wie:

fortfahren
dasselbe für diese Datei tun
das noch einmal versuchen

Das ist nützlich. Aber es hilft nicht, wenn man einen Workflow Tage später wiederholt.

Ein Agent muss sich daran erinnern können, was den letzten Durchlauf erfolgreich gemacht hat. Er muss wissen:

welcher Button funktioniert
welcher Schritt eine Sackgasse ist
welches Feld eine spezielle Behandlung benötigt
welche Regel immer angewendet werden soll

Der erste Durchlauf ist der teuerste. Das ist der Moment, in dem der Agent exploriert und Details findet, die nicht in deinem Prompt stehen.

Vor meiner Korrektur existierten diese Details nur in den Rohprotokollen. Der Agent hatte zwar eine Historie, aber kein wiederverwendbares Gedächtnis. Er musste jedes Mal alles neu entdecken.

Das ist keine Intelligenz. Das ist, als würde man die gleichen Debugging-Kosten doppelt bezahlen.

Der falsche Ansatz ist es, mehr Historie zu speichern und zu hoffen, dass das Modell sie nutzt. Das erzeugt Rauschen.

Stattdessen habe ich eine kleinere, wiederverwendbare Memory-Schicht aufgebaut. Ich habe mich auf Folgendes konzentriert:

Prozeduren
Fakten
Direktiven
Referenzen

Ich habe aufgehört zu versuchen, alles zu speichern, was passiert ist. Ich habe angefangen zu speichern, was man sich merken sollte.

Jetzt nutzt der Assistent eine dateibasierte Memory-Schicht, um sich zu erinnern an:

eine Prozedur: die besten Schritte und bekannte Sackgassen
einen Fakt: eine URL oder eine spezifische Einstellung
eine Direktive: wie Dinge erledigt werden sollen
eine Referenz: wo die Dokumentation zu finden ist

So arbeiten Menschen.

Ich möchte kein perfektes Replay der Vergangenheit, weil sich Schnittstellen ändern und Buttons verschieben. Ich möchte, dass der Agent:

Die bestbekannte Prozedur abruft
Sie zuerst versucht
Jeden Schritt verifiziert
Auf Exploration zurückgreift, falls es fehlschlägt
Das Gedächtnis nach Erfolg aktualisiert

Dies verwandelt brüchige Automatisierung in nützliches operationelles Gedächtnis.

Ich habe zudem dauerhafte Regeln von der Konversationshistorie getrennt. Regeln wie „antworte immer auf Chinesisch“ oder „berühre keine Produktionsdaten“ sind kein Sitzungskontext. Sie sind Betriebsregeln.

Sobald ich diese getrennt hatte, wurde der Assistent berechenbar. Er muss deine Präferenzen nicht mehr mitten in einer Aufgabe neu entdecken.

Wiederholte Aufgaben sind jetzt kürzer. Der Assistent arbeitet schneller, weil er nicht jedes Mal mit einem leeren Modell beginnt.

Verwechsle einen kontinuierlichen Thread nicht mit einem System, das lernt.

Eine Session hält die Konversation am Leben. Das Gedächtnis hält die nützlichen Lektionen am Leben.

Wenn du Coding-Agents baust, frage dich: Merkt sich dein System den Thread oder merkt es sich die erfolgreiche Prozedur?

Quelle: https://dev.to/codekingai/my-coding-agent-remembered-sessions-not-work-that-was-the-bug-2fig

Mein Coding-Agent erinnerte sich an Sessions, nicht an die Arbeit

Weiterlesen

Mein Coding-Agent hat die Aufgabe erledigt. Warum ist der Thread gestorben?

𝗔𝗴𝗲𝗻𝘁 𝗦𝗲𝘀𝘀𝗶𝗼𝗻 𝗠𝗲𝗺𝗼𝗿𝘆 𝗜𝘀𝗻'𝘁 𝗔 𝗙𝗲𝗮𝘁𝘂𝗿𝗲. 𝗜𝘁'𝘀 𝗬𝗼𝘂𝗿 𝗖𝗼𝗻𝘁𝗿𝗼𝗹 𝗣𝗹𝗮𝗻𝗲.

Was ich beim Betrieb von KI-Agenten in der Produktion gelernt habe

Mein Coding-Agent erinnerte sich an Sitzungen, nicht an die Arbeit