Deine Dokumentation verschwendet keine Token – dein Tooling tut es
Die Leute fragen mich, ob das Schreiben von Dokumentationen wie PRDs und Design-Reviews zu viele Token verbraucht.
Sie denken, der Prozess sei zu aufwendig. Sie glauben, es sei günstiger, die KI direkt Code schreiben zu lassen.
Sie irren sich.
Viele Dokumente zu haben und viele Token zu verbrauchen, sind zwei verschiedene Dinge. Dokumente liegen in deinen Ordnern. Sie verbrauchen nicht von selbst Token. Deine schlechten Gewohnheiten verbrauchen Token.
Die wahren Token-Killer sind:
- Context Bloat: Du lässt einen Chat den ganzen Tag über laufen. Du bezahlst jedes Mal für tausende Token an alter Historie, wenn du eine neue Frage stellst.
- Vage Prompts: Du sagst nicht genau, was du willst. Die KI rät. Du benötigst drei Durchgänge für das, was ein einziger klarer Prompt hätte erledigen können.
- Schlechte Tool-Nutzung: Du lässt die KI dein gesamtes Repository lesen, obwohl du nur eine einzige Datei änderst.
Die größten Kosten entstehen durch Nachbesserungen.
Wenn du kein PRD schreibst, interpretiert die KI deine Anforderungen möglicherweise falsch. Du gibst dann mehr Token dafür aus, Dinge umzuschreiben, wieder einzureißen und fehlerhafte Teile zu reparieren.
Ein PRD ist eine einmalige Ausgabe. Nachbesserungen sind eine sich aufschaukelnde Schuld.
Nutze diese Methoden, um Token zu sparen, anstatt die Dokumentation zu kürzen:
- Kontext kürzen: Lösche regelmäßig deinen Chatverlauf.
- Modelle staffeln: Nutze günstige, kleine Modelle zum Suchen und Lesen. Nutze starke Modelle nur für komplexes Denken und das Programmieren.
- Dateien präzise lesen: Füttere die KI nur mit dem, was für die aktuelle Änderung relevant ist.
- Prompt-Caching nutzen: Das senkt deine Kosten erheblich.
- Einen Token-Proxy nutzen: Verknappe den Output von Routinebefehlen.
- Parallelisieren: Führe unabhängige Aufgaben gleichzeitig aus, um die Anzahl der Round-Trips zu reduzieren.
Dokumentationen sind Assets. Sie helfen dir, Entscheidungen nachzuvollziehen. Wenn die KI eine gute Dokumentation liest, versteht sie das „Warum“ sofort. Das spart Token.
Wenn du sparen willst, dann spare bei der Art und Weise, wie du deine Tools nutzt. Spare nicht, indem du die Dokumentation weglässt.
Source: https://dev.to/kanfu-panda/your-docs-arent-burning-your-tokens-your-tooling-is-58ck
Optional learning community: https://t.me/GyaanSetuAi