Ein Blick in einen KI-Agenten

KI-Agenten-Demos sehen in Videos großartig aus. Doch sie scheitern oft, wenn man ihnen echte Fragen stellt.

Der Agent tut das Falsche. Er vergisst Entscheidungen. Er ruft Tools auf, die nicht existieren. Er gerät in Endlosschleifen. Das sind keine Modellfehler. Es sind Workflow-Fehler.

Ein Agent ist ein Software-Workflow. Ein Sprachmodell wählt den nächsten Schritt aus und ruft Tools auf. Die Intelligenz liegt in der Orchestrierung, nicht allein im Modell.

Jeder Agent in der Produktion stützt sich auf fünf Säulen:

  • Planung: Erst denken, dann handeln.
  • Tool-Nutzung: Interaktion mit der Außenwelt.
  • Gedächtnis: Speichern von Kontext und Fakten.
  • Einschränkungen: Festlegen von Grenzen und Budgets.
  • Verifizierung: Nachweisen, dass die Arbeit korrekt ist.

Planungsstile

Naive Agenten springen direkt ins Handeln. Das führt zu Halluzinationen. Ein guter Agent plant zuerst.

  1. Plan-then-execute: Das Modell erstellt einen vollständigen Plan. Er ist leicht zu prüfen, aber schwer anzupassen, wenn sich die Realität ändert.
  2. ReAct (Reason + Act): Das Modell denkt, handelt und beobachtet in einer Schleife. Es ist anpassungsfähiger, kostet aber mehr Token und Zeit.

Tool-Nutzung

Ohne Tools ist ein Agent nur ein Chatbot. Ein Tool benötigt einen Namen, ein JSON-Schema und eine Funktion.

Modelle wählen Tools basierend auf Beschreibungen aus. Wenn Ihre Beschreibung vage ist, wird der Agent scheitern. Behandeln Sie Beschreibungen wie Lastenhefte. Definieren Sie, wofür ein Tool gedacht ist und wofür nicht.

Validieren Sie Tool-Aufrufe immer. Wenn ein Modell fehlerhafte Argumente sendet, lehnen Sie den Aufruf ab und geben Sie die Fehlermeldung an das Modell zurück. Dies hilft dem Agenten, während der Schleife zu lernen.

Gedächtnis

Gedächtnis ist nicht nur eine Sache.

  • Arbeitsgedächtnis: Die aktuelle Konversation und die Ergebnisse der Tools.
  • Scratchpad: Ein Ort, an dem der Agent sich selbst Notizen schreiben kann.
  • Langzeitgedächtnis: Speichern von Fakten für zukünftige Sitzungen.

Verlassen Sie sich nicht ausschließlich auf Vektordatenbanken. Dateibasiertes Gedächtnis unter Verwendung von Markdown-Dateien ist oft besser. Es lässt sich leicht prüfen, bearbeiten und per grep durchsuchen.

Einschränkungen und Sicherheit

Produktionsreife Agenten benötigen Leitplanken. Nutzen Sie diese vier:

  • Tool-Allowlisten: Nur spezifische, benannte Tools zulassen.
  • Iterations-Budgets: Begrenzen Sie die Anzahl der Schritte, um Endlosschleifen zu verhindern.
  • Token-Budgets: Begrenzen Sie die Kosten durch eine Deckelung der Gesamttoken.
  • Genehmigungsschranken (Approval Gates): Erfordern Sie menschliche Zustimmung für kritische Aktionen wie das Versenden von E-Mails oder das Löschen von Daten.

Verifizierung

Vertrauen Sie einem Modell niemals blind, wenn es sagt, dass eine Aufgabe erledigt ist. Das Modell ist standardmäßig selbstbewusst.

Nutzen Sie echte Verifizierung. Wenn ein Agent Code schreibt, führen Sie die Tests aus. Wenn er JSON generiert, prüfen Sie das Schema. Wenn er eine Aufgabe ausführt, führen Sie eine Abfrage aus, um die Änderung zu bestätigen.

Die besten Agenten nutzen die Verifizierung innerhalb der Schleife. Wenn ein Test fehlschlägt, geben Sie den Fehler an den Agenten zurück. Lassen Sie ihn es erneut versuchen.

Hören Sie auf, nach smarteren Prompts zu suchen. Fangen Sie an, ein besseres Grundgerüst zu bauen.

Quelle: https://dev.to/nazar_boyko/inside-an-ai-agent-planning-tool-use-memory-constraints-and-verification-2fcc

Optionale Lern-Community: https://t.me/GyaanSetuAi