Data2Story: Transformation von Roh-CSV-Dateien in verifizierbare, KI-gesteuerte Nachrichten

Die Ära des manuellen Datenjournalismus erlebt mit der Einführung von Data2Story einen Paradigmenwechsel – ein autonomes System, das in der Lage ist, Rohdatensätze in vollständig interaktive, multimodale Nachrichtenartikel umzuwandeln. Durch den Einsatz einer spezialisierten Multi-Agenten-Architektur geht diese Technologie über die einfache Textgenerierung hinaus und erstellt verifizierbare, datengestützte Narrative ohne jeglichen menschlichen Input.

Ein virtueller Newsroom, gesteuert von sieben spezialisierten Agenten

Im Gegensatz zu Standard-LLMs, die versuchen zu „halluzinieren“ oder statistische Trends zu erraten, nutzt Data2Story einen strukturierten „virtuellen Newsroom“, der aus sieben verschiedenen KI-Agenten besteht. Diese Pipeline stellt sicher, dass jede Phase des redaktionellen Prozesses – von der ersten Recherche bis zur finalen HTML-Bereitstellung – von einem Modell bearbeitet wird, das für diese spezifische Aufgabe optimiert ist.

Der Workflow beginnt mit dem Detective, der Websuchen durchführt, um Kontext für Rohdatentabellen zu liefern, und dem Analyst, der tatsächlichen Code ausführt, um Zahlen zu berechnen, anstatt sie nur vorherzusagen. Der Editor wählt die überzeugendsten narrativen Treiber aus, während der Designer das beste Medium für die Daten bestimmt (wie etwa Karten oder Audio). Schließlich erstellt der Programmer die Webseite, der Auditor prüft auf Layoutfehler und der Inspector stellt sicher, dass jede Behauptung nachvollziehbar ist. Das System wird von Claude Opus 4.7 betrieben, das auf Claude Code läuft, wobei multimodale Assets über OpenRouter-Modelle wie gpt-5.4-image-2 und lyria-3-pro-preview generiert werden.

Die Lösung der Verifizierbarkeitskrise im KI-Journalismus

Einer der bedeutendsten Durchbrüche bei Data2Story ist das „Inspector“-Panel, das entwickelt wurde, um das branchenweite Problem der KI-Halluzinationen anzugehen. Während der Basiswert für von Menschen geschriebene Artikel zeigt, dass nur etwa 25 % der analytischen Behauptungen leicht auf den Quellcode zurückgeführt werden können, ermöglicht Data2Story die Überprüfung des Ursprungs von 93 % seiner Aussagen.

Jeder Satz, jedes Diagramm und jedes interaktive Element ist mit einer Indexkarte verknüpft, die entweder die exakte Codezeile zur Erstellung der Grafik oder eine externe URL anzeigt. Dies schafft ein „ausführbares“ Journalismusmodell: Wenn ein Leser eine Statistik anzweifelt, kann er das zugrunde liegende Skript selbst ausführen, um das Ergebnis neu zu berechnen, und so die massive Transparenzlücke in modernen digitalen Medien schließen.

Mensch vs. Agent: Wo die KI gewinnt und scheitert

In einer fundierten Studie, die Data2Story mit von Menschen verfassten Inhalten aus The Economist, The Pudding und TidyTuesday verglich, übertraf die KI die Menschen in 74 % der Leserpräferenztests. Die größte Stärke des Agenten zeigte sich bei der Transparenz und in datenintensiven Briefings, wo er oft mehr Klarheit bot als seine menschlichen Gegenstücke.

Die Forscher wiesen jedoch auf klare Grenzen hin, an denen menschliche Expertise unverzichtbar bleibt:

  • Redaktionelle Perspektive: Während die KI zeigen kann, was in einem Datensatz passiert, kann sie das „Warum“ (z. B. die Zuweisung niedriger Reparaturraten zu einer Herstellerrichtlinie) ohne externe investigative Berichterstattung nicht erklären.
  • Kreatives Design: Hochgradig maßgeschneiderte, experimentelle Benutzeroberflächen – wie sie in The Pudding zu sehen sind – erfordern nach wie vor menschliche Kunstfertigkeit, die über Standard-HTML-Vorlagen hinausgeht.
  • Dichte Visualisierungen: Die KI neigt dazu, Daten über mehrere Diagramme zu verteilen, während erfahrene menschliche Designer komplexe Annotationen in einer einzigen, aussagekräftigen Grafik schichten können.

Wichtigste Erkenntnisse

  • Multi-Agenten-Architektur: Data2Story nutzt sieben spezialisierte Agenten (Detective, Analyst, Editor, Designer, Programmer, Auditor und Inspector), um den gesamten redaktionellen Lebenszyklus zu verwalten.
  • Beispiellose Überprüfbarkeit: Das System erreicht eine Rückverfolgbarkeit von 93 % für seine Behauptungen und übertrifft damit die ca. 25 %ige Überprüfbarkeit, die im traditionellen, von Menschen geschriebenen analytischen Journalismus zu finden ist.
  • Kollaboratives Potenzial: Anstatt Journalisten zu ersetzen, ist das Tool als „Newsroom-Kollaborateur“ konzipiert, um rechenintensive Aufgaben und maschinell überprüfbare Quellenarbeit zu übernehmen, während investigative „Warum“-Fragen den Menschen überlassen werden.