Data2Story: Transforming Raw CSVs into Verifiable AI-Driven News

The era of manual data journalism is facing a paradigm shift with the introduction of Data2Story, an autonomous system capable of converting raw datasets into fully interactive, multimodal news articles. By leveraging a specialized multi-agent architecture, this technology moves beyond simple text generation to create verifiable, data-backed narratives with zero human input.

A Virtual Newsroom Driven by Seven Specialized Agents

Unlike standard LLMs that attempt to "hallucinate" or guess statistical trends, Data2Story utilizes a structured "virtual newsroom" composed of seven distinct AI agents. This pipeline ensures that every stage of the editorial process—from initial research to final HTML deployment—is handled by a model optimized for that specific task.

The workflow begins with the Detective, which conducts web searches to provide context for raw tables, and the Analyst, which executes actual code to calculate figures rather than predicting them. The Editor selects the most compelling narrative drivers, while the Designer determines the best medium for the data (such as maps or audio). Finally, the Programmer builds the web page, the Auditor checks for layout errors, and the Inspector ensures every claim is traceable. The system is powered by Claude Opus 4.7 running on Claude Code, with multimodal assets generated via OpenRouter models like gpt-5.4-image-2 and lyria-3-pro-preview.

Solving the Verifiability Crisis in AI Journalism

One of the most significant breakthroughs in Data2Story is its "Inspector" panel, designed to tackle the industry-wide issue of AI hallucinations. While the baseline for human-written articles shows that only about 25% of analytical claims are easily traceable to source code, Data2Story enables 93% of its statements to be checked for origin.

Each sentence, chart, and interactive element is linked to an index card that displays either the exact line of code used to generate the figure or an external URL. This creates a "runnable" journalism model: if a reader doubts a statistic, they can run the underlying script to recalculate the result themselves, bridging a massive transparency gap in modern digital media.

Human vs. Agent: Where the AI Wins and Fails

W rygorystycznym badaniu porównującym Data2Story z treściami napisanymi przez ludzi w The Economist, The Pudding i TidyTuesday, AI osiągnęła lepsze wyniki niż ludzie w 74% testów preferencji czytelników. Agent odniósł największy sukces w zakresie przejrzystości i briefingów opartych na dużych zbiorach danych, gdzie często zapewniał większą klarowność niż ludzcy odpowiednicy.

Jednak badacze wskazali na wyraźne granice, w których wiedza ekspercka ludzi pozostaje niezastąpiona:

  • Perspektywa redakcyjna: Choć AI potrafi pokazać, co dzieje się w zbiorze danych, nie jest w stanie wyjaśnić „dlaczego” (np. przypisując niskie wskaźniki napraw polityce producenta) bez zewnętrznego dziennikarstwa śledczego.
  • Kreatywny design: Wysoce spersonalizowane, eksperymentalne interfejsy — takie jak te widoczne w The Pudding — wciąż wymagają ludzkiego artyzmu, który wykracza poza standardowe szablony HTML.
  • Gęste wizualizacje: AI ma tendencję do rozpraszania danych na wielu wykresach, podczas gdy doświadczeni projektanci potrafią nałożyć złożone adnotacje na pojedynczą, potężną grafikę.

Kluczowe wnioski

  • Architektura wieloagentowa: Data2Story wykorzystuje siedmiu wyspecjalizowanych agentów (Detective, Analyst, Editor, Designer, Programmer, Auditor oraz Inspector) do zarządzania pełnym cyklem redakcyjnym.
  • Bezprecedensowa weryfikowalność: System osiąga 93-procentową identyfikowalność swoich twierdzeń, znacznie wyprzedzając ~25-procentową weryfikowalność spotykaną w tradycyjnym dziennikarstwie analitycznym tworzonym przez ludzi.
  • Potencjał współpracy: Zamiast zastępować dziennikarzy, narzędzie zostało zaprojektowane jako „współpracownik redakcji”, który zajmuje się ciężkimi obliczeniami i maszynowo weryfikowalnym wskazywaniem źródeł, pozostawiając ludziom śledcze pytania o „dlaczego”.