Data2Story: Transforming Raw CSVs into Verifiable AI-Driven News

The era of manual data journalism is facing a paradigm shift with the introduction of Data2Story, an autonomous system capable of converting raw datasets into fully interactive, multimodal news articles. By leveraging a specialized multi-agent architecture, this technology moves beyond simple text generation to create verifiable, data-backed narratives with zero human input.

A Virtual Newsroom Driven by Seven Specialized Agents

Unlike standard LLMs that attempt to "hallucinate" or guess statistical trends, Data2Story utilizes a structured "virtual newsroom" composed of seven distinct AI agents. This pipeline ensures that every stage of the editorial process—from initial research to final HTML deployment—is handled by a model optimized for that specific task.

The workflow begins with the Detective, which conducts web searches to provide context for raw tables, and the Analyst, which executes actual code to calculate figures rather than predicting them. The Editor selects the most compelling narrative drivers, while the Designer determines the best medium for the data (such as maps or audio). Finally, the Programmer builds the web page, the Auditor checks for layout errors, and the Inspector ensures every claim is traceable. The system is powered by Claude Opus 4.7 running on Claude Code, with multimodal assets generated via OpenRouter models like gpt-5.4-image-2 and lyria-3-pro-preview.

Solving the Verifiability Crisis in AI Journalism

One of the most significant breakthroughs in Data2Story is its "Inspector" panel, designed to tackle the industry-wide issue of AI hallucinations. While the baseline for human-written articles shows that only about 25% of analytical claims are easily traceable to source code, Data2Story enables 93% of its statements to be checked for origin.

Each sentence, chart, and interactive element is linked to an index card that displays either the exact line of code used to generate the figure or an external URL. This creates a "runnable" journalism model: if a reader doubts a statistic, they can run the underlying script to recalculate the result themselves, bridging a massive transparency gap in modern digital media.

Human vs. Agent: Where the AI Wins and Fails

В ходе тщательного исследования, сравнивающего Data2Story с контентом, написанным людьми для The Economist, The Pudding и TidyTuesday, ИИ превзошел человека в 74% тестов на предпочтения читателей. Наибольшего успеха агент добился в обеспечении прозрачности и подготовке информационных сводок с большим объемом данных, где он зачастую обеспечивал большую ясность, чем его человеческие коллеги.

Однако исследователи отметили четкие границы, где экспертные знания человека остаются незаменимыми:

  • Редакционный взгляд: Хотя ИИ может показать, что происходит в наборе данных, он не может объяснить «почему» (например, связать низкие показатели ремонта с политикой производителя) без проведения внешних журналистских расследований.
  • Креативный дизайн: Уникальные, экспериментальные интерфейсы — подобные тем, что представлены в The Pudding, — по-прежнему требуют человеческого мастерства, выходящего за рамки стандартных HTML-шаблонов.
  • Насыщенная визуализация: ИИ склонен распределять данные по нескольким графикам, в то время как опытные дизайнеры могут накладывать сложные аннотации на один мощный графический объект.

Основные выводы

  • Мультиагентная архитектура: Data2Story использует семь специализированных агентов (Детектив, Аналитик, Редактор, Дизайнер, Программист, Аудитор и Инспектор) для управления полным редакционным циклом.
  • Беспрецедентная проверяемость: Система достигает 93% прослеживаемости своих утверждений, что значительно превосходит ~25% проверяемости, характерной для традиционной аналитической журналистики, написанной людьми.
  • Потенциал для сотрудничества: Вместо того чтобы заменять журналистов, инструмент задуман как «помощник редакции» для выполнения сложных вычислений и работы с машинопроверяемыми источниками, оставляя человеку вопросы расследовательского характера («почему?»).