Die umgekehrte Pyramide des Datenjournalismus: Vom Datensatz zur Story

Die umgekehrte Pyramide des Datenjournalismus
Ideen entwickeln
Daten sammeln
Reinigen
Kontextualisieren
Kombinieren
Fragen
Kommunizieren

Datenjournalistische Projekte lassen sich in einzelne Schritte aufteilen – jeder einzelne Schritt bringt eigene Herausforderungen. Um dir zu helfen, habe ich die “Umgekehrte Pyramide des Datenjournalismusentwickelt. Sie zeigt, wie du aus einer Idee eine fokussierte Datengeschichte machst. Ich erkläre dir Schritt für Schritt, worauf du achten solltest, und gebe dir Tipps, wie du typische Stolpersteine vermeiden kannst.

(Auch auf Englisch, Spanisch, Finnisch, Russisch and Ukrainisch verfügbar.)

Schritt 1: Ideen entwickeln

Am Anfang steht die Frage: Wie kommst du zu einer Idee für eine datenbasierte Geschichte? 

Es gibt mindestens sieben typische Wege, wie du zu guten Ideen kommen kannst:

  1. Du schaust dir öffentlich verfügbare Daten an.
  2. Du erhältst exklusiven Zugang zu einem Datensatz.
  3. Du entwickelst eine frühere, auf Daten basierende Geschichte weiter.
  4. Du reagierst auf eine aktuelle Nachricht, die du weiterentwickelst.
  5. Du stellst eine Frage, der du nachgehst.
  6. Du bekommst einen Hinweis auf spannende Daten.
  7. Du spielst mit Daten herum und stößt auf etwas Interessantes.
7 typische Wege zu Geschichten

Du schaust dir öffentlich verfügbare Daten an.
Du erhältst exklusiven Zugang zu einem Datensatz.
Du entwickelst eine frühere, auf Daten basierende Geschichte weiter.
Du reagierst auf eine aktuelle Nachricht, die du weiterentwickelst.
Du stellst eine Frage, der du nachgehst.
Du bekommst einen Hinweis auf spannende Daten.
Du spielst mit Daten herum und stößt auf etwas Interessantes.

Ideen, die nicht direkt aus einem Datensatz kommen – etwa aus einer Frage, einem Tipp oder als Nachzug zu einer Nachricht – sind oft schwieriger umzusetzen. In solchen Fällen musst du prüfen, ob es überhaupt passende Daten gibt und was sie tatsächlich aussagen.

In How to brainstorm COVID-19 data story ideas stelle ich dir geeignete Herangehensweisen vor. Weitere Rechercheansätze lernst du in How to use the ‘4 stages of curiosity’ as a framework for investigations und Empathy as an investigative tool: how to map systems to come up with story ideas kennen.

Wenn du dagegen mit einem Datensatz startest, musst du herausfinden, welche Story-Perspektiven darin stecken. Frag dich:

  • Welche Daten gibt es in den verschiedenen Spalten? (Was wird gemessen)
  • Was erzählen die Daten? (Welche Geschichten könnte man damit erzählen)
  • Was fehlt? (Was wird nicht gemessen)

In Here are the angles journalists use most often to tell the stories in data erkläre ich, wie du für die Daten, die du hast, den richtigen Dreh (die richtige Erzählperspektive) finden kannst.

  8 typische Blickwinkel für Datengeschichten_
Größenordnung
Entwicklung
Rangliste
Abweichung
Erkundung
Zusammenhänge
Meta
Hinweise
  • Verfügt dein Datensatz über zeitliche Informationen (zum Beispiel Monate oder Jahre) kannst du erzählen, wie sich etwas über die Zeit entwickelt hat.
  • Wenn in deinen Daten Ortsangaben oder andere Kategorien sind, kannst du Ranglisten erstellen oder Unterschiede aufzeigen.
  • Fast alle Daten erlauben Aussagen über Größenordnungen.

Schritt 2: Daten sammeln

Manchmal geht’s ganz einfach, oft ist die Beschaffung der Daten aber schon ein Projekt für sich.

  1. Am einfachsten ist es, wenn die passenden Daten bereits vorhanden sind, etwa auf Seiten, wo sie regelmäßig bereitgestellt werden. Oder du bekommst Daten mit einer Pressemitteilung zugeschickt.
  2. Du findest Daten über fortgeschrittene Suchtechniken.
  3. Du holst Daten per API und etwas Code.
  4. Du scrapest mithilfe eines Skripts Daten aus dem Internet, um mehrere Seiten oder Dokumente zu durchsuchen und die Informationen in einer Tabelle zusammenzuführen.
  5. Du wandelst unstrukturierte Inhalte wie Texte in auswertbare Daten um.
  6. Du sammelst Daten selbst – über Beobachtungen, Umfragen oder Crowdsourcing.

Letzteres ist aufwändig und daher eher die Ausnahme.

Der 2. Schritt ist zentral, denn es kann gut sein, dass du zu einem späteren Zeitpunkt darauf zurückkommen musst. Zum Beispiel, um vorhandene Daten zu bereinigen, sie in Kontext zu stellen und zu kombinieren, sowie um die Ergebnisse besser zu erklären.

Wichtig

  • Hinterfrage immer deine Perspektive und suche nach blinden Flecken: Wessen Perspektive bilden die Datensätze ab, die du gefunden hast? Wessen Stimme fehlt? Suchst du nur in öffentlich zugänglichen Datensätzen? Welche unveröffentlichten Daten könnten spannend sein? Wäre es möglich, selbst Daten zu sammeln? Konzentrierst du dich auf Daten des öffentlichen Sektors? Was ist mit dem privaten Sektor? Hast du Vorlieben für bestimmte Arten von Datengeschichten und siehst für das Publikum spannendere Zugänge deshalb nicht?
  • Stell dir immer wieder die Frage: Habe ich die beste Quelle? Ist sie glaubwürdig? Wie zuverlässig ist die Methode?

Schritt 3: Daten reinigen

Ein Datensatz allein bringt noch keine verlässlichen Aussagen. Du musst der Qualität der Daten trauen können – und dazu musst du die Daten in vielen Fällen bereinigen.

"Verschmutzte Daten"-Probleme
Ungenau
Unvollständig
Inkonsistent
Inkompatibel
Aus What is dirty data and how do I clean it? A great big guide for data journalists

Schritt 4: Daten kontextualisieren

Daten zeigen nie die ganze Geschichte. Damit wir Antworten auf unsere Fragen bekommen, müssen wir sie in einen geeigneten Kontext stellen. Denn Daten spiegeln immer eine bestimmte Perspektive — mit eigenen Interessen, blinken Flecken und Zielen.

Stell dir deshalb diese Fragen:

  • Wer hat die Daten gesammelt? Wann? Und du welchem Zweck?
  • Wie wurden die Daten gesammelt (Methodik)?
  • Was bedeuten die Kategorien / Klassifikationen genau? Haben sie in der Fachsprache eine besondere Bedeutung?
  • Was sagen die Daten aus?

Oft musst du noch weitere Informationen sammeln, um die ursprünglichen Daten richtig einordnen zu können. Die Zahl der Straftaten in einer Stadt zum Beispiel sagt alleine wenig aus. Hilfreiche Zusatzinformationen können sein:

  • Wie viele Menschen leben in der Stadt? 
  • Wie stark ist die Zahl der Straftaten in den letzten fünf Jahren gestiegen? 
  • Wie viele Polizistinnen und Polizisten gibt es?
  • Wie nehmen Menschen die Kriminalität wahr?
  • Was sagen Verurteilungsquoten?
  • Wie genau werden die Kategorien von Kriminalität definiert?

Ein grundlegendes Statistik-Wissen hilft dir enorm weiter. Eine einfach lesbare Einführung findest du bei “Statistik für Dummies“. Wenn du dich vertiefen willst, dann lies “Statistik für Journalist:innen“. “So lügt man mit Statistik” ist eine zwar etwas polemische, aber dafür sehr unterhaltsame Annäherung an das Thema. Auch zu empfehlen ist der BBC-Podcast “More or Less” rein und das Buch “The Tiger That Isn’t“, das sie Podcast-Moderatoren geschrieben.

Schritt 5: Kombinieren

Natürlich können gute Geschichten auch in einem einzigen Datensatz stecken. Viele der guten Geschichten entstehen aber erst dann, wenn du verschiedene Datensätze miteinander kombinierst. Durch das Verbinden schaffst du Kontext, der dir hilft, Antworten auf deine Fragen zu finden:

  • Du kombinierst neue Daten mit älteren, um eine Geschichte über Veränderung zu erzählen.
  • Du verknüpfst Daten über Ereignisse mit Bevölkerungsdaten, um eine Geschichte über den Umfang pro Person (oder pro 10.000 Personen usw.) zu erzählen.
  • Du verbindest Leistungsdaten von Schulen oder Spitälern mit Standorten, um Ranglisten und regionale Unterschiede sichtbar zu machen.
  • Du legst Statistik auf Kartenmaterial, um räumliche Muster zu zeigen – wie bei Die Spur des Geldes: Prioritäten der EU-Migrationspoliti, Die Stadtflucht, oder Mein Viertel, eine Blase

Wichtig dabei: Beide Datensätze müssen eine gemeinsame Größe haben, über die sie verbunden werden können – etwa Codes, Namen oder Jahreszahlen.

Beim Kombinieren kann es sein, dass du zum Schritt 3, der Reinigung der Daten zurück musst. In unterschiedlichen Datensätzen können dieselben Daten verschiedene Bezeichnungen haben: Institutionen oder Gebiete können leicht unterschiedlich benannt sein oder ein Datensatz verwendet beispielsweise ‘und’, während der andere ‘&’ nutzt. Wenn immer möglich solltest du, wenn Datensätze mit Codes arbeiten, diese statt Namen verwenden, sie sind viel zuverlässiger.

Schritt 6: Kommunizieren

Daten sind prädestiniert für Visualisierungen. Es liegt deshalb nahe, dass du aus den Daten eine Karte, ein Diagramm oder eine Infografik machst. Aber das ist nur eine Möglichkeit. Du kannst deine Datengeschichten auch ganz anders erzählen:

  • mit einem gut strukturierten Text zu den Ergebnissen (z.B. Bulletpoint-Liste).
  • mit konkreten Beispielen von Protagonistinnen oder Protagonisten, die den Daten ein Gesicht verleihen.
  • mit Anwendungen, mit denen das Publikum Daten selbst durchsuchen kann. 
  • mit Hilfestellungen, die es dem Publikum ermöglichen, ein Problem zu lösen.

Weil es dazu (siehe Diagramm unten) noch so viel zu sagen gibt, habe ich dazu einen separaten Beitrag geschrieben. Ich freue mich über dein Feedback zur Pyramide!

Datenjournalismus: Daten kommunizieren Visualisiern Erzählen Herunterbrechen Personalisieren Audiolisieren/materialisieren Nutzen bieten

Übersetzt mit Hilfe von Alexandra Stark

This entry was posted in computer aided reporting, data journalism, online journalism and tagged , , on by .
Unknown's avatar

About Paul Bradshaw

Paul teaches data journalism at Birmingham City University and is the author of a number of books and book chapters about online journalism and the internet, including the Online Journalism Handbook, Mobile-First Journalism, Finding Stories in Spreadsheets, Data Journalism Heist and Scraping for Journalists. From 2010-2015 he was a Visiting Professor in Online Journalism at City University London and from 2009-2014 he ran Help Me Investigate, an award-winning platform for collaborative investigative journalism. Since 2015 he has worked with the BBC England and BBC Shared Data Units based in Birmingham, UK. He also advises and delivers training to a number of media organisations.

Leave a comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.