
Datenjournalistische Projekte lassen sich in einzelne Schritte aufteilen – jeder einzelne Schritt bringt eigene Herausforderungen. Um dir zu helfen, habe ich die “Umgekehrte Pyramide des Datenjournalismus” entwickelt. Sie zeigt, wie du aus einer Idee eine fokussierte Datengeschichte machst. Ich erkläre dir Schritt für Schritt, worauf du achten solltest, und gebe dir Tipps, wie du typische Stolpersteine vermeiden kannst.
(Auch auf Englisch, Spanisch, Finnisch, Russisch and Ukrainisch verfügbar.)
Schritt 1: Ideen entwickeln
Am Anfang steht die Frage: Wie kommst du zu einer Idee für eine datenbasierte Geschichte?
Es gibt mindestens sieben typische Wege, wie du zu guten Ideen kommen kannst:
- Du schaust dir öffentlich verfügbare Daten an.
- Du erhältst exklusiven Zugang zu einem Datensatz.
- Du entwickelst eine frühere, auf Daten basierende Geschichte weiter.
- Du reagierst auf eine aktuelle Nachricht, die du weiterentwickelst.
- Du stellst eine Frage, der du nachgehst.
- Du bekommst einen Hinweis auf spannende Daten.
- Du spielst mit Daten herum und stößt auf etwas Interessantes.

Ideen, die nicht direkt aus einem Datensatz kommen – etwa aus einer Frage, einem Tipp oder als Nachzug zu einer Nachricht – sind oft schwieriger umzusetzen. In solchen Fällen musst du prüfen, ob es überhaupt passende Daten gibt und was sie tatsächlich aussagen.
In How to brainstorm COVID-19 data story ideas stelle ich dir geeignete Herangehensweisen vor. Weitere Rechercheansätze lernst du in How to use the ‘4 stages of curiosity’ as a framework for investigations und Empathy as an investigative tool: how to map systems to come up with story ideas kennen.
Wenn du dagegen mit einem Datensatz startest, musst du herausfinden, welche Story-Perspektiven darin stecken. Frag dich:
- Welche Daten gibt es in den verschiedenen Spalten? (Was wird gemessen)
- Was erzählen die Daten? (Welche Geschichten könnte man damit erzählen)
- Was fehlt? (Was wird nicht gemessen)
In Here are the angles journalists use most often to tell the stories in data erkläre ich, wie du für die Daten, die du hast, den richtigen Dreh (die richtige Erzählperspektive) finden kannst.

- Verfügt dein Datensatz über zeitliche Informationen (zum Beispiel Monate oder Jahre) kannst du erzählen, wie sich etwas über die Zeit entwickelt hat.
- Wenn in deinen Daten Ortsangaben oder andere Kategorien sind, kannst du Ranglisten erstellen oder Unterschiede aufzeigen.
- Fast alle Daten erlauben Aussagen über Größenordnungen.
Schritt 2: Daten sammeln
Manchmal geht’s ganz einfach, oft ist die Beschaffung der Daten aber schon ein Projekt für sich.
- Am einfachsten ist es, wenn die passenden Daten bereits vorhanden sind, etwa auf Seiten, wo sie regelmäßig bereitgestellt werden. Oder du bekommst Daten mit einer Pressemitteilung zugeschickt.
- Du findest Daten über fortgeschrittene Suchtechniken.
- Du holst Daten per API und etwas Code.
- Du scrapest mithilfe eines Skripts Daten aus dem Internet, um mehrere Seiten oder Dokumente zu durchsuchen und die Informationen in einer Tabelle zusammenzuführen.
- Du wandelst unstrukturierte Inhalte wie Texte in auswertbare Daten um.
- Du sammelst Daten selbst – über Beobachtungen, Umfragen oder Crowdsourcing.
Letzteres ist aufwändig und daher eher die Ausnahme.
Der 2. Schritt ist zentral, denn es kann gut sein, dass du zu einem späteren Zeitpunkt darauf zurückkommen musst. Zum Beispiel, um vorhandene Daten zu bereinigen, sie in Kontext zu stellen und zu kombinieren, sowie um die Ergebnisse besser zu erklären.
Wichtig:
- Hinterfrage immer deine Perspektive und suche nach blinden Flecken: Wessen Perspektive bilden die Datensätze ab, die du gefunden hast? Wessen Stimme fehlt? Suchst du nur in öffentlich zugänglichen Datensätzen? Welche unveröffentlichten Daten könnten spannend sein? Wäre es möglich, selbst Daten zu sammeln? Konzentrierst du dich auf Daten des öffentlichen Sektors? Was ist mit dem privaten Sektor? Hast du Vorlieben für bestimmte Arten von Datengeschichten und siehst für das Publikum spannendere Zugänge deshalb nicht?
- Stell dir immer wieder die Frage: Habe ich die beste Quelle? Ist sie glaubwürdig? Wie zuverlässig ist die Methode?
Schritt 3: Daten reinigen
Ein Datensatz allein bringt noch keine verlässlichen Aussagen. Du musst der Qualität der Daten trauen können – und dazu musst du die Daten in vielen Fällen bereinigen.

Schritt 4: Daten kontextualisieren
Daten zeigen nie die ganze Geschichte. Damit wir Antworten auf unsere Fragen bekommen, müssen wir sie in einen geeigneten Kontext stellen. Denn Daten spiegeln immer eine bestimmte Perspektive — mit eigenen Interessen, blinken Flecken und Zielen.
Stell dir deshalb diese Fragen:
- Wer hat die Daten gesammelt? Wann? Und du welchem Zweck?
- Wie wurden die Daten gesammelt (Methodik)?
- Was bedeuten die Kategorien / Klassifikationen genau? Haben sie in der Fachsprache eine besondere Bedeutung?
- Was sagen die Daten aus?
Oft musst du noch weitere Informationen sammeln, um die ursprünglichen Daten richtig einordnen zu können. Die Zahl der Straftaten in einer Stadt zum Beispiel sagt alleine wenig aus. Hilfreiche Zusatzinformationen können sein:
- Wie viele Menschen leben in der Stadt?
- Wie stark ist die Zahl der Straftaten in den letzten fünf Jahren gestiegen?
- Wie viele Polizistinnen und Polizisten gibt es?
- Wie nehmen Menschen die Kriminalität wahr?
- Was sagen Verurteilungsquoten?
- Wie genau werden die Kategorien von Kriminalität definiert?
Ein grundlegendes Statistik-Wissen hilft dir enorm weiter. Eine einfach lesbare Einführung findest du bei “Statistik für Dummies“. Wenn du dich vertiefen willst, dann lies “Statistik für Journalist:innen“. “So lügt man mit Statistik” ist eine zwar etwas polemische, aber dafür sehr unterhaltsame Annäherung an das Thema. Auch zu empfehlen ist der BBC-Podcast “More or Less” rein und das Buch “The Tiger That Isn’t“, das sie Podcast-Moderatoren geschrieben.
Schritt 5: Kombinieren
Natürlich können gute Geschichten auch in einem einzigen Datensatz stecken. Viele der guten Geschichten entstehen aber erst dann, wenn du verschiedene Datensätze miteinander kombinierst. Durch das Verbinden schaffst du Kontext, der dir hilft, Antworten auf deine Fragen zu finden:
- Du kombinierst neue Daten mit älteren, um eine Geschichte über Veränderung zu erzählen.
- Du verknüpfst Daten über Ereignisse mit Bevölkerungsdaten, um eine Geschichte über den Umfang pro Person (oder pro 10.000 Personen usw.) zu erzählen.
- Du verbindest Leistungsdaten von Schulen oder Spitälern mit Standorten, um Ranglisten und regionale Unterschiede sichtbar zu machen.
- Du legst Statistik auf Kartenmaterial, um räumliche Muster zu zeigen – wie bei Die Spur des Geldes: Prioritäten der EU-Migrationspoliti, Die Stadtflucht, oder Mein Viertel, eine Blase
Wichtig dabei: Beide Datensätze müssen eine gemeinsame Größe haben, über die sie verbunden werden können – etwa Codes, Namen oder Jahreszahlen.
Beim Kombinieren kann es sein, dass du zum Schritt 3, der Reinigung der Daten zurück musst. In unterschiedlichen Datensätzen können dieselben Daten verschiedene Bezeichnungen haben: Institutionen oder Gebiete können leicht unterschiedlich benannt sein oder ein Datensatz verwendet beispielsweise ‘und’, während der andere ‘&’ nutzt. Wenn immer möglich solltest du, wenn Datensätze mit Codes arbeiten, diese statt Namen verwenden, sie sind viel zuverlässiger.
Schritt 6: Kommunizieren
Daten sind prädestiniert für Visualisierungen. Es liegt deshalb nahe, dass du aus den Daten eine Karte, ein Diagramm oder eine Infografik machst. Aber das ist nur eine Möglichkeit. Du kannst deine Datengeschichten auch ganz anders erzählen:
- mit einem gut strukturierten Text zu den Ergebnissen (z.B. Bulletpoint-Liste).
- mit konkreten Beispielen von Protagonistinnen oder Protagonisten, die den Daten ein Gesicht verleihen.
- mit Anwendungen, mit denen das Publikum Daten selbst durchsuchen kann.
- mit Hilfestellungen, die es dem Publikum ermöglichen, ein Problem zu lösen.
Weil es dazu (siehe Diagramm unten) noch so viel zu sagen gibt, habe ich dazu einen separaten Beitrag geschrieben. Ich freue mich über dein Feedback zur Pyramide!

Übersetzt mit Hilfe von Alexandra Stark
