"Tatort"-Datenanalyse
Wie wurde bei der Datenanalyse vorgegangen?
Für die Datenanalyse wurden im August 2022 alle verfügbaren Beschreibungen und Metadaten wie Sendedatum, Bewertungen, Orte und Ermittler von Tatort-Sendungen automatisiert von der Webseite daserste.de heruntergeladen und in einer Tabelle gesammelt. Grundlage der Auswertung sind damit über 1.200 Tatort-Sendungen aus 40 Orten und 53 Jahren (1970-2022).
Im nächsten Schritt wurden die Beschreibungen je Folge auf ihre grammatikalischen Kernbestandteile reduziert. Dafür wurde ein mit Nachrichten- und Medientexten trainiertes Modell von SpaCy, einer Code-Bibliothek für Natürliche Sprachverarbeitung genutzt: SpaCy erkennt durch mit einer sehr hohen Präzision grammatikalische Strukturen und Satzbestandteile.
Dabei wird Relevantes von Unwichtigem entfernt: Am Ende blieben nur die Rollen oder handelnde Organisationen und deren Beschreibungen. Damit und mit den Metadaten ist es beispielsweise möglich auszuwerten, mit welchen Adjektiven Substantive wie "Familie" oder "Frau" beschrieben werden und wie sich die Beschreibungen über die Jahre hinweg verändern.
Für die Auswertung, wie unterschiedlich weibliche und männliche Charaktere in den Tatort-Beschreibungen umschrieben werden, wurden 270 Adjektive, die mindestens zwei Mal in den Beschreibungen auftauchen, insgesamt sechs Kategorien zugeordnet: Alter, Aussehen, Zustand, Charakter, Erfolg und Emotionen. Damit wurden die häufigsten 530 Charakterbeschreibungen in den Texten ausgewertet.
Kommentare