Database - Entry

Return to results · New search
Resource Name
SpiegelMining – Reverse Engineering von Spiegel-Online
URL
Citation
Kriesel, David (2016): SpiegelMining – Reverse Engineering von Spiegel-Online. Talk auf dem CCC-Kongress am 28. Dezember 2016.
Short Description

David Kriesel has stored around 700,000 articles from the online journal “Spiegel Online” and their versions since 2014, amassing a huge dataset on an important opinion leader in Germany. In the talk, Kriesel shows how such a dataset can be sorted and evaluated according to certain features, such as how frequently individual headings occur, when the publication period of the individual articles is, text lengths, by day of the week and time, commentability by topic, article versions, etc. He then discusses the sometimes ludicrous inferences, assumptions, conclusions and interpretations that can be drawn from the meta-data and criticizes the high potential for misuse that arises when certain questions are asked of the data set. If the questions are biased, then the risk of misinterpretation is high. The key phrase in his talk is certainly this: "When you publish data, it's not you who decides what you're publishing, it's the adversary who decides." The talk impressively shows how modern data processing can influence a society.

David Kriesel hat seit 2014 rund 700.000 Spiegel-Online-Artikel und ihre Versionen gespeichert und so einen riesigen Datensatz über einen wichtigen Meinungsmacher angehäuft. Im Talk zeigt Kriesel, wie ein solcher Datensatz nach bestimmten Features sortiert und ausgewertet werden kann, beispielsweise wie häufig einzelne Rubriken vorkommen, wann der Veröffentlichungszeitraum der einzelnen Artikel ist, Textlängen, nach Wochentag und Zeit, Kommentierbarkeit nach Themen, Artikel-Versionen etc. Anschließend diskutiert er die teils aberwitzigen Folgerungen, Vermutungen, Rückschlüsse und Interpretationen, die aus den Meta-Daten gezogen werden können und kritisiert das hohe Missbrauchspotential, das entsteht, wenn an den Datensatz bestimmte Fragen gestellt werden. Sind die Fragen vorurteilsbelastet, dann ist die Gefahr von Fehlinterpretationen hoch. Der Schlüsselsatz in seinem Talk ist sicherlich dieser: „Wenn Ihr Daten veröffentlicht, dann entscheidet nicht ihr, was ihr da veröffentlicht, das entscheidet der Gegner.“ Der Talk zeigt eindrucksvoll, wie moderne Datenverarbeitung eine Gesellschaft beeinflussen kann.

Creator URL
Creator URL (2)
-
Who created the resource?
NGO / Civil society
If 'Other', specify here
-
License
Unclear
Format
Video (movie, documentary, video series)
Interactivity
No
Personalization
No
Languages
English, German
Domain
Journalistic, Data Science, Data Visualization
Target Group Age
Young adults (17-20), Adult learning / University
Target Group Size
Individual (1), Small Group (2 - 12), Large Group (>12)
Target Group: Prior knowledge required?
Advanced
If any - What kind of prior knowledge is required?
-
Timeframe
Up to 1 hour
Usage
Once
Offline Use possible?
Yes
Technical Requirements / Accessibility
access to internet
Comment / Feedback
Spannender Vortrag, weil er zeigt, das ein Datensatz erst durch die Fragen, die an ihn gestellt werden, eine Bedeutung bekommen. Daher ist es von entscheidender Bedeutung, wer mit welcher Intention fragt.
Publication Date / Last Updated
2016
Submitted by
tt