Wenn Sie einen tödlichen Verkehrsunfall vermeiden möchten, was sollten Sie tun? Langsamer fahren? Verzichten Sie auf Alkohol? Roberts und Winters haben diesen Zusammenhang zwischen Verkehrsunfällen und Akazienbäumen gefunden.

Was ist denn los? Pflanzt jemand Akazien an Kreuzungen und versperrt die Sicht? Lassen Akazien auf überraschende Weise Blätter fallen und verursachen Unfälle? Sie würden nicht erwarten, dass ein herunterfallendes Blatt einen Unfall verursacht, aber vielleicht ist es diese Unerwartetheit, die das Problem verursacht. Wird gezielter Holzfäller die Straßen sicherer machen? Die Korrelation ist real und das ist es: eine Korrelation.
Nur weil ein Ergebnis mit einem anderen korreliert, bedeutet das nicht, dass Sie eine Kausalitätslinie ziehen können. In meinem Fall habe ich angedeutet, dass Akazien Verkehrsunfälle verursachen. Könnte es umgekehrt sein. Verursachen tödliche Unfälle Akazien? Vielleicht pflanzen die Menschen Akazien zum Gedenken an die Verstorbenen. Oft gibt es einen tieferen Grund für eine Verbindung.
Roberts und Winters Papier, Sprachliche Vielfalt und Verkehrsunfälle: Lehren aus statistischen Studien kultureller Merkmale richtet sich an Personen, die nach Korrelationen in sprachlichen und kulturellen Daten suchen, aber ihre Warnungen gelten für alle, die mit komplexen Daten arbeiten, insbesondere wenn Sie zu Beginn Ihres Studiums keine Forschungsfrage definieren.
Ein Merkmal, das sie hervorheben, ist ein historischer Unfall. Sie finden eine Korrelation zwischen Akazienbäumen und Tonsprachen. Verursacht das eine das andere? Tonale Sprachen sind am häufigsten in Afrika zu finden, und Sprachen neigen dazu, sich zu gruppieren, weil sie gemeinsame historische Wurzeln haben. Akazien kommen (hauptsächlich) in Afrika vor. Es gibt keinen großen Einblick in die Korrelation, nur dass Sie in Afrika zwei Dinge gemeinsam haben. Denkt man an die vergleichsweise sichere Straßenlage in Afrika, wird klar, warum es einen Zusammenhang zwischen Akazien und Verkehrsunfällen gibt.
Ein weiteres Merkmal des Herstellens von Verbindungen zwischen Datensätzen besteht darin, dass Korrelationen zufällig auftreten können. Sie können quantifizieren, wie wahrscheinlich es ist, dass ein Ergebnis auf Zufall zurückzuführen ist, aber das allein sagt Ihnen wenig über die Bedeutung des Ergebnisses aus. Wenn ein Ergebnis nur mit einer Wahrscheinlichkeit von 1 % auf Zufall zurückzuführen ist, Sie aber 100 Tests durchgeführt haben, sollten Sie mit etwa einem ungewöhnlichen Ergebnis rechnen. Je mehr Dinge Sie sich ansehen, desto größer ist die Wahrscheinlichkeit, dass falsche Ergebnisse gefunden werden. Das Originalpapier enthält ein praktisches Zitat von Nassim Nicholas Taleb: „Dies ist die Tragödie von Big Data: Je mehr Variablen, desto mehr Korrelationen können Bedeutung zeigen. Falschheit wächst auch schneller als Information; es ist nichtlinear (konvex) in Bezug auf Daten.“
So können Roberts und Winters eine Kette von Scheinkorrelationen zusammenstellen. Es ist ein wertvolles Papier, auf das Sie sich beziehen können, wenn Sie das nächste Mal mit einem Papier konfrontiert werden, das merkwürdige Ergebnisse liefert. Du kannst auch Lesen Sie ihren Blogbeitrag über das Papier.

Literaturhinweis
Roberts S. & Winters J. (2013). Sprachenvielfalt und Verkehrsunfälle: Lehren aus statistischen Studien zu kulturellen Merkmalen.,
Plus eins,DOI: 10.1371 / journal.pone.0070902
Bilder
Die durchschnittliche Zahl der jährlichen Verkehrstoten pro 100,000 Einwohner innerhalb eines Landes als Funktion des Vorkommens von Acacia nilotica. Bild von Seán Roberts und James Winters. [cc]von[/cc]
Korrelation. Bild von Randall Munroe/xkcd. [cc]von-nc[/cc]
