Achtung Statistik (3)

Heute geht es um K und K, nicht die Kaffee und Kuchen Monarchie von Österreich Ungarn, sondern um

Korrelation und Kausalität

Korrelationen sind Zusammenhänge, Wenn-Dann-Beziehungen. Zum Beispiel könnte man statistisch feststellen, dass wenn besonders viele Störche nisten, besonders viele Kinder geboren werden. Es besteht also eine hohe Korrelation zwischen Anzahl Störche und Anzahl Geburten bei Menschen.

Kausalzusammenhänge oder Ursache-Wirkungsbeziehungen hingegen lassen sich nicht mit Statistiken feststellen. Aus obiger Statistik folgt eben NICHT, dass die Störche für die hohen Geburtenraten ursächlich verantwortlich sind.

Aus einer Kausalbeziehung folgt natürlich eine hohe Korrelation. Ist es draußen kalt, frieren viele Menschen und ziehen deshalb eine dicke Jacke an. Die Ursache Kälte ist für die Wirkung dicke Jacke verantwortlich. Wenn jetzt jemand die Temperatur misst, und die Anzahl der Menschen mit dicken Jacken zählt, wird er auch hier eine hohe Korrelation zwischen Kälte und dicke Jacke finden.

Umgekehrt muss das aber nicht sein. Nur weil eine statistische Korrelation vorliegt, muss nicht das eine Ursache des anderen sein. Formal: Wenn A und B korrelieren, kann A die Ursache für B sein, B die Ursache für A, oder C die Ursache für A und B.

So klar diese Tatsache beim Storchenbeispiel ist, so gern wird dieser Fehler bei anderen Themen von einer Mehrheit begangen.

Nehmen wir an, wir finden eine hohe Korrelation zwischen der Zeit, die jemand brutale Computerspiele spielt und seiner Aggressivität. Wir stellen fest, WENN jemand viel spielt, DANN ist er besonders aggressiv.

Viele begehen jetzt schon – nur aufgrund dieses Zusammenhangs – davon aus, dass die Computerspiele die Aggressivität auslösen. Sie denken also, WEIL jemand viel spielt, ist er besonders aggressiv.

Nach unserem Formalismus wären aber verschiedene Kausalzusammenhänge denkbar:

  1. Weil jemand viel spielt, wird er aggressiv.
  2. Weil jemand aggressiv ist, spielt er viele brutale Spiele.
  3. Aus Grund C wird jemand aggressiv und spielt gerne brutale Spiele.

Grund C kann hier durch vielfältige Ursachen ersetzt werden. Vielleicht wurde er von den Eltern geschlagen, was Aggressivität und die Flucht aus der Realität ins Spiel befördert etc. Erst durch Experimente können Ursache-Wirkungs-Beziehungen festgestellt werden. Ohne diese (und gerade bei diesem Thema ist es ethisch schwer vertretbar gute wissenschaftliche Experimente durchzuführen) kann man zur Ursache keine Angaben machen.

Fazit: Wirft jemand mit einer Statistik um sich, um damit eine Kausalbeziehung zu belegen, ist äußerste Vorsicht geboten.

Bleibt skeptisch!

Euer Alien

Achtung Statistik (2)

Heute mal ein paar einfache Sachen, die man leider immer mal wieder sieht. Es gibt genügend Beispiele, wie man Statistiken so auslegen und per Diagramm darstellen kann, damit sie besser die eigene Meinung widerspiegeln. Wie immer in dieser Reihe geht es um nicht gefälschte Statistiken (was es ja auch gibt). Obwohl eine Statistik also wahr ist, kann sie oft von zwei gegensätzlichen Parteien verwendet werden.

Erste Methode: Umdrehen.

Jüngstes Beispiel: „22 Prozent der Muslime wollen sich nicht integrieren!“, titelt die Bildzeitung. „78 Prozent der Muslime wollen sich integrieren!“, titelt die taz.

Zweite Methode: Diagramm ohne Null darstellen.

Der Polizeichef möchte einen fulminanten Rückgang der Kriminalität veranschaulichen, den es so gar nicht gab. Zwar ist die Anzahl der Verbrechen leicht gesunken, aber nur um 0,01 %. Macht nichts:

Diagramme

Das obere Diagramm würde der Polizeichef verwenden um zu demonstrieren, wie erfolgreich seine Arbeit die Kriminalität einschränkt. Das untere Diagramm zeigt realistischer die Größenordnung, die sich verändert hat: praktisch gar nicht. Von 10.000 Verbrechen im Jahr 2010 waren es im Jahr 2011 „nur“ noch 9.999 und 2012 „nur“ noch 9.998.

Fehlt also die 0 im Diagramm, oder sind über der 0 zwei Striche, so dass ein Teil der Hochwert-Achse ausgelassen wird, vorsichtig sein mit der Interpretation.

So das wars mit der leichten Kost für heute. Bis zum nächsten mal.

Euer Alien

Achtung Statistik (1)

Statistiken sind eine heimtückische Sache. Man kann mit ihnen einen Sachverhalt „beweisen“, leider aber das genaue Gegenteil ebenfalls, teilweise mit der selben Statistik. Also Vorsicht! In loser Folge werde ich deshalb interessante Tricks und Paradoxien vorstellen, die zeigen, wie gefährlich es sein kann, mit Statistiken zu argumentieren.

Heute geht es um ein Paradoxon, dass ein Mathematiker namens Simpson entdeckt hat. Das nach ihm benannte Simpson-Paradoxon lässt sich an vielen Beispielen demonstrieren. Fangen wir direkt mit dem schlimmsten an:

Stellt euch vor, ihr wärt Gesundheitsminister eines Staates, in dem sich seit Kurzem eine Krankheit verbreitet, die oft tödlich endet. Ihr werdet aufgefordert, ein Medikament zuzulassen, oder eben die Zulassung zu verweigern. Glücklicherweise hat der Nachbarstaat schon viel Erfahrung mit dem Wirkstoff sammeln können. Die Vertreter der Pharma-Industrie, die sich von dem massenhaften Verkauf der Arznei viel Geld erwarten, präsentieren euch folgende wahre Statistik:

12 Millionen Menschen mit der Erkrankung wurden erfasst. Von 6 Millionen Menschen, die das Medikament eingenommen haben starben 2 Millionen. Von 6 Millionen Menschen, die das Medikament nicht eingenommen haben starben hingegen 4 Millionen.

Wie würdet ihr entscheiden?

Angesichts der Vielzahl an mehr geretteten Personen, würden wir wohl alle zum Schluss neigen: Ja, lasst das Medikament zu.

Ein Kritiker der Pharma-Industrie meldet sich nun zu Wort. Er präsentiert Ihnen folgende wahre Statistik, die sich zu hundert Prozent mit denen der Pharma-Industrie deckt:

Die obigen 12 Millionen waren unterteilt in Männer und Frauen. Es gab 6 Millionen Männer und 6 Millionen Frauen.

  • Von den Frauen nahmen 1 Million das Medikament. Diese 1 Million sind alle verstorben. Von den 5 Millionen Frauen, die kein Medikament genommen haben, sind 4 Millionen verstorben.
  • Bei den Männern nahmen 5 Million das Medikament. 1 Million davon sind verstorben. Von den 1 Million Männern, die das Medikament nicht genommen haben, ist keiner gestorben.

Rechnen wir zusammen bedeutet das: Bei den Frauen sind 100 % der Medikamenten-Einnehmer verstorben, aber nur 80 % derer, die das Medikament verweigert haben. Bei den Männern sind 20 % der Medikamenten-Einnehmer verstorben, und 0 % bei den Medikamenten-Verweigerern.

Sowohl für Männer, als auch für Frauen, ist es also nach dieser Statistik besser, das Medikament NICHT zu nehmen. Obwohl die Zahlen der Pharma-Firma stimmen:

Von 6 Milllionen Medikamenten-Nehmern (5 Million Männer und 1 Million Frauen) sind 2 Millionen gestorben (1 Million Männer und 1 Million Frauen), während von den 6 Millionen Medikamenten-Verweigerern (1 Million Männer und 5 Millionen Frauen) 4 Millionen gestorben sind (0 Männer und 4 Millionen Frauen).

Wer hat also Recht?

Weniger tödlich ist ein Beispiel, dass Simpson an einer Universität entdeckt hat, in der weniger Frauen als Männer angenommen wurden, und man von einer Diskriminierung ausging. Als Simpson alle Fachbereiche getrennt betrachtet hatte, stellte er fest, dass in allen Fachbereichen ein höherer Prozentsatz an Frauen angenommen wurde. Wurden also in Wahrheit die Männer diskriminiert?

Verwirrte Grüße

Euer Alien