Irreführende Intuition in der Statistik – das Simpson-Paradoxon (Folge 17)
Manage episode 458674772 series 3632739
Auch zu Beginn des neuen Jahres 2024 beschäftigt sich das Streuspanne-Team sich mit einem (vermeintlichen) statistischen Paradoxon. Was ist das Simpson-Paradoxon? Wie kann es eine sinnvolle Datenanalyse beeinflussen? Und wie kann man verhindern, dass man darauf reinfällt?
Das Simpson-Paradoxon beschreibt die Situation, wo eine statistische Bewertung einer gesamten Population ein anderes Ergebnis liefert als eine analoge Analyse auf den einzelnen Teilpopulationen. Ein Beipsiel: So kann es sein, dass das mittlere Einkommen in allen Bildungsschichten einer Bevölkerung abnimmt, während das mittlere Einkommen der gesamten Bevölkerung zunimmt.
Wie nun genau lässt sich dieser scheinbare Widerspruch auflösen? Warum muss man sich als Statistiker:in und Fan von Datenanalysen damit überhaupt beschäftigen? Wo taucht dieses Paradoxon in der realen Welt auf und wie kann man verhindern, dass man dieser irreführenden Intuition erliegt?
All diese Fragen diskutieren in der neuen Podcastfolge »Irreführende Intuition in der Statistik – das Simpson-Paradoxon« unsere bloggenden Statistiker Dr. Sascha Feth und Dr. Jochen Fiedler mit Moderatorin Esther Packullat. Dabei orientiert sich das Team an praktischen Beispielen, die das Paradoxon und seiner Bedeutung in der Praxis mit Leben befüllen. Gleichzeitig warnen sie damit vor zu oberflächlichen oder gar absichtlich irreführenden Analysen, denn das Paradoxon eignet sich ebenso zur gezielten Manipulation. Denn auch hier gilt wieder: Traue keiner Statistik, die Du nicht… sehr gut verstanden hast!
Das Zahlenbeispiel aus der Folge: An zwei Tagen nehmen jeweils 50 Personen an einem Test teil. An Tag 1 10 Frauen und 40 Männer, an Tag 2 genau umgekehrt: 40 Frauen und 10 Männer. Nun kommt es zu folgenden Durchfallquoten im Test:
- Tag 1, Frauen: 5 von 10, also 50 Prozent
- Tag 1, Männer: 16 von 40, also 40 Prozent (weniger als die Frauen)
- Tag 2, Frauen: 12 von 40, also 30 Prozent
- Tag 2, Männer: 2 von 10, also 20 Prozent (weniger als die Frauen)
- Gesamt, Frauen: 17 von 50, also 34 Prozent
- Gesamt, Männer: 18 von 50, also 46 Prozent (mehr als die Frauen)
Buchtipps, die in der aktuellen Folge angesprochen werden:
Zum US-Wahlen-Beispiel:
Die verflixte Mathematik der Demokratie von George G. Szpiro
Zur Gender Data Gap:
Unsichtbare Frauen – Wie eine von Daten beherrschte Welt die Hälfte der Bevölkerung ignoriert von Caroline Criado-Perez
Ihr habt ein ebenso irreführendes Phänomen, das wir besprechen sollen oder eine Statistik in den Medien entdeckt und wollt, dass wir sie in der »Streuspanne« zum Thema machen? Oder Euch ist ein mathematisches Zahlen- oder Gedankenspiel aufgefallen? Dann meldet Euch gerne über presse@itwm.fraunhofer.de bei uns.
34 قسمت