Simpsons Paradoxon, Will-Rogers-Phänomen und weitere ...
Simpsons Paradoxon, Will-Rogers-Phänomen und weitere ...
Simpsons Paradoxon, Will-Rogers-Phänomen und weitere ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Spezialthema<br />
<strong>Simpsons</strong> <strong>Paradoxon</strong>, <strong>Will</strong>-<strong>Rogers</strong>-<strong>Phänomen</strong><br />
<strong>und</strong> <strong>weitere</strong> statistische Fallstricke<br />
Eine reale Studie zum Einstieg<br />
Große Studie zu Lebenserwartung <strong>und</strong> Lebensgewohnheiten<br />
in England (Beginn 1972)<br />
1314 Frauen:<br />
582 Raucherinnen<br />
732 Nichtraucherinnen<br />
lebend tot<br />
443<br />
502<br />
20 Jahre später<br />
139<br />
230<br />
Ergebnis: Rauchen bringt eine höhere Lebenserwartung?!<br />
Anteil<br />
lebend<br />
76%<br />
68%<br />
1
Datenmanipulation für Anfänger<br />
Vom Strecken, Auslassen <strong>und</strong> Prozentrechnen<br />
Daten auf der Streckbank<br />
Polizei sagt:<br />
Zahl der Einbrüche ist konstant.<br />
Sicherheitsfirma sagt:<br />
Zahl der Einbrüche steigt stark an.<br />
Beide Darstellungen zeigen dieselben Daten!<br />
2
Reden ist Silber, Schweigen ist Gold<br />
Die rasante Entwicklung einer<br />
frei erf<strong>und</strong>enen Schädlingsart<br />
erfordert dringende Maßnahmen:<br />
Der Käfer wurde zuvor fast völlig<br />
ausgerottet <strong>und</strong> sollte daher<br />
geschützt werden:<br />
Im überlappenden Zeitbereich sind dieselben Daten gezeigt!<br />
Normalerweise wird natürlich immer nur eine Auftragung veröffentlicht...<br />
Mit der Wahrheit lügen: absolut oder relativ?<br />
„Die neue Kläranlage hat eine<br />
hervorragende Auswirkung auf<br />
den Nutzfischbestand.“<br />
Die Berücksichtigung aller<br />
Fischarten ergibt ein ganz<br />
anderes Bild:<br />
Beide Darstellungen basieren auf denselben Rohdaten!<br />
3
Unerwünschte Preissteigerung<br />
Inflationsrate <strong>und</strong> ihre Änderung<br />
Sie wollen als Präsident<br />
wiedergewählt werden.<br />
Leider hat während Ihrer<br />
Amtszeit der Milchpreis<br />
aufgr<strong>und</strong> der Inflation stark<br />
zugenommen...<br />
Ihr Wahlkampf: Sie haben tatsächlich<br />
gute Arbeit geleistet.<br />
Die Inflationsrate wurde seit Ihrem<br />
Amtsantritt 1989 deutlich reduziert!<br />
Selbst wenn die Inflationsrate in Ihrer Amtszeit ansteigt statt abfällt,<br />
kann es noch Rettung geben: „Ich habe in meiner Regierungszeit die<br />
Inflationszunahme klar verringert, Erfolg meiner Wirtschaftspolitik.“<br />
Verwendeter Begriff: Mathematische Größe:<br />
(Milch-)Preis Funktionswert<br />
Inflation 1. Ableitung<br />
Inflationszunahme 2. Ableitung<br />
Verringerung der Zunahme 3. Ableitung<br />
Vorsicht beim<br />
Argumentieren<br />
mit Ableitungen!<br />
4
Datenmanipulation für Fortgeschrittene<br />
<strong>Simpsons</strong> <strong>Paradoxon</strong>, <strong>Will</strong>-<strong>Rogers</strong>-<strong>Phänomen</strong><br />
<strong>und</strong> Gerrymander: Klassen sind klasse<br />
Ein neuer Detektor: besser oder schlechter?<br />
Sie haben mit viel Aufwand einen neuen Teilchendetektor entwickelt,<br />
den zwei verschiedene Arbeitsgruppen für Sie austesten <strong>und</strong> mit dem<br />
etablierten alten Verfahren vergleichen sollen.<br />
Uni Würzburg<br />
1200 Einzelversuche:<br />
200 mit altem Verfahren<br />
1000 mit neuem Detektor<br />
TU München<br />
1200 Einzelversuche:<br />
1000 mit altem Verfahren<br />
200 mit neuem Detektor<br />
Erfolge Misserfolge<br />
150<br />
650<br />
50<br />
350<br />
Erfolge Misserfolge<br />
350<br />
50<br />
650<br />
150<br />
Erfolgs-<br />
Anteil<br />
75%<br />
65%<br />
Erfolgs-<br />
Anteil<br />
35%<br />
25%<br />
Wie ärgerlich: Das alte Verfahren ist in beiden Testreihen besser!<br />
5
Ergebnis in der Publikation<br />
Trotz Ihrer Enttäuschung überzeugen Sie mit viel Mühe den Editor der<br />
Zeitschrift Review of Scientific Instruments, Ihre Ergebnisse dennoch zu<br />
publizieren. Seine Bedingung ist aber: Die Zahl der Schaubilder <strong>und</strong><br />
Tabellen muss gekürzt werden, da wegen der negativen Resultate Ihre<br />
Detektor-Neuentwicklung nun doch nicht so interessant ist.<br />
Sie fassen also die Ergebnisse aus Würzburg <strong>und</strong> München zusammen:<br />
Würzburg + München<br />
2400 Einzelversuche:<br />
1200 mit altem Verfahren<br />
1200 mit neuem Detektor<br />
Erfolge Misserfolge<br />
500<br />
700<br />
700<br />
500<br />
Erfolgs-<br />
Anteil<br />
42%<br />
58%<br />
Großes Erstaunen: Ihr neuer Detektor ist nun plötzlich doch besser!?<br />
<strong>Simpsons</strong> <strong>Paradoxon</strong><br />
Unerlaubtes Zusammenfassen<br />
von Daten unterschiedlicher Klassen/Kategorien:<br />
Statistische Aussagen können verfälscht<br />
<strong>und</strong> sogar ins Gegenteil verkehrt werden!<br />
6
Warum Raucher länger leben als Nichtraucher<br />
Große Studie zu Lebenserwartung <strong>und</strong> Lebensgewohnheiten<br />
in England (Beginn 1972)<br />
1314 Frauen:<br />
582 Raucherinnen<br />
732 Nichtraucherinnen<br />
lebend tot<br />
443<br />
502<br />
20 Jahre später<br />
139<br />
230<br />
Frage: Wie setzen sich die befragten Gruppen zusammen?<br />
Anteil<br />
lebend<br />
76%<br />
68%<br />
Raucherstudie nach Altersgruppen aufgeteilt<br />
Alter 18-44 Jahre<br />
288 Raucherinnen<br />
340 Nichtraucherinnen<br />
Alter 45-64 Jahre<br />
245 Raucherinnen<br />
199 Nichtraucherinnen<br />
Alter >64 Jahre<br />
49 Raucherinnen<br />
193 Nichtraucherinnen<br />
lebend tot<br />
269<br />
327<br />
19<br />
13<br />
lebend tot<br />
167<br />
147<br />
78<br />
52<br />
lebend tot<br />
7<br />
28<br />
42<br />
165<br />
Anteil lebend<br />
93%<br />
96%<br />
Anteil lebend<br />
68%<br />
74%<br />
Anteil lebend<br />
14,3%<br />
14,5%<br />
7
<strong>Will</strong>-<strong>Rogers</strong>-<strong>Phänomen</strong><br />
Sie sind Lehrer an einer Bayerischen Schule. Für eine optimale<br />
Förderung unterrichten Sie Ihre Klasse in zwei getrennten Gruppen:<br />
a) lernstärkere Schüler, b) lernschwächere Schüler.<br />
Trotz Ihrer Mühen haben beide Gruppen beim letzten PISA-Test nach<br />
Meinung des Schuldirektors zu schlecht abgeschnitten.<br />
Die Durchschnittsnoten waren: a) 3,0 <strong>und</strong> b) 5,5.<br />
Hier ist die Notentabelle:<br />
Gruppe<br />
a)<br />
b)<br />
Name<br />
Daniela<br />
Verena<br />
Thomas<br />
Katrin<br />
Julian<br />
1. Note 2. Note<br />
2<br />
3<br />
4<br />
5<br />
6<br />
Ein <strong>weitere</strong>r Test etwas später brachte leider keine Veränderung,<br />
aber Ihre Beförderung hängt von einem besseren Ergebnis ab!<br />
<strong>Will</strong>-<strong>Rogers</strong>-<strong>Phänomen</strong><br />
Sie hören in einer alten Fernsehshow einen Witz des amerikanischen<br />
Komikers <strong>Will</strong> <strong>Rogers</strong> <strong>und</strong> kommen auf die Idee, die Lerngruppen<br />
neu einzuteilen:<br />
Gruppe<br />
a)<br />
b)<br />
Name<br />
Daniela<br />
Verena<br />
Thomas<br />
Katrin<br />
Julian<br />
Die Neueinteilung der Lerngruppen verbessert die durchschnittliche<br />
Leistung in beiden Gruppen um eine halbe Note, ein „großer Erfolg“<br />
Ihrer neuen Unterrichtsmethode.<br />
2<br />
3<br />
4<br />
5<br />
6<br />
1. Note 2. Note<br />
2<br />
3<br />
4<br />
5<br />
6<br />
Der Schuldirektor ist nur an den Durchschnittswerten interessiert<br />
<strong>und</strong> Ihre Beförderung ist gerettet...<br />
2<br />
3<br />
4<br />
5<br />
6<br />
8
Gerrymandering: <strong>Will</strong> <strong>Rogers</strong> in der Politik<br />
Amtsinhaber Herr Schwarz hat 35 Anhänger, Frau Weiß 46 Anhänger.<br />
Es wird nach Wahlbezirken abgerechnet (s. US-Präsidentschaftswahl).<br />
Bezirke nach Zeilen:<br />
Herr Schwarz würde<br />
nur 3 von 9 Bezirken<br />
gewinnen <strong>und</strong> damit<br />
insgesamt die Wahl<br />
verlieren.<br />
Gerrymandering: <strong>Will</strong> <strong>Rogers</strong> in der Politik<br />
Amtsinhaber Herr Schwarz hat 35 Anhänger, Frau Weiß 46 Anhänger.<br />
Es wird nach Wahlbezirken abgerechnet (s. US-Präsidentschaftswahl).<br />
Bezirke nach Spalten: Herr Schwarz würde wieder nur 3 von 9<br />
Bezirken gewinnnen.<br />
9
Gerrymandering: <strong>Will</strong> <strong>Rogers</strong> in der Politik<br />
Da Herr Schwarz noch im Amt ist, erlässt er ein Wahlgesetz zur<br />
Neueinteilung der neun (gleich großen) Wahlbezirke wie folgt:<br />
Reale Gerrymander<br />
Wahlkreis von Elbridge Gerry<br />
(Gouverneur von Massachusetts 1812)<br />
Gerry + Salamander = Gerrymander<br />
Jetzt gewinnt er<br />
(mit Ausnahme der grauen Bereiche)<br />
in 7 von 9 Bezirken!<br />
Ein 9:0-Sieg für Frau Weiß wäre auch<br />
möglich, wenn sie an der Macht wäre.<br />
Moderne Gerrymander (USA)<br />
US-Gerichtsurteil: Gerrymandering ist rechtsgültig, wenn es aus<br />
„politischen“ <strong>und</strong> nicht aus „rassistischen“ Gründen praktiziert wird.<br />
10
Datenmanipulation für Profis<br />
Korrelation <strong>und</strong> Kausalität<br />
Was bedeutet Korrelation?<br />
B<br />
A<br />
Beobachtung:<br />
A <strong>und</strong> B sind korreliert.<br />
Mögliche Erklärungen:<br />
1) A ist die Ursache von B.<br />
2) B ist die Ursache von A.<br />
3) A <strong>und</strong> B haben eine gemeinsame Ursache.<br />
4) Die Korrelation beruht auf einem systematischen Fehler.<br />
5) Die Korrelation ist zufällig, trotz statistischer Signifikanz.<br />
Oft wird aus Korrelation fälschlicherweise auf Erklärung 1) geschlossen.<br />
11
Korrelation = Ursache?<br />
Statistische Untersuchung ergibt: A <strong>und</strong> B sind korreliert.<br />
Beispiele für unzulässige Schlussfolgerungen „A verursacht B“:<br />
1) A = Hahnenkrähen, B = Sonnenaufgang<br />
2) A = Zahl der Feuerwehrleute beim Einsatz, B = Größe des Schadens<br />
3) A = Lange Verweilzeit im Krankenhaus, B = Schlechtes Befinden<br />
4) A = Tägliches Spazierengehen, B = Höhere Lebenserwartung<br />
Eine Ursache-Wirkung-Beziehung führt immer zu einer Korrelation.<br />
Der Umkehrschluss gilt nicht!<br />
Ursache für den Geburtenrückgang<br />
Es gibt eine klare Korrelation.<br />
Man erkennt auch: Störche werden erst ab ihrem zweiten Lebensjahr<br />
für Lieferungen eingesetzt (siehe Anstiege 1977/78 bzw. 1979/80)...<br />
12
Zusammenfassung: Das tägliche Glas Rotwein<br />
Schwerkranke Ges<strong>und</strong>e<br />
Literatur<br />
Lebensverlängernde Wirkung<br />
von 20...39 g Alkohol pro Tag:<br />
Bild der Wissenschaft 11, 66 (1997)<br />
Die verschiedenen Möglichkeiten zur<br />
Datenmanipulation hier kombiniert:<br />
1) Daten auf der Streckbank<br />
2) Simpson <strong>und</strong> <strong>Will</strong> <strong>Rogers</strong><br />
3) Korrelation ⇒ Kausalität<br />
Alkoholiker<br />
Wer täglich ein Glas<br />
Rotwein trinkt, ist<br />
wahrscheinlich nur<br />
weder schwerkrank<br />
noch Alkoholiker.<br />
Die meisten Beispiele stammen aus diesen drei hervorragenden,<br />
unterhaltsamen <strong>und</strong> sehr empfehlenswerten Büchern:<br />
13
Frage des Tages<br />
Sie wollen wieder Präsident werden. Leider lag in<br />
Ihrer gerade abgelaufenen Amtszeit von 10 Jahren<br />
die Inflationsrate bei 19,3%, aber bei Ihrem Gegner,<br />
der zuvor 10 Jahre regierte, nur bei 11,0%.<br />
Wie argumentieren Sie im Wahlkampf?<br />
14