05.06.2013 Aufrufe

Simpsons Paradoxon, Will-Rogers-Phänomen und weitere ...

Simpsons Paradoxon, Will-Rogers-Phänomen und weitere ...

Simpsons Paradoxon, Will-Rogers-Phänomen und weitere ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Spezialthema<br />

<strong>Simpsons</strong> <strong>Paradoxon</strong>, <strong>Will</strong>-<strong>Rogers</strong>-<strong>Phänomen</strong><br />

<strong>und</strong> <strong>weitere</strong> statistische Fallstricke<br />

Eine reale Studie zum Einstieg<br />

Große Studie zu Lebenserwartung <strong>und</strong> Lebensgewohnheiten<br />

in England (Beginn 1972)<br />

1314 Frauen:<br />

582 Raucherinnen<br />

732 Nichtraucherinnen<br />

lebend tot<br />

443<br />

502<br />

20 Jahre später<br />

139<br />

230<br />

Ergebnis: Rauchen bringt eine höhere Lebenserwartung?!<br />

Anteil<br />

lebend<br />

76%<br />

68%<br />

1


Datenmanipulation für Anfänger<br />

Vom Strecken, Auslassen <strong>und</strong> Prozentrechnen<br />

Daten auf der Streckbank<br />

Polizei sagt:<br />

Zahl der Einbrüche ist konstant.<br />

Sicherheitsfirma sagt:<br />

Zahl der Einbrüche steigt stark an.<br />

Beide Darstellungen zeigen dieselben Daten!<br />

2


Reden ist Silber, Schweigen ist Gold<br />

Die rasante Entwicklung einer<br />

frei erf<strong>und</strong>enen Schädlingsart<br />

erfordert dringende Maßnahmen:<br />

Der Käfer wurde zuvor fast völlig<br />

ausgerottet <strong>und</strong> sollte daher<br />

geschützt werden:<br />

Im überlappenden Zeitbereich sind dieselben Daten gezeigt!<br />

Normalerweise wird natürlich immer nur eine Auftragung veröffentlicht...<br />

Mit der Wahrheit lügen: absolut oder relativ?<br />

„Die neue Kläranlage hat eine<br />

hervorragende Auswirkung auf<br />

den Nutzfischbestand.“<br />

Die Berücksichtigung aller<br />

Fischarten ergibt ein ganz<br />

anderes Bild:<br />

Beide Darstellungen basieren auf denselben Rohdaten!<br />

3


Unerwünschte Preissteigerung<br />

Inflationsrate <strong>und</strong> ihre Änderung<br />

Sie wollen als Präsident<br />

wiedergewählt werden.<br />

Leider hat während Ihrer<br />

Amtszeit der Milchpreis<br />

aufgr<strong>und</strong> der Inflation stark<br />

zugenommen...<br />

Ihr Wahlkampf: Sie haben tatsächlich<br />

gute Arbeit geleistet.<br />

Die Inflationsrate wurde seit Ihrem<br />

Amtsantritt 1989 deutlich reduziert!<br />

Selbst wenn die Inflationsrate in Ihrer Amtszeit ansteigt statt abfällt,<br />

kann es noch Rettung geben: „Ich habe in meiner Regierungszeit die<br />

Inflationszunahme klar verringert, Erfolg meiner Wirtschaftspolitik.“<br />

Verwendeter Begriff: Mathematische Größe:<br />

(Milch-)Preis Funktionswert<br />

Inflation 1. Ableitung<br />

Inflationszunahme 2. Ableitung<br />

Verringerung der Zunahme 3. Ableitung<br />

Vorsicht beim<br />

Argumentieren<br />

mit Ableitungen!<br />

4


Datenmanipulation für Fortgeschrittene<br />

<strong>Simpsons</strong> <strong>Paradoxon</strong>, <strong>Will</strong>-<strong>Rogers</strong>-<strong>Phänomen</strong><br />

<strong>und</strong> Gerrymander: Klassen sind klasse<br />

Ein neuer Detektor: besser oder schlechter?<br />

Sie haben mit viel Aufwand einen neuen Teilchendetektor entwickelt,<br />

den zwei verschiedene Arbeitsgruppen für Sie austesten <strong>und</strong> mit dem<br />

etablierten alten Verfahren vergleichen sollen.<br />

Uni Würzburg<br />

1200 Einzelversuche:<br />

200 mit altem Verfahren<br />

1000 mit neuem Detektor<br />

TU München<br />

1200 Einzelversuche:<br />

1000 mit altem Verfahren<br />

200 mit neuem Detektor<br />

Erfolge Misserfolge<br />

150<br />

650<br />

50<br />

350<br />

Erfolge Misserfolge<br />

350<br />

50<br />

650<br />

150<br />

Erfolgs-<br />

Anteil<br />

75%<br />

65%<br />

Erfolgs-<br />

Anteil<br />

35%<br />

25%<br />

Wie ärgerlich: Das alte Verfahren ist in beiden Testreihen besser!<br />

5


Ergebnis in der Publikation<br />

Trotz Ihrer Enttäuschung überzeugen Sie mit viel Mühe den Editor der<br />

Zeitschrift Review of Scientific Instruments, Ihre Ergebnisse dennoch zu<br />

publizieren. Seine Bedingung ist aber: Die Zahl der Schaubilder <strong>und</strong><br />

Tabellen muss gekürzt werden, da wegen der negativen Resultate Ihre<br />

Detektor-Neuentwicklung nun doch nicht so interessant ist.<br />

Sie fassen also die Ergebnisse aus Würzburg <strong>und</strong> München zusammen:<br />

Würzburg + München<br />

2400 Einzelversuche:<br />

1200 mit altem Verfahren<br />

1200 mit neuem Detektor<br />

Erfolge Misserfolge<br />

500<br />

700<br />

700<br />

500<br />

Erfolgs-<br />

Anteil<br />

42%<br />

58%<br />

Großes Erstaunen: Ihr neuer Detektor ist nun plötzlich doch besser!?<br />

<strong>Simpsons</strong> <strong>Paradoxon</strong><br />

Unerlaubtes Zusammenfassen<br />

von Daten unterschiedlicher Klassen/Kategorien:<br />

Statistische Aussagen können verfälscht<br />

<strong>und</strong> sogar ins Gegenteil verkehrt werden!<br />

6


Warum Raucher länger leben als Nichtraucher<br />

Große Studie zu Lebenserwartung <strong>und</strong> Lebensgewohnheiten<br />

in England (Beginn 1972)<br />

1314 Frauen:<br />

582 Raucherinnen<br />

732 Nichtraucherinnen<br />

lebend tot<br />

443<br />

502<br />

20 Jahre später<br />

139<br />

230<br />

Frage: Wie setzen sich die befragten Gruppen zusammen?<br />

Anteil<br />

lebend<br />

76%<br />

68%<br />

Raucherstudie nach Altersgruppen aufgeteilt<br />

Alter 18-44 Jahre<br />

288 Raucherinnen<br />

340 Nichtraucherinnen<br />

Alter 45-64 Jahre<br />

245 Raucherinnen<br />

199 Nichtraucherinnen<br />

Alter >64 Jahre<br />

49 Raucherinnen<br />

193 Nichtraucherinnen<br />

lebend tot<br />

269<br />

327<br />

19<br />

13<br />

lebend tot<br />

167<br />

147<br />

78<br />

52<br />

lebend tot<br />

7<br />

28<br />

42<br />

165<br />

Anteil lebend<br />

93%<br />

96%<br />

Anteil lebend<br />

68%<br />

74%<br />

Anteil lebend<br />

14,3%<br />

14,5%<br />

7


<strong>Will</strong>-<strong>Rogers</strong>-<strong>Phänomen</strong><br />

Sie sind Lehrer an einer Bayerischen Schule. Für eine optimale<br />

Förderung unterrichten Sie Ihre Klasse in zwei getrennten Gruppen:<br />

a) lernstärkere Schüler, b) lernschwächere Schüler.<br />

Trotz Ihrer Mühen haben beide Gruppen beim letzten PISA-Test nach<br />

Meinung des Schuldirektors zu schlecht abgeschnitten.<br />

Die Durchschnittsnoten waren: a) 3,0 <strong>und</strong> b) 5,5.<br />

Hier ist die Notentabelle:<br />

Gruppe<br />

a)<br />

b)<br />

Name<br />

Daniela<br />

Verena<br />

Thomas<br />

Katrin<br />

Julian<br />

1. Note 2. Note<br />

2<br />

3<br />

4<br />

5<br />

6<br />

Ein <strong>weitere</strong>r Test etwas später brachte leider keine Veränderung,<br />

aber Ihre Beförderung hängt von einem besseren Ergebnis ab!<br />

<strong>Will</strong>-<strong>Rogers</strong>-<strong>Phänomen</strong><br />

Sie hören in einer alten Fernsehshow einen Witz des amerikanischen<br />

Komikers <strong>Will</strong> <strong>Rogers</strong> <strong>und</strong> kommen auf die Idee, die Lerngruppen<br />

neu einzuteilen:<br />

Gruppe<br />

a)<br />

b)<br />

Name<br />

Daniela<br />

Verena<br />

Thomas<br />

Katrin<br />

Julian<br />

Die Neueinteilung der Lerngruppen verbessert die durchschnittliche<br />

Leistung in beiden Gruppen um eine halbe Note, ein „großer Erfolg“<br />

Ihrer neuen Unterrichtsmethode.<br />

2<br />

3<br />

4<br />

5<br />

6<br />

1. Note 2. Note<br />

2<br />

3<br />

4<br />

5<br />

6<br />

Der Schuldirektor ist nur an den Durchschnittswerten interessiert<br />

<strong>und</strong> Ihre Beförderung ist gerettet...<br />

2<br />

3<br />

4<br />

5<br />

6<br />

8


Gerrymandering: <strong>Will</strong> <strong>Rogers</strong> in der Politik<br />

Amtsinhaber Herr Schwarz hat 35 Anhänger, Frau Weiß 46 Anhänger.<br />

Es wird nach Wahlbezirken abgerechnet (s. US-Präsidentschaftswahl).<br />

Bezirke nach Zeilen:<br />

Herr Schwarz würde<br />

nur 3 von 9 Bezirken<br />

gewinnen <strong>und</strong> damit<br />

insgesamt die Wahl<br />

verlieren.<br />

Gerrymandering: <strong>Will</strong> <strong>Rogers</strong> in der Politik<br />

Amtsinhaber Herr Schwarz hat 35 Anhänger, Frau Weiß 46 Anhänger.<br />

Es wird nach Wahlbezirken abgerechnet (s. US-Präsidentschaftswahl).<br />

Bezirke nach Spalten: Herr Schwarz würde wieder nur 3 von 9<br />

Bezirken gewinnnen.<br />

9


Gerrymandering: <strong>Will</strong> <strong>Rogers</strong> in der Politik<br />

Da Herr Schwarz noch im Amt ist, erlässt er ein Wahlgesetz zur<br />

Neueinteilung der neun (gleich großen) Wahlbezirke wie folgt:<br />

Reale Gerrymander<br />

Wahlkreis von Elbridge Gerry<br />

(Gouverneur von Massachusetts 1812)<br />

Gerry + Salamander = Gerrymander<br />

Jetzt gewinnt er<br />

(mit Ausnahme der grauen Bereiche)<br />

in 7 von 9 Bezirken!<br />

Ein 9:0-Sieg für Frau Weiß wäre auch<br />

möglich, wenn sie an der Macht wäre.<br />

Moderne Gerrymander (USA)<br />

US-Gerichtsurteil: Gerrymandering ist rechtsgültig, wenn es aus<br />

„politischen“ <strong>und</strong> nicht aus „rassistischen“ Gründen praktiziert wird.<br />

10


Datenmanipulation für Profis<br />

Korrelation <strong>und</strong> Kausalität<br />

Was bedeutet Korrelation?<br />

B<br />

A<br />

Beobachtung:<br />

A <strong>und</strong> B sind korreliert.<br />

Mögliche Erklärungen:<br />

1) A ist die Ursache von B.<br />

2) B ist die Ursache von A.<br />

3) A <strong>und</strong> B haben eine gemeinsame Ursache.<br />

4) Die Korrelation beruht auf einem systematischen Fehler.<br />

5) Die Korrelation ist zufällig, trotz statistischer Signifikanz.<br />

Oft wird aus Korrelation fälschlicherweise auf Erklärung 1) geschlossen.<br />

11


Korrelation = Ursache?<br />

Statistische Untersuchung ergibt: A <strong>und</strong> B sind korreliert.<br />

Beispiele für unzulässige Schlussfolgerungen „A verursacht B“:<br />

1) A = Hahnenkrähen, B = Sonnenaufgang<br />

2) A = Zahl der Feuerwehrleute beim Einsatz, B = Größe des Schadens<br />

3) A = Lange Verweilzeit im Krankenhaus, B = Schlechtes Befinden<br />

4) A = Tägliches Spazierengehen, B = Höhere Lebenserwartung<br />

Eine Ursache-Wirkung-Beziehung führt immer zu einer Korrelation.<br />

Der Umkehrschluss gilt nicht!<br />

Ursache für den Geburtenrückgang<br />

Es gibt eine klare Korrelation.<br />

Man erkennt auch: Störche werden erst ab ihrem zweiten Lebensjahr<br />

für Lieferungen eingesetzt (siehe Anstiege 1977/78 bzw. 1979/80)...<br />

12


Zusammenfassung: Das tägliche Glas Rotwein<br />

Schwerkranke Ges<strong>und</strong>e<br />

Literatur<br />

Lebensverlängernde Wirkung<br />

von 20...39 g Alkohol pro Tag:<br />

Bild der Wissenschaft 11, 66 (1997)<br />

Die verschiedenen Möglichkeiten zur<br />

Datenmanipulation hier kombiniert:<br />

1) Daten auf der Streckbank<br />

2) Simpson <strong>und</strong> <strong>Will</strong> <strong>Rogers</strong><br />

3) Korrelation ⇒ Kausalität<br />

Alkoholiker<br />

Wer täglich ein Glas<br />

Rotwein trinkt, ist<br />

wahrscheinlich nur<br />

weder schwerkrank<br />

noch Alkoholiker.<br />

Die meisten Beispiele stammen aus diesen drei hervorragenden,<br />

unterhaltsamen <strong>und</strong> sehr empfehlenswerten Büchern:<br />

13


Frage des Tages<br />

Sie wollen wieder Präsident werden. Leider lag in<br />

Ihrer gerade abgelaufenen Amtszeit von 10 Jahren<br />

die Inflationsrate bei 19,3%, aber bei Ihrem Gegner,<br />

der zuvor 10 Jahre regierte, nur bei 11,0%.<br />

Wie argumentieren Sie im Wahlkampf?<br />

14

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!