Wann gebraucht man Boxplots? - Stochastik in der Schule
Wann gebraucht man Boxplots? - Stochastik in der Schule
Wann gebraucht man Boxplots? - Stochastik in der Schule
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
<strong>Wann</strong> <strong>gebraucht</strong> <strong>man</strong> <strong>Boxplots</strong>?<br />
Von Gary Ka<strong>der</strong> und Mike Perry<br />
übersetzt und bearbeitet von Gerhard König<br />
Zusammenfassung: Nach e<strong>in</strong>er Beschreibung <strong>der</strong> Tecbnik <strong>der</strong> Boxploterstellung <strong>in</strong> <strong>der</strong> Explorativen<br />
Datenanalyse werden Verwendungsmöglichkeiten diskutiert. Speziell wird aufgezeigt,<br />
wie Mißbräuche zu vermeiden s<strong>in</strong>d.<br />
<strong>Boxplots</strong> (Box-plot-Diagramme, verdeutscht auch Kastendiagramme, Kastenschaubil<strong>der</strong>)<br />
benutzt <strong>man</strong>, um die Verteilung von Daten geeignet graphisch darzustellen.<br />
Dabei werden nicht nur die e<strong>in</strong>zelnen Daten dargestellt, son<strong>der</strong>n es<br />
wird auch ihre Streuung sichtbar. Beson<strong>der</strong>s gut geeignet s<strong>in</strong>d diese Darstellungen<br />
fiir den Vergleich von zwei verschiedenen Datensätzen.<br />
<strong>Boxplots</strong> werden nicht nur <strong>in</strong> <strong>der</strong> sog. Explorativen Datenanalyse e<strong>in</strong>gesetzt, son<strong>der</strong>n<br />
haben auch wegen ihrer E<strong>in</strong>fachheit und Vielseitigkeit E<strong>in</strong>gang <strong>in</strong> Curricula<br />
und Lehrplänen gefunden. E<strong>in</strong> zu häufiger E<strong>in</strong>satz <strong>in</strong> Büchern und im Unterricht<br />
bedeutet aber auch, daß die Gefahr e<strong>in</strong>es Mißbrauchs besteht. Die Konstruktion<br />
von <strong>Boxplots</strong> mag e<strong>in</strong>fach se<strong>in</strong>, <strong>der</strong>en geignete Anwendung und Interpretation ist<br />
jedoch vom statistischen Standpunkt aus vielschichtig und komplex. In diesem<br />
Beitrag wird daher etwas konkreter über mißbräuchliche Verwendungen von<br />
<strong>Boxplots</strong> berichtet und diskutiert, warum dies geschah und wie wir im Unterricht<br />
solche Mißbräuche vermeiden können.<br />
Was s<strong>in</strong>d <strong>Boxplots</strong>?<br />
E<strong>in</strong> Boxplot ist e<strong>in</strong>e graphische Darstellung, die die Lage und Ausdehnung jedes<br />
Quartils <strong>in</strong> <strong>der</strong> Verteilung <strong>der</strong> Daten graphisch darstellt. Fünf wesentliche Kenngrößen<br />
bestimmen die Grundform e<strong>in</strong>es <strong>Boxplots</strong>: M<strong>in</strong>imum, Unteres Quartil,<br />
Median, Oberes Quartil, Maximum (s.Abbildung). Manchmal werden auch noch<br />
sog. Ausreißer beson<strong>der</strong>s gekennzeichnet.<br />
I I I<br />
/ !<br />
I , "<br />
M<strong>in</strong>imum untere Quartile Median obere Quartile Maximum<br />
<strong>Stochastik</strong> <strong>in</strong> <strong>der</strong> <strong>Schule</strong> 17(1997)1, S.3-7<br />
Übersetzung aus Teach<strong>in</strong>g Statistics 18(1996)2, S.39-41
Jede vernünftige Interpretation würde<br />
suggerieren, daß beide Autos gleich<br />
wert seien. Die beiden <strong>Boxplots</strong> stellen<br />
die hypothetischen Daten <strong>der</strong> Tab.<br />
2 graphisch dar. Die Mediane s<strong>in</strong>d<br />
"gleich", s<strong>in</strong>d aber doch wie<strong>der</strong><br />
"verschieden". Beide Mediane haben<br />
den Wert 20. Aber <strong>der</strong> Median für das<br />
Auto x ist die Komfort-E<strong>in</strong>schätzung,<br />
für das Auto y dagegen die Freude am<br />
Fahren. Ähnliche Unterschiede gibt es<br />
für die Quartile sowie für Maximum<br />
und M<strong>in</strong>imum, obwohl die entspre-<br />
6<br />
30<br />
2.<br />
27<br />
2.<br />
26<br />
2.<br />
23<br />
22<br />
R 21<br />
r 20<br />
i 1.<br />
n<br />
• 18 . 17<br />
chenden Werte gleich s<strong>in</strong>d. n:" n.'"<br />
16<br />
15<br />
"<br />
13<br />
12<br />
11<br />
10<br />
Abb.l: E<strong>in</strong>schätzungen<br />
von Experten für zwei<br />
Autos x und y<br />
Schaut <strong>man</strong> sich Tabelle 2 genauer an, stellt <strong>man</strong> fest, daß für jede Kategorie die<br />
Werte <strong>der</strong> E<strong>in</strong>schätzungen für beide Autos sich um 10-12 Punkte unterscheiden.<br />
Das Auto x wird z.B beim Aussehen um 10 Punkte höher als das Auto y e<strong>in</strong>geschätzt,<br />
während das Auto y bei den Bremsen um 12 Punkte besser abschnitt.<br />
Tabelle 1: E<strong>in</strong>schätzungen von Experten für zwei Autos x und y<br />
Was wäre nun e<strong>in</strong>e geeignete Darstellung, die verschiedenen Streuungen <strong>in</strong> den<br />
E<strong>in</strong>schätzungen <strong>der</strong> Experten bei verschiedenen Autos geeignet darzustellen. Die<br />
Profilplots <strong>der</strong> Abb. 4 vergleichen z.B. übersichtlich Vorteile und Nachteile <strong>der</strong><br />
-<br />
beiden Autos 1 und 2 aus Tabelle 1 beim Expertenvergleich.<br />
.....<br />
....<br />
Abb.4: Profilplots zweier Autos<br />
_Autol<br />
----------- Auto 2<br />
- "'10<br />
-40<br />
_30<br />
_1.<br />
7<br />
Der Übersetzer möchte allerd<strong>in</strong>gs h<strong>in</strong>zufügen, daß ihm Abb.4 als Ersatz für die<br />
sicherlich ungeeigneten <strong>Boxplots</strong> auch nicht geeignet ersche<strong>in</strong>t. Die Daten s<strong>in</strong>d<br />
diskret und Punkte zwischen ihnen s<strong>in</strong>d bedeutungslos. Warum also die<br />
"Fieberkurve"? Ist das nicht e<strong>in</strong> gutes Beispiel für e<strong>in</strong>e weitere Fehldeutung?<br />
Die Rolle <strong>der</strong> Computer Software<br />
Professionelle wie auch pädagogische Software haben erhebliche Fortschritte<br />
gemacht sowohl bezüglich <strong>der</strong> Anwendungsmöglichkeiten als auch h<strong>in</strong>sichtlich<br />
<strong>der</strong> Benutzerfreundlichkeit. Aus den englischsprachigen Län<strong>der</strong>n ist beson<strong>der</strong>s<br />
auf das Werkzeug MINITAB h<strong>in</strong>zuweisen, daß sehr vielfaltige Anwendungen <strong>der</strong><br />
<strong>Stochastik</strong> ermöglicht, aber auch speziell für Ausbildungszwecke konzipiert ist.<br />
Deutsche Software ist:<br />
--EDA, das Werkzeug zur statistischen Datenanalyse. Duisburg: CoMet Verlag<br />
Verlag für Unterrichts software, 1992.<br />
--GSTAT, StatistikprogranIffipaket, ZUSanIffien mit dem Buch von F.Böker: Statistik<br />
lernen am Computer. Gött<strong>in</strong>gen: Vandenhoek&Ruprecht, 1989<br />
Die Vorteile <strong>der</strong> Computer Software liegen <strong>in</strong> <strong>der</strong> praktischen Datenanalyse:<br />
Reale Daten können als Beispiel-und Übungsmaterial zur Illustration von Techniken<br />
und Strategien für die Explorative Datenanalyse herangezogen werden.<br />
Schlußfolgerungen<br />
Wie können wir potentiellen Mißbräuchen im Unterricht begegnen? Wir müssen<br />
die Daten <strong>in</strong> e<strong>in</strong>en Problemlösungsprozeß e<strong>in</strong>glie<strong>der</strong>n, könnte e<strong>in</strong>e Antwort lauten.<br />
Dieser Prozeß schliesst e<strong>in</strong>: e<strong>in</strong>e geeignet gestellte Frage, relevante Daten,<br />
e<strong>in</strong>e richtige Analyse und sorgfaltige Interpretationen <strong>der</strong> Auswertung. E<strong>in</strong>e angemessene<br />
Analyse setzt e<strong>in</strong> Verständnis <strong>der</strong> Daten voraus. Als Lehrer müssen<br />
wir sowohl Wert auf s<strong>in</strong>nvolle Daten als auch auf richtige Analysetechniken legen.<br />
Weiter müssen die Lernenden verstehen, wie die Daten gesanIffielt und gemessen<br />
wurden. Ferner müssen die beobachteten Variablen deutlich se<strong>in</strong>. Nur<br />
unter allen diesen V oraussetzunegn können wir erwarten, daß Mißdeutungen, wie<br />
<strong>in</strong> diesem Beitrag geschil<strong>der</strong>t, vermieden werden können.<br />
Literatur<br />
Hirsch, C.(series editor): Curriculum and evaluation standards for school mathematics.<br />
Addenda series grades 9-12. Reston (Virg<strong>in</strong>ia): National Council ofTeachers<br />
of Mathematics, 1992<br />
Landwehr, 1.1\4.; Watk<strong>in</strong>s, AE.: Explor<strong>in</strong>g data. Palo Alto (California): Dale<br />
Seymour Publications, 1986 (The Quantitative Literacy Series)