14.03.2013 Aufrufe

Wann gebraucht man Boxplots? - Stochastik in der Schule

Wann gebraucht man Boxplots? - Stochastik in der Schule

Wann gebraucht man Boxplots? - Stochastik in der Schule

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>Wann</strong> <strong>gebraucht</strong> <strong>man</strong> <strong>Boxplots</strong>?<br />

Von Gary Ka<strong>der</strong> und Mike Perry<br />

übersetzt und bearbeitet von Gerhard König<br />

Zusammenfassung: Nach e<strong>in</strong>er Beschreibung <strong>der</strong> Tecbnik <strong>der</strong> Boxploterstellung <strong>in</strong> <strong>der</strong> Explorativen<br />

Datenanalyse werden Verwendungsmöglichkeiten diskutiert. Speziell wird aufgezeigt,<br />

wie Mißbräuche zu vermeiden s<strong>in</strong>d.<br />

<strong>Boxplots</strong> (Box-plot-Diagramme, verdeutscht auch Kastendiagramme, Kastenschaubil<strong>der</strong>)<br />

benutzt <strong>man</strong>, um die Verteilung von Daten geeignet graphisch darzustellen.<br />

Dabei werden nicht nur die e<strong>in</strong>zelnen Daten dargestellt, son<strong>der</strong>n es<br />

wird auch ihre Streuung sichtbar. Beson<strong>der</strong>s gut geeignet s<strong>in</strong>d diese Darstellungen<br />

fiir den Vergleich von zwei verschiedenen Datensätzen.<br />

<strong>Boxplots</strong> werden nicht nur <strong>in</strong> <strong>der</strong> sog. Explorativen Datenanalyse e<strong>in</strong>gesetzt, son<strong>der</strong>n<br />

haben auch wegen ihrer E<strong>in</strong>fachheit und Vielseitigkeit E<strong>in</strong>gang <strong>in</strong> Curricula<br />

und Lehrplänen gefunden. E<strong>in</strong> zu häufiger E<strong>in</strong>satz <strong>in</strong> Büchern und im Unterricht<br />

bedeutet aber auch, daß die Gefahr e<strong>in</strong>es Mißbrauchs besteht. Die Konstruktion<br />

von <strong>Boxplots</strong> mag e<strong>in</strong>fach se<strong>in</strong>, <strong>der</strong>en geignete Anwendung und Interpretation ist<br />

jedoch vom statistischen Standpunkt aus vielschichtig und komplex. In diesem<br />

Beitrag wird daher etwas konkreter über mißbräuchliche Verwendungen von<br />

<strong>Boxplots</strong> berichtet und diskutiert, warum dies geschah und wie wir im Unterricht<br />

solche Mißbräuche vermeiden können.<br />

Was s<strong>in</strong>d <strong>Boxplots</strong>?<br />

E<strong>in</strong> Boxplot ist e<strong>in</strong>e graphische Darstellung, die die Lage und Ausdehnung jedes<br />

Quartils <strong>in</strong> <strong>der</strong> Verteilung <strong>der</strong> Daten graphisch darstellt. Fünf wesentliche Kenngrößen<br />

bestimmen die Grundform e<strong>in</strong>es <strong>Boxplots</strong>: M<strong>in</strong>imum, Unteres Quartil,<br />

Median, Oberes Quartil, Maximum (s.Abbildung). Manchmal werden auch noch<br />

sog. Ausreißer beson<strong>der</strong>s gekennzeichnet.<br />

I I I<br />

/ !<br />

I , "<br />

M<strong>in</strong>imum untere Quartile Median obere Quartile Maximum<br />

<strong>Stochastik</strong> <strong>in</strong> <strong>der</strong> <strong>Schule</strong> 17(1997)1, S.3-7<br />

Übersetzung aus Teach<strong>in</strong>g Statistics 18(1996)2, S.39-41


Jede vernünftige Interpretation würde<br />

suggerieren, daß beide Autos gleich<br />

wert seien. Die beiden <strong>Boxplots</strong> stellen<br />

die hypothetischen Daten <strong>der</strong> Tab.<br />

2 graphisch dar. Die Mediane s<strong>in</strong>d<br />

"gleich", s<strong>in</strong>d aber doch wie<strong>der</strong><br />

"verschieden". Beide Mediane haben<br />

den Wert 20. Aber <strong>der</strong> Median für das<br />

Auto x ist die Komfort-E<strong>in</strong>schätzung,<br />

für das Auto y dagegen die Freude am<br />

Fahren. Ähnliche Unterschiede gibt es<br />

für die Quartile sowie für Maximum<br />

und M<strong>in</strong>imum, obwohl die entspre-<br />

6<br />

30<br />

2.<br />

27<br />

2.<br />

26<br />

2.<br />

23<br />

22<br />

R 21<br />

r 20<br />

i 1.<br />

n<br />

• 18 . 17<br />

chenden Werte gleich s<strong>in</strong>d. n:" n.'"<br />

16<br />

15<br />

"<br />

13<br />

12<br />

11<br />

10<br />

Abb.l: E<strong>in</strong>schätzungen<br />

von Experten für zwei<br />

Autos x und y<br />

Schaut <strong>man</strong> sich Tabelle 2 genauer an, stellt <strong>man</strong> fest, daß für jede Kategorie die<br />

Werte <strong>der</strong> E<strong>in</strong>schätzungen für beide Autos sich um 10-12 Punkte unterscheiden.<br />

Das Auto x wird z.B beim Aussehen um 10 Punkte höher als das Auto y e<strong>in</strong>geschätzt,<br />

während das Auto y bei den Bremsen um 12 Punkte besser abschnitt.<br />

Tabelle 1: E<strong>in</strong>schätzungen von Experten für zwei Autos x und y<br />

Was wäre nun e<strong>in</strong>e geeignete Darstellung, die verschiedenen Streuungen <strong>in</strong> den<br />

E<strong>in</strong>schätzungen <strong>der</strong> Experten bei verschiedenen Autos geeignet darzustellen. Die<br />

Profilplots <strong>der</strong> Abb. 4 vergleichen z.B. übersichtlich Vorteile und Nachteile <strong>der</strong><br />

-<br />

beiden Autos 1 und 2 aus Tabelle 1 beim Expertenvergleich.<br />

.....<br />

....<br />

Abb.4: Profilplots zweier Autos<br />

_Autol<br />

----------- Auto 2<br />

- "'10<br />

-40<br />

_30<br />

_1.<br />

7<br />

Der Übersetzer möchte allerd<strong>in</strong>gs h<strong>in</strong>zufügen, daß ihm Abb.4 als Ersatz für die<br />

sicherlich ungeeigneten <strong>Boxplots</strong> auch nicht geeignet ersche<strong>in</strong>t. Die Daten s<strong>in</strong>d<br />

diskret und Punkte zwischen ihnen s<strong>in</strong>d bedeutungslos. Warum also die<br />

"Fieberkurve"? Ist das nicht e<strong>in</strong> gutes Beispiel für e<strong>in</strong>e weitere Fehldeutung?<br />

Die Rolle <strong>der</strong> Computer Software<br />

Professionelle wie auch pädagogische Software haben erhebliche Fortschritte<br />

gemacht sowohl bezüglich <strong>der</strong> Anwendungsmöglichkeiten als auch h<strong>in</strong>sichtlich<br />

<strong>der</strong> Benutzerfreundlichkeit. Aus den englischsprachigen Län<strong>der</strong>n ist beson<strong>der</strong>s<br />

auf das Werkzeug MINITAB h<strong>in</strong>zuweisen, daß sehr vielfaltige Anwendungen <strong>der</strong><br />

<strong>Stochastik</strong> ermöglicht, aber auch speziell für Ausbildungszwecke konzipiert ist.<br />

Deutsche Software ist:<br />

--EDA, das Werkzeug zur statistischen Datenanalyse. Duisburg: CoMet Verlag<br />

Verlag für Unterrichts software, 1992.<br />

--GSTAT, StatistikprogranIffipaket, ZUSanIffien mit dem Buch von F.Böker: Statistik<br />

lernen am Computer. Gött<strong>in</strong>gen: Vandenhoek&Ruprecht, 1989<br />

Die Vorteile <strong>der</strong> Computer Software liegen <strong>in</strong> <strong>der</strong> praktischen Datenanalyse:<br />

Reale Daten können als Beispiel-und Übungsmaterial zur Illustration von Techniken<br />

und Strategien für die Explorative Datenanalyse herangezogen werden.<br />

Schlußfolgerungen<br />

Wie können wir potentiellen Mißbräuchen im Unterricht begegnen? Wir müssen<br />

die Daten <strong>in</strong> e<strong>in</strong>en Problemlösungsprozeß e<strong>in</strong>glie<strong>der</strong>n, könnte e<strong>in</strong>e Antwort lauten.<br />

Dieser Prozeß schliesst e<strong>in</strong>: e<strong>in</strong>e geeignet gestellte Frage, relevante Daten,<br />

e<strong>in</strong>e richtige Analyse und sorgfaltige Interpretationen <strong>der</strong> Auswertung. E<strong>in</strong>e angemessene<br />

Analyse setzt e<strong>in</strong> Verständnis <strong>der</strong> Daten voraus. Als Lehrer müssen<br />

wir sowohl Wert auf s<strong>in</strong>nvolle Daten als auch auf richtige Analysetechniken legen.<br />

Weiter müssen die Lernenden verstehen, wie die Daten gesanIffielt und gemessen<br />

wurden. Ferner müssen die beobachteten Variablen deutlich se<strong>in</strong>. Nur<br />

unter allen diesen V oraussetzunegn können wir erwarten, daß Mißdeutungen, wie<br />

<strong>in</strong> diesem Beitrag geschil<strong>der</strong>t, vermieden werden können.<br />

Literatur<br />

Hirsch, C.(series editor): Curriculum and evaluation standards for school mathematics.<br />

Addenda series grades 9-12. Reston (Virg<strong>in</strong>ia): National Council ofTeachers<br />

of Mathematics, 1992<br />

Landwehr, 1.1\4.; Watk<strong>in</strong>s, AE.: Explor<strong>in</strong>g data. Palo Alto (California): Dale<br />

Seymour Publications, 1986 (The Quantitative Literacy Series)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!