14.12.2012 Aufrufe

Lehrstuhl für Mathematik und ihre Didaktik Walter Olbricht, Doris ...

Lehrstuhl für Mathematik und ihre Didaktik Walter Olbricht, Doris ...

Lehrstuhl für Mathematik und ihre Didaktik Walter Olbricht, Doris ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

48<br />

5. Integrative Analyse <strong>und</strong> Diskussion<br />

In diesem Kapitel soll die Gesamtstruktur des Datensatzes detailliert betrachtet werden. Angesichts<br />

der etwas unscharfen Abgrenzung einzelner Skalen erscheint es <strong>für</strong> diese zusammenfassende Diskussion<br />

zweckmäßig, die Größe Gesamtmittel als Hauptzielgröße zu wählen. Bereits in den vorangehenden<br />

Kapiteln wurden hierzu erste Schritte unternommen. Abbildung 4 (Mittel-SD-Diagramm) zeigt<br />

die Verteilung der Größen Gesamtmittel <strong>und</strong> Gesamtsd <strong>und</strong> die darin auftretenden Substrukturen<br />

nach Klassensatz. Der vergleichende Boxplot in Abbildung 17 (Klassensatzplot) gibt einen Eindruck<br />

von der Stärke des Einflusses der Klasse. Es musste aber bisher weitgehend offen bleiben, welche<br />

der Kovariablen als entscheidende Einflussgrößen auf die Hauptzielvariable Gesamtmittel angesehen<br />

werden können. Folgende Größen kommen in Frage:<br />

Variable Typ Mögliche Ausprägungen<br />

Klassensatz Factor 1,3,4,5,6,7,8,9,11,12,14,15,16,17,20,21,22<br />

Klasse Factor 6,7,8,9,10,12<br />

Schulart Factor GY, RS, HS<br />

Geschlecht Factor m w, KA<br />

Alter Double 11,12,13,14,15,16,17,18,KA<br />

Anzahl Double 0,1,2,3,4,5,6,7,8,9,10,11,14,15,KA<br />

Note Double 1,2,3,4,5,6,KA<br />

Tabelle 21 Klassifikation der Variablen<br />

Klasse wurde hier also als Faktor behandelt, da<strong>für</strong> wurde Alter als quantitative Variable mit betrachtet.<br />

5.1. Multivariate Aspekte<br />

Von der Ausgangsfrage her liegt zunächst die Anwendung multivariater statistischer Techniken wie<br />

Regression oder Faktorenanalyse nahe. Die bereits festgestellten Substrukturen mahnen jedoch zur<br />

Vorsicht. Weder die Unabhängigkeit der einzelnen Versuchspersonen noch plausible Verteilungsannahmen<br />

noch akzeptable Festlegungen über die Kovarianzstruktur scheinen unproblematisch. Unter<br />

solchen Umständen liefern die genannten Ansätze häufig eher Artefakte als wirkliche Erklärungen. Ein<br />

sehr datennahes Vorgehen erscheint solider. Die folgenden Techniken sind ausschließlich in diesem<br />

Sinne zu verstehen, auch wenn sie <strong>ihre</strong>rseits ebenfalls zum Teil willkürliche Modellannahmen <strong>und</strong><br />

Festlegungen erfordern.<br />

Von besonderem Interesse scheinen uns Darstellungen, die die „innere Struktur“ <strong>und</strong> die Hierarchie<br />

der Kovariablen visualisieren. In natürlicher Weise führt dies zu Klassifikations- <strong>und</strong> Regressionsbäumen,<br />

die den Klassifikationsschemata der Lebenswissenschaften oder der Medizin nachempf<strong>und</strong>en<br />

sind. Bei der Bestimmung von Pflanzenarten oder Krankheiten geht der Biologe oder Mediziner seit<br />

jeher durch eine hierarchische Abfolge von Fragen vor. Die Baumstruktur des Fragenkataloges zeigt<br />

dann zugleich die Hierarchie der einzelnen Unterscheidungsmerkmale auf. In der Statistik wurden<br />

solche „baumbasierten Methoden“ vor allem durch Breiman e. a. (1984) propagiert.<br />

Die folgende Darstellung ist ein Beispiel <strong>für</strong> einen Regressionsbaum mit 7 Endknoten:

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!