Lehrstuhl für Mathematik und ihre Didaktik Walter Olbricht, Doris ...

48 

5. Integrative Analyse und Diskussion 

In diesem Kapitel soll die Gesamtstruktur des Datensatzes detailliert betrachtet werden. Angesichts 

der etwas unscharfen Abgrenzung einzelner Skalen erscheint es für diese zusammenfassende Diskussion 

zweckmäßig, die Größe Gesamtmittel als Hauptzielgröße zu wählen. Bereits in den vorangehenden 

Kapiteln wurden hierzu erste Schritte unternommen. Abbildung 4 (Mittel-SD-Diagramm) zeigt 

die Verteilung der Größen Gesamtmittel und Gesamtsd und die darin auftretenden Substrukturen 

nach Klassensatz. Der vergleichende Boxplot in Abbildung 17 (Klassensatzplot) gibt einen Eindruck 

von der Stärke des Einflusses der Klasse. Es musste aber bisher weitgehend offen bleiben, welche 

der Kovariablen als entscheidende Einflussgrößen auf die Hauptzielvariable Gesamtmittel angesehen 

werden können. Folgende Größen kommen in Frage: 

Variable Typ Mögliche Ausprägungen 

Klassensatz Factor 1,3,4,5,6,7,8,9,11,12,14,15,16,17,20,21,22 

Klasse Factor 6,7,8,9,10,12 

Schulart Factor GY, RS, HS 

Geschlecht Factor m w, KA 

Alter Double 11,12,13,14,15,16,17,18,KA 

Anzahl Double 0,1,2,3,4,5,6,7,8,9,10,11,14,15,KA 

Note Double 1,2,3,4,5,6,KA 

Tabelle 21 Klassifikation der Variablen 

Klasse wurde hier also als Faktor behandelt, dafür wurde Alter als quantitative Variable mit betrachtet. 

5.1. Multivariate Aspekte 

Von der Ausgangsfrage her liegt zunächst die Anwendung multivariater statistischer Techniken wie 

Regression oder Faktorenanalyse nahe. Die bereits festgestellten Substrukturen mahnen jedoch zur 

Vorsicht. Weder die Unabhängigkeit der einzelnen Versuchspersonen noch plausible Verteilungsannahmen 

noch akzeptable Festlegungen über die Kovarianzstruktur scheinen unproblematisch. Unter 

solchen Umständen liefern die genannten Ansätze häufig eher Artefakte als wirkliche Erklärungen. Ein 

sehr datennahes Vorgehen erscheint solider. Die folgenden Techniken sind ausschließlich in diesem 

Sinne zu verstehen, auch wenn sie ihrerseits ebenfalls zum Teil willkürliche Modellannahmen und 

Festlegungen erfordern. 

Von besonderem Interesse scheinen uns Darstellungen, die die „innere Struktur“ und die Hierarchie 

der Kovariablen visualisieren. In natürlicher Weise führt dies zu Klassifikations- und Regressionsbäumen, 

die den Klassifikationsschemata der Lebenswissenschaften oder der Medizin nachempfunden 

sind. Bei der Bestimmung von Pflanzenarten oder Krankheiten geht der Biologe oder Mediziner seit 

jeher durch eine hierarchische Abfolge von Fragen vor. Die Baumstruktur des Fragenkataloges zeigt 

dann zugleich die Hierarchie der einzelnen Unterscheidungsmerkmale auf. In der Statistik wurden 

solche „baumbasierten Methoden“ vor allem durch Breiman e. a. (1984) propagiert. 

Die folgende Darstellung ist ein Beispiel für einen Regressionsbaum mit 7 Endknoten:

Vorherige Seite

Nächste Seite

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

Lehrstuhl für Mathematik und ihre Didaktik Walter Olbricht, Doris ...

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?