Lehrstuhl für Mathematik und ihre Didaktik Walter Olbricht, Doris ...

Weitere Magazine

Empfehlungen

Info

50 Die genaue Beschreibung ergibt sich aus folgender Datei: Regression tree: *** Tree Model *** snip.tree(tree = tree(formula = Gesamtmean ~ Geschlecht + Alter + Anzahlum + Noteum + Schulartkopie + Klassefak + Klassensatzfak, data = gepruefteEndtabelle27kurz, na.action = na.exclude, mincut = 3, minsize = 6, mindev = 0), nodes = c (12, 22, 23, 7, 4, 13, 10)) Variables actually used in tree construction: [1] "Klassensatzfak" "Anzahlum" "Noteum" "Geschlecht" Number of terminal nodes: 7 Residual mean deviance: 0.111 = 34.5 / 311 Distribution of residuals: Min. 1st Qu. Median Mean 3rd Qu. Max. -0.987 -0.20 -0.00567 -2.17e-016 0.22 0.905 node), split, n, deviance, yval * denotes terminal node 1) root 318 53.00 2.0 2) Klassensatzfak:1,3,5,6,7,9,14,15,17,20 199 19.00 1.8 4) Klassensatzfak:1,3,6,20 77 4.00 1.7 * 5) Klassensatzfak:5,7,9,14,15,17 122 13.00 1.9 10) Klassensatzfak:5,7,14,15 80 6.50 1.9 * 11) Klassensatzfak:9,17 42 6.10 2.0 22) Anzahlum3.5 10 0.96 1.7 * 3) Klassensatzfak:11,12,16,21,22 119 20.00 2.3 6) Noteum2.5 92 16.00 2.3 * Abbildung 26 Output für den Regressionsbaum Die Graphiken sind weitgehend selbsterklärend. Man sieht, dass Klassensatz, Note, Geschlecht und Anzahl als Kriterien fungieren, um einen Regressionsbaum für die Variable Gesamtmittel zu erstellen. Für einen Schüler mit Klassensatz = a (bzw. 1) wird als Gesamtmittel 1.7 vorhergesagt usw. Klassensatz = a in der Graphik steht dabei für Klassensatz = 1, da für faktorielle Variablen dort eine Buchstabenkodierung vorgenommen wird, um auch höhere Werte als 10 einstellig zu kodieren. Entsprechend bezeichnet Klassensatz aber den ersten, zweiten, fünften und fünfzehnten Ausprägungswert des Faktors Klassensatz, mithin die Klassensätze 1, 3, 6 und 20. In der Datei-Beschreibung des Regressionsbaumes ist aber die ursprüngliche Bezeichnung gewählt. Der gerade angesprochene Fall Klassensatz: abeo (bzw. 1, 3, 6, 20) findet sich dort unter „4“. Der damit bezeichnete Knoten ist ein Endknoten mit 77 Mitgliedern und einem Durchschnittswert von 1,7 für das Gesamtmittel. Bei der Addition der Endknotengrößen ergibt sich nur 318, weil Fälle mit fehlenden Werten in einer der Variablen ausgeschlossen werden müssen. Insgesamt ist der Baum und seine Knotenpunkte so gewählt worden, dass er die Daten möglichst genau und sparsam beschreibt. Als Vorteile hat man neben einer einfachen Beschreibung dann auch eine durchsichtige Darstellung der Struktur der Daten. Allerdings sind derartige Bäume im hohen Maße instabil, das heißt sie hängen stark von den gewählten Verfahren und Parametern für die zugrunde liegende Optimierung ab. Um nicht Artefakte zu produzieren, ist daher ein methodisch vorsichtiges Vorgehen gefordert. Im obigen Fall wurde ausgehend von den Variablen aus der Tabelle zunächst ein großer Baum erzeugt, der dann durch so genanntes „Pruning“ zurechtgestutzt wurde. Es ergab sich eine Sequenz von Bäumen mit zunehmender bzw. abnehmender Anzahl von Endknoten. Die so genannte „Deviance“ (als Maß für die Ungenauigkeit des Baumes) ist in folgender Graphik skizziert:
deviance 30 35 40 45 50 Devianzabnahme 14.00000 0.20000 0.15000 0.08300 0.03300 0.01300 0.00300 1 20 40 60 Abbildung 27 Devianzabnahme für einige Regressoinsbäume Grob gesprochen sind nun die Anzahlen von Knoten besonders interessant, bei denen man eine möglichst kleine Devianz erreicht. Das Augenmerk richtet sich daher auf solche Knotenanzahlen, die zu großen Abstiegen („hohen Treppenstufen“) gehören. Es lohnt sich gewissermaßen solche Knoten mit einzubeziehen, da man für diesen Aufwand relativ viel Ertrag – gemessen als Abnahme der Devianz – erhält. Im vorliegenden Fall legt diese Überlegung nahe einerseits mindestens 7 (wie im obigen Beispiel) und andererseits höchstens 15 oder 21 Endknoten zu wählen. Der „volle“ Baum (unter Beachtung einiger voreingestellter Parameter) mit 71 Endknoten wäre: Klassensatz:b Klassensatz:abeo Abbildung 28 Vollständiger Regressionsbaum mit 71 Endknoten size Klassensatz:abdefhklno | Klassensatz:dfkl Geschlecht:b Note
Seite 1 und 2: Lehrstuhl für Mathematik und ihre
Seite 3 und 4: Inhalt 0. Vorbemerkung.............
Seite 5 und 6: 0. Vorbemerkung Konzeption des Proj
Seite 7 und 8: 80 70 60 50 40 30 20 10 0 Mathemati
Seite 9 und 10: 2. Datenbasis In diesem Kapitel sol
Seite 11 und 12: Abbildung 2 Überblick über Schuls
Seite 13 und 14: schon möglich, deshalb gibt es unt
Seite 15 und 16: Gesamtsd 1.6 1.4 1.2 1.0 0.8 0.6 0.
Seite 17 und 18: sehr häufig, das Pendant „stimmt
Seite 19 und 20: Anzahl auffälliger Skalen Row Klas
Seite 21 und 22: 3. Untersuchung der Items In diesem
Seite 23 und 24: dynamischen Arbeitsblättern zu arb
Seite 25 und 26: Skala 1 Skala 2 Skala 3 Skala 4 Ska
Seite 27 und 28: 3.2. Substrukturen (Datenbasierte S
Seite 29 und 30: Chiquadratabstand zum Antioptimum 1
Seite 31 und 32: ganz aus der Berechnung der Kovaria
Seite 33 und 34: 3.4. Auswirkungen der Kovariablen i
Seite 35 und 36: che im Umgang mit dem Computer durc
Seite 37 und 38: diesen beiden Items verglichen mit
Seite 39 und 40: 1. GEONExT wird im Allgemeinen rech
Seite 41 und 42: Hintergrund: Boxplot und vergleiche
Seite 43 und 44: Gesamtmittel 3.0 2.5 2.0 1.5 1.0 21
Seite 45 und 46: Zensur Vorauszuschicken ist, dass d
Seite 47 und 48: Bereinigtes Gesamtmittel Anfänger
Seite 49 und 50: 4.3. Fazit Es lassen sich deutliche
Seite 51: 1.7 Abbildung 24 Regressionsbaum mi
Seite 55 und 56: Die voreingestellten Parameter wurd
Seite 57 und 58: 2.4 1.9 1.4 0.9 0.4 -0.1 0 1 2 3 4
Seite 59 und 60: 3 2 1 0 0 10 20 30 40 Items Klassen
Seite 61 und 62: Hier zeigt sich in keiner Skala ein
Seite 63 und 64: 6. Schlussfolgerungen In diesem Kap
Seite 65 und 66: 6.3. Antworten auf die Ausgangsfrag
Seite 67 und 68: 7. Abbildungsverzeichnis Abbildung
Seite 69 und 70: 9. Literatur Baptist, Peter (Hrsg.)
Seite 71: Den Themenschwerpunkt der Bayreuthe

Lehrstuhl für Mathematik und ihre Didaktik Walter Olbricht, Doris ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?