14.12.2012 Aufrufe

Lehrstuhl für Mathematik und ihre Didaktik Walter Olbricht, Doris ...

Lehrstuhl für Mathematik und ihre Didaktik Walter Olbricht, Doris ...

Lehrstuhl für Mathematik und ihre Didaktik Walter Olbricht, Doris ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Lehrstuhl</strong> <strong>für</strong> <strong>Mathematik</strong> <strong>und</strong> <strong>ihre</strong> <strong>Didaktik</strong><br />

Bayreuther Schriftenreihe mαth-kit<br />

Heft 18 (2007)<br />

– Sektion Evaluation –<br />

<strong>Walter</strong> <strong>Olbricht</strong>, <strong>Doris</strong> Bocka<br />

Evaluierung von GEONExT – Teil I<br />

Quantitative Analyse <strong>und</strong> methodische Anmerkungen<br />

ISSN 1613-4095


0<br />

Stand der vorliegenden Textfassung: Dezember 2007<br />

Der Druck des vorliegenden Heftes wurde ermöglicht im Rahmen des BLK-<br />

Programms SINUS-Transfer.<br />

Abstract<br />

Die quantitative Analyse von knapp 370 Schülerfragebogen über die Evaluierung von<br />

GEONExT zeigt, dass die meisten gut mit GEONExT zu Recht kommen <strong>und</strong> positiv<br />

urteilen. Die Schülerinnen <strong>und</strong> Schüler profitieren in mehrfacher Hinsicht von der dynamischen<br />

Veranschaulichung. Während die allgemeinen Erfahrungen mit dem<br />

Computer recht ähnlich sind, zeigen sich bei der Arbeit mit GEONExT <strong>und</strong> dynamischen<br />

Arbeitsblättern große Unterschiede zwischen den Klassen. Der Klassenfaktor<br />

scheint den größten Einfluss auf das Antwortverhalten der Befragten auszuüben.<br />

The quantitative results of a study with almost 370 students show that most students<br />

come to grips with dynamic worksheets and assess GEONExT as good. Students<br />

benefit from dynamic visualisation in manifold ways. Their general experiences with<br />

computers are very similar, but their special experiences with GEONExT diverge<br />

among classes. Class emerges as the dominant factor.<br />

Impressum<br />

ISSN 1613-4095<br />

Herausgeber:<br />

<strong>Lehrstuhl</strong> <strong>für</strong> <strong>Mathematik</strong> <strong>und</strong> <strong>ihre</strong> <strong>Didaktik</strong><br />

Universität Bayreuth<br />

Postfach 101251<br />

D-95440 Bayreuth<br />

Deutschland<br />

Redaktion: Dr. Manfred J. Bauch<br />

http://did.mat.uni-bayreuth.de/math-kit


Inhalt<br />

0. Vorbemerkung..................................................................................................... 3<br />

Konzeption des Projektberichts ........................................................................... 3<br />

1. Eckdaten ............................................................................................................. 4<br />

1.1. Hintergr<strong>und</strong> ...................................................................................................... 4<br />

Dynamische <strong>Mathematik</strong> ..................................................................................... 4<br />

Einsatz dynamischer Arbeitsblätter im <strong>Mathematik</strong>unterricht .............................. 4<br />

1.2. Projektziele ...................................................................................................... 5<br />

2. Datenbasis .......................................................................................................... 7<br />

2.1. Datenerhebung <strong>und</strong> Datenstruktur................................................................... 7<br />

Auswahl der Klassen........................................................................................... 7<br />

Erhebungszeitraum ............................................................................................. 9<br />

Erhebungsinstrument .......................................................................................... 9<br />

Ausrichtung der Fragen....................................................................................... 9<br />

Umskalierung der Items..................................................................................... 10<br />

Ausfüllen der Bogen .......................................................................................... 10<br />

2.2. Qualitätssicherung <strong>und</strong> Qualitätsbeurteilung.................................................. 11<br />

Generelles ......................................................................................................... 11<br />

Eingabe- <strong>und</strong> Bedienungsfehler ........................................................................ 11<br />

Berechnungs- <strong>und</strong> Verständnisfehler ................................................................ 12<br />

Mangelnde Seriosität der Antworten ................................................................. 12<br />

Auffälligkeiten von Schülern .............................................................................. 12<br />

Auftreten <strong>und</strong> Verteilung von fehlenden Werten <strong>und</strong> Randwerten..................... 13<br />

Ankreuzschemata <strong>und</strong> inhaltlich konsistentes Antwortverhalten ....................... 15<br />

2.3. Fazit ............................................................................................................... 17<br />

3. Untersuchung der Items .................................................................................... 19<br />

3.1. Inhaltliche Skalenbildung ............................................................................... 19<br />

Gruppierung der Items <strong>und</strong> <strong>ihre</strong> Begründung .................................................... 19<br />

Überprüfung der Skalen durch eine Befragung ................................................. 22<br />

Zusammenfassung............................................................................................ 24<br />

3.2. Substrukturen (Datenbasierte Skalenbildung)................................................ 25<br />

3.3. Klassische Kennzahlen zur Itemanalyse........................................................ 28<br />

3.4. Auswirkungen der Kovariablen im Spiegel der Skalen................................... 31<br />

Gr<strong>und</strong>sätzliches................................................................................................. 31<br />

Geschlecht ........................................................................................................ 31<br />

Zensur ............................................................................................................... 32<br />

Schulart ............................................................................................................. 32<br />

Anzahl der bearbeiteten dynamischen Arbeitsblätter ........................................ 34<br />

Klassenstufe...................................................................................................... 35<br />

Zusammenhang ................................................................................................ 36<br />

3.5. Fazit ............................................................................................................... 37<br />

4. Untersuchung der Schüler................................................................................. 38<br />

4.1. Klasseneinteilung <strong>und</strong> Substrukturen............................................................. 38<br />

4.2. Einfluss der Kovariablen ................................................................................ 41<br />

Geschlecht ........................................................................................................ 42<br />

Zensur ............................................................................................................... 43<br />

Schulart ............................................................................................................. 44<br />

Anzahl der bearbeiteten dynamischen Arbeitsblätter ........................................ 44<br />

Klassenstufe...................................................................................................... 45<br />

4.3. Fazit ............................................................................................................... 47<br />

1


2<br />

5. Integrative Analyse <strong>und</strong> Diskussion................................................................... 48<br />

5.1. Multivariate Aspekte....................................................................................... 48<br />

5.2. Längsschnittbetrachtung ................................................................................ 53<br />

5.3. Vergleich von Schulalltag <strong>und</strong> Universitätsbedingungen................................ 58<br />

5.4 Fazit ................................................................................................................ 59<br />

6. Schlussfolgerungen........................................................................................... 61<br />

6.1. Bemerkungen zur statistischen Methodologie................................................ 61<br />

6.2. Anregungen, Vorschläge <strong>und</strong> Empfehlungen methodischer Art <strong>für</strong> weitere<br />

Untersuchungen.................................................................................................... 62<br />

6.3. Antworten auf die Ausgangsfragen ................................................................ 63<br />

7. Abbildungsverzeichnis....................................................................................... 65<br />

8. Tabellenverzeichnis........................................................................................... 66<br />

9. Literatur ............................................................................................................. 67


0. Vorbemerkung<br />

Konzeption des Projektberichts<br />

Aufgr<strong>und</strong> der Bedeutung von internationalen Schulvergleichsstudien <strong>und</strong> Qualitätssicherung im Unterricht<br />

ist davon auszugehen, dass Evaluations-Maßnahmen im Unterricht der Zukunft einen bedeutenden<br />

Rang einnehmen werden. Betrachtet man bisherige Vorstöße in diese Richtung, fällt jedoch auf,<br />

dass die befragten Lehrkräfte <strong>und</strong> Schüler mehr als Objekte zur Datengewinnung dienen <strong>und</strong> weniger<br />

als Adressaten der Ergebnisse. Deswegen erscheint es uns wichtig, sich mit praktikablen Möglichkeiten<br />

der Evaluation im schulischen Bereich auseinander zu setzen. Im Mittelpunkt des vorliegenden<br />

Projektberichts stehen demnach die Beteiligten der Untersuchung. Die Ausführungen zur Evaluation<br />

dynamischer Arbeitsblätter im <strong>Mathematik</strong>unterricht der Sek<strong>und</strong>arstufe sind in Form eines Kompendiums<br />

konzipiert. Dies soll als Handreichung <strong>für</strong> Lehrkräfte <strong>und</strong> Studierende des Lehramtes dienen,<br />

indem Möglichkeiten <strong>und</strong> Grenzen der Evaluation schulischer Prozesse aufgezeigt werden. Um dieses<br />

Ziel zu verfolgen setzt sich das Forschungsteam aus einer <strong>Didaktik</strong>erin <strong>und</strong> einem Statistiker zusammen,<br />

ergänzt um drei Studierende des Lehramtes an Gr<strong>und</strong>schulen. Die Studentinnen sollten durch<br />

Bearbeitung von Teilproblemen in <strong>ihre</strong>n Zulassungsarbeiten Einblick in Evaluationsprozesse erhalten<br />

<strong>und</strong> bei der Bewältigung komplexerer Aufgabenstellungen helfen. Für die Einbindung von Studierenden<br />

in das Projekt spricht noch ein forschungsbedingter Umstand. Als Erhebungsinstrument der Evaluation<br />

wurde ein Schülerbogen eingesetzt. Es ist davon auszugehen, dass man von den Studierenden<br />

dahingehend profitieren kann, dass sie sich sprachlich näher am Jugendjargon befinden. Die<br />

Erhebungsbogen liegen in einer online-Version www.geonext.de/evaluation vor, die von Herrn PD Dr.<br />

Alfred Wassermann im Kursverwaltungssystem moodle installiert wurde. Ihm gilt unser besonderer<br />

Dank <strong>für</strong> die Entwicklung <strong>und</strong> die technische Betreuung.<br />

3


4<br />

1. Eckdaten<br />

Vor der ausführlicheren Darstellung des Evaluationsprojekts sollen noch kurze Hintergr<strong>und</strong>informationen<br />

über dynamische <strong>Mathematik</strong> <strong>und</strong> die Projektziele erläutert werden.<br />

1.1. Hintergr<strong>und</strong><br />

Dynamische <strong>Mathematik</strong><br />

Traditionelle Arbeitsmedien im <strong>Mathematik</strong>unterricht sind das Schülerheft, das Lehrbuch <strong>und</strong> die Tafel,<br />

gelegentlich auch der Overhead-Projektor oder Arbeitsblätter. Dynamische <strong>Mathematik</strong> erweitert<br />

dieses Spektrum um den Computer als Werkzeug. Die Schüler können am Bildschirm mathematische<br />

Konstruktionen selbst erstellen oder fertige Konstruktionen als Ausgangspunkt <strong>für</strong> eigenständiges<br />

Experimentieren, Forschen <strong>und</strong> Entdecken nehmen. Dazu dient die dynamische <strong>Mathematik</strong>software<br />

GEONExT als Konstruktionswerkzeug in der Geometrie <strong>und</strong> durch das integrierte Computer-Algebra-<br />

System kann sie auch in der Analysis <strong>und</strong> Algebra eingesetzt werden (Ehmann 2004, Miller 2004). Die<br />

dynamische <strong>Mathematik</strong> bietet Visualisierungsmöglichkeiten durch bewegliche Konstruktionen, die<br />

traditionelle Unterrichtsmedien nicht leisten können. Interaktive Konstruktionen, die von den Schülern<br />

am Bildschirm dynamisch variiert werden können, in Verbindung mit Text, Bildern, Links <strong>und</strong> anderen<br />

Web-Elementen werden als dynamische Arbeitsblätter bezeichnet. Der Computer <strong>und</strong> diese Unterrichtsmaterialien<br />

sind Werkzeuge, die eigenständiges Arbeiten der Schüler mit mathematischen Inhalten,<br />

gemeinschaftliches Forschen <strong>und</strong> Begründen sowie kooperatives Präsentieren <strong>und</strong> Diskutieren<br />

erarbeiteter Resultate anregen sollen (Miller, Ulm 2006).<br />

Einsatz dynamischer Arbeitsblätter im <strong>Mathematik</strong>unterricht<br />

Folgt man dem konstruktivistischen Verständnis von Lernprozessen, müssen Schüleraktivitäten im<br />

Unterricht angeregt werden. Dynamische Arbeitsblätter bieten dazu einen möglichen Rahmen. Die<br />

Schüler sind gefordert, sich eigenständig mit den Problemstellungen <strong>und</strong> Arbeitsaufträgen auseinander<br />

zu setzen <strong>und</strong> eigene Lernwege zu gehen. Der Computer <strong>und</strong> die eingesetzte Unterrichtssoftware<br />

dienen dabei als Werkzeuge, um eigenständiges Arbeiten der Schüler mit mathematischen Inhalten,<br />

gemeinschaftliches Forschen <strong>und</strong> Entdecken, Argumentieren <strong>und</strong> Begründen sowie kooperatives Präsentieren<br />

<strong>und</strong> Diskutieren erarbeiteter Resultate anzuregen. Diese Prinzipien lassen sich in das didaktische<br />

Konzept von Gallin <strong>und</strong> Ruf (1998) einbinden, die eine dreistufige Konzeption als Arbeitsform<br />

entwerfen. In der ersten Phase (ICH-Phase) macht sich jeder Schüler mit der Aufgabenstellung der<br />

dynamischen Arbeitsblätter vertraut. Die Arbeitsaufträge fordern auf zum Experimentieren, Beobachten<br />

<strong>und</strong> Entdecken. Anschließend (DU-Phase) tauschen die Lernenden in Partnerarbeit oder in Kleingruppen<br />

<strong>ihre</strong> Ideen <strong>und</strong> Ergebnisse aus. Gemeinsam wird tiefer in die Problemlösung vorgedrungen.<br />

Abschließend (WIR-Phase) präsentieren die Arbeitsgruppen im Klassenplenum <strong>ihre</strong> Resultate <strong>und</strong><br />

diskutieren diese. Unter Leitung der Lehrkraft wird ein gemeinsames Ergebnis erarbeitet. Zur Dokumentation<br />

der Experimente <strong>und</strong> Gedankengänge, empfiehlt es sich diese schriftlich zu fixieren. Parallel<br />

zur Tätigkeit am Computer mit dynamischen <strong>und</strong> somit flüchtigen Ergebnissen sollten die Schüler<br />

in einem Heft oder auf einem Arbeitsblatt aussagekräftige Figuren skizzieren, Beobachtungen notieren,<br />

Vermutungen formulieren, Begründungen aufschrieben <strong>und</strong> persönliche Eindrücke festhalten.<br />

Dadurch soll eine intensive Auseinandersetzung mit den Aufgabenstellungen bewirkt werden <strong>und</strong><br />

zugleich eine gewisse Nachhaltigkeit des Lernprozesses initiiert werden. Derartige Aspekte sollten bei<br />

der Konzeption des Unterrichts mit dynamischen Arbeitsblättern berücksichtigt werden (Baptist 2004).<br />

Die dynamischen Arbeitsblätter, die mehrheitlich evaluiert wurden, haben als Zielgruppe die Sek<strong>und</strong>arstufe<br />

– hier vor allem die 7. <strong>und</strong> 8. Jahrgangsstufe. Besonders <strong>für</strong> die siebte <strong>und</strong> achte Jahrgangsstufe<br />

liegt umfangreiches Unterrichtsmaterial in Form dynamischer Arbeitsblätter vor (Baptist 2004).<br />

Der Erhebungsbogen bietet aber auch Lehrkräften die Möglichkeit selbst konzipierte dynamische Arbeitsblätter<br />

von den Schülern bewerten zu lassen. Die Gesamtergebnisse <strong>ihre</strong>r Befragung können von<br />

den Lehrkräften innerhalb des Kursverwaltungssystems moodle automatisiert ausgewertet werden.<br />

Dazu lassen sich Grafiken mit den Ergebnissen <strong>ihre</strong>r Gruppe generieren. Bei der durchgeführten<br />

Untersuchung wurden folgende Themen dynamischer Arbeitsblätter bearbeitet. Dabei ist anzumerken,<br />

dass vier Themenkreise von mindestens zwei Gruppen bzw. Klassen bearbeitet <strong>und</strong> bewertet wurden.


80<br />

70<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

<strong>Mathematik</strong> in der Kunst<br />

Dynamische Arbeitsblätter - Schüleranzahl<br />

3 5 7<br />

Goldener Schnitt<br />

15<br />

19 19<br />

Vierecke<br />

Sehnen-Tangenten-Winkel<br />

Parabeln<br />

Strahlensatz<br />

23 24 24<br />

Abbildung 1 Dynamische Arbeitsblätter <strong>und</strong> Schüleranzahl<br />

27<br />

34<br />

43<br />

50<br />

Umfangswinkelsatz<br />

Dreiecke<br />

Gr<strong>und</strong>erfahrung<br />

Vierecke <strong>und</strong> Billard<br />

Pythagoras<br />

Thales<br />

1.2. Projektziele<br />

In Anlehnung an Helmke (2003) beinhaltet das Evaluationskonzept von GEONExT folgende Bestandteile:<br />

• eine systematische Erfassung<br />

• des Einsatzes von dynamischen Arbeitsblättern im <strong>Mathematik</strong>unterricht der Sek<strong>und</strong>arstufe<br />

• verglichen mit den Erwartungen<br />

• mit dem Ziel der Verbesserung der dynamischen Arbeitsblätter <strong>und</strong> Empfehlungen <strong>für</strong> den Einsatz<br />

dynamischer Arbeitsblätter im Unterricht.<br />

Mit der Evaluation der mit GEONExT erstellten dynamischen Arbeitsblätter werden folgende Ziele<br />

verfolgt:<br />

• Rückmeldungen aus der Praxis zum Einsatz der dynamischen Arbeitsblätter<br />

Hierbei geht es darum eine Bestandsaufnahme zum Unterricht mit dynamischen Arbeitsblättern zu<br />

erhalten. Im Mittelpunkt des Interesses steht es dabei zu erfassen, wie Anwender mit GEONExT umgehen.<br />

• Qualitätssicherung der dynamischen Arbeitsblätter<br />

Durch Rückmeldungen über die dynamischen Arbeitsblätter sollen Möglichkeiten gef<strong>und</strong>en werden,<br />

diese optimieren zu können.<br />

• Bedingungs-Wirkungsmuster<br />

Von Schülern werden <strong>ihre</strong> Einstellungen zu Computereinsatz in der Schule <strong>und</strong> <strong>ihre</strong> generellen Haltungen<br />

zum <strong>Mathematik</strong>unterricht in der Schule (in Verbindung mit dem Einsatz dynamischer Arbeitsblätter)<br />

erfragt.<br />

• Ableitung von Empfehlungen <strong>für</strong> den Einsatz dynamische Arbeitsblätter im <strong>Mathematik</strong>unterricht<br />

Aufgr<strong>und</strong> der gef<strong>und</strong>enen Resultate soll der Unterrichtseinsatz dynamischer Arbeitsblätter optimiert<br />

werden.<br />

72<br />

5


6<br />

Aus den Zielen können folgende forschungsleitende Fragestellungen abgeleitet werden:<br />

1. Sind die dynamischen Arbeitsblätter nutzergerecht konzipiert?<br />

Um dies beantworten zu können, werden von den Anwendern verschiedene Beschreibungen <strong>und</strong><br />

Beurteilungen zum Einsatz der dynamischen Arbeitsblätter im Unterricht erfragt.<br />

2. Gibt es besonders günstige Kontextbedingungen bzw. wichtige Einflussvariablen beim Einsatz<br />

dynamischer Arbeitsblätter im Unterricht zu beachten?<br />

Zu klären ist inwiefern bestimmte Kovariablen wie Vorkenntnisse, Leistungsstand etc. Wirkungen auf<br />

das Arbeiten mit dynamischen Arbeitsblättern erzielen.<br />

3. Lassen sich besondere Wirkungen auf die subjektiven Einstellungen der Lernenden feststellen?<br />

Hierbei geht es vor allem darum mögliche Folgen auf gr<strong>und</strong>sätzliche Haltungen zu erfassen.


2. Datenbasis<br />

In diesem Kapitel soll die vorhandene Datenbasis <strong>und</strong> <strong>ihre</strong> Erhebung erläutert sowie die Datenqualität<br />

untersucht werden. Beide Themenkreise sind <strong>für</strong> alle weiteren Schritte f<strong>und</strong>amental. Während dies <strong>für</strong><br />

die Datenerhebung <strong>und</strong> Datenstruktur schon deshalb einleuchtet, weil ohne diese Erläuterungen ein<br />

Verständnis kaum möglich ist, erfährt die Qualitätsbeurteilung <strong>und</strong> Qualitätssicherung oft zu wenig<br />

Aufmerksamkeit. Sie stellt aber in analoger Weise die Voraussetzung <strong>für</strong> zutreffende Schlussfolgerungen<br />

dar. Sonst kommt es zu dem bekannten „Müll rein- Müll raus-“ Effekt.<br />

2.1. Datenerhebung <strong>und</strong> Datenstruktur<br />

Auswahl der Klassen<br />

Die Teilnahme an der Befragung erfolgte auf freiwilliger Basis unter Gewährleistung von Anonymität.<br />

Diese Bedingung bewirkt üblicherweise, dass man eine Positivauswahl von Antworten erhält, da eher<br />

engagierte <strong>und</strong> interessierte Lehrkräfte Interesse an Befragungen zeigen. Als Argument gegen die<br />

Teilnahme an einer Befragung klingt im schulischen Bereich oft die Furcht vor Kontrolle des Unterrichts<br />

an bzw. die Furcht vor Beurteilungen, die nicht zuletzt <strong>für</strong> die schulische Laufbahn negative<br />

Konsequenzen nach sich ziehen könnten. Deshalb ist zu beachten, dass sich die aufgeschlossene<br />

Einstellung der beteiligten Lehrkräfte in der Führung <strong>und</strong> im täglichen Unterricht <strong>ihre</strong>r Klassen widerspiegeln<br />

kann <strong>und</strong> so Einfluss auf die Antworten <strong>ihre</strong>r Schüler bewirken kann. Es ist daher nicht ausgeschlossen,<br />

dass es bei der Auswertung zu – positiven – Verzerrungen kommen kann.<br />

Für den vorliegenden Datensatz haben 17 Gruppen (in der Regel Schulklassen) Datensätze geliefert,<br />

so dass insgesamt 365 Schülerbogen vorliegen. Zu betonen ist vorab, dass die Daten also in keiner<br />

Weise einer Zufallsstichprobe entstammen, sondern eine Sammlung aller verfügbaren Antworten darstellen.<br />

Insofern handelt es sich bei der vorliegenden Untersuchung auch nur um eine Beobachtungsstudie.<br />

Es sind zwar – außer den oben schon angesprochenen – keine augenfälligen Gründe <strong>für</strong> eine<br />

hierdurch bedingte Verzerrung der Resultate erkennbar, doch ist dies auch nicht auszuschließen. Die<br />

Teilnahme war auch <strong>für</strong> die Schüler freiwillig unter Zusicherung von Anonymität. Die Befragten wurden<br />

unmittelbar im Anschluss an die Arbeit mit einem dynamischen Arbeitsblatt gebeten, einen Erhebungsbogen<br />

auszufüllen. Dabei lassen sich gr<strong>und</strong>sätzlich zwei äußere Bedingungen unterscheiden,<br />

die möglicherweise Einfluss auf das Antwortverhalten der Schüler haben können. Wie in nachstehender<br />

Abbildung zu ersehen ist, wurde nur ein Teil der Bogen in der Schule unter realen Unterrichtsbedingungen<br />

erhoben, während der andere Teil im Rahmen einer Schulung von Schulklassen durch<br />

<strong>Lehrstuhl</strong>mitarbeiter an der Universität quasi unter speziellen Laborbedingungen erzielt wurde. Zudem<br />

ist zu unterscheiden, dass anfangs die Bogen in Printform vorlagen <strong>und</strong> zur elektronischen Weiterverarbeitung<br />

online eingegeben werden mussten (Klassensatz 20, 21, 22), während der Großteil der<br />

Schülerbogen direkt online ausgefüllt wurde. Zu einem kritischen Vergleich dieser beiden Möglichkeiten<br />

später mehr.<br />

Insgesamt beteiligten sich vier Klassen aus der Hauptschule, eine Realschulklasse, zehn Gymnasialklassen<br />

sowie eine schulart- <strong>und</strong> altersgemischte Gruppe (Girl’s Day / UBT) an der Befragung. Die<br />

Grafik zeigt des Weiteren die Verteilung in Jahrgangsstufen: zwei 6. Klassen (HS), acht 7. Klassen<br />

(GY), eine 8. Klasse (RS), zwei 9. Klassen (HS/GY) <strong>und</strong> zwei 10. Klassen (HS/GY).<br />

Bei vier Klassenpaaren handelt es sich um Parallelklassen: Das betrifft die zwei 7. Klassen aus Berlin,<br />

die zwei 7. Klassen aus Brandenburg, die zwei 7. Klassen des Richard-Wagner-Gymnasiums Bayreuth<br />

<strong>und</strong> die beiden 6. Klassen der Gutenberg-Schule Rehau. Wie die Verteilung in Jahrgangsstufen<br />

verdeutlicht, sind weitere jahrgangsparallele Datensätze vorhanden. Die 7. Jahrgangsstufe ist besonders<br />

häufig vertreten. Die Realschulklasse nahm zweimal teil (Herbst 2004, Frühjahr 2005). Außerdem<br />

wurden die dynamischen Arbeitsblätter „Thales“, „Pythagoras“, „Billard <strong>und</strong> Vierecke“ <strong>und</strong><br />

„Gr<strong>und</strong>erfahrungen“ von mehr als einer Klasse bearbeitet, so dass an dieser Stelle themenspezifische<br />

Teiluntersuchungen möglich sind.<br />

Die Grafik verdeutlicht außerdem, dass jene Schulklassen, die im Unterricht mit GEONExT arbeiteten<br />

<strong>und</strong> abschließend Fragebögen ausfüllten, von den Gruppen, die aufgr<strong>und</strong> der Unterstützung durch die<br />

Robert-Bosch-Stiftung im Rahmen eines Universitätsbesuches sich mit GEONExT beschäftigten, zu<br />

unterscheiden sind. Diese Differenzierung ist bedeutsam, da man annimmt, dass die Rahmenbedingungen<br />

<strong>für</strong> jene Gruppen, die durch die Robert-Bosch-Stiftung gefördert wurden, günstiger sind (z. B.<br />

durch den Universitätsbesuch: besondere Betreuung, Klassenausflug, andere Umgebung, etc). Dementsprechend<br />

ist zu fragen, inwiefern sich die günstigeren Bedingungen auf die Motivation oder die<br />

Einschätzung tatsächlich auswirken.<br />

7


P<br />

R<br />

I<br />

N<br />

T<br />

B<br />

O<br />

G<br />

E<br />

N<br />

8<br />

Überblick über Schulstufe, Klassenzusammensetzung, bearbeitetes Thema<br />

S<br />

C<br />

H<br />

U<br />

L<br />

I<br />

N<br />

T<br />

E<br />

R<br />

N<br />

U<br />

N<br />

I<br />

V<br />

E<br />

R<br />

S<br />

I<br />

T<br />

Ä<br />

T<br />

S<br />

B<br />

E<br />

S<br />

U<br />

C<br />

H<br />

Schul<br />

art<br />

Schul-<br />

stufe<br />

Klassen- <br />

Thema<br />

Schüler-<br />

zahl<br />

satz ( m / w )<br />

GY 7. 21 Umfangswinkel- 24<br />

Satz 12 / 12<br />

GY 7. 22 Dreiecke 27<br />

8 / 10 / 9 o.A.<br />

RS 8. 20 Thales 23<br />

Herbst 23 m<br />

RS 8. 3 Brüche 24<br />

Frühjahr 24 m<br />

GY 7. 12 Sehnen-Tang. 19<br />

Winkel 10 / 9<br />

GY 7. 17 Billard- 23<br />

Vierecke 23 w<br />

GY 7. 9 Billiard- 20<br />

Vierecke 20 w<br />

GY 9. 8 Pythagoras 24<br />

11 / 13<br />

GY 10. 7 Pythagoras 26<br />

11 / 15<br />

GY 7. 14 Vierecke 15<br />

3 / 12<br />

GY 7. 16 Thales 17<br />

5 / 12<br />

GY 7. 11 Thales 32<br />

21 / 11<br />

HS 6. 15 Gr<strong>und</strong>- 18<br />

Erfahrungen 12 / 6<br />

HS 6. 6 Gr<strong>und</strong>- 16<br />

Erfahrungen 11 / 5<br />

HS M 10 4 Parabeln 19<br />

11 / 8<br />

HS M 9 5 Strahlensatz 23<br />

14 / 9<br />

GY 7./ 1 15 1<br />

Girl’s Day 8./<br />

10./<br />

12.<br />

Goldener Schnitt<br />

8<br />

<strong>Mathematik</strong>/<br />

Kunst 4<br />

Was ist Schönheit?<br />

5<br />

1 In dieser Gruppe bearbeiteten einzelne Schüler mehrere Arbeitsblätter.<br />

Parallel-<br />

Klassen<br />

Brandenburg<br />

Zweimalige<br />

Teilnahme<br />

Parallel-<br />

Klassen<br />

Berlin<br />

Parallel-<br />

Klassen<br />

Bayreuth<br />

Parallel-<br />

Klassen<br />

Rehau


Abbildung 2 Überblick über Schulstufe, Klassenzusammensetzung, bearbeitetes Thema<br />

Erhebungszeitraum<br />

Die Bogen wurden im Schuljahr 2004/05 eingesandt. Mehrheitlich wurden diese aus folgenden Gründen<br />

im Frühjahr 2005 bearbeitet: Zum einen haben die Lehrkräfte in diesem Zeitraum Geometrie-<br />

Themen in <strong>ihre</strong>m Unterricht behandelt. Zum anderen wurden zwischen Februar 2005 <strong>und</strong> Juli 2005<br />

Schulklassen vom <strong>Lehrstuhl</strong> <strong>für</strong> <strong>Mathematik</strong> <strong>und</strong> <strong>ihre</strong> <strong>Didaktik</strong> an der Universität Bayreuth in das Arbeiten<br />

mit dynamischen Arbeitsblättern eingeführt.<br />

Erhebungsinstrument<br />

Als Befragungsinstrument wurde ein Erhebungsbogen 2 entwickelt, der neben soziometrischen Daten,<br />

wie Alter, Geschlecht, Schulstufe <strong>und</strong> Schulart im Wesentlichen aus 38 Aussagen zum Themenbereich<br />

dynamischer Arbeitsblätter besteht, denen die Befragten in einer vierstufigen Skala zustimmen<br />

können. Als Antwortmöglichkeiten sind „stimmt vollständig“, „stimmt eher“, „stimmt eher nicht“ <strong>und</strong><br />

„stimmt gar nicht“ vorgesehen. Außerdem ist es möglich „keine Angabe“ anzukreuzen. Das Antwortschema<br />

sieht also so aus:<br />

Item<br />

1. Ich habe...<br />

Abbildung 3 Antwortschema<br />

stimmt<br />

vollständig<br />

stimmt<br />

eher<br />

stimmt<br />

eher nicht<br />

stimmt<br />

gar nicht<br />

keine<br />

Angabe<br />

Um sicherzustellen, dass nicht nur Antworten zu Themen, die im Horizont der Fragebogenentwickler<br />

stehen, beantwortet werden, wurde der Bogen am Ende durch eine offene Fragestellung ergänzt (vgl.<br />

Czerwenka 1990). Die dort gesammelten Aussagen können als ergänzende Belege bzw. als Korrektiv<br />

<strong>für</strong> die nach Auszählungen gef<strong>und</strong>enen Ergebnisse dienen.<br />

Ausrichtung der Fragen<br />

Um die Antworten auszählen zu können, werden den Antwortmöglichkeiten Werte zugeordnet, die<br />

eine Mittelbildung ermöglichen. Eine offensichtliche Codierung reicht von „stimmt vollständig“ (Wert 1) 3<br />

über „stimmt eher“ (Wert 2) <strong>und</strong> „stimmt eher nicht“ (Wert 3) bis „stimmt gar nicht“ (Wert 4) <strong>und</strong> „keine<br />

Angabe“ (Lücke bzw. Wert 0). Allerdings ist es <strong>für</strong> eine aussagefähige Mittelwertbildung notwendig,<br />

dass die Codierungen „gleich gerichtet“ sind.<br />

Sind Items positiv gerichtet bedeutet das, dass ein Kreuz bei „stimmt vollständig“ einer positiven Aussage<br />

der Schüler entspricht. Ist dagegen ein Item negativ gerichtet, beinhaltet es also eine Verneinung<br />

oder ein negative Aussage, wie „verzichten“, „nicht gerne“ oder „schwierig“, so entspricht ein Kreuz bei<br />

„stimmt vollständig“ einer negativen, ein Kreuz bei „stimmt gar nicht“ dagegen einer positiven Antwort.<br />

Bei dem Entwurf eines Erhebungsbogens <strong>für</strong> Schüler <strong>und</strong> Schülerinnen muss man sich überlegen, wie<br />

man die Aussagen formuliert. Für den Einsatz von negativ formulierten Items sprechen zwei Gründe.<br />

Einerseits müssen die Fragen <strong>für</strong> die Schüler gut verständlich sein <strong>und</strong> sollten deshalb keine Doppelverneinungen,<br />

wie zum Beispiel „Ich hatte keine Schwierigkeiten...“ beinhalten. Andererseits kann<br />

man die Aussagen der Befragten bei Themen, die besonders interessieren überprüfen indem man sie<br />

doppelt – einmal positiv <strong>und</strong> einmal negativ gerichtet – abfragt.<br />

Man muss sich aber auch die Frage stellen, ob die Befragten bei einem negativ gerichteten Item genauso<br />

antworten, als wenn das Item positiv gerichtet worden wäre. Wahrscheinlich lehnt man negativ<br />

gerichtete Aussagen eher ab, wie man positiv gerichteten zustimmt. Dies hätte zur Folge, dass unterschiedlich<br />

gerichtete Items das Ergebnis der Erhebung verschieben könnten. Wechselt man aber positiv<br />

<strong>und</strong> negativ gerichtete Items im Erhebungsbogen ab, hebt sich diese Wirkung wieder auf. Man<br />

muss sich dabei allerdings stets bewusst sein, dass unterschiedlich gerichtete Items auch unterschiedliche<br />

Antwortmuster nach sich ziehen können.<br />

2<br />

Der Erhebungsbogen ist im Teil II abgedruckt (Bocka & <strong>Olbricht</strong> 2007).<br />

3<br />

Die Werte / Kodierungen 1,0 / 2,0...Lücke sind die in den Computerdaten verwendete Form der Antworten.<br />

9


10<br />

Umskalierung der Items<br />

Die Antworten mit den dazugehörigen Werten der negativ gerichteten Items werden inhaltlich umskaliert,<br />

dass heißt die negativ gerichteten Items werden in positiv gerichtete verwandelt, indem man <strong>ihre</strong><br />

Werte x <strong>für</strong> die numerischen Berechnungen umdreht <strong>und</strong> in (5 – x) transformiert. Aus einem Kreuz bei<br />

„stimmt vollständig“ wird somit ein „stimmt gar nicht“ hinsichtlich der ins Gegenteil transformierten<br />

Frage, aus einem bei „stimmt eher“ ein „stimmt eher nicht“ <strong>und</strong> anders herum. Der Wert 0 <strong>für</strong> „keine<br />

Angabe“ bleibt bestehen. Die umskalierten Items sind im Folgenden mit einer Markierung (∗) versehen.<br />

Zur Identifizierung der negativen Items wurde ein kleines Experiment durchgeführt: Acht verschiedene<br />

Personen wurden gebeten, sich die Aussagen durchzulesen <strong>und</strong> zu entscheiden, welche sie <strong>für</strong><br />

negativ formuliert halten. Unter diesen acht Personen befanden sich drei Studentinnen, die an der<br />

GEONExT-Erhebung mitarbeiten <strong>und</strong> fünf außen stehende Personen, die die Items zum ersten Mal<br />

sehen. Von diesen fünf Befragten sind zwei Schüler einer Realschule, die gelegentlich schon mit GE-<br />

ONExT gearbeitet haben.<br />

Item 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19<br />

Positiv<br />

gerichtet<br />

Negativ<br />

gerichtet<br />

8 8 8 0 8 8 0 0 0 8 0 0 8 8 8 8 1 8 8<br />

0 0 0 8 0 0 8 8 8 0 8 8 0 0 0 0 7 0 0<br />

Item 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38<br />

Positiv<br />

gerichtet<br />

Negativ<br />

gerichtet<br />

8 8 0 0 1 8 8 0 1 8 0 8 8 0 8 8 0 8 0<br />

0 0 8 8 7 0 0 8 7 0 8 0 0 8 0 0 8 0 8<br />

Tabelle 1 Ausrichtung der Items<br />

In diesen Tabellen kann man erkennen, dass die Befragten bei fast allen Items übereinstimmender<br />

Meinung waren. Zur Sicherheit werden die drei Items, bei denen Abweichungen vorliegen, nochmals<br />

genauer betrachtet.<br />

• Item 17: Ich fand den Computereinsatz überflüssig<br />

Stimmt man dieser Aussage zu, zielt die Antwort ins Negative. Die Aussage, dass man den Computereinsatz<br />

überflüssig fand spricht nicht <strong>für</strong> die Lernsoftware. Das bedeutet ein Kreuz bei „stimmt vollständig“<br />

entspricht einer negativen Bewertung von GEONExT. Deshalb ist dieses Item eindeutig negativ<br />

gerichtet.<br />

• Item 24: Ich arbeite nicht gerne mit Lernsoftware<br />

Stimmt man dieser Aussage zu bedeutet das, dass man ungern mit Lernsoftware arbeitet. Das heißt<br />

die Antwortrichtung zielt ins Negative. Deshalb ist dieses Item eindeutig negativ gerichtet.<br />

• Item 28: Ich finde es nicht gut, im Unterricht selbständig zu arbeiten<br />

Bei Zustimmung zu dieser Aussage bestätigt man, dass man die Selbständigkeit im Unterricht nicht<br />

gut findet. Etwas nicht gut oder auch schlecht finden zielt in die negative Richtung. Deshalb ist dieses<br />

Item eindeutig negativ gerichtet.<br />

Die zunächst nicht eindeutig klassifizierten Items erweisen sich also als negativ formuliert. Als Gr<strong>und</strong><br />

<strong>für</strong> die Abweichungen bei diesen drei Items kommen Flüchtigkeitsfehler oder Überlesen von Wörtern<br />

seitens der Befragten in Betracht. Die Umskalierung der Items ist damit überprüft <strong>und</strong> man kann davon<br />

ausgehen, dass die Daten ohne Fehler umcodiert worden sind.<br />

Ausfüllen der Bogen<br />

Insgesamt liegen 365 Erhebungbogen vor, von denen 291 in EDV Form im Internet unter<br />

www.geonext.de/evaluation ausgefüllt wurden <strong>und</strong> 74 in Printform. Ursprünglich wurde der Erhebungsbogen<br />

in Printform verwendet. Dies wurde auf Wunsch der Befragten geändert, da mit GEO-<br />

NExT am Computer gearbeitet wird <strong>und</strong> das Ausfüllen am Computer damit eine Erleichterung <strong>für</strong> die<br />

Durchführung der Befragung darstellt. In der EDV-Form konnten die Schüler kein Item auslassen, da<br />

sie nur vollständig ausgefüllte Erhebungsbogen abschicken konnten. Bei der Printform war dies leider


schon möglich, deshalb gibt es unterschiedliche Bedeutungen der 0: Einerseits Kreuze bei „keine<br />

Angabe“ <strong>und</strong> andererseits Leerzellen (nur bei den Bögen in Printform), wobei die Schüler gar kein<br />

Kreuz gemacht haben. Quantitativ ergibt sich, dass 5,73 % fehlende Werte („keine Angabe“) bei der<br />

Printform auftreten gegenüber 4,50 % bei der EDV-Form.<br />

Dieser Unterschied wäre bei der vorliegenden Anzahl der Erhebungsbogen signifikant.<br />

Die nahe liegende Vermutung, dass bei der Printvorlage des Erhebungsbogens mehr Schüler Items<br />

ausgelassen haben als bei der EDV-Form, bei der sie gezwungen waren, zumindest „keine Angabe“<br />

anzukreuzen, bestätigt sich also. Insofern stellt die Onlineversion auch in dieser Hinsicht eine Verbesserung<br />

in der Datenerhebung dar. Um im weiteren Verlauf der Untersuchung nicht mit zu komplizierten<br />

Aufschlüsselungen <strong>für</strong> die Printform arbeiten zu müssen, werden die beiden verschiedenen<br />

Werte „keine Angabe angekreuzt“ <strong>und</strong> „nichts angekreuzt“ zusammengefasst <strong>und</strong> als gleichwertig<br />

betrachtet. Angesichts der letztlich geringen Anteile fehlender Werte <strong>und</strong> der noch geringeren Differenz<br />

zwischen Print- <strong>und</strong> EDV-Form erscheint dies vertretbar.<br />

2.2. Qualitätssicherung <strong>und</strong> Qualitätsbeurteilung<br />

Generelles<br />

Weit seltener als eine genaue Erläuterung findet sich in empirischen Untersuchungen eine detaillierte<br />

Diskussion der Datenqualität. Es wird zu unrecht stets unterstellt, dass die Daten „stimmen“. Hintergr<strong>und</strong><br />

scheint die Überzeugung zu sein, dass bei normaler Sorgfalt Datenprobleme auszuschließen<br />

seien. Dies ist jedoch nicht richtig. Gerade durch das natürliche Wachsen nahezu jeder empirischen<br />

Untersuchung bei der sich fast immer Fragebogen, Antwortmöglichkeiten oder Erfassungstechniken<br />

ändern, ergibt sich ein weites Feld <strong>für</strong> Fehlerquellen. Dass darüber nahezu nie berichtet wird verstärkt<br />

noch den Eindruck, Datenqualität sei selbstverständlich <strong>und</strong> eigentlich kein Problem, was wiederum<br />

zur Unterschätzung der Thematik führen kann. Dem soll hier ausdrücklich <strong>und</strong> nachdrücklich entgegen<br />

getreten werden.<br />

Dazu ist zunächst festzuhalten, dass mangelnde Datenqualität viele Ursachen haben kann: Eingabefehler,<br />

Bedienungsfehler, Berechnungsfehler, Verständnisfehler <strong>und</strong> mangelnde Seriosität bei den<br />

Antworten können etwa alle zu problematischen Daten führen, die dann ebenso problematische Analysen<br />

nach sich ziehen. Analog zu den Qualitätssicherungsprogrammen der Industrie sollte man daher<br />

auch Qualitätssicherung niemals als ein statisches Unterfangen, sondern immer als einen dynamischen<br />

Prozess betrachten, der ein Projekt auf allen Stufen begleitet <strong>und</strong> laufend überwacht.<br />

Eingabe- <strong>und</strong> Bedienungsfehler<br />

Da die Klassensätze 2, 10 <strong>und</strong> 13 noch nicht direkt online erhoben wurden, mussten die Werte nachträglich<br />

im Computer erfasst werden. Im Einklang mit den obigen Prinzipien wurden deshalb im Rahmen<br />

dieser Untersuchung die bereits von Hilfskräften eingegebenen Daten nochmals mit den von den<br />

Schülern per Hand ausgefüllten Printbogen abgeglichen <strong>und</strong> auf Eingabefehler untersucht. Die Ergebnisse<br />

(vgl. Reuschlein 2006 <strong>für</strong> Details) waren überraschend <strong>und</strong> bemerkenswert: Es stellte sich<br />

nämlich heraus, dass die bisher als Computerdatei erfassten Daten in erheblichem Umfang von den<br />

Angaben in den Printbogen abwichen. Dabei ist natürlich zu berücksichtigen, dass die Reihenfolge bei<br />

den Printbogen <strong>und</strong> den Erfassungen permutiert sein konnte. Bemerkenswerterweise ließen sich aber<br />

auch markante Einzelbogen (z. B. der des einzigen 14-jährigen in den Printbogen <strong>und</strong> der EDV-<br />

Erfassung) in keiner Weise sinnvoll zuordnen. Somit blieb auch die Ursache <strong>für</strong> die fehlenden Übereinstimmungen<br />

unklar. Letztlich ließ sich das Problem nur durch eine (überprüfte) Neueingabe der<br />

Klassensätze 21, 22 <strong>und</strong> 20 lösen. Wir möchten nochmals davor warnen, dies als ungewöhnlichen<br />

Einzelfall anzusehen – es illustriert vielmehr die allgemein unterschätzte Notwendigkeit, Datenkontrolle<br />

ganz Ernst zu nehmen. Aus diesem Gr<strong>und</strong> haben wir das Phänomen hier auch beschrieben, was<br />

sonst fast nie geschieht. Eine bemerkenswerte Ausnahme ist Breiman (1985).<br />

Abhilfe kann man wieder durch die direkte EDV-Erfassung schaffen, die schon in Hinblick auf fehlende<br />

Werte als sinnvoll erkannt wurde. Hierdurch werden Übertragungsfehler fast vollständig vermieden.<br />

Allerdings hat man nach wie vor keine Klarheit über etwaige Bedienungsfehler seitens des Teilnehmers.<br />

Wer Schwierigkeiten mit der Mausbedienung hat (Item 7), klickt vielleicht gerade deswegen eine<br />

unbeabsichtigte Kategorie an! Allerdings dürfte sich hier die von uns in anderer Hinsicht favorisierte<br />

Vorerhebung auch als nützliches Vortraining erweisen. Im vorliegenden Fall haben wir keine Anzeichen<br />

von Bedienungsfehlern (z. B. durch Rückmeldungen).<br />

11


12<br />

Berechnungs- <strong>und</strong> Verständnisfehler<br />

Die Auswertung der Daten wird typischerweise mit Hilfe von EDV-Programmen (im vorliegenden Fall<br />

z.B. EXCEL <strong>und</strong> S-PLUS) vorgenommen. Es mag daher überflüssig erscheinen, systematisch die<br />

Ergebnisse zu kontrollieren. Allerdings lehrt die Erfahrung, dass sich auch bei EDV-Benutzung leicht<br />

Programmierfehler oder falsche Datenzugriffe einschleichen. Am besten schafft man hier Abhilfe<br />

durch Gegenprüfungen (crosschecks) <strong>und</strong> summarische – leicht kontrollierbare – Abgleiche wie Quersummen,<br />

Minima <strong>und</strong> Maxima.<br />

Verständnisfehler beziehen sich schließlich auf die Möglichkeiten, Fragen <strong>und</strong> Antwortoptionen semantisch<br />

misszuverstehen. Als Vorbeugung wird man gr<strong>und</strong>sätzlich auf möglichst klare <strong>und</strong> eindeutige<br />

Formulierungen achten. Gleichwohl empfiehlt sich in der Regel ein Testlauf mit der beabsichtigten<br />

Zielgruppe. Auch in dieser Hinsicht kann eine Vorerhebung hilfsweise größere Probleme anzeigen.<br />

Nicht zu unterschätzen ist bei der Durchführung von Schülerbefragungen die Problematik des Jugendjargons<br />

(vgl. Czerwenka 1990).<br />

Mangelnde Seriosität der Antworten<br />

In anekdotenhafter oder essayistischer Form wird diese Problematik oft behandelt – leider beschränkt<br />

sich ihr Vorkommen aber nicht auf solche Fälle. Es ist vielmehr davon auszugehen, dass viele Antworten<br />

in Umfragen schlichtweg nicht ehrlich sind. Als Gründe kommen verschiedenste psychologische<br />

Motive in Betracht. In einigen Fällen kann man durch objektive Überprüfungen Vorhandensein <strong>und</strong><br />

Ausmaß solcher unseriösen Antworten abschätzen.<br />

In der vorliegenden Untersuchung war es beispielsweise durch persönlichen Kontakt mit einer Lehrkraft<br />

möglich, eine Liste mit der im Bogen erfragten Zensur im letzten Zeugnis zu erhalten. Ein Vergleich<br />

der Lehrer- mit den Schülerangaben brachte Erstaunliches zu Tage: Nur bei den Extremwerten<br />

der Noten 1 <strong>und</strong> 6 herrscht Übereinstimmung. Bei Notenstufe 2 kann die Abweichung noch durch die<br />

unterschiedliche Anzahl von Schülern bei der Lehrer- <strong>und</strong> bei der Schülerliste erklärt werden. Bei den<br />

restlichen Zensuren 3, 4 <strong>und</strong> 5 ist jedoch die Differenz bei den erzielten Noten nicht nachvollziehbar.<br />

Note 1 Note 2 Note 3 Note 4 Note 5 Note 6<br />

Lehrerdaten 0 2 10 11 6 0<br />

Schülerantworten 0 5 13 3 2 0<br />

Tabelle 2 Angegebene Zensuren<br />

Als erste Möglichkeit kann man eine Fehlinterpretation der Fragestellung durch die Schüler (gefragt<br />

war nach der Zensur im letzten Zeugnis <strong>und</strong> nicht etwa nach der letzen Probearbeit oder Schulnote)<br />

<strong>und</strong> daraus resultierender Antwort in Betracht ziehen. Die Frage scheint aber weder semantisch noch<br />

inhaltlich zweideutig zu sein, so dass man dieses Erklärungsmuster ausschließen kann. Vielmehr ist<br />

man zu dem Schluss gezwungen, dass nicht ehrlich geantwortet wurde.<br />

Als Empfehlung lässt sich schon an dieser Stelle aussprechen, dass Schülerangaben zu erhaltenen<br />

Zensuren mit Vorsicht zu behandeln sind. Besser wäre es, nach einer Möglichkeit zu suchen, diese<br />

mit den Notenlisten der Lehrkräfte bei der Befragung abzugleichen. Allerdings ist dabei die Anonymität<br />

der Befragten zu gewährleisten.<br />

Auffälligkeiten von Schülern<br />

Nicht immer stehen externe (objektive) Daten zur Überprüfung bereit. Dann bleibt immerhin die Möglichkeit<br />

nach Auffälligkeiten bei der Verteilung der Schülerantworten, fehlenden Werten, konsistentem<br />

Antwortverhalten bzw. Ankreuzmustern in den Schülerantworten zu suchen, um zu sehen, ob „etwas<br />

nicht stimmt“.<br />

In der folgenden Graphik (Mittelwert-SD-Diagramm) werden als ein erster Versuch alle Schüler mit<br />

<strong>ihre</strong>n Werten <strong>für</strong> das Gesamtmittel <strong>und</strong> die Gesamtstandardabweichung (Gesamtsd) – jeweils berechnet<br />

unter Weglassung fehlender Werte – in einem Streuungsdiagramm dargestellt. Die einzelnen<br />

Schüler sind dabei durch <strong>ihre</strong>n Klassensatz als Symbol gekennzeichnet, wobei verschiedene Klassensätze<br />

verschiedene Farben haben. Wegen der hohen Anzahl von Klassensätzen ist aber die Farbcodierung<br />

nicht einfach. Immerhin lassen sich auf dies Weise zusammenhängende Gruppierungen<br />

von Daten aus den gleichen Klassensätzen leicht erkennen.


Gesamtsd<br />

1.6<br />

1.4<br />

1.2<br />

1.0<br />

0.8<br />

0.6<br />

0.4<br />

1.0 1.5 2.0 2.5 3.0<br />

Abbildung 4 Mittel-SD-Diagramm<br />

5<br />

8<br />

9<br />

22 11<br />

11<br />

15<br />

21 11 12<br />

11<br />

22 11<br />

16 15<br />

22 1622<br />

16<br />

21 16<br />

16<br />

4 22 11 7<br />

12<br />

22 11 1<br />

4<br />

12 12<br />

21<br />

8<br />

12<br />

11<br />

22 11 12<br />

12 9 8<br />

22<br />

6<br />

1617<br />

15<br />

11<br />

22 11<br />

11<br />

17 12<br />

6 8 219<br />

5<br />

7<br />

21<br />

15 8<br />

17 7<br />

12<br />

6<br />

17<br />

7<br />

8<br />

11<br />

17 7<br />

17<br />

7 1<br />

3 8 20<br />

22<br />

1<br />

4 22<br />

21<br />

4<br />

5<br />

7<br />

9<br />

8 11<br />

21<br />

3<br />

1<br />

7<br />

14 12<br />

3<br />

7<br />

7<br />

8<br />

9<br />

1<br />

5<br />

3 9<br />

11<br />

20 21<br />

16<br />

16<br />

15<br />

22<br />

15<br />

8 22 11 7 7 14 21<br />

17<br />

17<br />

9<br />

4<br />

3 5<br />

4 1<br />

5 9<br />

21<br />

8 6<br />

21 12<br />

15<br />

8<br />

14<br />

6 4 12<br />

22 16<br />

5<br />

4<br />

6 3<br />

7<br />

78<br />

7 7 8<br />

822<br />

11 14 9<br />

21<br />

9<br />

21<br />

21<br />

14<br />

1<br />

17 11<br />

8<br />

17 20<br />

7 4<br />

9<br />

8 6 14<br />

14<br />

17<br />

14<br />

21<br />

7 3 8<br />

8<br />

11<br />

4<br />

3<br />

4<br />

4 7<br />

6 8<br />

14 15<br />

8 12<br />

1<br />

5 9<br />

6<br />

17<br />

7<br />

8<br />

20 20<br />

21<br />

20<br />

9<br />

20 5<br />

1<br />

9<br />

1<br />

3<br />

3 5 14 5<br />

17<br />

6<br />

9<br />

15 15 17 7<br />

14<br />

15<br />

14<br />

21<br />

20 22 16 20<br />

46<br />

17 5<br />

1 36<br />

7 9<br />

22<br />

15<br />

20 20<br />

9 7 8 17 5 4 15<br />

17 16<br />

16 6 8 5 11<br />

20<br />

7 16 15 5<br />

3<br />

4 3 14 3<br />

3<br />

5<br />

5 15 2120<br />

15<br />

4 5 6<br />

11<br />

20 20<br />

21<br />

3<br />

3<br />

5<br />

14<br />

1<br />

3<br />

20<br />

14 9 1122<br />

21 20 17 20<br />

20 144<br />

20 1<br />

3<br />

4<br />

17<br />

5<br />

17<br />

7 3<br />

3<br />

20<br />

15 20<br />

20<br />

5 9<br />

5<br />

17<br />

15<br />

22 16<br />

11<br />

1122<br />

1122<br />

16<br />

22 11 16<br />

21<br />

2122<br />

11<br />

12<br />

22 16<br />

21 11<br />

9<br />

11<br />

35<br />

3<br />

17<br />

Gesamtmittel<br />

Man erkennt z. B. deutlich einige kohärente Substrukturen in den Daten. Hauptzweck des Plots ist es<br />

aber an dieser Stelle, Befragte mit ungewöhnlichen summarischen Werten (Gesamtmittel <strong>und</strong> Gesamtsd)<br />

deutlich hervortreten zu lassen. Es zeigt sich, dass unter den Schülern mit hoher Gesamtsd<br />

(etwa größer als 1.3) recht viele aus Klassensatz 12 stammen. Weiterhin sind unter den Schülern mit<br />

hohem Wert des Gesamtmittels auffällig viele aus Klassensatz 11 vertreten. Schließlich weisen umgekehrt<br />

die Klassensätze 3, 5 <strong>und</strong> 20 meist kleine Werte des Gesamtmittels bei kleinen Standardabweichungen<br />

auf (d. h. sie beurteilen GEONExT konstant recht positiv). Man kann aber nicht sagen, dass<br />

der Datensatz als Ganzes in klare Teilgruppen zerfällt. Auch „Cliquen“ mit eindeutig unplausiblen Antworten<br />

(z. B. Gesamtmittel = 4.0 <strong>und</strong> Gesamtsd = 0.0) tauchen nicht auf.<br />

Auftreten <strong>und</strong> Verteilung von fehlenden Werten <strong>und</strong> Randwerten<br />

Auch das Auftreten fehlender Werte sollte auf Muster untersucht werden. Gr<strong>und</strong>sätzlich bedeuten<br />

fehlende Werte im Datensatz (Lücke), dass Teilnehmer „keine Angabe“ markiert haben. Lediglich 12<br />

Schüler haben also mehr als neunmal „keine Angabe“ gewählt. Sie verteilen sich zudem unauffällig<br />

über den Gesamtdatensatz. Die folgende Graphik gibt die Anzahl der angekreuzten „keine Angabe“<br />

<strong>für</strong> die einzelnen Schüler an:<br />

12<br />

6<br />

11 12<br />

12<br />

7<br />

21<br />

12<br />

22<br />

11<br />

12<br />

17<br />

22 16<br />

22 11<br />

13


14<br />

35,00<br />

30,00<br />

25,00<br />

20,00<br />

15,00<br />

10,00<br />

5,00<br />

Abbildung 5 Anzahl „keine Angabe“<br />

Ebenso interessiert natürlich auch das häufige Auftreten von Randwerten, also sowohl sehr hohen<br />

(ceiling) als auch sehr niedrigen (floor) Antwortoptionen. In folgender Graphik lässt sich die Anzahl der<br />

angekreuzten „stimmt vollständig “ <strong>für</strong> die einzelnen Schüler ablesen.<br />

35,00<br />

30,00<br />

25,00<br />

20,00<br />

15,00<br />

10,00<br />

5,00<br />

Anzahl der angekreuzten "stimmt vollständig"<br />

0,00<br />

0 50 100 150 200 250 300 350 400<br />

Abbildung 6 Anzahl „stimmt vollständig“<br />

In entsprechender Weise zeigt die nächste Graphik die Anzahl der angekreuzten „stimmt gar nicht“ <strong>für</strong><br />

die einzelnen Befragten an:<br />

25,00<br />

20,00<br />

15,00<br />

10,00<br />

5,00<br />

Anzahl der angekreuzten "keine Angabe"<br />

0,00<br />

0 50 100 150 200 250 300 350 400<br />

Anzahl der angekreuzten "stimmt gar nicht"<br />

0,00<br />

0 50 100 150 200 250 300 350 400<br />

Abbildung 7 Anzahl „stimmt gar nicht“<br />

Beunruhigende Auffälligkeiten zeigen sich in keiner der beiden Graphiken. Allerdings lässt sich deutlich<br />

erkennen, dass es einen asymmetrischen Zug zu „stimmt vollständig“ gibt. Diese Antwort wurde


sehr häufig, das Pendant „stimmt gar nicht“ nur sehr selten gewählt. Die letzte Graphik verdeutlicht<br />

außerdem, dass in zwei Bereichen der Wert 4 („stimmt gar nicht“) öfter als 10-mal gewählt wurde:<br />

zwischen den Schülern 149 <strong>und</strong> 216 <strong>und</strong> zwischen Schüler 319 <strong>und</strong> 363. Das deckt sich fast exakt mit<br />

dem Bereich der Klassensätze 9, 11 <strong>und</strong> 12 bzw. den Klassensätzen 21 <strong>und</strong> 22.<br />

In der folgenden Tabelle sind abschließend zur genaueren Analyse die Verteilungen aller Antwortkategorien,<br />

einschließlich derer <strong>für</strong> „stimmt eher“ <strong>und</strong> „stimmt eher nicht“, zusammengefasst. Die Tabelle<br />

zeigt die jeweilige Anzahl der Schüler, die eine bestimmte Antwortmöglichkeit x-mal angekreuzt haben.<br />

Beispielsweise haben 16 Schüler die Antwort „stimmt vollständig“ zwischen 0- <strong>und</strong> 5-mal angekreuzt.<br />

Anzahl wie oft<br />

gewählt wurde<br />

stimmt vollständig<br />

0 – 5 6 - 10 11 - 15 16 - 20 21 - 25 26 - 30 31 - 35 36 - 38<br />

16 85 104 79 57 21 3 0<br />

stimmt eher 63 120 107 55 16 3 1 0<br />

stimmt eher<br />

nicht<br />

stimmt gar<br />

nicht<br />

219 109 36 1 0 0 0 0<br />

279 48 25 13 0 0 0 0<br />

keine Angabe 332 23 4 2 1 2 1 0<br />

Tabelle 3 Verteilung der Antworten<br />

Hier zeigt sich eine stark ausgeprägte Asymmetrie, die einerseits eine ungünstige Kalibrierung der<br />

Fragestellung andeuten können oder aber andererseits auf die positiven Resultate zurückzuführen<br />

sind. Darauf wird später noch einzugehen sein.<br />

Ankreuzschemata <strong>und</strong> inhaltlich konsistentes Antwortverhalten<br />

Eine weitere potentielle Art von Auffälligkeiten in Schülerantworten stellen Ankreuzschemata dar. Das<br />

wären z.B. Antworten mit zwei oder drei sich abwechselnden Werten (z. B.12121.. oder 113344<br />

113344), mit auf- <strong>und</strong> absteigenden Reihen (z.B. 1234 321 234.. oder 1234 1234 1234..) oder Ketten<br />

mit gleichen Zahlen wie 1111.. etc. Solche Schemata konnten in Reinform nicht nachgewiesen werden.<br />

Allerdings besteht gleichwohl die Möglichkeit, dass ein Fragebogen willkürlich ausgefüllt wurde <strong>und</strong><br />

auf den Inhalt der Fragen gar nicht geachtet wurde. Es wäre natürlich sinnvoll, solche Bogen auszuschließen.<br />

Als ein elementarer deskriptiver Test werden hierzu die einzelnen Schülerantworten im<br />

Sinne der Skalen gruppiert, da diese zusammengehörende Items eines Themas bündeln. Mit Hilfe von<br />

Mittelwert <strong>und</strong> Standardabweichung wird dann überprüft, inwiefern <strong>und</strong> inwieweit Antworten zum gleichen<br />

Thema voneinander abweichen. Zur Illustration sei folgendes Beispiel eingefügt. Skala 1 umfasst<br />

die Items 1, 7, 22, 26, 31.<br />

Es werden die Antworten der Schüler betrachtet: Zum Beispiel kreuzte Schüler RowNr 5 an:<br />

Item 1 7 22 26 31<br />

Wert 1 1 1 1 1<br />

Tabelle 4 Antworten von Schüler RowNr 5<br />

Der Mittelwert 1,0 <strong>und</strong> die Standardabweichung σ = 0 lassen auf ein konsistentes Antwortschema<br />

schließen. Als ein anderes Beispiel kreuzte Schüler RowNr 66 an:<br />

Item 1 7 22 26 31<br />

Wert 1 1 4 3 1<br />

Tabelle 5 Antworten von Schüler RowNr 66<br />

15


16<br />

Der Mittelwert 2,0 <strong>und</strong> die Standardabweichung σ = 1,41 werfen hier die Frage auf, inwieweit dieses<br />

Antwortverhaltens noch konsistent ist.<br />

Es gibt natürlich keine feste Regel („benchmark“), ab wann ein Antwortverhalten als auffällig gelten<br />

soll, zumal die Skalen unterschiedlich viele Items umfassen, die noch dazu nicht unabhängig sind.<br />

Aus rein pragmatischen Gründen sowie einigen empirischen Erwägungen wird deshalb hier mit dem –<br />

zugegebenermaßen willkürlichen – Grenzwert 1,3 gearbeitet.<br />

Die folgende Tabelle fasst die Ergebnisse zusammen:<br />

Skala<br />

Anzahl der darunter-<br />

liegenden Schüler<br />

Tabelle 6 Antwortverhalten der Schüler<br />

Anzahl der „auf-<br />

fälligen" Schüler<br />

1 332 (91,0%) 33 (9,0%)<br />

2 213 (58,4%) 152 (41,6%)<br />

3 335 (91,8%) 30 (8,2 %)<br />

4 349 (95,6%) 16 (4,4%)<br />

5 341 (93,4%) 24 (6,6%)<br />

6 331 (90,7%) 34 (9,3%)<br />

7 291 (79,7%) 74 (20,3%)<br />

8 320 (87,7%) 45 (12,3%)<br />

9 344 (94,3%) 21 (5,7%)<br />

Das Resultat ist recht beruhigend: Die große Mehrzahl der Schüler scheint konsistent zu antworten.<br />

Der Anteil von Teilnehmern, der höhere Streuungen besitzt, befindet sich zumeist unter 10%. Allerdings<br />

fällt Skala 2 hier deutlich aus dem Rahmen, da hier nur 58,4% der Schüler zum konsistenten<br />

Bereich gehören. Skala 7 <strong>und</strong> 8 liegen mit etwa 80 % <strong>und</strong> 88 % ebenfalls über der 10%-Marke. Neben<br />

potentiell inkonsistentem Verhalten seitens einzelner Schüler kann dies – gerade weil es sich auf einzelne<br />

Skalen konzentriert – auch umgekehrt ein Hinweis darauf sein, dass diese Skalen intern selbst<br />

nicht konsistent sind, sondern divergierende Fragestellungen kombinieren. Später werden diese Aspekte<br />

noch ausführlich beleuchtet.<br />

Es ist interessant, jene Schüler herauszufiltern, die tatsächlich auffallen, da sie mehrmals im „nichtkonsistenten“<br />

Bereich liegen:<br />

Anzahl der auffälligen Skalen 0 1 2 3 4 5 6 7 8 9<br />

Schüleranzahl 145 119 56 29 10 1 2 1 0 2<br />

Tabelle 7 Anzahl auffälliger Schüler bei den Skalen<br />

Nur 16 Schüler, d. h. 4,4% von 365, haben auffällige Werte bei mehr als vier Skalen. Diese 16 Schüler<br />

sind:


Anzahl<br />

auffälliger<br />

Skalen<br />

Row<br />

Klassensatz<br />

Skala 1<br />

Skala 2<br />

Skala 3<br />

9 170 11 x x x x x x x x x<br />

9 200 12 x x x x x x x x x<br />

7 86 6 x x x x x x x<br />

6 187 11 x x x x x x<br />

6 359 22 x x x x x x<br />

5 241 15 x x x x x<br />

4 83 6 x x x x<br />

4 107 7 x x x x<br />

4 176 11 x x x x<br />

4 181 11 x x x x<br />

4 188 11 x x x x<br />

4 209 12 x x x x<br />

4 216 12 x x x x<br />

4 255 16 x x x x<br />

4 351 22 x x x x<br />

4 354 22 x x x x<br />

Tabelle 8 Auffällige Schüler<br />

In der Tabelle sind die Skalen, in welchen ein Schüler auffällige Werte aufweist, mit einem Kreuz versehen.<br />

Es fällt auf, dass die „Problemfälle“ einigen wenigen Klassensätzen angehören. Insbesondere<br />

Klassensatz 11 ist allein fünfmal vertreten, Klassensatz 12 <strong>und</strong> 22 je dreimal.<br />

Es zeigt sich, dass die Daten als in hohem Maß konsistent betrachtet werden können, da die als konsistent<br />

angenommenen Daten je nach Skala über 80% liegen. Im Übrigen wird nur ein sehr geringer<br />

Anteil (


18<br />

Antworten, aber all dies hält sich in relativ engen Grenzen. Deswegen scheint es auch unangebracht,<br />

durch Ausschließen von Fragenbogen den Datensatz – letztlich etwas willkürlich – zu verändern. Wir<br />

wollen lieber den umgekehrten Weg gehen <strong>und</strong> nur solche Analysetechniken verwenden, die durch<br />

etwaige kleine Anomalien nicht beeinträchtigt werden, mit anderen Worten es soll eher ein deskriptives<br />

solides Vorgehen bei der Auswertung eingeschlagen werden.<br />

Inhaltlich sei schon festgehalten, dass es bei Skala 2 Anzeichen <strong>für</strong> fehlende Konsistenz gibt. Ferner<br />

scheinen die Klassensätze 11, 12 <strong>und</strong> 22 einige „auffällige Teilnehmer“ zu umfassen.


3. Untersuchung der Items<br />

In diesem Kapitel geht es darum, schwerpunktmäßig den Datensatz von den Items her zu untersuchen.<br />

Es interessiert insbesondere, ob <strong>und</strong> wie sich die Items inhaltlich in Gruppen zusammenfassen<br />

<strong>und</strong> durch Skalen bündeln lassen. Dem wird als zweiter Schritt eine datenbasierte Skalenbildung gegenübergestellt.<br />

Dabei wird untersucht, wie sich die Items nicht vom Inhalt, sondern von den gegebenen<br />

Antworten her gruppieren. Idealerweise sollte natürlich beides in etwa zusammenfallen. Einen<br />

weiteren Schwerpunkt bildet ein Abschnitt über klassische Kennzahlen der Itemanalyse (Boden- <strong>und</strong><br />

Deckeneffekte, Cronbach’s α). Schließlich werden die interessantesten Kovariablen (Geschlecht, Zensur,<br />

Schulart, Anzahl der Arbeitsblätter, Klassenstufe) im Spiegel der Skalen beleuchtet, um zu untersuchen,<br />

ob es hier besonders auffällige Verschiebungen in den Skalenprofilen gibt.<br />

3.1. Inhaltliche Skalenbildung<br />

Gruppierung der Items <strong>und</strong> <strong>ihre</strong> Begründung<br />

Um die Ziele der Untersuchung erreichen zu können, wurden a priori Items in Form von Aussagen<br />

festgelegt <strong>und</strong> zu Skalen gruppiert. Als Quelle dienten bisherige Untersuchungen zur Schülersicht<br />

über Schule <strong>und</strong> Unterricht (vgl. Bocka, Czerwenka, Weinert) bzw. Studien über Schulleistungen (vgl.<br />

Helmke, PISA). Um <strong>für</strong> alle Schülerinnen <strong>und</strong> Schüler eine Verständlichkeit der Items zu erleichtern<br />

<strong>und</strong> eine persönliche Betroffenheit auszulösen, wurde als einheitlicher Satzanfang „Ich...“ festgelegt.<br />

Als maximale Bearbeitungsdauer des Bogens wurden 15 Minuten 4 angestrebt, weswegen die Anzahl<br />

der Items auf 38 begrenzt wurde. Diese 38 Items verteilen sich aus folgenden Überlegungen heraus<br />

auf neun Themenkreise (Skalen):<br />

Im Zentrum des Interesses stehen die Rückmeldungen von GEONExT-Anwendern zu dynamischen<br />

Arbeitsblättern. Dieser Bereich gliedert sich in den Aufbau der dynamischen Arbeitsblätter (Skala 4)<br />

<strong>und</strong> die Beurteilung des bearbeiteten Themas (Skala 5), den bei der Bearbeitung benötigten Zeitaufwand<br />

(Skala 6) <strong>und</strong> die Beurteilung des selbständigen Arbeitens (Skala 7). Flankierend dazu sollen<br />

Aussagen erfragt werden über bestehende Kontextbedingungen <strong>und</strong> mögliche Wirkungen. Deshalb<br />

werden Vorerfahrungen mit dem Medium Computer (Skala 1) <strong>und</strong> dabei speziell mit Lernsoftware<br />

(Skala 2) ermittelt, sowie nach der Bedeutung des Computers als Lernwerkzeug (Skala 3) gefragt.<br />

Gr<strong>und</strong>sätzliche Einstellungen zum Themengebiet (Skala 9) können sowohl als Kontextbedingung als<br />

auch als mögliche Wirkungen beurteilt werden, die Frage nach weiterem Einsatz von Lernsoftware<br />

(Skala 8) zielt auf mögliche positive Effekte.<br />

Um die Zugehörigkeit der Items zu den Skalen überprüfen zu können, werden die Items zunächst<br />

nach inhaltlichen Aspekten den verschiedenen Skalen zugeordnet. Deshalb werden die neun vorab<br />

konzipierten Skalen nochmals genauer diskutiert. Die 38 Items werden dazu der Reihe nach einzeln<br />

durchgegangen <strong>und</strong> einer Skala, bei Grenzfällen auch mehreren Skalen, zugeteilt. Diese Zuordnung<br />

wird dann nochmals durch weitere unabhängige Meinungen abgeklärt. Da das Erhebungsinstrument<br />

(Fragebogen) von zentraler Bedeutung <strong>für</strong> die vorliegende Untersuchung ist, soll diesen Aspekten<br />

breiter Raum gewidmet werden.<br />

Skala 1: Vorerfahrungen mit Computern<br />

Diese Skala soll Aussagen enthalten, die auf Vorerfahrungen mit dem Computer zielen.<br />

Eindeutig zur Skala gehörend ist Item 1 (Ich habe Erfahrung mit Computern.). Item 7 (Ich hatte<br />

Schwierigkeiten, mit der Maus die Befehle auszuführen.), genauso wie Item 22 (Ich habe Hemmungen,<br />

mit dem Computer zu arbeiten.), lassen auf fehlende Erfahrung im Umgang mit dem Computer<br />

schließen <strong>und</strong> sind deshalb negativ gerichtete Aussagen nach Vorerfahrungen mit dem Computer. Die<br />

inhaltliche Gegenfrage dazu ist Item 26 (Ich fühle mich sicher im Umgang mit dem Computer.), was<br />

sicherlich durch oftmalige Benutzung gefördert wird. Voraussetzung <strong>für</strong> die regelmäßige Computernutzung<br />

<strong>und</strong> dadurch resultierenden Vorerfahrungen ist die Möglichkeit, zu Hause einen Computer<br />

nutzen zu können bei Item 31 (Ich habe die Möglichkeit zuhause einen Computer zu nutzen.).<br />

4 Zeitmessungen bei den an der Universität betreuten Gruppen ergaben eine durchschnittliche Bearbeitungsdauer<br />

von 8-15 Minuten. Der höchste Wert wurde in solchen Hauptschul-Klassen erzielt, in<br />

denen die Lehrkraft die Items vorlas, um Verständnisschwierigkeiten von Seiten der Schüler ausschließen<br />

zu können. Dieses Vorgehen können wir <strong>für</strong> leseschwache Klassen empfehlen, da wir den<br />

Nutzen hinsichtlich der Verständlichkeit höher einschätzen als eine mögliche Beeinflussung im Antwortverhalten<br />

durch das Vorlesen.<br />

19


20<br />

Die Zuteilung dieser fünf Items zu dieser Skala ist recht eindeutig, nur Item 31 lässt nicht direkt auf die<br />

Vorerfahrungen schließen, da die Möglichkeit noch nicht den konkreten Gebrauch beinhaltet. Vielleicht<br />

sollte man dieses Item deshalb in „Ich habe zu Hause Zugang zu einem Computer <strong>und</strong> nutze ihn<br />

auch.“ ändern, um sicher zu gehen, dass die Schüler damit auch Erfahrungen haben. Alternativ kann<br />

man, wenn man nur daran interessiert ist, wie viele Schüler daheim einen Computer zur Verfügung<br />

haben, dieses Item als Einzelitem stehen lassen.<br />

Skala 2: Vorerfahrungen mit Lernsoftware<br />

Diese Skala soll eine Spezialisierung der eben erläuterten Skala sein, da die Erfahrungen mit Lernsoftware<br />

mit allgemeiner Computernutzung einhergehen.<br />

Zu dieser Skala gehören einerseits die Items, in denen Lernsoftware explizit genannt ist, wie bei den<br />

Items 11 (Ich arbeite sonst nicht mit Lernsoftware.), 21 (Ich kenne andere Lernsoftware.) <strong>und</strong> 24 (Ich<br />

arbeite nicht gerne mit Lernsoftware.). Andererseits gehören aber auch solche Items dazu, bei denen<br />

von Lernen mit Hilfe des Computers wie Item 27 (Ich benutze den Computer in meiner Freizeit nicht<br />

zum Lernen.), sowie speziell von Erfahrungen mit dynamischen Arbeitsblättern wie Item 30 (Ich habe<br />

vorher noch nie mit dynamischen Arbeitsblättern gearbeitet.) die Rede ist, da Lernen mit dem Computer<br />

meist nur mit Lernsoftware möglich ist <strong>und</strong> es sich bei den dynamischen Arbeitsblättern um Lernsoftware<br />

handelt. Wobei man sich dieses Item wahrscheinlich sparen könnte, weil die Schüler am<br />

Anfang des Erhebungsbogens angeben sollten, wie viele dynamische Arbeitsblätter sie vorher schon<br />

bearbeitet haben. Die Zuteilung dieser fünf Items zu der Skala Vorerfahrungen mit Lernsoftware erscheint<br />

eindeutig.<br />

Skala 3: Beurteilung von Computernutzung<br />

Diese Skala hängt eng mit den zwei vorhergehenden zusammen, wobei es bei dieser Skala um die<br />

Beurteilung der Computernutzung gehen soll.<br />

Die Items 17 (Ich fand den Computereinsatz überflüssig.) <strong>und</strong> 19 (Ich finde es gut, wenn wir in der<br />

Schule mit dem Computer arbeiten.) fragen einmal negativ <strong>und</strong> einmal positiv gerichtet nach der Meinung<br />

über Computereinsatz in der Schule. Wobei die zwei Items zu schnell aufeinander folgen, was<br />

sich durch einige Schülerkommentare in der Spalte <strong>für</strong> „Was möchtest Du uns noch mitteilen?“ belegen<br />

lässt. Zum Beispiel schrieb eine Gymnasiastin aus der 10 Klasse: „Im Fragebogen nicht immer so<br />

ziemlich die gleichen Fragen stellen - manche sind fast gleich“ (RowNr 119) 5 . „Bitte im Fragebogen<br />

nicht immer dieselben Fragen, bloß anders formuliert, stellen! Danke!“ (RowNr 104) bat ein Junge aus<br />

derselben Klasse. Ebenfalls aus derselben Klasse merkte ein 17 - Jähriger an: „Mehrere Fragen sind<br />

aus Manipulationsgründen gleich oder haben gleiche Bedeutung. Ich denke in der 10. Klasse ist niemand<br />

dumm genug darauf hereinzufallen. Das würde ich beim nächsten Mal schon aus Zeitgründen<br />

unterlassen.“ (RowNr 106). Diese Befragten haben also die einmal positiv <strong>und</strong> einmal negativ gerichteten<br />

Items als Abfrage derselben Aussage verstanden, fanden es aber überflüssig bzw. sogar manipulativ<br />

dasselbe zweimal abzufragen. Man könnte diesem Problem aus dem Weg gehen, wenn man<br />

zwei zusammengehörende Items weit genug auseinander stellt.<br />

Die Aussage 37 (Ich halte es <strong>für</strong> mich wichtig, mit dem Computer umgehen zu können.) geht noch<br />

über die Schule hinaus <strong>und</strong> fragt nach der persönlichen Bedeutung von Computerkompetenz <strong>für</strong> die<br />

Schüler. Diese Frage ist vielleicht <strong>für</strong> die Jüngeren schwieriger zu beantworten, weil sie noch nicht<br />

darüber nachdenken bzw. einschätzen können, inwieweit sie Fähigkeiten am Computer <strong>für</strong> Schule,<br />

Beruf etc. benötigen.<br />

Skala 4: Aufbau der dynamischen Arbeitsblätter<br />

Bei dieser Skala geht es um die Verständlichkeit der dynamischen Arbeitsblätter des Lernprogramms<br />

GEONExT.<br />

Mit Item 2 (Ich fand die farbliche Gestaltung der dynamischen Arbeitsblätter hilfreich.), Item 3 (Ich<br />

denke, dass die Reihenfolge der einzelnen dynamischen Arbeitsblätter hilfreich war.), Item 4 (Ich hatte<br />

Schwierigkeiten, die schriftlichen Arbeitsanweisungen zu verstehen.), Item 6 (Ich fand diese dynamischen<br />

Arbeitsblätter übersichtlich aufgebaut.) Item 33 (Ich fand die dynamischen Arbeitsblätter langweilig.)<br />

<strong>und</strong> Item 38 (Ich hatte Schwierigkeiten, die schriftlichen Anleitungen zu verstehen.) werden<br />

offensichtliche Aspekte der Beurteilung der Arbeitsblätter erfragt. Diesen Items ließen sich nach inhaltlichen<br />

Gesichtspunkten noch weitere zuordnen. Wenn man voraussetzt, dass der Aufbau der Arbeitsblätter<br />

zum Verständnis des Themas beigetragen hat, würden folgende Items zu dieser Skala passen:<br />

Item 15 (Ich habe den Eindruck, dass ich das Thema verstanden habe.), Item 18 (Ich meine, dass mir<br />

die dynamischen Arbeitsblätter geholfen haben, das Unterrichtsthema zu verstehen.), Item 20 (Ich<br />

fand das Thema verständlich aufbereitet.), Item 23 (Ich meine, dass es überflüssig war, mit diesen<br />

5 Die Schülerzitate wurden nur rechtschriftlich verbessert


dynamischen Arbeitsblättern zu arbeiten.) <strong>und</strong> Item 25 (Ich denke, dass ich mir das Ergebnis gut merken<br />

kann.). Diese fünf Items sind bisher allerdings der Skala 5 (Beurteilung des Themas) zugeteilt. Die<br />

Skalen 4 (Aufbau der dynamischen Arbeitsblätter) <strong>und</strong> 5 (Beurteilung des Themas) hängen eng zusammen,<br />

sie könnten eventuell zu einer Skala zusammengefasst werden.<br />

Skala 5: Beurteilung des Themas<br />

In dieser Skala sollen sich Items zur Beurteilung des Themas des bearbeiteten dynamischen Arbeitsblattes<br />

wieder finden. Die Items 15 (Ich habe den Eindruck, dass ich das Thema verstanden habe.),18<br />

(Ich meine, dass mir die dynamischen Arbeitsblätter geholfen haben, das Unterrichtsthema zu verstehen.),<br />

20 (Ich fand das Thema verständlich aufbereitet.), 23 (Ich meine, dass es überflüssig war, mit<br />

diesen dynamischen Arbeitsblättern zu arbeiten.) <strong>und</strong> 25 (Ich denke, dass ich mir das Ergebnis gut<br />

merken kann.) drehen sich aber nicht nur um die Verständlichkeit des Themas <strong>und</strong> einen möglichen<br />

Lernerfolg, sondern auch um die Aufbereitung des Themas durch die dynamischen Arbeitsblätter <strong>und</strong><br />

die Vermittlung des Stoffes durch Lernsoftware <strong>und</strong> Lehrer. Daher sollte man erwägen, die beiden<br />

Skalen 4 <strong>und</strong> 5 zusammenzufassen, oder sie treffender zu formulieren. Eine Möglichkeit wäre, die<br />

vierte Skala in „Gestaltung der dynamischen Arbeitsblätter“ zu ändern <strong>und</strong> die fünfte Skala in „Lernerfolg<br />

<strong>und</strong> Verständlichkeit durch die dynamischen Arbeitsblätter“ umzubenennen.<br />

Skala 6: Zeitrahmen<br />

Diese Skala soll Items enthalten, anhand derer man überprüfen kann, ob die Zeit, die von Lehrern <strong>und</strong><br />

Entwicklern der Lernsoftware GEONExT <strong>für</strong> die Bearbeitung der dynamischen Arbeitsblätter eingeplant<br />

wurde, passend war.<br />

Zu dieser Skala gehören die Items 9 (Ich bin unter Zeitdruck geraten.) <strong>und</strong> 16 (Ich denke, dass ich<br />

zügig gearbeitet habe.). Sie fragen einmal danach, ob die Schüler unter Zeitdruck geraten sind, das<br />

andere Mal danach, ob sie zügig gearbeitet haben. Item 9 (s. o.) ist klar formuliert <strong>und</strong> gehört eindeutig<br />

zu dieser Skala, bei Item 16 (s. o.) hingegen kann man nicht unbedingt auf den zeitlichen Rahmen<br />

schließen. Der Gr<strong>und</strong> <strong>für</strong> zügiges Arbeiten kann auf der einen Seite Interesse, Ehrgeiz, Selbstverantwortung<br />

<strong>und</strong> guter, klarer Aufbau der Software sein, aber auf der anderen Seite ist auch Zeitmangel<br />

oder Druck des Lehrers als Antrieb <strong>für</strong> zügiges Arbeiten denkbar. Klarer <strong>und</strong> damit besser wäre es<br />

gewesen, wenn man an dieser Stelle die Aussage 9 (s. o.) positiv gerichtet abfragen würde, wie beispielsweise:<br />

„Ich denke, dass ich <strong>für</strong> die Bearbeitung der Arbeitsblätter genügend Zeit hatte."<br />

Skala 7: Beurteilung selbständigen Arbeitens<br />

Das Arbeiten mit dynamischen Arbeitsblättern soll so stattfinden, dass die Schüler am Computer ohne<br />

die ständige Anleitung der Lehrperson arbeiten. 6<br />

Dieser Skala gehört eindeutig das negativ gerichtete Item 28 an (Ich finde es nicht gut, im Unterricht<br />

selbständig zu arbeiten.), in welchem nach der Meinung der Schüler zu selbständigen Arbeiten gefragt<br />

wird. Auch in den Items 5 (Ich habe keine zusätzliche Hilfe vom Lehrer gebraucht.) <strong>und</strong> 14 (Ich habe<br />

auch mit anderen zusammengearbeitet.) geht es um selbständiges Arbeiten, aber bei diesen beiden<br />

Items wird nicht die Meinung der Schüler abgefragt, sondern ob sie selbständig mit GEONExT umgehen<br />

konnten <strong>und</strong> deshalb die Hilfe des Lehrers nicht gebraucht haben <strong>und</strong> ob sie selbständig auch mit<br />

anderen zusammengearbeitet haben. Dabei wird allerdings nicht die Beurteilung sondern vielmehr die<br />

Fähigkeit selbständig zu arbeiten, abgefragt. Deshalb sollte man diese Skala zu „Selbständiges Arbeiten“<br />

kürzen.<br />

Skala 8: Weiterer Einsatz von Lernsoftware<br />

In dieser Skala soll herausgef<strong>und</strong>en werden, ob der Wunsch besteht in der Schule zukünftig mehr mit<br />

Lernsoftware zu arbeiten.<br />

In Item 29 (Ich denke, wir sollten öfters in <strong>Mathematik</strong> mit dynamischen Arbeitsblättern arbeiten.) wird<br />

diese Thematik direkt angesprochen. Die Gegenaussage dazu ist in Item 36 (Ich möchte nicht mehr<br />

mit dynamischen Arbeitsblättern arbeiten.) zu finden, in dem negativ gerichtet nach dem weiteren<br />

Einsatz von dynamischen Arbeitsblättern im Unterricht gefragt wird. Weiterführend wird in den Items<br />

32 (Ich kann mir vorstellen, Mathetests zu schreiben, in denen ich am Computer arbeiten muss.) <strong>und</strong><br />

34 (Ich bin der Meinung, Computer sollten in Matheprüfungen eingesetzt werden.), nach dem Computereinsatz<br />

bei Tests bzw. Prüfungen gefragt. 7 Die Items sind beide positiv gerichtet <strong>und</strong> folgen zu kurz<br />

6 Der momentane Forschungsstand bestätigt die Bedeutung von selbständigem Arbeiten, das die<br />

Schüler in Deutschland laut PISA-Studie in der Vergangenheit viel zu wenig gelernt haben.<br />

7 Der Computereinsatz bei Prüfungen wurde erst auf Vorschlag von Schülern nach einem früheren<br />

Testlauf der Erhebungsbogen mit in den Fragenkatalog aufgenommen.<br />

21


22<br />

hintereinander. Besser wäre es die Items unterschiedlich gerichtet <strong>und</strong> an weiter auseinander liegenden<br />

Stellen des Erhebungsbogens zu bringen.<br />

Skala 9: Generelle Einstellung zum Themengebiet<br />

Dieser Skala sollen die Items zugeordnet werden, die sich auf gr<strong>und</strong>legende Haltungen zum Themengebiet<br />

beziehen. Allerdings sollte die Bezeichnung der Skala konkretisiert werden, da nicht ganz klar<br />

ist, was man unter Themengebiet zu verstehen hat.<br />

Nach Änderung des Namens der Skala von „Generelle Einstellung zum Themengebiet“ in „Generelle<br />

Einstellung zu Geometrie/<strong>Mathematik</strong>“ lassen sich Item 8 (Ich finde Geometrie schwierig.) <strong>und</strong> Item 13<br />

(Ich interessiere mich <strong>für</strong> Geometrie.) eindeutig dieser Skala zuordnen, da bei diesen nach dem subjektiv<br />

empf<strong>und</strong>enen Schwierigkeitsgrad <strong>und</strong> dem Interesse an Geometrie gefragt wird. Auch die Aussage<br />

12 (Ich kann mir mathematische Formeln nicht merken.) zielt auf die subjektive Begabung der<br />

Schüler in Hinsicht auf <strong>Mathematik</strong> ab. Darüber hinaus geht das Item 35 (Ich denke, dass das bearbeitete<br />

Thema <strong>für</strong> mich wichtig ist.), in dem die persönliche Bedeutung des Themas <strong>für</strong> die Schüler<br />

selbst benannt ist. Da dieses Item so formuliert ist, dass die Bedeutung eines bearbeiteten Arbeitsblattes,<br />

<strong>und</strong> nicht die von <strong>Mathematik</strong> allgemein, abgefragt wird, ist die Zuordnung nicht eindeutig. Ein<br />

Vorschlag wäre, das Item anders zu formulieren: „Ich denke, dass Geometrie <strong>für</strong> mich wichtig ist.“<br />

Überprüfung der Skalen durch eine Befragung<br />

Nach der kritischen Diskussion der Items kann es auch aufschlussreich sein, Dritte zur Einteilung der<br />

Items in die Skalen zu befragen. Da<strong>für</strong> liegen von acht verschiedenen Personen Zuordnungen vor. Zu<br />

diesen acht Personen zählen drei Studentinnen (a – c), die sich mit der GEONExT-Erhebung beschäftigen,<br />

zwei außen stehende Personen (d – e) <strong>und</strong> drei Schüler einer Realschule (f – h), die im Unterricht<br />

des Öfteren mit GEONExT gearbeitet haben. Ihre Zuordnungen werden mit den a priori festgelegten<br />

Kombinationen verglichen, um zu erkennen, welche Items nicht eindeutig einer Skala zugeordnet<br />

werden.


Skala 1<br />

Skala 2<br />

Skala 3<br />

Skala 4<br />

Skala 5<br />

Skala 6<br />

Skala 7<br />

Skala 8<br />

Skala 9<br />

a b c d e f g h<br />

Item 1 1 1 1 1 1 1 1 1<br />

Item 7 1 1 1 3 7 3 3 3<br />

Item 22 1 1 1 3 3 1 3 5<br />

Item 26 1 1 1 3 1 1 1 5<br />

Item 31 1 1 1 1 1 1 1 9<br />

a b c d e f g h<br />

Item 11 2 2 2 2 2 2 2 9<br />

Item 21 2 2 2 2 2 2 2 2<br />

Item 24 2 2 2 2 2 2 8 5<br />

Item 27 1 1 2 3 9 1 2 9<br />

Item 30 2 2 2 2 2 5 2 8<br />

a b c d e f g h<br />

Item 17 3 3 3 3 3 3 3 7<br />

Item 19 3 3 3 3 3 3 9 9<br />

Item 37 3 3 3 3 3 1 1 9<br />

a b c d e f g h<br />

Item 2 4 4 4 4 4 4 4 5<br />

Item 3 4 4 4 4 4 4 4 4<br />

Item 4 4 4 4 7 7 4 5 7<br />

Item 6 4 4 4 4 4 4 4 4<br />

Item 33 4 4 4 5 5 5 5 5<br />

Item 38 4 4 4 4 7 4 5 9<br />

a b c d e f g h<br />

Item 15 5 5 5 5 5 5 5 7<br />

Item 18 5 5 5 7/8 9 5 5 5<br />

Item 20 4/5 5 5 5 5 9 5 7<br />

Item 23 5/8 5 5 8 8 5 5/9 5<br />

Item 25 5 5 5 9 8 5 9 9<br />

a b c d e f g h<br />

Item 9 6 6 6 6 6 6 6 6<br />

Item 16 6 6 6 6 7 3 6 7<br />

a b c d e f g h<br />

Item 5 2/7 7 7 7 7 7 7 2<br />

Item 10 7 7 7 7 7 7 7 7<br />

Item 14 7 7 7 7 7 7 7 7<br />

Item 28 7 7 7 7 7 7 7 7<br />

a b c d e f g h<br />

Item 29 8 8 8 5 8 5 5 5<br />

Item 32 8 8 8 9 3 3 7/9 3<br />

Item 34 8 8 8 9 9 5 9 5<br />

Item 36 8 8 8 8 5 9 5<br />

a b c d e f g h<br />

Item 8 9 3/9 9 9 9 9 5 5<br />

Item 12 9 9 9 9 7 9 9 9<br />

Item 13 9 9 9 9 9 9 5 5<br />

Item 35 5 9 9 5 5 8 9 7<br />

Tabelle 9 Überprüfung der Zuordnung der Items zu den Skalen<br />

23


24<br />

Die Teilnehmer an diesem Experiment bilden keine Zufallsstichprobe aus einer wohldefinierten<br />

Gr<strong>und</strong>gesamtheit. Allerdings gehören sie größtenteils der Zielgruppe an. Insofern sind die Ergebnisse<br />

durchaus Ernst zu nehmen, da sich darin typische Einschätzungen von Schülern widerspiegeln können,<br />

die von der ursprünglichen Skalenkonstruktion abweichen. Folgende Punkte scheinen erwähnenswert:<br />

1. Die Studentinnen waren im Großen <strong>und</strong> Ganzen im Einklang mit den ursprünglichen Skalen. Bei<br />

den anderen Befragten zeigen sich hingegen deutliche Abweichungen. Es könnte also eine Art<br />

Betriebsblindheit bzw. Expertenwissen geben, nach dem einige Zuordnungen mit etwas Vertrautheit<br />

„klar“ erscheinen, es aber <strong>für</strong> Schüler nicht sind. Dieser Punkt ist wesentlich, da möglicherweise<br />

einige Fragen anders aufgefasst werden als gedacht.<br />

2. Zwischen Skala 1 <strong>und</strong> Skala 3 zeigen sich einige Überschneidungen. Insbesondere die Items 7<br />

<strong>und</strong> 22 werden auch oft der Skala 3 zugeschrieben, da die Befragten offenbar nicht streng zwischen<br />

Computererfahrung <strong>und</strong> Computerbeurteilung unterscheiden.<br />

3. Bei Skala 2 sticht insbesondere Item 27 heraus. Das Problem dürfte sein, dass „Lernsoftware“<br />

nicht explizit erwähnt wird, <strong>und</strong> die Frage eher auf den Computer allgemein bezogen wird. Dies<br />

könnte auch die schon in Sektion 2.2. bemerkten Inkonsistenzen bei Skala 2 erklären.<br />

4. Teile von Skala 4 (insbesondere Item 33 bzw. Item 4) werden oft als Teil von Skala 5 bzw. Skala 7<br />

verstanden.<br />

5. Bei Skala 6 ist Item 16 unklar formuliert.<br />

6. Die Items von Skala 8 werden sehr häufig anderen Skalen (insbesondere den Skalen 5, 3 <strong>und</strong> 9)<br />

zugeschrieben. Es erscheint problematisch, die spezielle Frage nach weiterem Einsatz von Lernsoftware<br />

von der generellen Einstellung zum Thema bzw. Computern bzw. dem Themengebiet zu<br />

trennen.<br />

7. Schließlich zeigen sich die schon bei der inhaltlichen Analyse vermuteten Überschneidungen zwischen<br />

Skala 9 <strong>und</strong> Skala 5.<br />

Zusammenfassung<br />

Die bisherigen Überlegungen zur inhaltlichen Überprüfung der Skalenbildung brachten folgende Ergebnisse.<br />

• Bei einigen Skalen sollte die Bezeichnung präzisiert werden:<br />

Skala 4: Gestaltung der dynamischen Arbeitsblätter<br />

Skala 5: Lernerfolg <strong>und</strong> Verständlichkeit durch die dynamischen Arbeitsblätter<br />

Skala 7: Selbständiges Arbeiten<br />

Skala 9: Generelle Einstellung zu Geometrie/<strong>Mathematik</strong>.<br />

• Zusammengehörige Items einer Skala könnten im Erhebungsbogen weiter auseinander gestellt<br />

werden (vgl. z.B. Skala 4: Items 2, 3, 4, 6, 33 <strong>und</strong> 38). Allerdings erschwert dies gerade wieder die<br />

Nutzung von Kontextinformation bei der Zuordnung <strong>und</strong> kann so leichter zu Missverständnissen führen.<br />

Insofern wäre eine klare Abgrenzung vielleicht das kleinere Übel.<br />

• Item 4 (Ich hatte Schwierigkeiten, die schriftlichen Arbeitsanweisungen zu verstehen.) <strong>und</strong> 38 (Ich<br />

hatte Schwierigkeiten die schriftlichen Anleitungen zu verstehen.) sind zu ähnlich. Eines der beiden<br />

Items sollte negativ formuliert werden (Vorschlag: Ich hatte keine Probleme den schriftlichen Anleitungen<br />

zu folgen.)<br />

• Es gibt einige Überschneidungen zwischen den Skalen. Insbesondere die folgenden Items erhielten<br />

weniger als vier „richtige“ Zuordnungen:<br />

Item 7 (Ich hatte Schwierigkeiten mit der Maus die Befehle auszuführen.) wird entweder Skala 1 (Vorerfahrungen<br />

mit Computern) oder Skala 3 (Beurteilung von Computernutzung) zugeordnet.<br />

Item 27 (Ich benutze den Computer in meiner Freizeit nicht zum Lernen.) wird unklar zugeordnet.<br />

Item 32 <strong>und</strong> 34 werden unklar zugeordnet.<br />

Item 33 (Ich fand die dynamischen Arbeitsblätter langweilig) wird entweder Skala 4 (Aufbau der dynamischen<br />

Arbeitsblätter) oder Skala 5 (Beurteilung des Themas) zugeordnet.<br />

Item 35 wird unklar zugeordnet.<br />

• Item 16 (Ich denke, dass ich zügig gearbeitet habe.) sollte umformuliert werden: Ich denke, dass<br />

ich <strong>für</strong> die Bearbeitung der dynamischen Arbeitsblätter genügend Zeit hatte.<br />

• Item 30 (Ich habe vorher noch nie mit dynamischen Arbeitsblättern gearbeitet) sollte entfallen, da<br />

dieser Sachverhalt bereits bei den Angaben abgefragt wird.<br />

• Item 31 (Ich habe die Möglichkeit zuhause einen Computer zu nutzen.) sollte umformuliert werden:<br />

Ich habe zu Hause Zugang zu einem Computer <strong>und</strong> nutze ihn auch.<br />

• Item 35 (Ich denke, dass das bearbeitete Thema <strong>für</strong> mich wichtig ist.) sollte umformuliert werden:<br />

Ich denke, dass Geometrie <strong>für</strong> mich wichtig ist.


3.2. Substrukturen (Datenbasierte Skalenbildung)<br />

Zu fragen ist nun, inwiefern die Ergebnisse der nach inhaltlichen Aspekten durchgeführten Skalenüberprüfung<br />

einer datenbasierten Analyse standhalten können. Hierzu zeigt schon ein erster Blick auf<br />

die Beantwortung der Items, dass sich verschiedene Gruppen von Items ausmachen lassen, die ähnliches<br />

Antwortverhalten zeigen.<br />

Anazhl der Schüler<br />

400<br />

350<br />

300<br />

250<br />

200<br />

150<br />

100<br />

50<br />

0<br />

Verteilung der Kreuze bei den Items<br />

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38<br />

Items<br />

Wie oft wurde stimmt vollständig angekreuzt Wie oft wurde stimmt eher angekreuzt<br />

Wie oft wurde stimmt eher nicht angekreuzt<br />

Wie oft wurde keine Angabe angekreuzt oder eine Lücke gelassen<br />

Wie oft wurde stimmt gar nicht angekreuzt<br />

Abbildung 8 Verteilung der Antworten bei den Items<br />

Beispielsweise erkennt man in der obigen Abbildung leicht, dass Item 31 nahezu immer mit „stimmt<br />

vollständig“ beantwortet wurde. Sehr hoch waren die Zustimmungsraten auch bei den Items 7, 22 <strong>und</strong><br />

19. Umgekehrt gab es hohe Anteile von eher negativen Antworten („stimmt gar nicht“) bei den Items<br />

15, 16 <strong>und</strong> 25. Die Items 11, 13, 34 <strong>und</strong> 35 hatten wenig Zustimmung, aber das lag weniger an negativen<br />

als vielmehr an hohen Raten von „keine Angabe“ <strong>und</strong> „stimmt eher nicht“. So offensichtlich diese<br />

Zusammenhänge sind, so schwer ist es doch, die Items in dieser Weise miteinander zu vergleichen.<br />

Dies liegt natürlich an der vierdimensionalen (genauer: 5 – 1) Struktur der Antworten – <strong>und</strong> gilt selbst<br />

dann, wenn man die Antworten nach einem Kriterium wie z. B. zunehmende volle Zustimmung sortiert.<br />

Es wäre daher zweckmäßig, diese Daten – selbst unter gewissem Informationsverlust – in einer<br />

zweidimensionalen Darstellung zusammenzufassen. Hierzu werden wir ein elementares, aber <strong>für</strong> diesen<br />

Zweck <strong>und</strong> diese Situation maßgeschneidertes Hilfsmittel verwenden. Als Hintergr<strong>und</strong> beschreibt<br />

der folgende Kasten, wie man <strong>für</strong> eine erwartete <strong>und</strong> eine beobachtete Multinomialverteilung den so<br />

genannten Chiquadrat-Abstand (χ²-Abstand) berechnet.<br />

25


26<br />

Hintergr<strong>und</strong>: χ²-Abstand<br />

Eine Multinomialverteilung ergibt sich, falls eine Anzahl n von Werten unabhängig voneinander in m<br />

Schubladen einsortiert werden, wobei die Wahrscheinlichkeit <strong>für</strong> die i-te Schublade gerade pi<br />

beträgt. Falls diese Wahrscheinlichkeiten bekannt sind, kann man die beobachteten (observed, „O“)<br />

<strong>und</strong> die erwartenen (expected, „E“) Anzahlen einander gegenüberstellen. Beispielsweise könnten sich<br />

<strong>für</strong> 60 Würfe mit einem Würfel folgende Resultate ergeben:<br />

Augenzahl 1 2 3 4 5 6<br />

Erwartet (E) 10 10 10 10 10 10<br />

Beobachtet (O) 9 8 16 17 6 4<br />

Mit dem χ²-Abstand kann man dann den Abstand der beobachteten Verteilung von der erwarteten Verteilung<br />

messen. Hierzu berechnet man:<br />

6<br />

2 ( Oi<br />

− Ei<br />

)<br />

∑ = 14.<br />

2 .<br />

i= 1 Ei<br />

Der χ²-Abstand ist also eine gewichtete quadratische Abstandssumme.<br />

Für unsere Situation bietet es sich an, <strong>für</strong> jedes Item die beiden χ²-Abstände zu zwei „extremen“ Multinomialverteilungen<br />

zu berechnen: Einerseits zum Optimum (das ist diejenige Verteilung, bei der 361<br />

Schüler die beste Antwort „stimmt vollständig“ <strong>und</strong> nur jeweils eine Person die restlichen vier Antwortmöglichkeiten<br />

– einschließlich „keine Angabe“ ankreuzte) <strong>und</strong> andererseits zum Antioptimum (das<br />

ist diejenige Verteilung, bei der 361 Schüler die schlechteste Antwort „stimmt gar nicht“ <strong>und</strong> nur jeweils<br />

eine Person die restlichen vier Antwortmöglichkeiten – einschließlich „keine Angabe“ ankreuzte.<br />

Dies liefert ein Koordinatenpaar, so dass man die einzelnen Items geometrisch in der Ebene darstellen<br />

kann. Items mit ähnlichem Antwortmuster werden in diesem Diagramm „nahe“ beieinander liegen.<br />

Im folgenden Diagramm sind die Items mit <strong>ihre</strong>r Nummer <strong>und</strong> die Skalen durch Farben codiert. Man<br />

kann auf diese Weise – natürlich unter Beachtung des eingeschränkten, weil verdichteten Informationsgehalts<br />

– viererlei gewinnen:<br />

• einen Eindruck von der Kohärenz der einzelnen Skalen<br />

• einen Eindruck von Verhältnis der Skalen zueinander<br />

• Vermutungen über die Zuordnung einzelner bislang nicht eindeutig zugeordneter Skalen oder<br />

Vorschläge <strong>für</strong> eine passendere Zuordnung abweichender Items<br />

• Hinweise darauf, welche Items bzw. Skalen besonders nahe am Optimum bzw. Antioptimum liegen<br />

<strong>und</strong> daher welche Dinge besonders gut bzw. schlecht bewertet wurden.


Chiquadratabstand zum Antioptimum<br />

100000<br />

80000<br />

60000<br />

40000<br />

20000<br />

31<br />

7<br />

22<br />

19<br />

0 10000 20000 30000 40000<br />

Chiquadratabstand zum Optimum<br />

Abbildung 9 χ²-Abstände zum Optimum <strong>und</strong> Antioptimum<br />

37<br />

30<br />

17<br />

14<br />

Die einer Skala angehörenden Items sind jeweils mit derselben Farbe gekennzeichnet:<br />

Skala 1: Vorerfahrungen mit Computern (Items 1, 7, 22, 26 <strong>und</strong> 31)<br />

Skala 2: Vorerfahrungen mit Lernsoftware (Items 11, 21, 24, 27 <strong>und</strong> 30)<br />

Skala 3: Beurteilung von Computernutzung (Items 17, 19 <strong>und</strong> 37)<br />

Skala 4: Aufbau der dynamischen Arbeitsblätter (Items 2, 3, 4, 6, 33 <strong>und</strong> 38)<br />

Skala 5: Beurteilung des Themas (Items 15, 18, 20, 23 <strong>und</strong> 25)<br />

Skala 6: Zeitrahmen (Items 9 <strong>und</strong> 16)<br />

Skala 7: Beurteilung selbständigen Arbeitens (Items 5, 10, 14 <strong>und</strong> 28)<br />

Skala 8: Weiterer Einsatz von Lernsoftware (Items 29, 32, 34 <strong>und</strong> 36)<br />

Skala 9: Generelle Einstellung zum Themengebiet (Items 8, 12, 13 <strong>und</strong> 35)<br />

9<br />

32 21<br />

Man erkennt unmittelbar folgende Punkte:<br />

1. Die Skalen sind weitgehend kohärend, was aber nicht ausschließt, dass einzelne Items oder einige<br />

Gruppen abweichende Lagen einnehmen. Beispielsweise erscheinen Skala 1 <strong>und</strong> Skala 6 nahezu<br />

zweigeteilt.<br />

2. An dem Diagramm kann man recht gut erkennen, dass die Items der Skala 1 <strong>und</strong> 3 (1, 7, 17, 19,<br />

22, 26, 31 <strong>und</strong> 37) zum Großteil recht nahe beieinander liegen <strong>und</strong> sich überlappen. Weitere Überschneidungen<br />

sieht man etwa zwischen Skala 5 <strong>und</strong> Skala 9 sowie zwischen Skala 4 <strong>und</strong> Skala 5<br />

oder Skala 2 <strong>und</strong> Skala 8.<br />

3. Für die oben mit weniger als vier „richtigen“ Zuordnungen genannten Items erhält man folgendes<br />

Bild:<br />

Item 7 bleibt umstritten zwischen Skala 1 <strong>und</strong> Skala 3.<br />

Item 27 wäre tendenziell wie vorgesehen der Skala 2 zuzuordnen.<br />

Item 32 <strong>und</strong> 34 bleiben zwischen Skala 2 <strong>und</strong> Skala 8 umstritten.<br />

Item 33 bleibt unklar, aber vielleicht tendenziell in Skala 4.<br />

1<br />

26<br />

23<br />

38<br />

36 29<br />

285<br />

34<br />

10<br />

12<br />

33<br />

24<br />

27<br />

3<br />

8<br />

6<br />

4<br />

20 2<br />

18<br />

35<br />

13<br />

11<br />

15<br />

25<br />

16<br />

27


28<br />

Item 35 bleibt zwischen Skala 9 <strong>und</strong> Skala 5 umstritten.<br />

4. Die Lage der Skalen als Ganzes unterscheidet sich deutlich. An den Vorkenntnissen (Skala 1)<br />

fehlt es beispielsweise nicht (relativ geringer Abstand zum Optimum, aber relativ großer zum Antioptimum).<br />

Demgegenüber werden die Themen (Skala 5) <strong>und</strong> das Themengebiet (Skala 9) etwas kritischer<br />

beurteilt (relativ großer Abstand zum Optimum, aber relativ kleiner zum Antioptimum). Dabei ist<br />

zu betonen, dass es sich um relative Aussagen handelt. Unter den Items schneidet Item 31 (Ich habe<br />

die Möglichkeit zu Hause einen Computer zu nutzen.) so einheitlich positiv ab, dass es vielleicht sogar<br />

aus dem Erhebungsbogen gestrichen werden kann. Die Skala 6 (Zeitrahmen) enthält das strittige Item<br />

16 (Ich denke, dass ich zügig gearbeitet habe.), das inhaltlich nicht dem Zeitrahmen, sondern eher<br />

dem selbstverantwortlichen Lernen, also der Skala 7 (Beurteilung selbständigen Arbeitens), zugeteilt<br />

werden könnte. Item 16 hat von den 38 Items den kleinsten χ²-Abstand zum antioptimalen Antwortmuster.<br />

Das bedeutet, dass dieses Item am negativsten beantwortet wurde. Der Abstand zu Item 9<br />

(Ich bin unter Zeitdruck geraten.) ist sehr groß <strong>und</strong> man kann die beiden Items datenorientiert nicht als<br />

zusammengehörig identifizieren. Wie bereits erwähnt sollte dieses Item aus dem Erhebungsbogen<br />

genommen werden <strong>und</strong> durch ein anderes zur Skala 6 (Zeitrahmen) passenden, ersetzt werden.<br />

3.3. Klassische Kennzahlen zur Itemanalyse<br />

Die Analyse von Items <strong>und</strong> Skalen ist ein geradezu klassischer Teil der psychologischen Testtheorie.<br />

Dabei werden allerdings zum Teil recht ausgefeilte Modelle zugr<strong>und</strong>e gelegt <strong>und</strong> oft weit reichende<br />

Annahmen gemacht. Für unsere eher elementaren Zwecke <strong>und</strong> eher unsicheren Annahmen ist das<br />

nicht unproblematisch. Aber zur Einordnung in klassische Herangehensweisen <strong>und</strong> zur Vergleichbarkeit<br />

mit der einschlägigen Literatur sollen in diesem Abschnitt die gängigsten Kennzahlen zusammengestellt<br />

werden. Die folgende Tabelle fasst die in diesem Kontext üblicherweise betrachteten Kennzahlen<br />

<strong>für</strong> die neun (inhaltlich definierten) Skalen zusammen:<br />

Dimension Anzahl Mittel SD<br />

Boden<br />

(Anzahl)<br />

Decke<br />

(Anzahl)<br />

NA's<br />

Cronbach's<br />

Skala 1 5 1.42 0.44 106 2 0 0.45<br />

Skala 2 5 2.34 0.55 5 3 2 0.08<br />

Skala 3 3 1.48 0.59 149 3 0 0.56<br />

Skala 4 6 1.99 0.63 16 2 0 0.75<br />

Skala 5 5 2.06 0.73 15 8 1 0.83<br />

Skala 6 2 1.90 0.75 73 10 1 0.56<br />

Skala 7 4 1.99 0.57 25 0 1 0.28<br />

Skala 8 4 2.14 0.86 55 24 2 0.76<br />

Skala 9 4 2.24 0.73 18 13 0 0.68<br />

Tabelle 10 Kennzahlen <strong>und</strong> Reliabilität der Skalen ( n=365)<br />

Die ersten sieben Spalten sind weitgehend selbsterklärend. Bei Skala 1 <strong>und</strong> insbesondere Skala 3<br />

zeigen sich deutliche Bodeneffekte. Deckeneffekte gibt es hingegen so gut wie nicht. Skala 1 <strong>und</strong><br />

Skala 3 sind insofern (im Rückblick) nicht ideal justiert, sondern zu positiv. Es ist aber zu bedenken,<br />

dass dies im Vorfeld ja nicht klar war.<br />

Die letzte Spalte gibt mit Cronbach's α ein gebräuchliches Maß <strong>für</strong> die Reliabilität an. Dazu sind in<br />

aller Kürze folgende Anmerkungen zu machen:<br />

1. Interpretation<br />

Cronbach's α ist nur eine Schätzung <strong>für</strong> eine untere Schranke der interessierenden Größe. Es ist anfällig<br />

<strong>für</strong> Verzerrungen <strong>und</strong> ohnehin nicht ganz leicht zu interpretieren. Grob gesprochen zeigt es die<br />

innere Konsistenz der beteiligten Items.<br />

2. Berechnung<br />

Cronbach's α wurde auf der Basis der Kovarianzmatrix berechnet. Für die Korrelationsvariante ergeben<br />

sich aber nahezu identische Werte, da die Varianzen aller Items sich nicht stark unterscheiden.<br />

Alle Schüler mit wenigstens einem fehlendem Wert bei einem Item der betrachteten Skala wurden<br />

α


ganz aus der Berechnung der Kovarianzmatrix ausgeschlossen (listwise deletion), um die gleichen<br />

Anzahlen <strong>für</strong> alle Kovarianzen herzustellen.<br />

3. Ergebnis<br />

Man strebt – mit Vorbehalten – Werte von etwa 0.7 <strong>und</strong> mehr an. Demnach sind die Skalen 2 <strong>und</strong> 7 –<br />

<strong>und</strong> eventuell auch 1– nicht so recht intern konsistent. Dies deckt sich mit schon früher gemachten<br />

Beobachtungen aus Abschnitt 2.2. bzw. 3.2. Ein Blick auf die Korrelationsmatrizen (Tabelle 11 bis<br />

Tabelle 13) zeigt auch die Gründe auf:<br />

Item 1 Item 7 Item 22 Item 26 Item 31<br />

Item 1 1.00 -0.01 0.23 0.49 0.15<br />

Item 7 -0.01 1.00 0.13 0.05 0.01<br />

Item 22 0.23 0.13 1.00 0.27 -0.02<br />

Item 26 0.49 0.05 0.27 1.00 0.16<br />

Item 31 0.15 0.01 -0.02 0.16 1.00<br />

Tabelle 11 Korrelationsmatrix <strong>für</strong> Skala 1<br />

Item 11 Item 21 Item 24 Item 27 Item 30<br />

Item 11 1.00 0.36 0.18 -0.19 -0.12<br />

Item 21 0.36 1.00 0.19 -0.04 -0.14<br />

Item 24 0.18 0.19 1.00 -0.16 -0.08<br />

Item 27 -0.19 -0.04 -0.16 1.00 0.15<br />

Item 30 -0.12 -0.14 -0.08 0.15 1.00<br />

Tabelle 12 Korrelationsmatrix <strong>für</strong> Skala 2<br />

Item 5 Item 10 Item 14 Item 28<br />

Item 5 1.00 0.32 0.02 0.12<br />

Item 10 0.32 1.00 -0.08 0.17<br />

Item 14 0.02 -0.08 1.00 -0.01<br />

Item 28 0.12 0.17 -0.01 1.00<br />

Tabelle 13 Korrelationsmatrix <strong>für</strong> Skala 7<br />

Dese Skalen sind die einzigen mit negativen Einträgen. Insbesondere Skala 2 scheint in die Items<br />

(11, 21, 24) <strong>und</strong> die Items (27,30) zu „zerfallen“. Abschließend interessiert auch die Korrelation der<br />

Skalen selbst. Denn natürlich sollen die Skalen zwar intern konsistent sein, aber untereinander verschiedene<br />

Dimensionen (also nichts Überflüssiges) messen. Dazu vergleiche man die folgende Tabelle:<br />

29


30<br />

Skala 1 Skala 2 Skala 3 Skala 4 Skala 5 Skala 6 Skala 7 Skala 8 Skala 9<br />

Skala 1 1.00 0.17 0.42 0.18 0.20 0.29 0.11 0.31 0.20<br />

Skala 2 0.17 1.00 0.15 -0.06 -0.03 -0.08 -0.03 0.14 -0.03<br />

Skala 3 0.42 0.15 1.00 0.29 0.31 0.27 0.17 0.50 0.24<br />

Skala 4 0.18 -0.06 0.29 1.00 0.75 0.45 0.24 0.47 0.54<br />

Skala 5 0.20 -0.03 0.30 0.75 1.00 0.41 0.21 0.60 0.63<br />

Skala 6 0.29 -0.08 0.27 0.45 0.41 1.00 0.22 0.31 0.38<br />

Skala 7 0.11 -0.03 0.17 0.24 0.21 0.22 1.00 0.17 0.19<br />

Skala 8 0.31 0.14 0.50 0.47 0.60 0.31 0.17 1.00 0.42<br />

Skala 9 0.20 -0.03 0.24 0.54 0.63 0.38 0.19 0.42 1.00<br />

Tabelle 14 Korrelationen der Skalen<br />

Auch hier findet man wieder die schon festgestellten Überschneidungen der Skalen 1 <strong>und</strong> 3 sowie 4<br />

<strong>und</strong> 5 oder auch 5 <strong>und</strong> 9. Natürlich stellt sich die Frage nach der Berechtigung von Korrelationen, da<br />

das vorliegende Datenmaterial stark diskreter Natur ist. Für die hier berechneten Korrelationen wurde<br />

anhand von Scatterplots aber immer überprüft, ob eine Berechnung sinnvoll ist. Als Beispiel gibt die<br />

nächste Abbildung die Scatterplotmatrix <strong>für</strong> die Korrelationsmatrix der Skalen an.<br />

4<br />

3<br />

2<br />

1<br />

4<br />

3<br />

2<br />

1<br />

4<br />

3<br />

2<br />

1<br />

4<br />

3<br />

2<br />

1<br />

Skala1mittel<br />

1 2 3 4<br />

1 2 3 4<br />

Skala2mittel<br />

Skala3mittel<br />

1 2 3 4<br />

1 2 3 4<br />

Skala4mittel<br />

Abbildung 10 Scatterplotmatrix <strong>für</strong> die neun Skalen<br />

Skala5mittel<br />

1 2 3 4<br />

1 2 3 4<br />

Skala6mittel<br />

Skala7mittel<br />

1 2 3 4<br />

1 2 3 4<br />

Skala8mittel<br />

Skala9mittel<br />

1 2 3 4<br />

Der Vollständigkeit halber sei noch erwähnt, dass die Verwendung nichtparametrischer Korrelationen<br />

hier wegen Bindungen erst recht nicht unproblematisch wäre.<br />

4<br />

3<br />

2<br />

1<br />

4<br />

3<br />

2<br />

1<br />

4<br />

3<br />

2<br />

1<br />

4<br />

3<br />

2<br />

1<br />

4<br />

3<br />

2<br />

1


3.4. Auswirkungen der Kovariablen im Spiegel der Skalen<br />

Gr<strong>und</strong>sätzliches<br />

Bei dieser Untersuchung wurden einige Kovariablen wie Geschlecht, Zensur, Schulart, Anzahl der<br />

bearbeiteten dynamischen Arbeitsblätter oder Klassenstufe erhoben. Es liegt nahe, die Ergebnisse in<br />

Bezug auf eben diese Merkmale zu betrachten. Hier<strong>für</strong> ist die Zusammenfassung der Items in Skalen<br />

praktisch, da die Themengebiete dann kompakter untersucht werden können <strong>und</strong> somit Tendenzen<br />

<strong>für</strong> die einzelnen Skalen ersichtlich werden. Dabei muss man bedenken, dass negativ gerichtete Items<br />

umskaliert wurden, um die Mittelwerte berechnen zu können. Im Folgenden werden alle Items bei der<br />

Verbindung mit den Kovariablen positiv gerichtet formuliert. Diejenigen, die im Erhebungsbogen ursprünglich<br />

negativ gerichtet waren, sind mit einem Sternchen (*) markiert.<br />

Natürlich kann es sein, dass die im Folgenden dargestellten Ergebnisse im Wesentlichen auf vermengenden<br />

Faktoren beruhen. Zum Beispiel könnte es sein, dass die Realschulklassen nicht aufgr<strong>und</strong> der<br />

Schulart eine Skala besonders positiv bewerten, sondern weil sich darunter viele Mädchen befinden,<br />

die diese Skala positiv beurteilen. Dann handelt es sich in Wirklichkeit nicht um einen Effekt der<br />

Schulart, sondern des Geschlechtes. Derartige Betrachtungen werden hier zunächst ignoriert. In der<br />

Tat legen unsere Ergebnisse nahe, dass eine sehr entscheidende Kovariable der in diesem Zusammenhang<br />

meist nicht untersuchte Klassensatz ist. Vor vorschnellen Schlussfolgerungen muss man<br />

sich jedenfalls hüten. Fehlende Werte werden bei den folgenden Darstellungen jeweils weggelassen.<br />

Geschlecht<br />

Schon in der PISA-Studie (2003) wurde der Vergleich von Interesse <strong>und</strong> Begabung zwischen Mädchen<br />

<strong>und</strong> Jungen im Fach <strong>Mathematik</strong> gezogen, mit dem Ergebnis, dass es den Jungen besser als<br />

den Mädchen gelingt ihr Leistungspotential im Bereich <strong>Mathematik</strong> auszuschöpfen. Mehr als 10 Jahre<br />

früher kam Czerwenka, der 1990 eine umfassende Studie zu Urteilen von Schülern über die Schule<br />

durchführte, zu folgenden Erkenntnissen: Mädchen schätzen die Fächer Musik, Textiles Gestalten <strong>und</strong><br />

Hauswirtschaft/Kochen mehr als die Jungen. Bei der Untersuchung des naturwissenschaftlichen Bereiches<br />

ließ seine Untersuchung jedoch keine Differenzen zwischen den Geschlechtern erkennen.<br />

„Interessant ist, dass die Mädchen dem mathematischen, aber auch dem naturwissenschaftlichen<br />

Bereich nicht anders gegenüberstehen als Jungen“ (Czerwenka 1990, S. 88). Zu fragen ist, inwiefern<br />

diese Erkenntnisse früherer Untersuchungen bei der GEONExT-Erhebung bestätigt werden können<br />

oder ob Geometrie, als ein Teilbereich der <strong>Mathematik</strong>, von den Mädchen <strong>und</strong> den Jungen unterschiedlich<br />

bewertet wird.<br />

Mittelwert<br />

4,0<br />

3,5<br />

3,0<br />

2,5<br />

2,0<br />

1,5<br />

1,0<br />

Unterschiede nach Geschlecht<br />

1 2 3 4 5<br />

Skala<br />

6 7 8 9<br />

Abbildung 11 Unterschiede nach Geschlecht<br />

weiblich<br />

männlich<br />

31


32<br />

In der Abbildung kann man erkennen, dass sich eine gleichmäßige Tendenz durch alle neun Skalen<br />

zieht. Die Jungen bewerteten durchschnittlich positiver als die Mädchen. Bei den Skalen 1 (Vorerfahrungen<br />

mit Computern), 2 (Vorerfahrungen mit Lernsoftware), 3 (Beurteilung von Computereinsatz), 4<br />

(Aufbau der dynamischen Arbeitsblätter), 5 (Beurteilung des Themas), 6 (Zeitrahmen) <strong>und</strong> 7 (Beurteilung<br />

selbständigen Arbeitens) ist dieser Unterschied jedoch nicht besonders stark ausgeprägt. Etwas<br />

auffälligere, aber immer noch geringe Unterschiede kann man bei den Skalen 8 (Weiterer Einsatz von<br />

Lernsoftware) <strong>und</strong> 9 (Generelle Einstellung zum Themengebiet) ausmachen. Betrachtet man auf der<br />

Ebene einzelner Skalen die Skala 2 im Detail, zeigt sich erstaunlicherweise, dass die Mädchen entgegen<br />

dem sonst vorherrschenden Muster bei 3 von 5 Items (Items 11, 21 <strong>und</strong> 24) leicht positiver urteilen.<br />

Zensur<br />

Ebenfalls wenige Unterschiede in den Antworten zeigen sich in Blick auf die letzte Zeugnisnote in<br />

<strong>Mathematik</strong>. Diese Variable wurde in Selbsteinschätzung der Befragten erhoben <strong>und</strong> ist nicht unbedingt<br />

zuverlässig, wie schon vorher gezeigt wurde. Deshalb sind die folgenden Untersuchungen vorsichtig<br />

zu betrachten.<br />

Mittelwert<br />

4,0<br />

3,5<br />

3,0<br />

2,5<br />

2,0<br />

1,5<br />

1,0<br />

Abbildung 12 Unterschiede nach Zensur<br />

Als Ergebnis kann man festhalten, dass sich schlechte Noten im letzten Zeugnis kaum negativ auf das<br />

Antwortverhalten ausgewirkt haben.<br />

Schulart<br />

Unterschiede nach Zensur<br />

1 2 3 4 5<br />

Skala<br />

6 7 8 9<br />

Der Vergleich der vorliegenden Daten in Hinsicht auf die Schularten ist deshalb so wichtig, weil Gymnasium,<br />

Realschule <strong>und</strong> Hauptschule unterschiedliche Lehrpläne <strong>und</strong> Fächer haben, in denen der<br />

Geometrie <strong>und</strong> dem Computereinsatz ein unterschiedlicher Stellenwert beigemessen wird <strong>und</strong> unterschiedliche<br />

Inhalte zugewiesen werden. Unser Vergleich bezieht sich vor allem auf die bayerischen<br />

Lehrpläne, da der Großteil der Befragten in diesem B<strong>und</strong>esland eine Schule besucht. Die befragten<br />

Gymnasiasten haben kein Pflichtfach, in dem der Umgang mit dem Computer gelernt wird. An der<br />

Realschule ist bei den Befragten Textverarbeitung ein Pflichtfach in der 5. Klasse gewesen. Auf dem<br />

mathematischen <strong>und</strong> wirtschaftlichen Zweig ist ab der 8. Klasse Informatik ein Pflichtfach. In der<br />

Hauptschule lernen die Schüler <strong>und</strong> Schülerinnen in der 5. Klasse im Fach ITG sich Informationen mit<br />

dem Computer zu beschaffen. Außerdem werden dort ab der 7. Klasse verschiedene Themenberei-<br />

Note 1<br />

Note 2<br />

Note 3<br />

Note 4<br />

Note 5


che im Umgang mit dem Computer durchgenommen (Buchführung, Tabellenkalkulation, EDV –<br />

Gr<strong>und</strong>lagen, etc.) 8 .<br />

Mittelwert<br />

4,0<br />

3,5<br />

3,0<br />

2,5<br />

2,0<br />

1,5<br />

1,0<br />

Abbildung 13 Unterschiede nach Schulart<br />

Unterschied nach Schulart<br />

1 2 3 4 5<br />

Skala<br />

6 7 8 9<br />

Betrachtet man die Übersicht zeigt sich, dass die Gymnasiasten bis auf die Skala 7 (Beurteilung selbständigen<br />

Arbeitens) bei allen Skalen negativer als die Realschüler <strong>und</strong> die Hauptschüler gewertet<br />

haben. Die Realschüler beantworten alle Items bis auf die der Skala 6 (Zeitrahmen) am positivsten.<br />

Vor allem der sehr positive Mittelwert der Realschüler bei Skala 3 (Beurteilung von Computernutzung)<br />

fällt auf. Ein möglicher Gr<strong>und</strong> da<strong>für</strong> könnte wie bereits vermutet der Unterricht in der Realschule sein,<br />

der im Gegensatz zu dem am Gymnasium die Fächer Textverarbeitung verpflichtend <strong>und</strong> auf dem<br />

mathematischen <strong>und</strong> wirtschaftlichen Zweig auch Informatik beinhaltet. Die Schüler der Realschule<br />

kommen also schon im Regelunterricht viel mit Computern in Berührung, bei den Gymnasiasten dagegen<br />

ist es nur ein Wahlfach <strong>und</strong> es liegt somit an den Lehrern, ob diese in <strong>ihre</strong>m Unterricht auch die<br />

Arbeit am Computer einplanen. Ebenfalls auffällig ist die deutlich negative Bewertung der Skala 9<br />

(Generelle Einstellung zum Themengebiet) durch die Gymnasiasten. Der zughörige Mittelwert ist um<br />

mehr als 0,5 niedriger als der von den Hauptschülern <strong>und</strong> mehr als 0,7 niedriger als jener der Realschüler.<br />

Diese Tatsache lässt Platz <strong>für</strong> Spekulationen. Entweder sind die Gymnasiasten durchgehend<br />

dem Fach <strong>Mathematik</strong> <strong>und</strong> speziell der Geometrie negativer eingestellt, was an dem Lehrplan <strong>und</strong> der<br />

Aufarbeitung der Themen im Unterricht liegen kann oder sie urteilen durchgehend negativer, weil sie<br />

kritischer mit den Items umgehen. Die These, dass die Gymnasiasten kritischer werten, wird von den<br />

Ergebnissen bei den anderen Skalen unterstützt. Aber auch Klassendynamiken <strong>und</strong> die soziale Erwünschtheit<br />

können eine große Rolle bei der Beantwortung des Erhebungsbogens gespielt haben.<br />

Weiter unten wird nochmals genauer darauf eingegangen.<br />

8 Vgl. www.isb.bayern.de : Lehrplan Gymnasium, Hauptschule <strong>und</strong> Realschule<br />

33<br />

Gymnasium<br />

Realschule<br />

Hauptschule


34<br />

Anzahl der bearbeiteten dynamischen Arbeitsblätter<br />

Als bedeutsame Einflussvariable auf die Bewertung von dynamischen Arbeitsblättern ist die Vorerfahrung<br />

mit diesen zu vermuten. Zu klären ist, ob Vorerfahrungen nützlich sind oder eher Langeweile<br />

verursachen. Deswegen kann man fragen, ob die Schüler, die schon öfter mit GEONExT gearbeitet<br />

haben, GEONExT <strong>und</strong> Geometrie besser beurteilen <strong>und</strong> ob sie auch mit dem Aufbau der dynamischen<br />

Arbeitsblätter <strong>und</strong> dem Zeitrahmen besser zu Recht kamen. Dies könnte zutreffen, da die Schüler,<br />

die mit der Lernsoftware besser vertraut sind, im technischen Umgang mit den dynamischen Arbeitsblättern<br />

weniger Probleme haben sollten als Schüler <strong>und</strong> Schülerinnen, die zum ersten Mal mit<br />

GEONExT arbeiten. Die Frage, ob die Lernsoftware eine hohe Eingewöhnungszeit voraussetzt, lässt<br />

sich durch diesen Vergleich abfragen. Schüler <strong>und</strong> Schülerinnen, die mehr als drei dynamische Arbeitsblätter<br />

vor dem Ausfüllen des Erhebungsbogens bearbeitet haben, werden als Profis, diejenigen<br />

die zwischen einem <strong>und</strong> drei Blätter bearbeitet haben, werden als Fortgeschrittene <strong>und</strong> diejenigen, die<br />

vorher noch nie mit GEONExT gearbeitet haben, werden als Anfänger bezeichnet.<br />

Mittelwert<br />

4,0<br />

3,5<br />

3,0<br />

2,5<br />

2,0<br />

1,5<br />

1,0<br />

Unterschiede nach Anzahl der bearbeiteten Arbeitsblätter<br />

1 2 3 4 5<br />

Skala<br />

6 7 8 9<br />

Abbildung 14 Unterschiede nach Anzahl der bearbeiteten Arbeitsblätter<br />

Anfänger (0)<br />

Fortgeschrittene (1-3)<br />

Profis (mehr als 3)<br />

Betrachtet man diese Übersicht, erkennt man eine eindeutige <strong>und</strong> wieder ziemlich homogene Tendenz.<br />

Die Schüler, die vor der Befragung mehr als drei dynamische Arbeitsblätter bearbeitet haben,<br />

beurteilen acht von neun Skalen am besten. Die Schüler die vorher noch nie mit GEONExT gearbeitet<br />

haben bewegen sich meist in der Mitte, <strong>und</strong> die Befragten, die mit einem bis drei Arbeitsblättern gearbeitet<br />

haben antworten bei sechs von neun Skalen am Negativsten. Eine mögliche Erklärung <strong>für</strong> dieses<br />

Muster ist es, dass die Anfänger dem Reiz des Neuen ausgesetzt sind <strong>und</strong> dem Programm deshalb<br />

freudig entgegen treten. Bei den Fortgeschrittenen tritt die Ernüchterung ein <strong>und</strong> deshalb urteilen<br />

sie negativer. Die positive Beurteilung der Profis resultiert aus deren Erfahrungen, die sie im Umgang<br />

mit GEONExT sicher machen. Trotzdem scheint keine Langeweile aufzukommen, was an unterschiedlichen<br />

Inhalten <strong>und</strong> abwechslungsreichem Aufbau dynamischen Arbeitsblättern liegen könnte.<br />

Abweichungen von dieser Tendenz findet man nur bei den Vorerfahrungen mit Lernsoftware, bei der<br />

das erwartete Muster (Anfänger am wenigsten <strong>und</strong> Profis am meisten Vorerfahrungen) auftritt. Außerdem<br />

fällt bei genauer Analyse der Skala 9 (Generelle Einstellung zum Themengebiet) auf, dass die<br />

Items bei denen Geometrie explizit genannt wird (Items 8 <strong>und</strong> 13) aus dem sonst vorherrschenden<br />

Muster herausfallen. Die Befragten, die vorher noch nie mit GEONExT gearbeitet haben antworten bei


diesen beiden Items verglichen mit den Ergebnissen der anderen Skalen auffallend negativ. Beachten<br />

muss man bei der Verbindung mit der Kovariable „Anzahl der bearbeiteten dynamischen Arbeitsblätter“,<br />

dass die Schüler klassenweise meist gleich viele Vorerfahrungen haben. Diese Variable steht<br />

also im engen Zusammenhang mit der Kovariable Klassenstufe, weshalb auch bei diesem Punkt<br />

Klassendynamiken, die Stimmung <strong>und</strong> die soziale Erwünschtheit in der Klasse eine große Rolle spielen<br />

können.<br />

Klassenstufe<br />

Die Klassenstufe stellt ein wichtiges Untersuchungskriterium in der Evaluation dar, um mögliche<br />

Schlüsse <strong>für</strong> den Einsatz von GEONExT in den verschiedenen Jahrgangsstufen zu ziehen. Vorstellbar<br />

ist ein besserer Umgang mit bzw. ein besseres Verständnis von GEONExT je mehr Unterrichtserfahrung<br />

die Schüler <strong>und</strong> Schülerinnen haben. Demnach müssten die Befragten höherer Klassenstufen<br />

besser mit dem Zeitrahmen zurechtgekommen sein <strong>und</strong> selbständiges Arbeiten positiver beurteilen.<br />

Mittelwert<br />

4,0<br />

3,5<br />

3,0<br />

2,5<br />

2,0<br />

1,5<br />

1,0<br />

Abbildung 15 Unterschiede nach Klassenstufe<br />

Unterschiede nach Klassenstufe<br />

1 2 3 4 5<br />

Skala<br />

6 7 8 9<br />

Auf den ersten Blick fällt auf, dass bei den ersten drei Skalen die Befragten unterschiedlicher Klassenstufen<br />

recht ähnlich antworten. Bei den Skalen 4 – 9 ist dies nicht mehr der Fall. Bei diesen Skalen<br />

stechen die relativ negative Beurteilung der 7. Klässer <strong>und</strong> die positive Beurteilung der 12. Klässer<br />

hervor. 9 Woran das liegt, kann aufgr<strong>und</strong> der vorliegenden Daten nicht geklärt werden. Wie sich bisher<br />

auch schon gezeigt hat, ist der Klasseneinfluss bedeutsam, so dass entsprechende Stimmungen in<br />

der Klasse zu einer negativen Meinungsbildung geführt haben könnten.<br />

Andere durchgehende Muster lassen sich in der Übersicht nicht finden. Analysiert man die Skalen<br />

einzeln, so zeigt sich bei Skala 8, dass die 12. Klässer gegenüber dem Einsatz von dynamischen Arbeitsblättern<br />

im Unterricht am positivsten eingestellt (Item 29), dem Computereinsatz bei Matheprüfungen<br />

dagegen am negativsten (Item 34) sind. Der relativ gesehen sehr negative Mittelwert der 12.<br />

Klässer bei Item 34 (Ich bin der Meinung, Computer sollten in Matheprüfungen eingesetzt werden.)<br />

sticht bei dieser Skala am meisten hervor. Eine Erklärungsmöglichkeit wäre, die zeitliche Nähe zu<br />

Abschlussprüfungen. Dort ist ein Computereinsatz noch nicht möglich, so dass dies eine neue <strong>und</strong><br />

ungewohnte Prüfungssituation darstellen würde.<br />

9<br />

Ein Gr<strong>und</strong> <strong>für</strong> die Extremwerte der 12. Klässer wäre, dass nur zwei Schüler der 365 Befragten dazu<br />

zählen.<br />

35<br />

Klasse 6<br />

Klasse 7<br />

Klasse 8<br />

Klasse 9<br />

Klasse 10<br />

Klasse 12


Mittelwert<br />

4,0<br />

3,5<br />

3,0<br />

2,5<br />

2,0<br />

1,5<br />

1,0<br />

36<br />

Der Vergleich der Klassenstufen liefert vor allem die Erkenntnis, dass die Befragten der 7. Klassen<br />

durchgehend negativer geantwortet haben als die übrigen. Tendenziell kann man außerdem noch<br />

feststellen, dass jüngere Schüler <strong>und</strong> Schülerinnen (6. <strong>und</strong> 8. Klasse) dem weiteren Einsatz von Lernsoftware<br />

<strong>und</strong> <strong>Mathematik</strong>/Geometrie im Vergleich positiver eingestellt sind. Mit dem gesteckten Zeitrahmen<br />

kommen die Befragten tendenziell besser zurecht je älter sie sind.<br />

Zusammenhang<br />

Betrachtet man die Resultate hinsichtlich der Kovariablen im Zusammenhang, so zeigen sich weitere<br />

bemerkenswerte Phänomene. Hinsichtlich Geschlecht <strong>und</strong> <strong>Mathematik</strong>zensuren sind die Auswirkungen<br />

in allen neun Skalen nahezu homogen. Bei Schulart <strong>und</strong> Anzahl der bearbeiteten Arbeitsblätter<br />

sind die Auswirkungen markanter <strong>und</strong> bei Klassenstufe am meisten ausgeprägt. Gerade bei den letzten<br />

drei Kovariablen wird man aber mit Vermengungen rechnen müssen. In allen Fällen beschränken<br />

sich die markanten Unterschied aber auf einige Skalen: Die Skalen 1, 2, 3 <strong>und</strong> 7 werden eigentlich<br />

stets einheitlich <strong>und</strong> unabhängig vom Status der Kovariable beantwortet. Bei Skala 6 zeigen sich moderierte<br />

Auswirkungen (vor allem wenn man von Klassenstufe 6 absieht). Bei den Skalen 4 <strong>und</strong> 5<br />

sowie 8 <strong>und</strong> 9 kommen die Kovariablen Schulart, Anzahl der bearbeiteten Arbeitsblätter <strong>und</strong> Klassenstufe<br />

ins Spiel. Hier „scheiden sich dann die Geister“. Dabei scheint der Schlüssel darin zu liegen, ob<br />

es in einer Unterrichtsreihe gelingt, GEONExT zu einer positiven Erfahrung werden zu lassen – oder<br />

nicht. Diese Erfahrung hat aber wenig Auswirkungen auf generelle Haltungen zu Computern oder<br />

selbständigem Arbeiten: Sie wird eben von den Schülern durchaus spezifisch (auf die Unterrichtsreihe<br />

bezogen) wahrgenommen. Es scheint im weitesten Sinne die Klassensituation (umschrieben durch<br />

Klassenstufe, Anzahl der bearbeiteten Arbeitsblätter <strong>und</strong> Schulart) <strong>und</strong> weniger Geschlecht <strong>und</strong> Note<br />

zu sein, die dann zu unterschiedlichen Beurteilungen führen. Prägnant zusammenfassen lassen sich<br />

diese Überlegungen mittels der Kovariable Klassensatz, die im Gr<strong>und</strong>e die anderen Kovariablen umgreift.<br />

Die entsprechende Graphik sieht dann so aus:<br />

Abbildung 16 Unterschiede nach Klassensatz<br />

Hieraus lässt sich unschwer erkennen:<br />

Unterschiede nach Klassensatz<br />

1 2 3 4 5<br />

Skala<br />

6 7 8 9<br />

Klassensatz1<br />

Klassensatz3<br />

Klassensatz4<br />

Klassensatz5<br />

Klassensatz6<br />

Klassensatz7<br />

Klassensatz8<br />

Klassensatz9<br />

Klassensatz11<br />

Klassensatz12<br />

Klassensatz14<br />

Klassensatz15<br />

Klassensatz16<br />

Klassensatz17<br />

Klassensatz20<br />

Klassensatz21<br />

Klassensatz22


1. GEONExT wird im Allgemeinen recht positiv bewertet – dies gilt selbst dann, wenn man in Rechnung<br />

stellt, dass durch die freiwillige Teilnahme an der Evaluation eine positive Verzerrung vorliegt.<br />

Der bestmögliche Mittelwert ist 1,0; der schlechtestmögliche 4,0. Wie leicht zu sehen ist, werden auf<br />

keiner Skala <strong>und</strong> in keiner Klasse Mittelwerte über 3,0 erreicht.<br />

2. Die Skalen zerfallen im Wesentlichen in zwei Gruppen: Allgemeine Einstellungen zum Arbeiten<br />

mit Computern (Skalen 1, 2, 3 <strong>und</strong> 7) <strong>und</strong> spezielle Erfahrungen mit GEONExT (Skalen 4, 5, 6, 8, 9).<br />

In der ersten Gruppe hängen die Bewertungen wenig von Kovariablen (wie insbesondere Klassensatz)<br />

ab. Sie variieren zwar deutlich zwischen den Skalen, aber eben im „Gleichschritt“. In der zweiten<br />

Gruppe zeigen sich hingegen deutliche Unterschiede zwischen den Klassen: In einigen Klassen wird<br />

GEONExT zu einer sehr positiven Unterrichtserfahrung (durchgehende Linien), in anderen weniger<br />

(gestrichelte Linien). Entscheidend hier<strong>für</strong> scheinen Lehrer- <strong>und</strong> Klasseneffekte. Hier ist anzusetzen,<br />

um das Potential von GEONExT voll auszuschöpfen.<br />

3.5. Fazit<br />

Eine genaue inhaltliche Analyse der Skalen zeigt zunächst, dass <strong>und</strong> wie die einzelnen Items zu interpretierbaren<br />

Gr<strong>und</strong>haltungen zusammengefasst werden können. Allerdings offenbart sie – insbesondere<br />

auch in Verbindung mit einem kleinen Befragungsinstrument – auch einige Überlappungen <strong>und</strong><br />

Unklarheiten. Darauf aufbauend können konkrete Empfehlungen zur Weiterentwicklung des Erhebungsinstrumentes<br />

gegeben werden. Eine datenbasierte Analyse der Antwortmuster zeigt einige interessante<br />

Strukturen innerhalb <strong>und</strong> zwischen den Skalen auf. Insbesondere liefert sie Hinweise, welche<br />

Items <strong>und</strong> Skalen besonders gut bzw. schlecht bewertet werden. Dies lässt sich durch die klassischen<br />

Kennzahlen aus Abschnitt 3.3. noch untermauern: GEONExT wird so gut bewertet, dass sich sogar<br />

einige Bodeneffekte zeigen. Allerdings war dies bei der Konzeption des Fragebogens nicht absehbar.<br />

Die Skaleneinteilung wird (gemessen in Cronbach's α) <strong>für</strong> die meisten Skalen als adäquat beurteilt.<br />

Auch hier ergeben sich wieder konkrete Resultate zur Verbesserung des Fragebogens. Betrachtet<br />

man die Resultate in den – mit einigen Einschränkungen abgesicherten – Skalen in Abhängigkeit von<br />

Kovariablen, so scheint vor allem die Klassensituation eine Rolle zu spielen. Sie beeinflusst die Rezeption<br />

von GEONExT, aber nicht allgemeinere Haltungen. Hier ist anzusetzen, um die an sich positiven<br />

Potentiale von GEONExT voll zum Tragen zu bringen.<br />

37


Gesamtmittel<br />

3.0<br />

2.5<br />

2.0<br />

1.5<br />

1.0<br />

38<br />

4. Untersuchung der Schüler<br />

Im vorigen Kapitel wurde die Datenmatrix weitgehend von den Spalten (Items) her betrachtet. In diesem<br />

Kapitel sollen nun die Zeilen (Schüler) im Vordergr<strong>und</strong> stehen. Jede der 365 Zeilen der Datenmatrix<br />

enthält die Antworten (<strong>und</strong> daraus abgeleitete Größen) <strong>für</strong> einen Teilnehmer. Auch hier gibt es<br />

aber Gruppierungen <strong>und</strong> Substrukturen, die dargelegt werden müssen. Ferner ist zu fragen, welche<br />

Kovariablen unter diesen Umständen klare Einflüsse bewirken <strong>und</strong> welcher Art diese Einflüsse sind.<br />

4.1. Klasseneinteilung <strong>und</strong> Substrukturen<br />

A priori erfolgt eine Gruppierung der Schüler durch die Klassenzugehörigkeit. Es ist auch sehr plausibel<br />

<strong>und</strong> sogar empirisch belegt, dass die Zugehörigkeit zu einer bestimmten Klassensituation starken<br />

Einfluss auf die Schülerantworten haben kann. Als Gründe da<strong>für</strong> wird man unschwer einen Effekt des<br />

Lehrers <strong>und</strong> der Klassengemeinschaft vermuten. In Verbindung mit Abbildung 4 (Mittel-SD-Diagramm)<br />

wurde bereits auf kohärente Substrukturen – wozu natürlich auch ganze Klassen zählen – hingewiesen.<br />

Auch in der zentralen Darstellung Abbildung 16 (Unterschiede nach Klassensatz) war die Rolle<br />

von Klassensatz als Einflussfaktor auf die Beurteilung im Spiegel der Skalen deutlich zu erkennen.<br />

Noch deutlicher wird diese Rolle durch den folgenden vergleichenden Boxplot:<br />

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22<br />

Abbildung 17 Klassensatzplot<br />

Klassensatz


Hintergr<strong>und</strong>: Boxplot <strong>und</strong> vergleichende Boxplots<br />

Ein Boxplot (Kastenzeichnung) ist eine übersichtliche horizontale oder vertikale Darstellung<br />

eines Datensatzes. Er geht auf Tukey (1977) zurück <strong>und</strong> stellt eine zeichnerische Umsetzung<br />

einer 5-number-summary dar.<br />

Daten<br />

30<br />

20<br />

10<br />

0<br />

Q3<br />

Q1<br />

In der obigen Darstellung ist ein (vertikaler) Boxplot <strong>für</strong> die Daten<br />

5, 5, 6, 7, 8, 9, 10, 11, 12, 15, 16, 20, 30<br />

wiedergegeben. Der Boxplot ergibt sich in drei Schritten:<br />

.<br />

1. Im ersten Schritt berechnet man zunächst den Median (10), das untere Quartil (Q1 = 7)<br />

<strong>und</strong> das obere Quartil (Q3 = 15), trägt diese in die Graphik ein <strong>und</strong> bildet daraus einen<br />

Kasten. Dieser Kasten umfasst die zentralen 50 % der Daten. Der eingetragene Median<br />

zeigt, inwieweit im zentralen Bereich der Daten Symmetrie vorliegt.<br />

2. Im zweiten Schritt berechnet man den Quartilsabstand, hier QA = 15 – 7 = 8. Das<br />

1.5- fache des Quartilsabstandes, also 1.5·8=12 legt man in Gedanken an das obere<br />

Quartil nach oben <strong>und</strong> vom unteren Quartil nach unten an. (Diese gedachten Bereiche<br />

reichen also von 7 bis 7 – 12 = -5 bzw. von 15 bis 15 + 12 = 27.) Man zeichnet nun (vertikale)<br />

Striche (whisker) bis zu dem kleinsten bzw. größten tatsächlich im Datensatz auftretenden<br />

Werten in diesen Bereichen, hier also bis 5 bzw. bis 20. Diese Striche beschreiben<br />

die Verteilung in den mittleren Bereichen.<br />

3. Im dritten Schritt trägt man alle Werte unterhalb von Q1 – 1.5·QA bzw. oberhalb von<br />

Q3 + 1.5·QA als potentielle Ausreißer einzeln durch (horizontale) Striche ein.<br />

Ein Boxplot lässt auf einen Blick Lokation, Streuung, Symmetrie <strong>und</strong> Ausreißer(kandidaten)<br />

eines Datensatzes erkennen. Zudem zeigt er die numerischen Werte von Minimum, unterem<br />

Quartil, Median, oberen Quartil <strong>und</strong> Maximum.<br />

Mehrere Boxplots nebeneinander eignen sich daher sehr gut zum Vergleich von Datensätzen<br />

<strong>und</strong> Verteilungen. Man spricht dann auch von vergleichenden Boxplots.<br />

39


40<br />

Man erkennt hier auch wieder direkt die Klassensätze, bei denen weniger zufrieden stellende Resultate<br />

erzielt wurden (11, 12, 16, 21, 22). Bei vier davon (11, 16, 21, 22) fallen auch die großen Quartilsabstände<br />

ins Auge, mit anderen Worten es handelt sich hier neben einem höheren Median um recht<br />

inhomogene, ziemlich weit differierende Ansichten der Schüler in diesen Klassensätzen.<br />

Man wird fragen, ob es außer dieser offenk<strong>und</strong>igen – schon a priori zu vermutenden – Gruppierung<br />

noch weitere relevante – eher datenbasierte – Substrukturen gibt. Aus Abbildung 4 (Mittel-SD-<br />

Diagramm) kann man erkennen, dass durchaus Teilgruppen innerhalb eines Klassensatzes zusammen<br />

hängen. Es ließen sich zwar keine „Cliquen“ mit verabredeten unsinnigen Antworten ausmachen,<br />

aber Abhängigkeiten im Sinne von Meinungsbeeinflussung scheinen schon vorzuliegen. Untermauern<br />

lässt sich dieser Eindruck auch durch eine Analyse der freien Kommentare, in denen ähnliche <strong>und</strong> in<br />

Einzelfällen verbatim übereinstimmende Formulierungen benutzt wurden. Das soll hier nicht überinterpretiert<br />

werden, aber es illustriert doch das nahe liegende Faktum, dass die Meinungsbildung der<br />

Schüler nicht gänzlich unabhängig von Bezugsgruppen erfolgen dürfte. Zugleich ist es eine Mahnung,<br />

die Schülerantworten eben nicht als unabhängige Realisationen identisch verteilter Zufallsvariabler<br />

(das heißt als „Zufallsstichprobe“ im eigentlichen Sinn) anzusehen <strong>und</strong> auszuwerten.<br />

Unabhängigkeit dürfte am ehesten noch auf der Ebene der Klassensätze selbst herrschen. Aber auch<br />

hier zeigen sich Phänomene, die zur Vorsicht mahnen. Betrachtet man etwa die Parallelklassen, die<br />

im folgenden vergleichenden Boxplot als Päckchen nebeneinander geplottet sind, so zeigt sich, dass<br />

zwischen den Schulen deutliche, aber zwischen den Parallelklassen eher geringere Unterschiede<br />

bestehen. Parallelklassen scheinen „miteinander verb<strong>und</strong>en“ zu sein. Dabei wurde folgende Kodierung<br />

gewählt:<br />

Klassensatz Kodierung<br />

21 21<br />

22 22<br />

17 24<br />

9 25<br />

16 27<br />

11 28<br />

15 30<br />

6 31<br />

Tabelle 15 Kodierung der Parallelklassen


Gesamtmittel<br />

3.0<br />

2.5<br />

2.0<br />

1.5<br />

1.0<br />

21 22 23 24 25 26 27 28 29 30 31<br />

Abbildung 18 Klassensatzplot der Parallelklassen<br />

Klassensatz <strong>für</strong> Parallelklassen<br />

Über die Gründe lässt sich (auch mangels Daten) nichts Endgültiges sagen. Das Thema allein scheint<br />

nicht zur Erklärung auszureichen, da gerade in den Klassensätzen 21 <strong>und</strong> 22 verschiedene Themen<br />

behandelt wurden, während umgekehrt das Thema Thales in Klassensatz 20 mit sehr gutem Erfolg<br />

durchgenommen wurde. Es ist denkbar, dass es auch einen nivellierenden Schuleffekt bei Parallelklassen<br />

gibt, der schon allein aufgr<strong>und</strong> von klassenübergreifenden Kontakten bei den Schülern, allgemeinen<br />

Absprachen bei den Lehrern sowie des Einzugsgebiets der Schule <strong>und</strong> des sozialen Hintergr<strong>und</strong>s<br />

<strong>ihre</strong>r Schüler plausibel wäre.<br />

Es gibt also sowohl Mikro- wie auch Makrostrukturen über den Klassensatz hinaus, die eine Behandlung<br />

der Schüler oder der Klassen als „i.i.d.-Zufallsstichprobe“ in Frage stellen. Andererseits erscheint<br />

Klassensatz nach wie vor als geeignete <strong>und</strong> einflussreiche Kovariable. Denn es spricht nichts dagegen,<br />

„Schuleffekte“ mit durch den Klassensatz zu modellieren, zumal meist ohnehin nur eine Klasse<br />

pro Schule teilnehmen wird. Überdies zeigt gerade der Parallelklassenplot, dass selbst bei sehr homogenen<br />

Verhältnissen ein deutlicher Klassensatzeffekt bleibt. Die Unterschiede zwischen Parallelklassen<br />

dürften nivellierte Klassensatzeffekte – <strong>und</strong> insofern „untere Schranken“ da<strong>für</strong> – sein.<br />

4.2. Einfluss der Kovariablen<br />

In diesem Abschnitt soll erneut eine Betrachtung der Kovariablen vorgenommen werden. Diesmal soll<br />

allerdings das Gesamtmittel über alle 38 Items <strong>und</strong> nicht die Mittel auf den einzelnen Skalen im Mittelpunkt<br />

stehen. Direkte Vergleiche sind mit großer Vorsicht zu interpretieren, da es wieder sehr leicht<br />

zur Vermengung von Faktoren kommen kann. In der bisherigen Untersuchung (Abschnitt 3.4. <strong>und</strong><br />

4.1.) stellte sich insbesondere der Klassensatz als sehr einflussreiche Kovariable heraus, was aus<br />

empirischer Sicht auch sehr plausibel ist. Dies wird in Kapitel 5 noch einmal durch einen anderen Ansatz<br />

bestätigt werden. Insofern erscheint es vernünftig, bei der Betrachtung der anderen Kovariablen,<br />

den Faktor Klassensatz wieder zu kontrollieren <strong>und</strong> seinen Effekt herauszurechnen. Dabei sollen angesichts<br />

der oben angesprochenen Substrukturen komplexe Techniken vermieden, sondern lieber<br />

elementar vorgegangen werden. Dazu wird neben dem ursprünglichen Gesamtmittel eines Schülers<br />

auch immer das „bereinigte Gesamtmittel“ betrachtet. Dieser Wert wird wie folgt gebildet: Zunächst<br />

wird vom Gesamtmittel eines jeden Schülers der Mittelwert <strong>für</strong> den Klassensatz, dem er angehört,<br />

subtrahiert. Anschließend wird der Mittelwert über alle Schüler addiert. Auf diese Weise wird also letztlich<br />

der Unterschied (in den Mittelwerten) zwischen dem Klassensatz des Schülers <strong>und</strong> dem Gesamtdatensatz<br />

eliminiert. Vergleiche auf der Basis dieses „bereinigten Gesamtmittels“ sind dann also wesentlich<br />

weniger von Vermengungen verzerrt.<br />

41


42<br />

Allerdings ist einzuräumen, dass Klassensatz nicht der einzige vermengende Faktor sein muss. Überdies<br />

kann im Klassensatzeffekt eben auch beispielsweise ein Teil eines Geschlechtereffektes bereits<br />

enthalten sein. Ganz krass ist dies bei der Variable Schulart der Fall, die ja eine Vergröberung von<br />

Klassensatz darstellt <strong>und</strong> daher (abgesehen von dem etwas Schulart übergreifenden Klassensatz 1)<br />

vollständig darin aufgeht. Insofern dürften die verbleibenden Effekte der einzelnen Kovariablen wieder<br />

eher „untere Schranken“ <strong>für</strong> die tatsächlichen Effekte sein. Zum Vergleich wird deshalb auch immer<br />

die unbereinigte Version mit diskutiert. Auch fehlende Werte (KA) sind hier mit berücksichtigt.<br />

Geschlecht<br />

Jungen schätzen sich selbst wahrscheinlich computeraffiner ein als Mädchen. Lernprogrammen gegenüber<br />

sind die Schüler eher kritisch eingestellt, da sie im privaten Bereich weniger davon Gebrauch<br />

machen als mit Spielen, mailen, Internet etc. Es ist daher anzunehmen, dass Mädchen computergestützte<br />

<strong>Mathematik</strong> positiver bewerten als Jungen. Betrachtet man allerdings die Ergebnisse dieser<br />

Umfrage, so lässt sich unschwer erkennen, dass die Schülerinnen insgesamt etwas kritischer urteilen.<br />

m w KA<br />

Anzahl 176 180 9<br />

Mittelwert 1.91 2.00 2.35<br />

Bereinigter Mittelwert 1.95 1.98 2.03<br />

Tabelle 16 Mittelwerte <strong>und</strong> bereinigte Mittelwerte nach Geschlecht<br />

Allerdings ist der Unterschied (jedenfalls nach Bereinigung) nicht mehr sehr groß wie sich in einem<br />

Boxplot sehr klar zeigt:<br />

Bereinigtes Gesamtmittel<br />

3.0<br />

2.5<br />

2.0<br />

1.5<br />

1.0<br />

Abbildung 19 Geschlechterplot<br />

KA m w<br />

Geschlecht


Zensur<br />

Vorauszuschicken ist, dass die Angabe der erhaltenen letzten Zeugnisnote in Selbsteinschätzung<br />

durch die Befragten erfolgt ist <strong>und</strong> demnach sind diese Ergebnisse unter Vorbehalt zu betrachten.<br />

Lernschwache sollten von der dynamischen Veranschaulichung profitieren <strong>und</strong> sind eventuell im<br />

häuslichen Bereich bzw. bei Nachhilfe eher mit Lernprogrammen vertraut als erfolgreiche Lerner.<br />

Nicht zu vergessen ist jedoch, dass nicht abgesicherte Vorkenntnisse <strong>und</strong> Misserfolgserlebnisse bei<br />

sich als schlechter einschätzenden Schülerinnen <strong>und</strong> Schülern zu negativeren Gesamturteilen führen<br />

können.<br />

Note 1 Note 2 Note 3 Note 4 Note 5 Note 6 KA<br />

Anzahl der Schüler 21 64 129 93 10 1 47<br />

Mittelwert 1.92 1.97 1.98 2.04 2.02 2.86 1.78<br />

Bereinigter Mittelwert 1.92 1.97 1.96 1.97 2.13 2.51 1.95<br />

Tabelle 17 Mittelwerte <strong>und</strong> bereinigte Mittelwerte nach Zensur<br />

Als Boxplot ergibt sich:<br />

Bereinigtes Gesamtmittel<br />

3.0<br />

2.5<br />

2.0<br />

1.5<br />

1.0<br />

Abbildung 20 Zensurenplot<br />

1 2 3 4 5 6 KA<br />

Note<br />

Insgesamt kann man festhalten, dass die besseren Lerner positiver als schlechtere urteilen. Die Unterschiede<br />

sind in einigen Skalen erheblich ausgeprägt. Bei Skala 6, in der die zur Verfügung stehende<br />

Zeit <strong>für</strong> die Bearbeitung abgefragt wird, urteilen die Einserschüler mit deutlichem Abstand besser<br />

als die schlechteren. Etwas abgeschwächt ist dies auch bei der Beurteilung des Themas zu sehen.<br />

Das heißt, dass die besseren Schüler eher mit der Aufgabenstellung <strong>und</strong> der Zeitvorgabe zu Recht<br />

kommen als die schlechteren Schüler. Zieht man die negativeren Urteile zur Vorerfahrung mit Lernsoftware<br />

<strong>und</strong> Beurteilung der Computernutzung im Allgemeinen der Lernschwachen hinzu, so zeigt<br />

sich auch hier ein erwartungswidriges Ergebnis. Zusammengenommen weisen diese Ergebnisse auf<br />

die Bedeutsamkeit der Vermittlung in einer angemessenen didaktisch-methodischen Lernumgebung<br />

gerade <strong>für</strong> die Lernschwächeren hin.<br />

43


44<br />

Schulart<br />

Aufgr<strong>und</strong> <strong>ihre</strong>s Sprachvermögens, <strong>ihre</strong>r Fähigkeit zur Selbstreflexion <strong>und</strong> <strong>ihre</strong>r Kritikfähigkeit urteilen<br />

Gymnasiasten vermutlich differenzierter <strong>und</strong> kritischer als die anderen Befragten. In der vorliegenden<br />

Stichprobe wird die Realschule nur durch eine Klasse repräsentiert, die zweimalig an der Erhebung<br />

teilgenommen hat. Aus der Tabelle lässt sich ablesen, dass die Gymnasiasten erwartungsgemäß am<br />

kritischsten antworten, während die Hauptschülerinnen <strong>und</strong> -schüler eine Mittelposition einnehmen.<br />

Die Realschüler antworten am positivsten.<br />

Gymnasium Realschule Hauptschule<br />

Anzahl der Schüler 241 48 76<br />

Mittelwert 2.07 1.69 1.82<br />

Bereinigter Mittelwert 1.97 1.97 1.97<br />

Tabelle 18 Mittelwerte <strong>und</strong> bereinigte Mittelwerte nach Schulart<br />

Bei den bereinigten Mittelwerten zeigt sich kein Unterschied, da etwaige Unterschiede bereits durch<br />

die umfassenderen Klassensatzeffekte (abgesehen von einer Realschülerin in Klassensatz 1) herausgerechnet<br />

wurden. Der Boxplot ist gleichwohl von Interesse, da er die Verteilungen <strong>und</strong> insbesondere<br />

die Spreizung der Werte zeigt.<br />

Bereinigtes Gesamtmittel<br />

3.0<br />

2.5<br />

2.0<br />

1.5<br />

1.0<br />

Abbildung 21 Schulartenplot<br />

Anzahl der bearbeiteten dynamischen Arbeitsblätter<br />

GY HS RS<br />

Schulart<br />

Als Hauptproblem <strong>ihre</strong>s Schulalltags geben Schülerinnen <strong>und</strong> Schüler vorherrschende Langeweile an.<br />

Deshalb kann man davon ausgehen, dass neue Arbeitsmethoden, abwechslungsreiche Inhalte oder<br />

spezieller Medieneinsatz eine willkommene Abwechslung bieten <strong>und</strong> entsprechend positiv gewertet<br />

werden. Bei den Anfängern kann dieser „Reiz des Neuen“ aber schnell verblassen, wenn erste<br />

Schwierigkeiten auftauchen oder erneut langweilige Routine auftritt. Allerdings können diese Probleme<br />

mit zunehmender Kompetenz bewältigt <strong>und</strong> gelöst werden. Man kann also von einer kontinuierlichen<br />

Entwicklung der Einstellungen ausgehen.


Bereinigtes Gesamtmittel<br />

Anfänger<br />

Fortgeschrittene<br />

Profis KA<br />

Anzahl der Schüler 195 99 49 22<br />

Mittelwerte 1.97 2.10 1.74 1.81<br />

Bereinigte Mittelwerte 1.97 1.99 1.93 1.93<br />

Tabelle 19 Mittelwerte <strong>und</strong> bereinigte Mittelwerte nach Vorkenntnissen<br />

Die Profis (mehr als 3 bearbeitete dynamische Arbeitsblätter) urteilen am positivsten, während die<br />

Anfänger eine Mittelposition einnehmen. Somit ist keine kontinuierliche Entwicklung festzustellen. Der<br />

Mittelwert der Anfänger (ohne Vorkenntnisse) liegt relativ niedrig, verschlechtert sich aber zunächst.<br />

Diese Entwicklung ließe sich mit dem „Reiz des Neuen“ erklären. Würde man diesem Erklärungsmuster<br />

weiter folgen, so müssten die Profis noch negativer als die Fortgeschrittenen antworten, da die<br />

Motivation durch wiederholte Bearbeitung abnehmen würde. Dies spiegelt sich jedoch nicht in den<br />

Mittelwerten wider. Zwischen den Fortgeschrittenen <strong>und</strong> den Profis ist eine deutliche Verbesserung<br />

der (unbereinigten) Mittelwerte festzustellen. Das Erklärungsmuster, dass wer als Fortgeschrittener zu<br />

kritisch ist, nicht zum Profi wird, greift hier nicht. Denn eine Weiterarbeit ist im Unterricht verpflichtend.<br />

Aus diesem Gr<strong>und</strong>e sind Unterschiede auch weitgehend bereits durch den Klassensatz erklärt; der<br />

Boxplot zeigt aber wieder die gesamte Verteilung:<br />

3.0<br />

2.5<br />

2.0<br />

1.5<br />

1.0<br />

Abbildung 22 Vorkenntnisplot<br />

Klassenstufe<br />

AN FO PR KA<br />

Anzahl der bearbeiteten dynamischen Arbeitsblätter<br />

Der Altersvergleich findet nach Jahrgangsstufen statt, wobei das Lebensalter innerhalb der untersuchten<br />

Schulklassen bis zu vier Jahren streut. Jüngere Schülerinnen <strong>und</strong> Schüler verfügen über ein weniger<br />

ausgeprägtes Abstraktionsvermögen <strong>und</strong> sind eher auf (dynamische) Veranschaulichung angewiesen<br />

als Ältere. Ebenso entwicklungsbedingt prägt sich eine Antihaltung gegenüber Schule <strong>und</strong><br />

Unterricht erst im Verlauf einer längeren Schulbesuchsdauer aus. Den älteren Schülerinnen <strong>und</strong><br />

45


46<br />

Schülern kommen aber größere Vorkenntnisse <strong>und</strong> Erfahrungen zugute, die <strong>ihre</strong> Urteile positiv beeinflussen<br />

können.<br />

Jgst. 6 Jgst. 7 Jgst. 8 Jgst. 9 Jgst. 10 Jgst.12<br />

Anzahl der Schüler 34 179 48 47 55 2<br />

Anzahl der Klassen 2 8 2 2 2 2 Teilnehmer<br />

Mittelwert 1.80 2.16 1.69 1.80 1.85 1.68<br />

Bereinigte Mittelwerte 1.97 1.97 1.97 1.97 1.97 1.87<br />

Tabelle 20 Mittelwerte <strong>und</strong> bereinigte Mittelwerte nach Klassenstufe<br />

Aus der Tabelle lässt sich keine kontinuierliche Entwicklung der Mittelwerte in den einzelnen Jahrgangsstufen<br />

feststellen. Die Werte in den sechsten, neunten <strong>und</strong> zehnten Klassen sind ähnlich ausgeprägt,<br />

während die der siebten Klassen negativ <strong>und</strong> die der achten Klasse, die zweimal an der Befragung<br />

teilnahm, positiv herausstechen. Schon von daher scheint es problematisch, dies der Jahrgangsstufe<br />

8 als solcher zuzuschreiben. Nach Bereinigung ergeben sich wieder keine Unterschiede in<br />

den Mittelwerten, da die Kovariable Jahrgangsstufe gänzlich durch Klassensatz erklärt werden kann<br />

(abgesehen von Klassensatz 1). Der Boxplot zeigt aber wieder die Verteilungen (wobei Klassenstufe<br />

11 nicht auftritt <strong>und</strong> Klassenstufe 12 nur zwei Schülerinnen umfasst).<br />

Bereinigtes Gesamtmittel<br />

3.0<br />

2.5<br />

2.0<br />

1.5<br />

1.0<br />

Abbildung 23 Klassenstufenplot<br />

6 7 8 9 10 11 12<br />

Klassenstufe<br />

Interessant in diesem Zusammenhang ist noch die Analyse der Skalen Vorerfahrung mit Computern<br />

(Skala 1) <strong>und</strong> Vorerfahrung mit Lernsoftware (Skala 2). In den unteren Jahrgangsstufen scheint eine<br />

kontinuierliche Zunahme der Vorkenntnisse stattzufinden, die sich aber ab der neunten Jahrgangsstufe<br />

gegenteilig entwickelt.


4.3. Fazit<br />

Es lassen sich deutliche Anhaltspunkte <strong>für</strong> Substrukturen in dem Datensatz dokumentieren. Vor der<br />

unkritischen Nutzung von Unabhängigkeitsannahmen etwa der einzelnen Schüler oder der einzelnen<br />

Klassen muss daher gewarnt werden.<br />

Bei der Betrachtung von Kovariablen ist angesichts der extrem homogenen Ausgangssituation bei<br />

Parallelklassen <strong>und</strong> der dennoch sichtbaren Unterschiede wohl einigermaßen sicher von einem deutlichen<br />

Klassensatzeffekt auszugehen. Nicht zuletzt auch wegen der Substrukturen ist nicht völlig klar,<br />

inwieweit dieser herausgerechnet werden sollte. In der obigen Darstellung wurden daher mit den unbereinigten<br />

<strong>und</strong> den vollständig bereinigten Gesamtmitteln die beiden Extremsituationen diskutiert. Für<br />

die bereinigten Gesamtmittel nivellieren sich die Unterschiede stark <strong>und</strong> fallen aus prinzipiellen Gründen<br />

<strong>für</strong> Schulart, Anzahl der berarbeiteten dynamischen Arbeitsblätter sowie Klassenstufen (abgesehen<br />

von Klassensatz 1) fort. Mädchen <strong>und</strong> Jungen urteilen (nach Bereinigung) nicht sehr unterschiedlich,<br />

sehr schwache Schüler (Note 5 <strong>und</strong> 6) etwas kritischer.<br />

47


48<br />

5. Integrative Analyse <strong>und</strong> Diskussion<br />

In diesem Kapitel soll die Gesamtstruktur des Datensatzes detailliert betrachtet werden. Angesichts<br />

der etwas unscharfen Abgrenzung einzelner Skalen erscheint es <strong>für</strong> diese zusammenfassende Diskussion<br />

zweckmäßig, die Größe Gesamtmittel als Hauptzielgröße zu wählen. Bereits in den vorangehenden<br />

Kapiteln wurden hierzu erste Schritte unternommen. Abbildung 4 (Mittel-SD-Diagramm) zeigt<br />

die Verteilung der Größen Gesamtmittel <strong>und</strong> Gesamtsd <strong>und</strong> die darin auftretenden Substrukturen<br />

nach Klassensatz. Der vergleichende Boxplot in Abbildung 17 (Klassensatzplot) gibt einen Eindruck<br />

von der Stärke des Einflusses der Klasse. Es musste aber bisher weitgehend offen bleiben, welche<br />

der Kovariablen als entscheidende Einflussgrößen auf die Hauptzielvariable Gesamtmittel angesehen<br />

werden können. Folgende Größen kommen in Frage:<br />

Variable Typ Mögliche Ausprägungen<br />

Klassensatz Factor 1,3,4,5,6,7,8,9,11,12,14,15,16,17,20,21,22<br />

Klasse Factor 6,7,8,9,10,12<br />

Schulart Factor GY, RS, HS<br />

Geschlecht Factor m w, KA<br />

Alter Double 11,12,13,14,15,16,17,18,KA<br />

Anzahl Double 0,1,2,3,4,5,6,7,8,9,10,11,14,15,KA<br />

Note Double 1,2,3,4,5,6,KA<br />

Tabelle 21 Klassifikation der Variablen<br />

Klasse wurde hier also als Faktor behandelt, da<strong>für</strong> wurde Alter als quantitative Variable mit betrachtet.<br />

5.1. Multivariate Aspekte<br />

Von der Ausgangsfrage her liegt zunächst die Anwendung multivariater statistischer Techniken wie<br />

Regression oder Faktorenanalyse nahe. Die bereits festgestellten Substrukturen mahnen jedoch zur<br />

Vorsicht. Weder die Unabhängigkeit der einzelnen Versuchspersonen noch plausible Verteilungsannahmen<br />

noch akzeptable Festlegungen über die Kovarianzstruktur scheinen unproblematisch. Unter<br />

solchen Umständen liefern die genannten Ansätze häufig eher Artefakte als wirkliche Erklärungen. Ein<br />

sehr datennahes Vorgehen erscheint solider. Die folgenden Techniken sind ausschließlich in diesem<br />

Sinne zu verstehen, auch wenn sie <strong>ihre</strong>rseits ebenfalls zum Teil willkürliche Modellannahmen <strong>und</strong><br />

Festlegungen erfordern.<br />

Von besonderem Interesse scheinen uns Darstellungen, die die „innere Struktur“ <strong>und</strong> die Hierarchie<br />

der Kovariablen visualisieren. In natürlicher Weise führt dies zu Klassifikations- <strong>und</strong> Regressionsbäumen,<br />

die den Klassifikationsschemata der Lebenswissenschaften oder der Medizin nachempf<strong>und</strong>en<br />

sind. Bei der Bestimmung von Pflanzenarten oder Krankheiten geht der Biologe oder Mediziner seit<br />

jeher durch eine hierarchische Abfolge von Fragen vor. Die Baumstruktur des Fragenkataloges zeigt<br />

dann zugleich die Hierarchie der einzelnen Unterscheidungsmerkmale auf. In der Statistik wurden<br />

solche „baumbasierten Methoden“ vor allem durch Breiman e. a. (1984) propagiert.<br />

Die folgende Darstellung ist ein Beispiel <strong>für</strong> einen Regressionsbaum mit 7 Endknoten:


1.7<br />

Abbildung 24 Regressionsbaum mit 7 Endknoten<br />

Die entsprechenden Knotengrößen sind:<br />

77<br />

Klassensatz:abeo<br />

1.9<br />

Klassensatz:abeo<br />

Klassensatz:dfkl<br />

Abbildung 25 Knotengrößen bei 7 Endknoten<br />

80<br />

Klassensatz:dfkl<br />

7 Endpunkte, Antwortwert<br />

Klassensatz:abdefhklno<br />

|<br />

Anzahl


50<br />

Die genaue Beschreibung ergibt sich aus folgender Datei:<br />

Regression tree:<br />

*** Tree Model ***<br />

snip.tree(tree = tree(formula = Gesamtmean ~ Geschlecht + Alter + Anzahlum +<br />

Noteum + Schulartkopie + Klassefak + Klassensatzfak, data =<br />

gepruefteEndtabelle27kurz, na.action = na.exclude, mincut = 3, minsize<br />

= 6, mindev = 0), nodes = c (12, 22, 23, 7, 4, 13, 10))<br />

Variables actually used in tree construction:<br />

[1] "Klassensatzfak" "Anzahlum" "Noteum" "Geschlecht"<br />

Number of terminal nodes: 7<br />

Residual mean deviance: 0.111 = 34.5 / 311<br />

Distribution of residuals:<br />

Min. 1st Qu. Median Mean 3rd Qu. Max.<br />

-0.987 -0.20 -0.00567 -2.17e-016 0.22 0.905<br />

node), split, n, deviance, yval<br />

* denotes terminal node<br />

1) root 318 53.00 2.0<br />

2) Klassensatzfak:1,3,5,6,7,9,14,15,17,20 199 19.00 1.8<br />

4) Klassensatzfak:1,3,6,20 77 4.00 1.7 *<br />

5) Klassensatzfak:5,7,9,14,15,17 122 13.00 1.9<br />

10) Klassensatzfak:5,7,14,15 80 6.50 1.9 *<br />

11) Klassensatzfak:9,17 42 6.10 2.0<br />

22) Anzahlum3.5 10 0.96 1.7 *<br />

3) Klassensatzfak:11,12,16,21,22 119 20.00 2.3<br />

6) Noteum2.5 92 16.00 2.3 *<br />

Abbildung 26 Output <strong>für</strong> den Regressionsbaum<br />

Die Graphiken sind weitgehend selbsterklärend. Man sieht, dass Klassensatz, Note, Geschlecht <strong>und</strong><br />

Anzahl als Kriterien fungieren, um einen Regressionsbaum <strong>für</strong> die Variable Gesamtmittel zu erstellen.<br />

Für einen Schüler mit Klassensatz = a (bzw. 1) wird als Gesamtmittel 1.7 vorhergesagt usw. Klassensatz<br />

= a in der Graphik steht dabei <strong>für</strong> Klassensatz = 1, da <strong>für</strong> faktorielle Variablen dort eine Buchstabenkodierung<br />

vorgenommen wird, um auch höhere Werte als 10 einstellig zu kodieren. Entsprechend<br />

bezeichnet Klassensatz aber den ersten, zweiten, fünften <strong>und</strong> fünfzehnten Ausprägungswert des Faktors<br />

Klassensatz, mithin die Klassensätze 1, 3, 6 <strong>und</strong> 20. In der Datei-Beschreibung des Regressionsbaumes<br />

ist aber die ursprüngliche Bezeichnung gewählt. Der gerade angesprochene Fall Klassensatz:<br />

abeo (bzw. 1, 3, 6, 20) findet sich dort unter „4“. Der damit bezeichnete Knoten ist ein Endknoten<br />

mit 77 Mitgliedern <strong>und</strong> einem Durchschnittswert von 1,7 <strong>für</strong> das Gesamtmittel. Bei der Addition der<br />

Endknotengrößen ergibt sich nur 318, weil Fälle mit fehlenden Werten in einer der Variablen ausgeschlossen<br />

werden müssen.<br />

Insgesamt ist der Baum <strong>und</strong> seine Knotenpunkte so gewählt worden, dass er die Daten möglichst<br />

genau <strong>und</strong> sparsam beschreibt. Als Vorteile hat man neben einer einfachen Beschreibung dann auch<br />

eine durchsichtige Darstellung der Struktur der Daten. Allerdings sind derartige Bäume im hohen Maße<br />

instabil, das heißt sie hängen stark von den gewählten Verfahren <strong>und</strong> Parametern <strong>für</strong> die zugr<strong>und</strong>e<br />

liegende Optimierung ab. Um nicht Artefakte zu produzieren, ist daher ein methodisch vorsichtiges<br />

Vorgehen gefordert. Im obigen Fall wurde ausgehend von den Variablen aus der Tabelle zunächst ein<br />

großer Baum erzeugt, der dann durch so genanntes „Pruning“ zurechtgestutzt wurde. Es ergab sich<br />

eine Sequenz von Bäumen mit zunehmender bzw. abnehmender Anzahl von Endknoten. Die so genannte<br />

„Deviance“ (als Maß <strong>für</strong> die Ungenauigkeit des Baumes) ist in folgender Graphik skizziert:


deviance<br />

30 35 40 45 50<br />

Devianzabnahme<br />

14.00000 0.20000 0.15000 0.08300 0.03300 0.01300 0.00300<br />

1 20 40 60<br />

Abbildung 27 Devianzabnahme <strong>für</strong> einige Regressoinsbäume<br />

Grob gesprochen sind nun die Anzahlen von Knoten besonders interessant, bei denen man eine möglichst<br />

kleine Devianz erreicht. Das Augenmerk richtet sich daher auf solche Knotenanzahlen, die zu<br />

großen Abstiegen („hohen Treppenstufen“) gehören. Es lohnt sich gewissermaßen solche Knoten mit<br />

einzubeziehen, da man <strong>für</strong> diesen Aufwand relativ viel Ertrag – gemessen als Abnahme der Devianz –<br />

erhält. Im vorliegenden Fall legt diese Überlegung nahe einerseits mindestens 7 (wie im obigen Beispiel)<br />

<strong>und</strong> andererseits höchstens 15 oder 21 Endknoten zu wählen. Der „volle“ Baum (unter Beachtung<br />

einiger voreingestellter Parameter) mit 71 Endknoten wäre:<br />

Klassensatz:b<br />

Klassensatz:abeo<br />

Abbildung 28 Vollständiger Regressionsbaum mit 71 Endknoten<br />

size<br />

Klassensatz:abdefhklno<br />

|<br />

Klassensatz:dfkl<br />

Geschlecht:b<br />

Note


52<br />

Auch hier sieht man die dominierende Rolle von Klassensatz. Wir dokumentieren noch den Baum mit<br />

15 Endknoten<br />

Klassensatz:b<br />

Note


Die voreingestellten Parameter wurden wie folgt gewählt:<br />

Min. No. Of Obs. Before Split: 3<br />

Min. Node Size: 6<br />

Min. Node Deviance: 0.00.<br />

Es soll in keiner Weise behauptet werden, dass die obigen Bäume optimal oder die einzig möglichen<br />

sind. Ihre Rechtfertigung ergibt sich vielmehr daraus, dass sie ex post leicht verifizierbar sind <strong>und</strong><br />

durch verschiedene Parametersätze <strong>und</strong> Optimierungen sehr beharrlich in ähnlicher Weise herauskommen.<br />

Welche „innere Struktur“ deutet sich durch diesen Ansatz an? Man kann wohl – bei allen Vorbehalten<br />

– folgende Beobachtungen <strong>und</strong> darauf fußende Kommentare festhalten:<br />

1. Auf der obersten Hierarchieebene wird bei binären Bäumen nach Klassensatz unterteilt. Dies ist in<br />

gewisser Weise nicht überraschend, da Klassensatz auch die meisten möglichen Ausprägungen besitzt<br />

<strong>und</strong> somit bei gleich starkem Einfluss eine bessere Regressionsvorhersage ermöglichen würde<br />

als Variablen mit geringerem Ausprägungsvorrat. Andererseits sollten sich aber wirklich deutliche<br />

Effekte (z. B. etwa durch Geschlecht oder Alter) – soweit vorhanden – auch entsprechend deutlich<br />

manifestieren – <strong>und</strong> würden dies auch tun, wenn man ein eindeutig geschlechtsbezogenes oder altersbezogenes<br />

Merkmal untersucht hätte.<br />

(Kommentar: Dies suggeriert – oder steht zum mindesten nicht im Widerspruch zu – einem sehr starken<br />

Einfluss der „Klassensituation“, den man wohl unschwer auf Lehrer <strong>und</strong> Klassengemeinschaft<br />

zurückführen kann. Das würde auch implizieren, dass an diesem Punkt <strong>für</strong> eine möglichst ertragreichen<br />

Einsatz von GEONExT angesetzt werden sollte (Lehrerschulung, „Klimaverbesserung“). Der<br />

Einfluss des Lehrpersonals ist auch hier nicht zu unterschätzen.)<br />

2. Bei den Klassensätzen, bei denen GEONExT „gut“ ankommt, spielt Klassensatz auch auf der<br />

nächsten Stufe eine entscheidende Rolle. Bei den Klassensätzen, bei denen GEONExT nicht so „gut“<br />

ankommt, schieben sich dann in zweiter Linie andere Distinktionen (Note, Geschlecht) nach vorne –<br />

hier greift dann übrigens das Argument vom größeren Wertevorrat eben nicht mehr<br />

(Kommentar: Auch das ist an sich leicht interpretierbar: Ist die „Klassensituation“ nicht mehr „überragend“,<br />

muss der Enthusiasmus vom einzelnen Schüler herkommen. Das gelingt „besseren“ (Note)<br />

<strong>und</strong> „trainierteren“ (Anzahl) Schülern besser. Zudem sind Jungen eher aufgeschlossen <strong>für</strong> GEONExT<br />

als Mädchen. Gerade hier sind aber Vermengungen von Effekten leicht möglich.)<br />

Die obigen Kommentare sind ausdrücklich als letztlich etwas subjektive Lesart der beobachteten –<br />

<strong>und</strong> insofern kaum bestreitbaren – Sachverhalte gedacht. Sie werden unseres Erachtens aber nicht<br />

dadurch wertlos, dass es sich um im Gr<strong>und</strong>e wohlbekannte didaktisch Erkenntnisse handelt (Bedeutung<br />

des Lehrers bzw. der Lerngruppe <strong>für</strong> das „Lernen“). Eine wichtige Konsequenz: Computereinsatz<br />

sollte nicht automatisch mit einer Individualisierung des Lernens identifiziert werden.<br />

5.2. Längsschnittbetrachtung<br />

Die Befragung war nicht explizit als Längsschnittstudie angelegt. Die zweimalige Teilnahme einer<br />

Realschulklasse bietet allerdings die Chance eine zumindest rudimentäre längsschnittliche Betrachtung<br />

anzustellen. Allerdings ist dies wegen fehlender <strong>und</strong> nicht wieder herstellbarer Zuordnungen nur<br />

in sehr begrenztem Umfang möglich.<br />

Die erste Erhebung fand im Herbst 2004 nach der Bearbeitung des dritten dynamischen Arbeitsblattes<br />

– in diesem Fall zum Thema Thales – <strong>und</strong> die zweite nach der Bearbeitung des zehnten Arbeitsblattes<br />

– zum Thema Brüche – im Frühjahr 2005 statt. Von Interesse ist primär, inwiefern sich die Beurteilung<br />

der dynamischen Arbeitsblätter im Laufe der Zeit verändert hat. Des Weiteren soll analysiert werden,<br />

ob sich die längere Benutzung von GEONExT auf die Haltung zum Medium Computer <strong>und</strong> auf allgemeine<br />

Einstellungen zum Themengebiet auswirkt– insbesondere ob es Gewöhnungs- bzw. sogar<br />

Abnutzungseffekte gibt.<br />

Die Werte aus der Herbstbefragung liegen bereits recht nahe an der Bestnote 1,0, so dass eine deutliche<br />

Verbesserung gar nicht mehr möglich ist. Trotzdem zeigt sich <strong>für</strong> den Gesamtmittelwert im<br />

Herbst <strong>und</strong> Frühjahr noch eine leichte positive Veränderung. Dies gilt ebenso <strong>für</strong> die Mittelwerte der<br />

einzelnen Skalen. Die folgende Tabelle zeigt die Ergebnisse im Zusammenhang (angegeben sind<br />

jeweils die Mittelwerte <strong>und</strong> – in Klammern – die Standardabweichungen):<br />

53


54<br />

Skala<br />

1 Vorerfahrungen mit Computern<br />

2 Vorerfahrungen mit Lernsoftware<br />

3 Beurteilung von Computernutzung<br />

4 Aufbau der dynamischen<br />

Arbeitsblätter<br />

Tabelle 22 Mittelwerte der Längsschnittbetrachtung<br />

Es zeigt sich also eine Verschlechterung in zwei Skalen (2 <strong>und</strong> 6) <strong>und</strong> eine Verbesserung in sieben<br />

Skalen (1, 3, 4, 5, 7, 8, 9). Geht man von der Nullhypothese aus, dass Verschlechterungen <strong>und</strong> Verbesserungen<br />

gleich wahrscheinlich sind, ergäbe ein einseitiger Zeichentest einen p-Wert von 0.09.<br />

Über die Verbesserung im Gesamtmittel selbst hinaus ist es gerade die Multiplizität in den Skalen, die<br />

<strong>für</strong> einen genuinen Verbesserungseffekt spricht.<br />

Hintergr<strong>und</strong>: Zeichentest<br />

Der Zeichentest testet im einfachsten Fall, ob sich ein Zufallsprozess wie das Werfen einer fairen<br />

Münze verhält. Bei den neun Versuchen (Skalen) kann jeweils eine Verbesserung (+) oder eine Verschlechterung<br />

(-) eintreten. Wir haben sieben Verbesserungen erzielt. Rein aus Zufall würde man mit<br />

einer fairen Münze aber nur mit einer Wahrscheinlichkeit von<br />

9<br />

∑<br />

i=<br />

7<br />

ein so extremes Resultat wie 7, 8 oder 9 Köpfe erzielen.<br />

Graphisch stellt sich das so dar:<br />

Klassensatz 20<br />

(24 Schüler, Herbst)<br />

Klassensatz 3<br />

(23 Schüler, Frühjahr)<br />

9<br />

⎛ 9!<br />

⎞ ⎛ 1 ⎞<br />

⎜ ⎟⋅<br />

⎜ ⎟ = 0.0898 ≈ 0.09<br />

⎝ i!<br />

( 9 − i)!<br />

⎠ ⎝ 2 ⎠<br />

Veränderung<br />

1.24 (0.17) 1.22 (0.32) +<br />

2.24 (0.51) 2.24 (0.38)<br />

–<br />

(in vierter Nachkommastelle)<br />

1.20 (0.36) 1.15 (0.33) +<br />

1.71 (0.32) 1.68 (0.39) +<br />

5 Beurteilung des Themas 1.77 (0.37) 1.55 (0.39) +<br />

6 Zeitrahmen 1.70 (0.36) 1.77 (0.42) –<br />

7 Beurteilung selbständigen<br />

Arbeitens<br />

8 Weiterer Einsatz von Lernsoftware<br />

9 Generelle Einstellung zum<br />

Themengebiet<br />

2.01 (0.39) 1.85 (0.47) +<br />

1.59 (0.67) 1.46 (0.49) +<br />

1.80 (0.45) 1.71 (0.43) +<br />

Gesamtmittel 1.72 (0.21) 1.64 (0.24) +


2.4<br />

1.9<br />

1.4<br />

0.9<br />

0.4<br />

-0.1<br />

0 1 2 3 4 5 6 7 8 9<br />

Abbildung 31 Veränderung der Antworten nach Skalen beim Längsschnittvergleich<br />

Es lohnt sich, noch die extremen Veränderungen zu betrachten. Skala 2 bleibt nahezu gleich, aber<br />

Skala 6 verschlechtert sich deutlich. Betrachtet man die einzelnen Items zur Skala 6, so zeigt sich in<br />

den Mittelwerten sogar eine gleichmäßige Verschlechterung. Hier spiegelt sich offensichtlich eine<br />

schärfere Zeitknappheit wieder.<br />

Items von Skala 6 Klassensatz 20 Klassensatz 3<br />

(9) Ich bin unter Zeitdruck geraten.* 1.48 1.54<br />

(16) Ich denke, dass ich zügig gearbeitet habe. 1.91 2.00<br />

Skala 6 insgesamt 1.70 1.77<br />

Tabelle 23 Items von Skala 6<br />

Klassensatz3<br />

Klassensatz20<br />

Differenz<br />

Null<br />

Skalen<br />

Die stärksten positiven Veränderungen zeigen die Skalen 5 <strong>und</strong> 7. Sie sind insbesondere auch in Anbetracht<br />

der Standardfehler der Mittel auffällig, auch wenn die Voraussetzungen <strong>für</strong> einen formalen<br />

Signifikanztest problematisch sind. Auf der Ebene der Items ist die Veränderung in den Mittelwerten<br />

bei Skala 5 wiederum sehr gleichmäßig. Das Thema „Brüche“ scheint besser beurteilt zu werden. Der<br />

starke Unterschied deutet auch an, dass die Themenstellung beachtlichen Einfluss haben könnte. Es<br />

wäre interessant, einen Längsschnitt in umgekehrter Reihenfolge zu sehen.<br />

55


56<br />

Items von Skala 5 Klassensatz 20 Klassensatz 3<br />

(15) Ich habe den Eindruck, dass ich das Thema verstanden habe.<br />

(18) Ich meine, dass mir die dynamischen Arbeitsblätter geholfen<br />

haben, das Unterrichtsthema zu verstehen.<br />

1.87 1.67<br />

1.87 1.58<br />

(20) Ich fand das Thema verständlich aufbereitet 1.78 1.67<br />

(23) Ich meine, dass es überflüssig war, mit diesen dynamischen<br />

Arbeitsblättern zu arbeiten.*<br />

1.43 1.21<br />

(25) Ich denke, dass ich mir das Ergebnis gut merken kann. 1.91 1.63<br />

Skala 5 insgesamt 1.77 1.55<br />

Tabelle 24 Items von Skala 5<br />

Bei Skala 7 fällt die fast gleich bleibende Beurteilung hinsichtlich Item 28 auf.<br />

Items von Skala 7 Klassensatz 20 Klassensatz 3<br />

(5) Ich habe keine zusätzliche Hilfe vom Lehrer gebraucht. 2.43 2.38<br />

(10) Ich hatte keine Schwierigkeiten, selbständig zu arbeiten. 2.09 1.75<br />

(14) Ich habe auch mit anderen zusammengearbeitet. 1.73 1.50<br />

(28) Ich finde es nicht gut, im Unterricht selbständig zu arbeiten.* 1.78 1.79<br />

Skala 7 insgesamt 2.01 1.85<br />

Tabelle 25 Items von Skala 7<br />

Es ist denkbar, dass dieses widersprüchliche Resultat an der negativen Formulierung liegt, so dass<br />

Verständnisschwierigkeiten hier eine Rolle spielen.<br />

Anders als <strong>für</strong> die Skalen soll <strong>für</strong> die einzelnen Items aus Platzgründen nur die<br />

Graphik angegeben werden:


3<br />

2<br />

1<br />

0<br />

0 10 20 30 40<br />

Items<br />

Klassensatz3<br />

Klassensatz20<br />

Differenz<br />

Null<br />

Abbildung 32 Veränderung der Antworten nach Items beim Längsschnittvergleich<br />

Man erkennt, dass sich die stärksten Verbesserungen <strong>für</strong> die Items 27 (mit 0.43) <strong>und</strong> 36 (mit 0.40)<br />

sowie 10 (mit 0.34) <strong>und</strong> 4 (mit 0.34) ergeben. Die stärksten Verschlechterungen ergeben<br />

sich bei den Items 3 (mit -0.26) <strong>und</strong> 21 (mit -0.24).<br />

Gr<strong>und</strong>sätzlich liegen sogar gepaarte Daten vor, da ja die Klasse zweimal befragt wurde. Allerdings<br />

ergeben sich dabei zwei Schwierigkeiten:<br />

1. Die Klasse umfasste ursprünglich 28 Schüler. Es ist nicht klar (<strong>und</strong> nicht rekonstruierbar), welche<br />

23 bzw. 24 davon im Herbst bzw. Frühjahr befragt wurden<br />

2. Selbst <strong>für</strong> Schüler, die an beiden Befragungen teilnahmen, lässt sich eine Zuordnung der beiden<br />

Antwortbogen nicht mehr erreichen.<br />

Als Ausweg könnte man so vorgehen:<br />

1. Man geht davon aus, dass zu beiden Zeitpunkten die gleichen Schüler teilnahmen – nur dass<br />

einer davon im Frühjahr fehlte. Um jedenfalls nicht zugunsten von GEONExT zu rechnen, wird daher<br />

derjenige der 24 Schüler aus Klassensatz 20 mit den positivstem Gesamtmittel weggelassen (Schüler<br />

21 mit dem Gesamtmittel 1.35).<br />

2. Die übrigen Daten werden entsprechend <strong>ihre</strong>r Rangfolge nach dem Gesamtmittel als gepaarte<br />

Daten zusammengefasst. Dies beruht auf dem Gedanken, dass die Schüler in <strong>ihre</strong>r Rangfolge unverändert<br />

bleiben, auch wenn sich im Niveau Veränderungen ergeben können.<br />

Beide Annahmen sind durchaus problematisch <strong>und</strong> alles andere als gesichert. In Reuschlein (2006)<br />

wurde versucht, anhand supplementärer personenbezogener Informationen (Alter, Note, Geschlecht)<br />

diese Zuordnung zu bestätigen oder zu widerlegen. Es ergab sich jedoch kein eindeutiges Ergebnis.<br />

Legt man trotzdem diese Zuordnung zugr<strong>und</strong>e, ergeben sich aufgr<strong>und</strong> des dann stärker homogenen<br />

Datenmaterials natürlich wesentlich schärfere Aussagen. Ein t-Test auf der Basis der gepaarten Differenzen<br />

der Gesamtmittel (Klassensatz 20 – Klassensatz 3) wäre etwa hochgradig signifikant (t =<br />

6.01, df = 22, P-Wert = 0.0); als 95%-Konfidenzintervall <strong>für</strong> die mittlere Differenz der Gesamtmittel<br />

erhält man [0.048, 0.098] (Verzichtet man auf die Paarung <strong>und</strong> nimmt man den da<strong>für</strong> gestrichenen<br />

Wert 1.35 <strong>für</strong> Schüler 21 wieder mit hinzu, so liefert Welchs modifizierter Zwei-Stichproben-t-Test einen<br />

zweiseitigen P-Wert von 0.1984.).<br />

Inhaltlich ergäben sich weder auf der Basis der Skalen noch der Items andere Aspekte als oben beschrieben.<br />

Gleichwohl ist festzuhalten, dass sich die tatsächlichen Verhältnisse zwischen den weiter<br />

oben extrem vorsichtig deskriptiv <strong>und</strong> unter Vernachlässigung jeder Paarung dokumentierten Verän-<br />

57


Mittelwert<br />

4,0<br />

3,5<br />

3,0<br />

2,5<br />

2,0<br />

1,5<br />

1,0<br />

58<br />

derungen <strong>und</strong> den hier unter zwar plausiblen, aber nicht gesicherten Annahmen kurz angesprochenen<br />

inferentiellen Resultaten (Signifikanztests, Konfidenzintervalle) bewegen dürften.<br />

Als Resultat ergibt sich also:<br />

In der hier aufgr<strong>und</strong> der Datenlage nur sehr rudimentär möglichen Längsschnittbetrachtung ergibt sich<br />

eine absolut gesehen leichte, aber nicht als Zufallsschwankung erklärbare Verbesserung der Beurteilungen.<br />

Insbesondere kann man keine „Abnutzungseffekte“ erkennen. Dies ist umso bemerkenswerter,<br />

als bereits das Ausgangsniveau sehr positiv ausfiel.<br />

5.3. Vergleich von Schulalltag <strong>und</strong> Universitätsbedingungen<br />

Bereits in Abschnitt 2.1. wurde darauf hingewiesen, dass nur ein Teil der Bogen unter realen Unterrichtsbedingungen<br />

erhoben wurde. Der andere Teil wurde im Rahmen von Schulungen durch <strong>Lehrstuhl</strong>mitarbeiter<br />

an der Universität Bayreuth ausgefüllt. Dies wirft die Frage auf, inwieweit beide Rahmenbedingungen<br />

vergleichbar <strong>und</strong> die Daten überhaupt kombinierbar sind. Das Problem kann ähnlich<br />

wie die Untersuchungen hinsichtlich der „klassischen“ Kovariablen erfolgen, indem man als weitere<br />

Kovariable die Variable Ort mit den Ausprägungen „U“ (<strong>für</strong> Universität) <strong>und</strong> „S“ (<strong>für</strong> Schule) bildet.<br />

Analog zu den Skalenplots in Abschnitt 3.4. erhält man dann <strong>für</strong> die Unterschiede nach Ort folgendes<br />

Resultat:<br />

Abbildung 33 Unterschiede nach Ort<br />

Unterschiede nach Ort<br />

1 2 3 4 5<br />

Skala<br />

6 7 8 9<br />

Schule<br />

Universität


Hier zeigt sich in keiner Skala ein nennenswerter Unterschied. Auch in Hinblick auf analoge Vergleiche<br />

auf der Basis des Gesamtmittels bzw. des bereinigten Gesamtmittels zeigen sich keine Unterschiede.<br />

Die numerischen Werte lauten:<br />

Schule Universität<br />

Anzahl der Schüler 210 155<br />

Mittelwert 1.96 1.97<br />

Bereinigter Mittelwert 1.97 1.97<br />

Tabelle 26 Mittelwerte <strong>und</strong> bereinigte Mittelwerte nach Ort<br />

Für den Boxplot erhält man:<br />

Bereinigtes Gesamtmittel<br />

3.0<br />

2.5<br />

2.0<br />

1.5<br />

1.0<br />

Abbildung 34 Ortplot<br />

U S<br />

Auch in der Verteilung selbst zeigt sich also kein nennenswerter Unterschied. Insbesondere kann<br />

keine Rede davon sein, dass die Universitätsbedingungen zu einer positiven Verzerrung oder zu Unvergleichbarkeit<br />

führen. Die hier aus dem Gesamtdatensatz gezogenen Schlussfolgerungen erscheinen<br />

<strong>für</strong> die reale Schulpraxis valide.<br />

5.4 Fazit<br />

Hauptziel dieses Kapitels war eine Gesamtbetrachtung des Datensatzes, also nicht eine speziell auf<br />

die Items oder die Schüler konzentrierte Sichtweise. Ein wichtiges Strukturmerkmal ist in diesem Zusammenhang,<br />

dass ein Teil der Daten an der Universität, das heißt quasi unter Laborbedingungen,<br />

erhoben wurde. Es zeigt sich jedoch, dass die dort erzielten Resultate nicht von denen im Schulalltag<br />

abweichen. Die Daten können daher auch zusammengelegt <strong>und</strong> analysiert werden.<br />

Fragt man dann nach den Haupteinflussgrößen auf die Hauptvariable (Gesamtmittel), so ist die Anwendung<br />

klassischer multivariater Verfahren wegen der Substrukturen in den Daten sehr problematisch.<br />

Als Alternative wurde hier ein Ansatz über Regressionsbäume gewählt (CART). Dieser Ansatz<br />

ist hier bewusst deskriptiv zu verstehen. Er bietet aber die Möglichkeit, die innere Struktur der Daten –<br />

oder wenigstens eine Beschreibung davon – transparent darzustellen. Zu den Vorteilen dieses Ansatzes<br />

zählt sicher, dass das Endresultat im allgemeinen ex post leicht verständlich <strong>und</strong> leicht kommuni-<br />

Ort<br />

59


60<br />

zierbar ist. Als Nachteil ist in vielen Fällen die Instabilität zu nennen. Im vorliegenden Fall scheinen die<br />

Resultate aber recht stabil <strong>und</strong> decken sich inhaltlich mit den schon in Kapitel 3 <strong>und</strong> 4 erzielten Ergebnissen.<br />

Ein etwas periphäres Strukturmerkmal des Datensatzes ist schließlich die zweimalige Teilnahme<br />

der Realschulklasse. Hier bietet sich – allerdings aus verschiedenen Gründen nur sehr begrenzt<br />

– die Möglichkeit zu Längsschnittbetrachtungen. Als Hauptergebnis zeigt sich, dass ein „Abnutzungseffekt“<br />

nicht feststellbar war.


6. Schlussfolgerungen<br />

In diesem Kapitel sollen die Resultate der vorangegangenen Überlegungen zusammengefasst <strong>und</strong><br />

darauf fußend einige Empfehlungen gegeben werden. Wir beginnen mit einigen gr<strong>und</strong>sätzlichen Anmerkungen<br />

zur Methodologie.<br />

6.1. Bemerkungen zur statistischen Methodologie<br />

Statistische Untersuchungen bewegen sich in der Regel zwischen zwei Polen: Einerseits explorativen<br />

Untersuchungen, bei denen in erster Linie Neues herausgef<strong>und</strong>en werden soll, andererseits konfirmatorische<br />

Analysen, bei denen in streng kodifizierter Weise bereits vorformulierte Hypothesen einem<br />

genauem Test unterzogen werden. Schon von den Ausgangsfragen her ist in diesem Fall eher das<br />

erste Vorgehen geboten. Denn mit vielen Fragestellungen wird Neuland betreten, <strong>und</strong> es liegen nur<br />

wenige gesicherte Vorkenntnisse oder selbst Vermutungen vor. Es kommt hinzu, dass auch von methodischer<br />

Seite Bedenken gegen allzu spezifische Modelle angebracht sind: Die dazu nötigen Annahmen<br />

sind problematisch <strong>und</strong> keineswegs plausiblerweise eo ipso gegeben. Viele unserer Untersuchungen<br />

deuten sogar eher das Gegenteil an <strong>und</strong> von einem standardisiertem Vorgehen wie etwa bei<br />

klinischen Studien ist man bei Unterrichtsversuchen des vorliegenden Typs gegenwärtig weit entfernt,<br />

womit übrigens nicht gesagt werden soll, dass solches unbedingt wünschenswert wäre.<br />

Es ist also ein eher deskriptives, datennahes Vorgehen angezeigt. Als Hauptziel der statistischen Behandlung<br />

kann eine möglichst transparente Aufbereitung <strong>und</strong> Auswertung der vorliegenden Daten<br />

gelten. Dementsprechend wurde bei der Auswahl stets solchen Verfahren der Vorzug eingeräumt, die<br />

leicht nachvollziehbar <strong>und</strong> durchschaubar sind. Dies ist einer der Gründe, warum wir so oft zu Graphiken<br />

<strong>und</strong> einfachen summarischen Zusammenfassungen greifen. Den Autoren ist durchaus bewusst,<br />

dass vielfach ein größerer technisch-statistischer Aufwand getrieben werden könnte. Wir glauben<br />

aber, in der vorliegenden Analyse darauf verzichten zu können <strong>und</strong> auch zu sollen, sofern lediglich<br />

„mehr“ <strong>und</strong> nicht „bessere“ Aussagen gemacht werden.<br />

In einer anderen Hinsicht sind wir aber statistisch anspruchsvoller. Wir sehen Evaluation eher als einen<br />

Prozess zur Qualitätssicherung <strong>und</strong> weniger als eine abschließende statische Qualitätsbeurteilung<br />

zu einem festen Zeitpunkt an. Dies beinhaltet auch eine recht große Flexibilität <strong>und</strong> Dynamik in<br />

der Datenanalyse, die mit der herkömmlichen Papierform kaum erreichbar ist. Idealerweise sollte die<br />

Analyse der Daten am besten im interaktiven Dialog am Computer erfolgen. In der Tat haben moderne<br />

Ansätze zur explorativen Datenanalyse <strong>und</strong> moderne Statistikpakete wie R <strong>und</strong> S-PLUS genau<br />

diese Zielrichtung. Man kann dann schnell <strong>und</strong> in der Regel durch Visualisierung verschiedenste Fragestellungen<br />

klären. Dieser „Lernprozess“ ist nicht zufälligerweise, sondern wie jeder Lernprozess<br />

notwendigerweise „dynamisch“ – <strong>und</strong> wie GEONExT die Geometrie „dynamisch“ macht, gibt es auch<br />

eine dynamische Graphik <strong>und</strong> eben exploratives Lernen aus den Daten auf der statistischen Ebene.<br />

Durch einen solchen Ansatz ergeben sich auch stetig Hinweise auf mögliche interessante neue Gesichtspunkte,<br />

die dann weiter verfolgt werden sollten. Ein wenig kann der Leser einen ähnlichen Effekt<br />

durch weiteres „Stöbern“ in einigen ergänzenden Dokumenten in Teil II dieser Evaluierung erzielen.<br />

In dieser Hinsicht verfolgen diese Notizen auch das Ziel, <strong>für</strong> eine stärkere statistische Begleitung von<br />

Evaluationsprozessen zu werben. Diese sollte aber umgekehrt nicht aufgesetzt ex post erfolgen, sondern<br />

sich den jeweils vorhandenen Sachverstand bzw. die Fachkenntnisse zu Nutze machen. In gewisser<br />

Weise ist dies vielleicht sogar der entscheidende Gr<strong>und</strong> <strong>für</strong> transparente Verfahren. Zwei Beispiele<br />

mögen diese Sichtweise erläutern: Es ist sicher jedem Lehrer geläufig, dass es Cliquenbildungen<br />

<strong>und</strong> dynamische (natürlich!) Gruppenprozesse innerhalb von Klassen gibt, die sich eben auch auf<br />

Beurteilungen <strong>und</strong> `Ankommen’ einer Unterrichtserie auswirken. In eine detachiert erfolgte statistische<br />

Modellierung fließt das selten ein: Man geht zumeist einfach von i.i.d. Beobachtungen aus. Oder ein<br />

noch naiveres Beispiel: Es erscheint vernünftig, die größere Nähe junger Studenten zur Altergruppe<br />

der Befragten zu nutzen, wenn es darum geht, Jugendjargon in freien Kommentaren richtig zu interpretieren.<br />

Nicht jedem ist ja klar, ob es gut oder schlecht ist, wenn etwas „rockt“. Wir haben durchaus<br />

das Ziel, mit diesen Notizen auch Handreichungen zu bieten, wie solche zwar elementaren, aber andererseits<br />

maßgeschneiderten <strong>und</strong> eben deshalb ertragreichen Auswertungen angegangen werden<br />

können. Es ist andererseits auch klar, dass hier<strong>für</strong> immer die kritische Distanz <strong>und</strong> Objektivität der<br />

Statistik gefordert ist, da sich ansonsten die Gefahr von Wunschdenken <strong>und</strong> Bestätigung von Vorurteilen<br />

vervielfacht. Eine mehr qualitative Analyse <strong>und</strong> Interpretation wird ebenfalls in Teil II vorgenommen.<br />

61


62<br />

6.2. Anregungen, Vorschläge <strong>und</strong> Empfehlungen methodischer Art <strong>für</strong> weitere<br />

Untersuchungen<br />

Auch die Auswertung von Evaluationsdaten ist ein Lernprozess. Deswegen sollen in diesem Abschnitt<br />

einige Anregungen gegeben werden, wie – aus der Rückperspektive – eine derartige Evaluation noch<br />

effizienter gestaltet werden kann. Vieles davon war im Vorfeld keineswegs absehbar, sondern beruht<br />

eben erst auf den gemachten Erfahrungen.<br />

Zunächst ist als technischer Punkt die direkte Eingabe am Computer verb<strong>und</strong>en mit der obligatorischen<br />

Beantwortung aller Fragen vor dem Abschicken einer Druckversion eindeutig vorzuziehen. Dies<br />

vermindert einerseits die Anzahl fehlender Werte <strong>und</strong> verhindert andererseits Übertragungsfehler bei<br />

der Eingabe schriftlich ausgefüllter Bögen.<br />

Zweitens ist es zu empfehlen, durchgängig der Kontrolle der Datenqualität mehr Aufmerksamkeit zu<br />

widmen als üblich. Im Kontext unserer – durchaus nicht etwa ungewöhnlich oberflächlich betriebenen<br />

– Untersuchung aufgetretene Schwierigkeiten (z. B. bei der Eingabe der Printbogen, bei der Behandlung<br />

fehlender Werte, bei der Koordination von Berechnungen <strong>und</strong> bei der Programmierung ) sind<br />

notorisch <strong>und</strong> sicher eher die Regel als die Ausnahme. Insbesondere bei ersten Auswertungsversuchen<br />

werden diese Probleme fast immer unterschätzt – vielleicht auch, weil sie so selten thematisiert<br />

<strong>und</strong> zumeist aus falsch verstandenem Perfektionsstreben verschwiegen werden. Hier ist jedoch Realismus<br />

<strong>und</strong> nicht „Optimismus“ gefragt.<br />

Eine unbedingt nötige Ergänzung sollte ein Vorabfragebogen sein, der vor Beginn der Arbeit mit dynamischen<br />

Arbeitsblättern ausgefüllt wird. Dadurch wird ein Standard festgestellt, gegen den dann die<br />

Veränderungen durch die Unterrichtsserie reliefartig hervortreten. Zugleich liefert dies auch nützliche<br />

Hinweise über die Erwartungen der Teilnehmer <strong>und</strong> wie weit diese im Rückblick erfüllt wurden. Darüber<br />

hinaus eröffnet sich dadurch bei falscher Kalibrierung noch die Möglichkeit des Eingriffs. Liefert<br />

etwa eine Frage nur Extremkategorieantworten (inklusive „KA“), ist sie falsch formuliert <strong>und</strong> kann im<br />

Hauptfragebogen entweder modifiziert oder ergänzt werden.<br />

Eine gute Idee in diesem Zusammenhang ist es natürlich, die Vorab- <strong>und</strong> Nachbefragungsbögen mit<br />

einer ID-Nummer zu versehen, so dass die Bögen leicht pro Teilnehmer einander zugeordnet werden<br />

können. Praktisch erreicht man auf diese Weise eine Art `Mikrolängsschnittstudie` <strong>für</strong> einen besseren<br />

Vorher-Nachher-Vergleich. Auf jeden Fall sollte eine solche Zuordnung bei echten Längsschnittuntersuchungen<br />

Pflicht sein. Echte Längsschnittstudien würden zudem eine wichtige Bereicherung des<br />

Untersuchungsspektrums darstellen <strong>und</strong> könnten neue Aspekte eröffnen.<br />

In Querschnittrichtung ergeben sich neue Aspekte durch die Kombination von Lehrer- <strong>und</strong> Schülerfragebögen.<br />

Im vorliegenden Fall wurden solche Fragebögen mit ins Auge gefasst, führten aber nur zu<br />

wenigen Rückläufen. Hier wäre anzuregen, im Vorfeld die Kooperationsbereitschaft der Lehrer zu<br />

stärken.<br />

Konkret <strong>für</strong> das benutzte Erhebungsinstrument sollte die Skalenbildung in folgender Hinsicht optimiert<br />

werden:<br />

1. Die Anzahl der Items pro Skala sollte äquilibriert werden. (Dies verbessert die Vergleichsmöglichkeiten<br />

der Skalen aus statistischer Sicht.)<br />

2. Die Items einer Skala sollten im vorliegenden Fall gebündelt <strong>und</strong> mit einer passenden Überschrift<br />

versehen werden. (Dies widerspricht zwar der oft empfohlenen randomisierten Reihenfolge, vermindert<br />

aber gerade bei Jugendlichen durch zusätzliche Kontextinformation Missverständnisse <strong>und</strong> unscharfe<br />

Abgrenzungen. Bei Schülerbefragungen überwiegt diese zusätzliche Klarheit nach unseren<br />

Erfahrungen potentielle Nachteile.)<br />

3. Konkret sollten die Skalen wie in Kapitel 3 diskutiert neu gefasst werden.<br />

Eine weitere – eigentlich notwendige – Dimension der Evaluation sollte zudem die Messung des objektiven<br />

Leistungsfortschritts sein. Zwar kann dies derzeit in den meisten Untersuchungen nicht thematisiert<br />

werden, doch darf nicht vergessen werden, dass Beurteilungen aus Schüler- bzw. Lehrersicht<br />

<strong>und</strong> objektiver Leistungsfortschritt nicht unbedingt identisch sein müssen.


6.3. Antworten auf die Ausgangsfragen<br />

Die statistischen Folgerungen haben wir bereits jeweils am Ende eines Kapitels in einem Fazit zusammengestellt.<br />

Sie sollen nunmehr in Bezug zu den am Ende von Kapitel 1 genannten Ausgangsfragen<br />

gesetzt werden:<br />

1. Sind die dynamischen Arbeitsblätter nutzergerecht konzipiert?<br />

Das wird man auf der Basis der vorliegenden Daten klar bejahen können. Schon ein Blick auf Abbildung<br />

1 aus Abschnitt 2.2. <strong>und</strong> auf die Skalenmittel in Anschnitt 3.4 lehrt, dass in dem möglichen Bereich<br />

von 1.0 bis 4.0 Werte über 3.0 weder <strong>für</strong> Skalenmittel noch <strong>für</strong> das Gesamtmittel überhaupt auftreten.<br />

Für das Gesamtmittel seien abschließend noch die folgenden summarischen Kennzahlen <strong>und</strong><br />

ein Boxplot angeführt:<br />

Minimum 1.21<br />

Unteres Quartil 1.68<br />

Mittelwert 1.97<br />

Median 1.89<br />

Oberes Quartil 2.19<br />

Maximum 3.00<br />

Standardabweichung 0.40<br />

Anzahl 365<br />

KA 0<br />

Abbildung 35 Summarische Kennzahlen <strong>und</strong> Boxplot des Gesamtmittels<br />

Gesamtmittel<br />

4.0<br />

3.0<br />

2.0<br />

1.0<br />

In Kapitel 1 wurde betont, dass es aufgr<strong>und</strong> der Auswahl eine positive Verzerrung vorliegen könnte.<br />

Es scheint aber wenig plausibel, dass die erkennbar positive Bewertung ausschließlich auf diese –<br />

noch nicht einmal erwiesene – Ursache zurückzuführen ist. Denn die positive Selbstselektion dürfte<br />

ohnehin vorwiegend auf Ebene der teilnehmenden Klassen, nicht aber der einzelnen 365 Schüler<br />

greifen.<br />

2. Gibt es besonders günstige Kontextbedingungen bzw. wichtige Einflussvariablen beim Einsatz<br />

dynamischer Arbeitsblätter im Unterricht zu beachten?<br />

Hierzu wurden in Kapiteln 3-5 detaillierte Analysen angestellt. Es zeigt sich dabei überall <strong>und</strong> einheitlich,<br />

dass die Variable Klassensatz am einflussreichsten zu sein scheint. Selbst bei Parallelklassen<br />

zeigt sich der Effekt nach wie vor deutlich, wenn auch abgemildert, das heißt. um einen Schuleffekt<br />

nivelliert. Dies deutet darauf hin, dass der „Lernsituation“ des Schülers entscheidende Bedeutung <strong>für</strong><br />

die Beurteilung zukommt. Alle anderen Kovariablen treten dahinter weit zurück (vgl. die bereinigten<br />

Werte in Kapitel 4). Der Leser mag in diesem Zusammenhang nochmals die sehr aufschlussreiche<br />

Abbildung 16 (Unterschiede nach Klassensatz) betrachten. In diesem Sinne ist auch GEONExT trotz<br />

der positiven Bewertung eben kein „Selbstläufer“ <strong>und</strong> sollte auch nicht (nur) als „Selbstlernumgebung“<br />

(miss-) verstanden werden. Damit ist insbesondere klar, dass der günstigen Gestaltung des didaktisch-methodischen<br />

Umfeldes große Bedeutung zukommt, um das Potential von GEONExT voll auszuschöpfen.<br />

Hieran knüpfen sich einige Empfehlungen inhaltlicher Art <strong>für</strong> den Unterricht, die aber<br />

nicht an dieser Stelle, sondern günstigerweise im Rahmen einer eher qualitativen Analyse mit zusätzlichen<br />

Anmerkungen aus den konkreten Unterrichtsbeobachtungen in Teil II diskutiert werden.<br />

Zwei Punkte seien aber noch kurz angesprochen: Zum einen scheint das Umfeld der Erhebung (an<br />

der Universität oder in der Schulpraxis) keine Auswirkungen zu haben. Es scheint daher gerechtfertigt,<br />

die an der Universität erhobenen Bögen voll in die Betrachtung einzubeziehen. Zum anderen erbrachte<br />

die Untersuchung der Leistung im <strong>Mathematik</strong>unterricht als Einflussvariable auf die subjektiven<br />

Einstellungen der Befragten, ein vielleicht überraschendes Ergebnis. Sucht man nach Unterschieden<br />

in den Antworten der guten <strong>und</strong> schwachen Schülerinnen <strong>und</strong> Schüler, so sind liegen diese nahe beieinander.<br />

Die nahe liegende <strong>und</strong> oft vertretene Vermutung, dass Leistungsschwächere stärker von der<br />

dynamischen Veranschaulichung profitieren, lässt sich aus den Daten nicht stützen.<br />

63


64<br />

3. Lassen sich besondere Wirkungen auf die subjektiven Einstellungen der Lernenden feststellen?<br />

Um Einflüsse der Unterrichtsreihen selbst festzustellen, wären gr<strong>und</strong>sätzlich Längsschnittstudien oder<br />

wenigstens Voraberhebungen (vgl. oben in Abschnitt 6.2.) nötig. Aber auch die Variabilität bzw. Stabilität<br />

in Querschnittvergleichen gibt deutliche Hinweise darauf, welche Größen beeinflussbar bzw. festgefügt<br />

sind. Die Untersuchungen in Abschnitt 3.4. zeigen beispielsweise, dass sich in den Skalen 1, 2,<br />

3 <strong>und</strong> 7, die allgemeine Haltungen <strong>und</strong> Bedingungen betreffen, kaum Unterschiede zeigen. Im Allgemeinen<br />

werden Computer geschätzt <strong>und</strong> benutzt, aber eben weniger zum Lernen. Solche generellen<br />

Einstellungen <strong>und</strong> Tatbestände sind längerfristig <strong>und</strong> kaum durch (kurzfristige) Unterrichtserfahrungen<br />

beeinflussbar. Anders sieht es mit den spezielleren Skalen 4, 5, 6, 8 <strong>und</strong> 9 aus. Hier sind die Erfahrungen<br />

eben durchaus unterschiedlich <strong>und</strong> führen dann offensichtlich auch zu entsprechenden Einstellungen<br />

<strong>für</strong> die Zukunft (z. B. Skala 8).


7. Abbildungsverzeichnis<br />

Abbildung 1 Dynamische Arbeitsblätter <strong>und</strong> Schüleranzahl ....................................... 5<br />

Abbildung 2 Überblick über Schulstufe, Klassenzusammensetzung, bearbeitetes<br />

Thema .................................................................................................................. 9<br />

Abbildung 3 Antwortschema....................................................................................... 9<br />

Abbildung 4 Mittel-SD-Diagramm ............................................................................. 13<br />

Abbildung 5 Anzahl „keine Angabe“ ......................................................................... 14<br />

Abbildung 6 Anzahl „stimmt vollständig“................................................................... 14<br />

Abbildung 7 Anzahl „stimmt gar nicht“ ...................................................................... 14<br />

Abbildung 8 Verteilung der Antworten bei den Items................................................ 25<br />

Abbildung 9 χ²-Abstände zum Optimum <strong>und</strong> Antioptimum ....................................... 27<br />

Abbildung 10 Scatterplotmatrix <strong>für</strong> die neun Skalen ................................................. 30<br />

Abbildung 11 Unterschiede nach Geschlecht........................................................... 31<br />

Abbildung 12 Unterschiede nach Zensur.................................................................. 32<br />

Abbildung 13 Unterschiede nach Schulart................................................................ 33<br />

Abbildung 14 Unterschiede nach Anzahl der bearbeiteten Arbeitsblätter................. 34<br />

Abbildung 15 Unterschiede nach Klassenstufe ........................................................ 35<br />

Abbildung 16 Unterschiede nach Klassensatz.......................................................... 36<br />

Abbildung 17 Klassensatzplot................................................................................... 38<br />

Abbildung 18 Klassensatzplot der Parallelklassen ................................................... 41<br />

Abbildung 19 Geschlechterplot................................................................................. 42<br />

Abbildung 20 Zensurenplot....................................................................................... 43<br />

Abbildung 21 Schulartenplot..................................................................................... 44<br />

Abbildung 22 Vorkenntnisplot ................................................................................... 45<br />

Abbildung 23 Klassenstufenplot ............................................................................... 46<br />

Abbildung 24 Regressionsbaum mit 7 Endknoten .................................................... 49<br />

Abbildung 25 Knotengrößen bei 7 Endknoten .......................................................... 49<br />

Abbildung 26 Output <strong>für</strong> den Regressionsbaum....................................................... 50<br />

Abbildung 27 Devianzabnahme <strong>für</strong> einige Regressoinsbäume ................................ 51<br />

Abbildung 28 Vollständiger Regressionsbaum mit 71 Endknoten ............................ 51<br />

Abbildung 29 Regressionsbaum mit 15 Endknoten <strong>und</strong> Antwortwert ...................... 52<br />

Abbildung 30 Regressionsbaum mit 15 Endknoten <strong>und</strong> Knotengröße ..................... 52<br />

Abbildung 31 Veränderung der Antworten nach Skalen beim Längsschnittvergleich55<br />

Abbildung 32 Veränderung der Antworten nach Items beim Längsschnittvergleich . 57<br />

Abbildung 33 Unterschiede nach Ort........................................................................ 58<br />

Abbildung 34 Ortplot................................................................................................. 59<br />

Abbildung 35 Summarische Kennzahlen <strong>und</strong> Boxplot des Gesamtmittels ............... 63<br />

65


66<br />

8. Tabellenverzeichnis<br />

Tabelle 1 Ausrichtung der Items............................................................................... 10<br />

Tabelle 2 Angegebene Zensuren ............................................................................. 12<br />

Tabelle 3 Verteilung der Antworten .......................................................................... 15<br />

Tabelle 4 Antworten von Schüler RowNr 5............................................................... 15<br />

Tabelle 5 Antworten von Schüler RowNr 66............................................................. 15<br />

Tabelle 6 Antwortverhalten der Schüler.................................................................... 16<br />

Tabelle 7 Anzahl auffälliger Schüler bei den Skalen................................................. 16<br />

Tabelle 8 Auffällige Schüler...................................................................................... 17<br />

Tabelle 9 Überprüfung der Zuordnung der Items zu den Skalen .............................. 23<br />

Tabelle 10 Kennzahlen <strong>und</strong> Reliabilität der Skalen ( n=365) .................................... 28<br />

Tabelle 11 Korrelationsmatrix <strong>für</strong> Skala 1................................................................. 29<br />

Tabelle 12 Korrelationsmatrix <strong>für</strong> Skala 2................................................................. 29<br />

Tabelle 13 Korrelationsmatrix <strong>für</strong> Skala 7................................................................. 29<br />

Tabelle 14 Korrelationen der Skalen ........................................................................ 30<br />

Tabelle 15 Kodierung der Parallelklassen ................................................................ 40<br />

Tabelle 16 Mittelwerte <strong>und</strong> bereinigte Mittelwerte nach Geschlecht ......................... 42<br />

Tabelle 17 Mittelwerte <strong>und</strong> bereinigte Mittelwerte nach Zensur................................ 43<br />

Tabelle 18 Mittelwerte <strong>und</strong> bereinigte Mittelwerte nach Schulart.............................. 44<br />

Tabelle 19 Mittelwerte <strong>und</strong> bereinigte Mittelwerte nach Vorkenntnissen .................. 45<br />

Tabelle 20 Mittelwerte <strong>und</strong> bereinigte Mittelwerte nach Klassenstufe ...................... 46<br />

Tabelle 21 Klassifikation der Variablen..................................................................... 48<br />

Tabelle 22 Mittelwerte der Längsschnittbetrachtung ................................................ 54<br />

Tabelle 23 Items von Skala 6 ................................................................................... 55<br />

Tabelle 24 Items von Skala 5 ................................................................................... 56<br />

Tabelle 25 Items von Skala 7 ................................................................................... 56<br />

Tabelle 26 Mittelwerte <strong>und</strong> bereinigte Mittelwerte nach Ort...................................... 59


9. Literatur<br />

Baptist, Peter (Hrsg.) (2004): Lernen <strong>und</strong> Lehren mit dynamischen Arbeitsblättern. <strong>Mathematik</strong> Klasse<br />

7/8. Seelze<br />

Bocka, <strong>Doris</strong> (2003): „...guter Unterricht ist schwer zu halten.“ – Eine explorative Studie über Unterrichtsqualität<br />

unter besonderer Berücksichtigung der Schülersicht in der Sek<strong>und</strong>arstufe I. Hamburg<br />

Bocka, <strong>Doris</strong> & <strong>Olbricht</strong>, <strong>Walter</strong> (2007): Evaluierung von GEONExT – Teil II: Qualitative Diskussion<br />

<strong>und</strong> Datendokumentation. mαth-kit Heft 19. Bayreuth<br />

Breiman, Leo (1985): Nail Finders, Edifices, and Oz. In: Proceedings of the Berkeley Conference in<br />

Honor of Jerzy Neyman and Jack Kiefer. Volume I. Belmont (Ca.)<br />

Breiman, Leo & Friedman, Jerome H. & Olshen, Richard A. & Stone, Charles J. (1984): Classification<br />

and Regression Trees. Belmont (Ca.)<br />

Czerwenka, Kurt & Nölle, Karin & Pause, Gerhard & Schlotthaus, Werner & Schmidt, Hans Jochim &<br />

Tessloff, Janina (1990): Schülerurteile über die Schule. Bericht über eine internationale Untersuchung.<br />

Frankfurt am Main<br />

Ehmann, Matthias (2004): GEONExT: Integration algebraischer Objekte <strong>und</strong> Internationalisierung.<br />

München<br />

Hartung, Joachim & Elpelt, Bärbel & Klösener, Karl-Heinz (2005): Statistik. Lehr- <strong>und</strong> Handbuch der<br />

angewandternStatistik. 14. Auflage. München/Wien<br />

Helmke, Andreas (2002). Das Projekt MARKUS. <strong>Mathematik</strong>-Gesamterhebung Rheinland-Pfalz:<br />

Kompetenzen, Unterrichtsmerkmale, Schulkontext. Landau<br />

Helmke, Andreas (2003): Unterrichtsqualität erfassen, bewerten, verbessern. Seelze<br />

Helmke, Andreas & Weinert, Franz E. (1997): Bedingungsfaktoren Schulischer Leistungen. In: Weinert,<br />

Franz E.: Psychologie des Unterrichts <strong>und</strong> der Schule. Göttingen/Bern/Toronto<br />

Miller, Carsten (2004): Entwicklung dynamischer Arbeitsblätter <strong>und</strong> <strong>ihre</strong> Realisierung <strong>für</strong> den <strong>Mathematik</strong>unterricht.<br />

München<br />

Miller, Carsten & Ulm, Volker (2006): Experimentieren <strong>und</strong> Entdecken mit dynamischen Arbeitsblättern.<br />

<strong>Mathematik</strong> in der Sek<strong>und</strong>arstufe I. Seelze<br />

PISA-Konsortium Deutschland (Hrsg.) (2004): PISA 2003. Der Bildungsstand der Jugendlichen in<br />

Deutschland - Ergebnisse des zweiten internationalen Vergleichs. Münster/München/u. a.<br />

Ruf, Urs & Gallin, Peter (1998): Dialogisches Lernen in Sprache <strong>und</strong> <strong>Mathematik</strong>. Seelze<br />

Ruf, Urs & Gallin, Peter (1998): Sprache <strong>und</strong> <strong>Mathematik</strong> in der Schule. Seelze<br />

Tukey, John W. (1977): Exploratory Data Analysis. Reading (Mass.)<br />

Ulm Volker (2004): <strong>Mathematik</strong>unterricht <strong>für</strong> individuelle Lernwege öffnen. Sek<strong>und</strong>arstufe. Seelze<br />

Weinert, Franz E. (1997): Psychologie des Unterrichts <strong>und</strong> der Schule. Göttingen/Bern/Toronto<br />

Weinert, Franz E. (2001): Disparate Unterrichtsziele: Empirische Bef<strong>und</strong>e <strong>und</strong> theoretische Probleme<br />

multikriterialer Zielerreichung. In: Bayerische Schule Heft 2 2001<br />

67


68<br />

Zulassungsarbeiten<br />

Meixner, Elke (2006): Überprüfung der Items der GEONExT-Erhebung. Bayreuth<br />

Reisnecker, Sarah (2006): Evaluierung von GEONExT – Untersuchung der Schülerantworten. Bayreuth<br />

Reuschlein, Nina (2006): Untersuchung der Datenbasis innerhalb des Projekts zur Evaluierung von<br />

GEONExT. Bayreuth


Den Themenschwerpunkt der Bayreuther Schriftenreihe mαth-kit bildet Multimedia im<br />

Prozess des Lernens <strong>und</strong> Lehrens – in Schule <strong>und</strong> Hochschule, in Präsenzlehre,<br />

Selbststudium <strong>und</strong> Fernlehre. Die Beiträge sind sowohl wissenschaftlicher Natur wie<br />

auch Berichte aus der Praxis. Besondere Berücksichtigung findet der Aspekt dynamische<br />

<strong>Mathematik</strong>.<br />

Der besseren Orientierung halber wird jedes Heft einer der folgenden Sektionen zugeordnet:<br />

• Konzepte (<strong>und</strong> Theorie)<br />

• Technik (Theorie <strong>und</strong> Praxis)<br />

• Evaluation (Praxis)<br />

Weitere Informationen sind im Internet erhältlich unter:<br />

http://did.mat.uni-bayreuth.de/math-kit<br />

The focus of the Bayreuther Schriftenreihe mαth-kit lies on multimedia in the process<br />

of learning and teaching – at school and university, in face-to-face teaching, self<br />

study and distance education. Contributions comprise of scientific articles as well as<br />

reports from practise. Particular attention is paid to the aspect of dynamic mathematics.<br />

For better orientation, each issue belongs to one of the sections<br />

• Concepts (and Theory)<br />

• Technology (Theory and Practise)<br />

• Evaluation (Practise)<br />

For further information, please visit the World Wide Web:<br />

http://did.mat.uni-bayreuth.de/math-kit<br />

69

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!