Vergleichsarbeiten UDiKom Aus- und Fortbildung der Lehrkräfte in
Vergleichsarbeiten UDiKom Aus- und Fortbildung der Lehrkräfte in
Vergleichsarbeiten UDiKom Aus- und Fortbildung der Lehrkräfte in
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
2.3.3 Aufgabenauswahl bei <strong>Vergleichsarbeiten</strong>: Orientierung an Bildungsstandards <strong>und</strong> hohe Testgüte<br />
Die Qualität e<strong>in</strong>es Kompetenzstufenmodells ist auch von <strong>der</strong> <strong>Aus</strong>wahl geeigneter Testaufgaben abhängig. Die Aufgaben<br />
<strong>der</strong> <strong>Vergleichsarbeiten</strong> sollen die Bildungsstandards wi<strong>der</strong>spiegeln, dürfen die jeweilige fachdidaktische Tradition<br />
nicht konterkarieren <strong>und</strong> müssen über e<strong>in</strong>e entsprechende Testgüte verfügen (vgl. Burkard & Peek, 2004; Dobbelste<strong>in</strong><br />
& Peek, 2007; Fleischer, Wirth & Leutner, 2007). H<strong>in</strong>zu kommt, dass die <strong>in</strong>tendierten sozialen Vergleiche<br />
(Kapitel 2.2) nur s<strong>in</strong>nvoll s<strong>in</strong>d, wenn <strong>Lehrkräfte</strong> gleiche Aufgabenlösungen gleich auswerten, die Aufgaben also objektiv<br />
(auswertbar) s<strong>in</strong>d. Um diesen Ansprüchen gerecht werden zu können, werden alle Testaufgaben unter realen<br />
Bed<strong>in</strong>gungen mehrschrittig erprobt: Der erste Schritt be<strong>in</strong>haltet e<strong>in</strong>e Präpilotierung, bei <strong>der</strong> die Schwierigkeit <strong>der</strong><br />
Aufgaben <strong>und</strong> die Güte <strong>der</strong> <strong>Aus</strong>wertungsanleitungen grob abgeschätzt werden. Darauf folgt e<strong>in</strong>e Pilotierungsphase,<br />
<strong>in</strong> <strong>der</strong> e<strong>in</strong>e ausreichend große Stichprobe von Schüler<strong>in</strong>nen <strong>und</strong> Schülern die Testaufgaben bearbeitet. Die Testgüte<br />
<strong>der</strong> Aufgaben wird folgen<strong>der</strong>maßen sichergestellt:<br />
1. Die Objektivität <strong>der</strong> Aufgabenbewertungen wird durch e<strong>in</strong>e hohe Anzahl von Aufgaben geschlossener Formate<br />
erhöht. Zudem kann mit Hilfe statistischer Indizes (Wirtz & Caspar, 2002) die Übere<strong>in</strong>stimmung von m<strong>in</strong>destens<br />
zwei <strong>Lehrkräfte</strong>n bei <strong>der</strong> Beurteilung von Aufgabenlösungen <strong>der</strong>selben Person erfasst werden.<br />
2. Wie auch <strong>in</strong> <strong>der</strong> klassischen Testtheorie (siehe Studienbrief 1) wird die Reliabilität <strong>der</strong> aus den Aufgaben zusammengesetzten<br />
Skala geprüft. Tests <strong>der</strong> bei <strong>Vergleichsarbeiten</strong> überwiegend e<strong>in</strong>gesetzten probabilistischen<br />
Testtheorie (siehe oben) nutzen dazu Methoden analog zum <strong>in</strong> Studienbrief 1 vorgestellten Koeffizienten<br />
Cronbachs Alpha. Die Reliabilität <strong>der</strong> <strong>Vergleichsarbeiten</strong> ist h<strong>in</strong>reichend hoch, um zuverlässige diagnostische<br />
<strong>Aus</strong>sagen auf <strong>der</strong> Ebene von Schulklassen zu treffen. Individualdiagnostische <strong>Aus</strong>sagen (vgl. Studienbrief 1)<br />
verbieten sich allerd<strong>in</strong>gs weitestgehend (Leutner, Fleischer, Spoden & Wirth, 2007). Um Kompetenzen e<strong>in</strong>zelner<br />
Schüler<strong>in</strong>nen <strong>und</strong> Schüler für diese Zielsetzung genau genug zu erfassen, wäre e<strong>in</strong>e höhere Item-Anzahl<br />
notwendig. Dies sollte bei <strong>der</strong> Ergebnisrückmeldung an die Schüler<strong>in</strong>nen <strong>und</strong> Schüler beachtet werden.<br />
3. Die Validität kann – wenn überhaupt – nur grob erfasst werden. Vere<strong>in</strong>zelt kann aber geprüft werden, ob sich<br />
<strong>in</strong> den Ergebnissen bekannte Bef<strong>und</strong>e (z.B. aus dem Bildungsmonitor<strong>in</strong>g, vgl. Studienbrief 3) wi<strong>der</strong>spiegeln,<br />
etwa Schulform- o<strong>der</strong> Geschlechtsunterschiede sowie Zusammenhänge mit sozioökonomischen Variablen.<br />
Die Aufgabensätze <strong>der</strong> <strong>Vergleichsarbeiten</strong> stellen schließlich e<strong>in</strong>en Kompromiss zwischen fachdidaktischen <strong>und</strong> testtheoretischen<br />
Anfor<strong>der</strong>ungen dar, d.h. <strong>in</strong>haltliche Qualität <strong>und</strong> Testgüte müssen gleichermaßen gewährleistet se<strong>in</strong>.<br />
Das deutsche Schulsystem weist e<strong>in</strong>e breite Leistungsstreuung zwischen Schulen (<strong>in</strong>sbeson<strong>der</strong>e zwischen Schulen<br />
unterschiedlicher Schulformen), aber e<strong>in</strong>e verhältnismäßig ger<strong>in</strong>ge Streuung <strong>in</strong>nerhalb <strong>der</strong> E<strong>in</strong>zelschule auf (Baumert,<br />
Trautwe<strong>in</strong> & Artelt, 2003). Diesem Ergebnis wird bei <strong>Vergleichsarbeiten</strong> e<strong>in</strong>erseits durch die Verwendung unterschiedlich<br />
schwieriger Testheftversionen, an<strong>der</strong>erseits durch e<strong>in</strong> breites Schwierigkeitsspektrum <strong>der</strong> Testaufgaben<br />
<strong>in</strong>nerhalb <strong>der</strong> Hefte Rechnung getragen. Es wird so sichergestellt, dass die Testaufgaben Schülergruppen nicht<br />
systematisch über- o<strong>der</strong> unterfor<strong>der</strong>n. Innerhalb e<strong>in</strong>er Lerngruppe werden identische Aufgaben verwendet, sodass<br />
gut nachvollziehbare vergleichende <strong>Aus</strong>sagen über die getesteten Kompetenzen getroffen werden können. E<strong>in</strong> typisches<br />
Missverständnis bei <strong>der</strong> Interpretation von Ergebnissen aus <strong>Vergleichsarbeiten</strong> verbirgt sich <strong>in</strong> <strong>der</strong> Annahme,<br />
dass Leistungen über verschiedene Schulformen h<strong>in</strong>weg nicht vergleichbar seien. Dies trifft auf <strong>Vergleichsarbeiten</strong> <strong>in</strong><br />
<strong>der</strong> Regel nicht zu7 Aufgabenerstellung/Aufgabenauswahl<br />
. Bei <strong>der</strong> Testauswertung auf Basis des zuvor dargestellten Rasch-Modells s<strong>in</strong>d die Ergebnisse von<br />
Klassen unterschiedlicher Schulformen auch dann noch vergleichbar, wenn <strong>in</strong> den Schulformen unterschiedliche<br />
Testhefte mit zum Teil an<strong>der</strong>en Aufgaben bearbeitet wurden.<br />
2.3.4 Weiterführende Literatur<br />
Das Vorgehen bei <strong>der</strong> Aufgabenentwicklung <strong>und</strong> Aufgabenselektion wird ausführlich von Leutner, Fleischer, Spoden Literatur<br />
& Wirth (2007) beschrieben. Das Rasch-Modell erläutern Bond & Fox (2001) weitestgehend „formelfrei“ <strong>und</strong> Rost<br />
(2004) auf Schulmathematik-Niveau. Die Def<strong>in</strong>ition von Kompetenzstufen auf <strong>der</strong> Rasch-Skala wird von Fleischer,<br />
Wirth & Leutner (2007) dargelegt, kann darüber h<strong>in</strong>aus aber auch den PISA-Bänden (z.B. Artelt, Stanat, Schnei<strong>der</strong> &<br />
Schiefele, 2001) o<strong>der</strong> ebenfalls Leutner, Fleischer, Spoden & Wirth (2007) entnommen werden.<br />
2.3.5 Verständnis <strong>und</strong> Diskussionspunkte<br />
1. Fassen Sie bitte zusammen, nach welchen Kriterien die Qualität <strong>der</strong> Aufgaben <strong>in</strong> <strong>Vergleichsarbeiten</strong> geprüft<br />
wird.<br />
2. Beschreiben Sie bitte, weshalb Testaufgaben bei <strong>Vergleichsarbeiten</strong> objektiv auswertbar se<strong>in</strong> sollen. Überlegen<br />
Sie, wie Sie selbst – ohne Aneignung weiteren Wissens – die <strong>Aus</strong>wertungsobjektivität von Aufgaben (z.B. bei Parallelarbeiten)<br />
überprüfen könnten.<br />
3. Diskutieren Sie bitte, welche Informationen als H<strong>in</strong>weise auf die Validität e<strong>in</strong>es für <strong>Vergleichsarbeiten</strong> konstruierten<br />
Tests herangezogen werden könnten.<br />
7 Voraussetzung ist allerd<strong>in</strong>gs, dass e<strong>in</strong> geme<strong>in</strong>sames Kompetenzstufenmodell zugr<strong>und</strong>e liegt. Derzeit stellt das Kompetenzstufenmodell für den mittleren Schulabschluss (MSA) den<br />
Referenzrahmen dar.<br />
15