14.03.2013 Aufrufe

Vergleichsarbeiten UDiKom Aus- und Fortbildung der Lehrkräfte in

Vergleichsarbeiten UDiKom Aus- und Fortbildung der Lehrkräfte in

Vergleichsarbeiten UDiKom Aus- und Fortbildung der Lehrkräfte in

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

2.3.3 Aufgabenauswahl bei <strong>Vergleichsarbeiten</strong>: Orientierung an Bildungsstandards <strong>und</strong> hohe Testgüte<br />

Die Qualität e<strong>in</strong>es Kompetenzstufenmodells ist auch von <strong>der</strong> <strong>Aus</strong>wahl geeigneter Testaufgaben abhängig. Die Aufgaben<br />

<strong>der</strong> <strong>Vergleichsarbeiten</strong> sollen die Bildungsstandards wi<strong>der</strong>spiegeln, dürfen die jeweilige fachdidaktische Tradition<br />

nicht konterkarieren <strong>und</strong> müssen über e<strong>in</strong>e entsprechende Testgüte verfügen (vgl. Burkard & Peek, 2004; Dobbelste<strong>in</strong><br />

& Peek, 2007; Fleischer, Wirth & Leutner, 2007). H<strong>in</strong>zu kommt, dass die <strong>in</strong>tendierten sozialen Vergleiche<br />

(Kapitel 2.2) nur s<strong>in</strong>nvoll s<strong>in</strong>d, wenn <strong>Lehrkräfte</strong> gleiche Aufgabenlösungen gleich auswerten, die Aufgaben also objektiv<br />

(auswertbar) s<strong>in</strong>d. Um diesen Ansprüchen gerecht werden zu können, werden alle Testaufgaben unter realen<br />

Bed<strong>in</strong>gungen mehrschrittig erprobt: Der erste Schritt be<strong>in</strong>haltet e<strong>in</strong>e Präpilotierung, bei <strong>der</strong> die Schwierigkeit <strong>der</strong><br />

Aufgaben <strong>und</strong> die Güte <strong>der</strong> <strong>Aus</strong>wertungsanleitungen grob abgeschätzt werden. Darauf folgt e<strong>in</strong>e Pilotierungsphase,<br />

<strong>in</strong> <strong>der</strong> e<strong>in</strong>e ausreichend große Stichprobe von Schüler<strong>in</strong>nen <strong>und</strong> Schülern die Testaufgaben bearbeitet. Die Testgüte<br />

<strong>der</strong> Aufgaben wird folgen<strong>der</strong>maßen sichergestellt:<br />

1. Die Objektivität <strong>der</strong> Aufgabenbewertungen wird durch e<strong>in</strong>e hohe Anzahl von Aufgaben geschlossener Formate<br />

erhöht. Zudem kann mit Hilfe statistischer Indizes (Wirtz & Caspar, 2002) die Übere<strong>in</strong>stimmung von m<strong>in</strong>destens<br />

zwei <strong>Lehrkräfte</strong>n bei <strong>der</strong> Beurteilung von Aufgabenlösungen <strong>der</strong>selben Person erfasst werden.<br />

2. Wie auch <strong>in</strong> <strong>der</strong> klassischen Testtheorie (siehe Studienbrief 1) wird die Reliabilität <strong>der</strong> aus den Aufgaben zusammengesetzten<br />

Skala geprüft. Tests <strong>der</strong> bei <strong>Vergleichsarbeiten</strong> überwiegend e<strong>in</strong>gesetzten probabilistischen<br />

Testtheorie (siehe oben) nutzen dazu Methoden analog zum <strong>in</strong> Studienbrief 1 vorgestellten Koeffizienten<br />

Cronbachs Alpha. Die Reliabilität <strong>der</strong> <strong>Vergleichsarbeiten</strong> ist h<strong>in</strong>reichend hoch, um zuverlässige diagnostische<br />

<strong>Aus</strong>sagen auf <strong>der</strong> Ebene von Schulklassen zu treffen. Individualdiagnostische <strong>Aus</strong>sagen (vgl. Studienbrief 1)<br />

verbieten sich allerd<strong>in</strong>gs weitestgehend (Leutner, Fleischer, Spoden & Wirth, 2007). Um Kompetenzen e<strong>in</strong>zelner<br />

Schüler<strong>in</strong>nen <strong>und</strong> Schüler für diese Zielsetzung genau genug zu erfassen, wäre e<strong>in</strong>e höhere Item-Anzahl<br />

notwendig. Dies sollte bei <strong>der</strong> Ergebnisrückmeldung an die Schüler<strong>in</strong>nen <strong>und</strong> Schüler beachtet werden.<br />

3. Die Validität kann – wenn überhaupt – nur grob erfasst werden. Vere<strong>in</strong>zelt kann aber geprüft werden, ob sich<br />

<strong>in</strong> den Ergebnissen bekannte Bef<strong>und</strong>e (z.B. aus dem Bildungsmonitor<strong>in</strong>g, vgl. Studienbrief 3) wi<strong>der</strong>spiegeln,<br />

etwa Schulform- o<strong>der</strong> Geschlechtsunterschiede sowie Zusammenhänge mit sozioökonomischen Variablen.<br />

Die Aufgabensätze <strong>der</strong> <strong>Vergleichsarbeiten</strong> stellen schließlich e<strong>in</strong>en Kompromiss zwischen fachdidaktischen <strong>und</strong> testtheoretischen<br />

Anfor<strong>der</strong>ungen dar, d.h. <strong>in</strong>haltliche Qualität <strong>und</strong> Testgüte müssen gleichermaßen gewährleistet se<strong>in</strong>.<br />

Das deutsche Schulsystem weist e<strong>in</strong>e breite Leistungsstreuung zwischen Schulen (<strong>in</strong>sbeson<strong>der</strong>e zwischen Schulen<br />

unterschiedlicher Schulformen), aber e<strong>in</strong>e verhältnismäßig ger<strong>in</strong>ge Streuung <strong>in</strong>nerhalb <strong>der</strong> E<strong>in</strong>zelschule auf (Baumert,<br />

Trautwe<strong>in</strong> & Artelt, 2003). Diesem Ergebnis wird bei <strong>Vergleichsarbeiten</strong> e<strong>in</strong>erseits durch die Verwendung unterschiedlich<br />

schwieriger Testheftversionen, an<strong>der</strong>erseits durch e<strong>in</strong> breites Schwierigkeitsspektrum <strong>der</strong> Testaufgaben<br />

<strong>in</strong>nerhalb <strong>der</strong> Hefte Rechnung getragen. Es wird so sichergestellt, dass die Testaufgaben Schülergruppen nicht<br />

systematisch über- o<strong>der</strong> unterfor<strong>der</strong>n. Innerhalb e<strong>in</strong>er Lerngruppe werden identische Aufgaben verwendet, sodass<br />

gut nachvollziehbare vergleichende <strong>Aus</strong>sagen über die getesteten Kompetenzen getroffen werden können. E<strong>in</strong> typisches<br />

Missverständnis bei <strong>der</strong> Interpretation von Ergebnissen aus <strong>Vergleichsarbeiten</strong> verbirgt sich <strong>in</strong> <strong>der</strong> Annahme,<br />

dass Leistungen über verschiedene Schulformen h<strong>in</strong>weg nicht vergleichbar seien. Dies trifft auf <strong>Vergleichsarbeiten</strong> <strong>in</strong><br />

<strong>der</strong> Regel nicht zu7 Aufgabenerstellung/Aufgabenauswahl<br />

. Bei <strong>der</strong> Testauswertung auf Basis des zuvor dargestellten Rasch-Modells s<strong>in</strong>d die Ergebnisse von<br />

Klassen unterschiedlicher Schulformen auch dann noch vergleichbar, wenn <strong>in</strong> den Schulformen unterschiedliche<br />

Testhefte mit zum Teil an<strong>der</strong>en Aufgaben bearbeitet wurden.<br />

2.3.4 Weiterführende Literatur<br />

Das Vorgehen bei <strong>der</strong> Aufgabenentwicklung <strong>und</strong> Aufgabenselektion wird ausführlich von Leutner, Fleischer, Spoden Literatur<br />

& Wirth (2007) beschrieben. Das Rasch-Modell erläutern Bond & Fox (2001) weitestgehend „formelfrei“ <strong>und</strong> Rost<br />

(2004) auf Schulmathematik-Niveau. Die Def<strong>in</strong>ition von Kompetenzstufen auf <strong>der</strong> Rasch-Skala wird von Fleischer,<br />

Wirth & Leutner (2007) dargelegt, kann darüber h<strong>in</strong>aus aber auch den PISA-Bänden (z.B. Artelt, Stanat, Schnei<strong>der</strong> &<br />

Schiefele, 2001) o<strong>der</strong> ebenfalls Leutner, Fleischer, Spoden & Wirth (2007) entnommen werden.<br />

2.3.5 Verständnis <strong>und</strong> Diskussionspunkte<br />

1. Fassen Sie bitte zusammen, nach welchen Kriterien die Qualität <strong>der</strong> Aufgaben <strong>in</strong> <strong>Vergleichsarbeiten</strong> geprüft<br />

wird.<br />

2. Beschreiben Sie bitte, weshalb Testaufgaben bei <strong>Vergleichsarbeiten</strong> objektiv auswertbar se<strong>in</strong> sollen. Überlegen<br />

Sie, wie Sie selbst – ohne Aneignung weiteren Wissens – die <strong>Aus</strong>wertungsobjektivität von Aufgaben (z.B. bei Parallelarbeiten)<br />

überprüfen könnten.<br />

3. Diskutieren Sie bitte, welche Informationen als H<strong>in</strong>weise auf die Validität e<strong>in</strong>es für <strong>Vergleichsarbeiten</strong> konstruierten<br />

Tests herangezogen werden könnten.<br />

7 Voraussetzung ist allerd<strong>in</strong>gs, dass e<strong>in</strong> geme<strong>in</strong>sames Kompetenzstufenmodell zugr<strong>und</strong>e liegt. Derzeit stellt das Kompetenzstufenmodell für den mittleren Schulabschluss (MSA) den<br />

Referenzrahmen dar.<br />

15

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!