11.11.2012 Aufrufe

Testbesprechung - Testzentrale

Testbesprechung - Testzentrale

Testbesprechung - Testzentrale

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Sonderdruck aus: Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 38 (3), 146–148<br />

146 <strong>Testbesprechung</strong><br />

© Hogrefe Verlag Göttingen 2006<br />

Kiese-Himmel, C. (2005). AWST-R. Aktiver Wortschatztest<br />

für 3- bis 5-jährige Kinder – Revision. Göttingen:<br />

Beltz Test GmbH.<br />

Der Aufbau adäquater sprachlicher Kommunikationsleistungen<br />

stellt eine der wesentlichen Entwicklungsherausforderungen<br />

der ersten Lebensjahre dar. Allerdings zeigen<br />

epidemiologische Studien, dass bei einem nicht unerheblichen<br />

Anteil von Kindern Sprachentwicklungsverzögerungen<br />

oder -störungen bestehen, die sich nicht nur<br />

negativ auf die Kommunikationsfähigkeit auswirken, sondern<br />

auch zu sozialen und emotionalen Folgeproblemen<br />

und Lernstörungen führen können (z.B. Suchodoletz,<br />

2004). Die Notwendigkeit einer rechtzeitigen Intervention<br />

bei Sprachentwicklungsstörungen ist unstrittig. Die Indikationsstellung<br />

im Einzelfall kann jedoch nur gelingen,<br />

wenn zuverlässige diagnostische Instrumente zur Erfassung<br />

der zentralen Dimensionen des Spracherwerbs<br />

(pragmatische, morphologisch-syntaktische, semantischlexikalische<br />

und phonetisch-phonologische Ebene) zur<br />

Verfügung stehen. Der AWST-R will als Entwicklungstest<br />

zur Erfassung des aktiven Wortschatzes bei 3;0 bis 5;5jährigen<br />

Kindern zu einer gründlichen Diagnostik der sprachlichen<br />

Entwicklung beitragen.<br />

Theoretischer Hintergrund<br />

Im Theorieteil des Manuals erhält der Testanwender Informationen<br />

über die Bedeutung und Differenzierung von<br />

Wortkategorien sowie die Entwicklung des Wortschatzes<br />

und der Wortbedeutung. Worte als „Grundeinheit der<br />

Sprache“, als „Bausteine, um eine sprachliche Äußerung<br />

zu tätigen“ (Manual, S. 12) haben unstrittig eine besondere<br />

Bedeutung für die Entwicklung der Kommunikationsfähigkeit.<br />

Ohne ein umfassendes, im Langzeitgedächtnis<br />

repräsentiertes mentales Lexikon kann weder eine adäquate<br />

sprachliche Ausdrucksfähigkeit erreicht werden, noch<br />

können die sprachlichen Äußerungen anderer Menschen<br />

verstanden werden. Die frühe Wortschatzentwicklung ist<br />

zudem ein wichtiger Prädiktor für den späteren Sprachentwicklungsstand<br />

und somit bedeutsam für die Selektion zur<br />

sprachlichen Frühförderung, für die Indikationsstellung<br />

zur Sprachtherapie und für die Therapieevaluation.<br />

Bilderbenennen erscheint intuitiv als adäquater Zugang<br />

zur Erfassung des Wortschatzes. Eine kritische Auseinandersetzung<br />

mit alternativen Herangehensweisen –<br />

z.B. aktives Erklären und Definieren von dargebotenen<br />

Begriffen, wie im Subtest „Wortschatz“ des Hannover-<br />

Wechsler-Intelligenztests für das Vorschulalter (Eggert<br />

& Schuck, 1975) oder im Subtest „Wörter Erklären“ des<br />

<strong>Testbesprechung</strong><br />

Wiener Entwicklungstests (Kastner-Koller & Deimann,<br />

2002) – findet sich im Manual leider nicht.<br />

Testaufbau, Material und Durchführung<br />

Der Testkoffer enthält das Manual (112 Seiten), zwei Spiralhefte<br />

mit insgesamt 81 Bildvorlagen sowie jeweils zehn<br />

Test- und Auswertungsprotokolle. Der AWST-R kann bei<br />

Kindern im Alter von 3;0 bis 5;5 Jahren eingesetzt werden.<br />

Die Zeit für die Durchführung beträgt nach Angaben der<br />

Testautorin 15–20 Minuten, ein auch nach eigenen Erfahrungen<br />

realistischer Wert.<br />

Im Gegensatz zur Vorläuferversion, dem Aktiven<br />

Wortschatztest für drei- bis sechsjährige Kinder AWST<br />

(Kiese & Kozielski, 1979), verwendet der AWST-R als<br />

Testmaterial durchgehend ansprechend gestaltete Farbfotografien.<br />

51 Items zeigen Gegenstände (substantivischer<br />

Wortschatz), z.B. ein Blatt, einen Pinsel, einen Liegestuhl,<br />

ein T-Shirt. 24 Items beziehen sich auf Tätigkeiten<br />

(Verb-Wortschatz), z.B. bügeln, stricken, telefonieren,<br />

kneifen. Bei der Testentwicklung wurde besonderer Wert<br />

darauf gelegt, unterschiedliche semantische Felder zu berücksichtigen<br />

und Begriffe aus dem „lebensnahen Wortschatz“<br />

der Kinder (Manual, S. 20) zu wählen. Bei der Auswahl<br />

stützte sich die Autorin u. a. auf Erfahrungen mit dem<br />

AWST, aktuelle Forschungsergebnisse zur Wortschatzentwicklung<br />

bei deutschsprachigen Kindern und detailliert<br />

dargestellte Pilotstudien.<br />

Der AWST-R wird stets im Einzelsetting in einem<br />

Durchgang ohne Zeitbegrenzung durchgeführt. Die Bildvorlagen<br />

werden den Kindern sukzessive mit der Aufforderung<br />

„Was ist das?“ (bei Substantiven) oder „Was<br />

macht die/der?“ (bei Verben) präsentiert. Es werden stets<br />

alle Bildkarten dargeboten. Auf die vollständige Durchführung<br />

wird nur verzichtet, wenn keines der ersten zehn<br />

Items korrekt gelöst wird. Die Aufgaben sind nach der<br />

Itemschwierigkeit geordnet. Um das Kind mit den Anforderungen<br />

vertraut zu machen, beginnt die Testung mit fünf<br />

„Eisbrecher“ genannten Items, die nicht in die quantitative<br />

Testauswertung eingehen. Ein weiteres leicht lösbares<br />

und nicht gewertetes Item beschließt den Test.<br />

Parallel- oder Kurzformen liegen nicht vor. Allgemeine<br />

Hinweise zur Testung und zu möglichen Störfaktoren,<br />

wörtliche Testanweisungen, ggf. erforderliche Nachfragen<br />

und weitere Erläuterungen sind im Manual hinreichend<br />

detailliert dargestellt. Die Durchführung des<br />

AWST-R kann zügig erlernt werden.<br />

Der Testbogen ist übersichtlich gegliedert. Die Protokollierung<br />

erfolgt in zwei Spalten für Spontanantworten


und Antworten auf Nachfrage und erlaubt eine (nicht normierte)<br />

Aufschlüsselung der Lösungen für Verben und<br />

Substantive. Außerdem kann unaufwändig vermerkt werden,<br />

ob das Kind verzögert (> 10 Sekunden) geantwortet<br />

hat. Die Bewertung der einzelnen Items wird dem geübten<br />

Anwender schon während der Testdurchführung gelingen,<br />

eine nachträgliche Bewertung ist auf Grund der geforderten<br />

genauen Protokollierung problemlos möglich.<br />

Das achtseitige Auswertungsprotokoll wird für die qualitative<br />

Auswertung benötigt, bei der die Antworten des<br />

Kindes nach semantischen Feldern und zahlreichen Fehlermerkmalen<br />

(z.B. nonverbale Antworten, Perseverationen,<br />

funktionale Umschreibungen, Wortneubildungen)<br />

kategorisiert werden können. Ob die qualitative Auswertung<br />

– wie in den ausführlich dargestellten Fallbeispielen<br />

impliziert – tatsächlich als Grundlage für differenzierte<br />

Therapievorschläge dienen sollte, kann angesichts fehlender<br />

Angaben zu allen Gütekriterien bezweifelt werden.<br />

Testanalyse und Normierung<br />

Auf Grund der exakten Testinstruktion, der weitgehend<br />

unkomplizierten Handhabung und standardisierten Reizdarbietung<br />

ist die Durchführungsobjektivität bei kooperativen<br />

Kindern gesichert. Die Auswertungsobjektivität<br />

erscheint – auch wenn keine empirischen Daten berichtet<br />

werden – ebenfalls unproblematisch. Übersichtliche Tabellen<br />

zeigen Musterlösungen und Fehlerbeispiele, allgemeine<br />

Bewertungskriterien werden im Manual ausführlich<br />

erläutert. Die Interpretationsobjektivität ist nur für die<br />

quantitative Auswertung durch den Bezug auf Normwerte<br />

gesichert.<br />

Als Reliabilitätskennwert wird für eine Stichprobe<br />

von 113 Kindern die Testhalbierungsreliabilität mit r tt = .86<br />

angegeben. Dieser Wert bezieht sich nur auf die Gesamtstichprobe,<br />

so dass eine Überschätzung der Reliabilität<br />

(s. Reynolds, 1989) denkbar wäre. Allerdings liegen die<br />

Angaben zur internen Konsistenz (Kuder-Richardson) für<br />

drei Altersgruppen der gleichen Stichprobe (r tt .80 bis .86)<br />

und fünf Altersgruppen in der Normstichprobe (r tt .85 bis<br />

.89) ebenfalls in einem für Entwicklungstests voll zufriedenstellenden<br />

Bereich. Die Retestreliabilität wurde<br />

nur an einer sehr kleinen Stichprobe (N = 19) über einen<br />

Zeitraum von 10 bis 14 Tagen mit r tt = .87 bestimmt, wobei<br />

nicht eindeutig zu erkennen ist, ob Testrohwerte (anfällig<br />

für Reliabilitätsüberschätzungen bei altersinhomogenen<br />

Stichproben, s.o.) oder Standardwerte korreliert wurden.<br />

Die Itemschwierigkeiten zeigen mit Werten zwischen<br />

.08 und .95 für die Gesamtstichprobe eine gute Verteilung,<br />

für die einzelnen Altersgruppen werden keine Angaben<br />

gemacht. Die Trennschärfe der Items liegt zwischen .25<br />

und .66 (Mittelwert .44). Der Gesamttestwert ist bei den<br />

älteren Kindern rechtssteil verteilt, zeigt aber keine kritischen<br />

Boden- oder Deckeneffekte.<br />

Die inhaltliche Validität des Verfahrens ist durch die<br />

sorgfältige Itemauswahl sowie den Bezug auf die relevante<br />

Theorienbildung und Forschung gut gesichert. Die<br />

<strong>Testbesprechung</strong><br />

147<br />

Testrohwerte zeigen – wie von einem Entwicklungstest zu<br />

fordern – einen engen Zusammenhang mit dem Lebensalter<br />

(r = .65 in der Normstichprobe).<br />

Empirische Untersuchungen zur konvergenten Validität<br />

wurden an unterschiedlich großen Substichproben<br />

(N zwischen 71 und 99) einer Gruppe von 113 deutschsprachigen<br />

Kindern durchgeführt. Der AWST-R Gesamtpunktwert<br />

korreliert demnach mit .41 (Rangkorrelationskoeffizient<br />

rho) mit einer globalen Einschätzung des Wortschatzes<br />

durch Kindergartenerzieherinnen. Als weitere<br />

sprachbezogene Validitätskriterien werden Korrelationen<br />

zu den Untertests „Sätze ergänzen“ (verbale Analogienbildung;<br />

r tc = .78) und „Wörter ergänzen“ (Erkennen akustisch<br />

unvollständig dargebotener Wörter; r tc = .58) des<br />

Psycholinguistischen Entwicklungstests PET (Angermaier,<br />

1977) angegeben. Der Zusammenhang zu anderen<br />

Wortschatztests oder Überprüfungen komplexerer<br />

sprachlicher Intelligenzleistungen wurde nicht empirisch<br />

untersucht. Bei einer nach Alter und Geschlecht parallelisierten<br />

Stichprobe von Kindern mit und ohne Sprachentwicklungsstörungen<br />

wurden die erwarteten besseren<br />

Testleistungen bei sprachlich unauffälligen Kindern gefunden.<br />

Als weitere Validitätsstudie wird ein Vergleich<br />

von monolingual und bilingual aufwachsenden Kindern<br />

berichtet. Die Annahme einer langsameren Entwicklung<br />

des Wortschatzes bei gleichzeitigem Erwerb von zwei<br />

Sprachen wird durch signifikant bessere AWST-R Ergebnisse<br />

der monolingualen Kinder gestützt.<br />

Im Kapitel zur Validität finden sich außerdem noch verschiedene<br />

deskriptive Daten, u.a. Vergleiche der Leistungen<br />

von Stadt- und Landkindern, Interkorrelationen der<br />

semantischen Kategorien und eine Darstellung der Altersentwicklung<br />

in den semantischen Kategorien.<br />

Normen (Prozentränge) werden in übersichtlichen Tabellen<br />

für fünf Altersgruppen, die jeweils sechs Monate<br />

umfassen, bereitgestellt. Da die Testautorin selbst der<br />

alternativen Skalierung in T-Werten die größere Brauchbarkeit<br />

zuspricht (Manual S. 64), überrascht, dass T-Werte<br />

nur über eine Transformationstabelle zugänglich sind.<br />

Die Berechnung von Konfidenzintervallen bleibt leider<br />

dem Anwender überlassen und ist unnötig umständlich,<br />

da erst Prozentränge in T-Werte umgewandelt werden<br />

müssen, ehe die Berechnung anhand der im Manual angegebenen<br />

Standardmessfehler erfolgen kann.<br />

Die Normierung erfolgte von Februar 2003 bis Oktober<br />

2004 an 551 „sinnesgesunden und vermeintlich normal<br />

begabten Kindern“ (Manual, S. 62) aus zehn Bundesländern.<br />

45% der Kinder stammen aus Niedersachsen. Das<br />

Manual lässt nicht erkennen, auf Grund welcher Kriterien<br />

die vermeintliche Normalbegabung festgestellt wurde und<br />

wie viele Kinder wegen kognitiver Retardierungen oder<br />

anderer Gründe von der Normierung ausgeschlossen wurden.<br />

Nähere Angaben zur Stichprobenrekrutierung und<br />

drop-outs werden nicht gemacht, ebenso fehlen Hinweise<br />

zur Qualitätssicherung der Normierung (z.B. Qualifikation,<br />

Schulung und Kontrolle der Testleiter). In den<br />

Altersgruppen liegt die Stichprobengröße zwischen 69<br />

(3;0–3;5 Jahre) und 124 (4;6–4;11 Jahre), bei einem ausge-


148 <strong>Testbesprechung</strong><br />

wogenen Verhältnis von Jungen und Mädchen. Die Normstichprobe<br />

wird nach Geschlecht, Alter und regionaler<br />

Herkunft beschrieben. Zu anderen demographischen oder<br />

sozialen Variablen werden keine statistischen Angaben<br />

gemacht.<br />

Plus/Minus<br />

Mit dem AWST-R liegt eine weitgehend gelungene Neubearbeitung<br />

eines Entwicklungstests zur Erfassung expressiver<br />

Sprachleistungen bei Kindern vor. Die vom<br />

AWST-R abgedeckte Altersspanne ist für die Indikationsstellung<br />

sprachtherapeutischer Interventionen besonders<br />

bedeutsam, wobei der Testeinsatz unmittelbar vor den<br />

üblichen Einschulungsterminen leider nicht mehr möglich<br />

ist. Das Testmaterial ist ansprechend und kindgerecht. Der<br />

Anspruch, die Testitems aus dem alltäglichen Wortschatz<br />

der Kinder zu entnehmen, ist erfüllt worden. Durch die<br />

Verwendung vielfältiger semantischer Felder ist die Gefahr<br />

einer Ergebnisverzerrung durch bereichsspezifische<br />

Leistungsstärken oder -defizite gering. Die Bedeutung<br />

einer aktuellen Normierung versteht sich von selbst. Die<br />

Testung kann objektiv und reliabel erfolgen. Als Bilderbenennungstest<br />

ist der AWST-R im deutschen Sprachraum<br />

konkurrenzlos.<br />

Allerdings sind auch kritische Punkte zu nennen. Die<br />

Normstichprobe ist zwar hinreichend groß, aber ungenau<br />

beschrieben. Bei der bekannten Abhängigkeit der Wortschatzentwicklung<br />

von der sprachlichen Anregung im<br />

Umfeld des Kindes wären Angaben über Bildungsstand<br />

und sozioökonomischen Status der Eltern sehr wichtig,<br />

um die Repräsentativität der Stichprobe beurteilen zu können.<br />

Ebenso vermissen wir Angaben über den Anteil an<br />

mehrsprachig aufwachsenden Kindern und eine präzise<br />

Darstellung der Ausschlusskriterien.<br />

Für einen eindimensionalen Entwicklungstest ohne<br />

jegliche Variation der Aufgabenstellung ist die Durchführungszeit<br />

mit 15–20 Minuten eher hoch. Nach eigenen Erfahrungen<br />

wird der AWST-R dennoch gut akzeptiert.<br />

Allerdings kann bei leistungs- und aufmerksamkeitsschwachen<br />

Kindern im Testverlauf die Motivation abbauen.<br />

Bei einem Mittelwert von knapp 31 gelösten Items in<br />

der jüngsten Normgruppe (3;0–3;5 Jahre) werden diese<br />

Kinder durchschnittlich mit 44 Items konfrontiert, die sie<br />

nicht lösen können. Bei einem Prozentrang von 10 werden<br />

sogar 60 der 75 Items nicht bewältigt. Für den Einsatz bei<br />

jüngeren stark sprachentwicklungsverzögerten Kindern<br />

wäre daher die Entwicklung einer Kurzform oder die – anhand<br />

der Normierungsdaten vermutlich auch empirisch<br />

begründbare – Definition von Abbruchkriterien sinnvoll.<br />

Auf die Notwendigkeit weiterer Validitätsstudien weist<br />

die Testautorin selbst hin, ohne näher über derzeit laufende<br />

oder geplante Forschungsarbeiten zu informieren. Zu<br />

wünschen sind Studien zur konvergenten Validität mit<br />

Sprachtests, die auch komplexere Ausdrucks- und Verständnisleistungen<br />

erfassen (z.B. bieten sich hier die Subtests<br />

„Wörter erklären“ und „Quiz“ aus dem Wiener Entwicklungstest<br />

an). Außerdem wären ergänzende Studien<br />

zur Testwiederholungszuverlässigkeit und insbesondere<br />

zur prognostischen Validität wünschenswert.<br />

Als Anregung für künftige Weiterentwicklungen sei<br />

darauf hingewiesen, dass im deutschen Sprachraum weiterhin<br />

– mit Ausnahme des nur im dritten Lebensjahr einsetzbaren<br />

Sprachentwicklungstests für zweijährige Kinder<br />

SETK-2 (Grimm, 2000) – kein aktuell normierter Wortschatztest<br />

existiert, der verschiedene Erfassungsmodi<br />

(z.B. aktiver und passiver Wortschatz) in einem Verfahren<br />

vereint. Gerade die Kontrastierung von konormierten<br />

expressiven und rezeptiven Sprachleistungen wäre für<br />

die klinische Untersuchung sprachentwicklungsgestörter<br />

Kinder sehr hilfreich.<br />

Literatur<br />

Angermaier, M. (1977). Psycholinguistischer Entwicklungstest<br />

(PET) (2., korrig. Aufl.). Weinheim: Beltz.<br />

Eggert, D. & Schuck, K. D. (1975). Hannover-Wechsler-Intelligenztest<br />

für das Vorschulalter (HAWIVA). Bern: Huber.<br />

Grimm, H. (2000). Sprachentwicklungstest für zweijährige Kinder<br />

(SETK-2). Göttingen: Hogrefe.<br />

Kastner-Koller, U. & Deimann, P. (2002). Wiener Entwicklungstest<br />

(WET) (2., überarb. u. neu norm. Aufl.). Göttingen:<br />

Hogrefe.<br />

Kiese, C. & Kozielski, P. M. (1979). Aktiver Wortschatztest für<br />

3- bis 6-jährige Kinder (AWST). Weinheim: Beltz.<br />

Reynolds, C. R. (1989). Measurement and Statistical Problems<br />

in Neuropsychological Assessment of Children. In C. R.<br />

Reynolds & E. Fletcher-Janzen (Eds.), Handbook of Clinical<br />

Child Neuropsychology (pp. 147–166). New York:<br />

Plenum Press.<br />

Suchodoletz, W. v. (2004). Zur Prognose von Kindern mit umschriebenen<br />

Sprachentwicklungsstörungen. In W. von Suchodoletz<br />

(Hrsg.), Welche Chancen haben Kinder mit Entwicklungsstörungen?<br />

(S. 155–199). Göttingen: Hogrefe.<br />

Dr. Gerolf Renner<br />

DOI: 10.1026/0049-8637.38.3.146

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!