Testbesprechung - Testzentrale
Testbesprechung - Testzentrale
Testbesprechung - Testzentrale
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Sonderdruck aus: Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 38 (3), 146–148<br />
146 <strong>Testbesprechung</strong><br />
© Hogrefe Verlag Göttingen 2006<br />
Kiese-Himmel, C. (2005). AWST-R. Aktiver Wortschatztest<br />
für 3- bis 5-jährige Kinder – Revision. Göttingen:<br />
Beltz Test GmbH.<br />
Der Aufbau adäquater sprachlicher Kommunikationsleistungen<br />
stellt eine der wesentlichen Entwicklungsherausforderungen<br />
der ersten Lebensjahre dar. Allerdings zeigen<br />
epidemiologische Studien, dass bei einem nicht unerheblichen<br />
Anteil von Kindern Sprachentwicklungsverzögerungen<br />
oder -störungen bestehen, die sich nicht nur<br />
negativ auf die Kommunikationsfähigkeit auswirken, sondern<br />
auch zu sozialen und emotionalen Folgeproblemen<br />
und Lernstörungen führen können (z.B. Suchodoletz,<br />
2004). Die Notwendigkeit einer rechtzeitigen Intervention<br />
bei Sprachentwicklungsstörungen ist unstrittig. Die Indikationsstellung<br />
im Einzelfall kann jedoch nur gelingen,<br />
wenn zuverlässige diagnostische Instrumente zur Erfassung<br />
der zentralen Dimensionen des Spracherwerbs<br />
(pragmatische, morphologisch-syntaktische, semantischlexikalische<br />
und phonetisch-phonologische Ebene) zur<br />
Verfügung stehen. Der AWST-R will als Entwicklungstest<br />
zur Erfassung des aktiven Wortschatzes bei 3;0 bis 5;5jährigen<br />
Kindern zu einer gründlichen Diagnostik der sprachlichen<br />
Entwicklung beitragen.<br />
Theoretischer Hintergrund<br />
Im Theorieteil des Manuals erhält der Testanwender Informationen<br />
über die Bedeutung und Differenzierung von<br />
Wortkategorien sowie die Entwicklung des Wortschatzes<br />
und der Wortbedeutung. Worte als „Grundeinheit der<br />
Sprache“, als „Bausteine, um eine sprachliche Äußerung<br />
zu tätigen“ (Manual, S. 12) haben unstrittig eine besondere<br />
Bedeutung für die Entwicklung der Kommunikationsfähigkeit.<br />
Ohne ein umfassendes, im Langzeitgedächtnis<br />
repräsentiertes mentales Lexikon kann weder eine adäquate<br />
sprachliche Ausdrucksfähigkeit erreicht werden, noch<br />
können die sprachlichen Äußerungen anderer Menschen<br />
verstanden werden. Die frühe Wortschatzentwicklung ist<br />
zudem ein wichtiger Prädiktor für den späteren Sprachentwicklungsstand<br />
und somit bedeutsam für die Selektion zur<br />
sprachlichen Frühförderung, für die Indikationsstellung<br />
zur Sprachtherapie und für die Therapieevaluation.<br />
Bilderbenennen erscheint intuitiv als adäquater Zugang<br />
zur Erfassung des Wortschatzes. Eine kritische Auseinandersetzung<br />
mit alternativen Herangehensweisen –<br />
z.B. aktives Erklären und Definieren von dargebotenen<br />
Begriffen, wie im Subtest „Wortschatz“ des Hannover-<br />
Wechsler-Intelligenztests für das Vorschulalter (Eggert<br />
& Schuck, 1975) oder im Subtest „Wörter Erklären“ des<br />
<strong>Testbesprechung</strong><br />
Wiener Entwicklungstests (Kastner-Koller & Deimann,<br />
2002) – findet sich im Manual leider nicht.<br />
Testaufbau, Material und Durchführung<br />
Der Testkoffer enthält das Manual (112 Seiten), zwei Spiralhefte<br />
mit insgesamt 81 Bildvorlagen sowie jeweils zehn<br />
Test- und Auswertungsprotokolle. Der AWST-R kann bei<br />
Kindern im Alter von 3;0 bis 5;5 Jahren eingesetzt werden.<br />
Die Zeit für die Durchführung beträgt nach Angaben der<br />
Testautorin 15–20 Minuten, ein auch nach eigenen Erfahrungen<br />
realistischer Wert.<br />
Im Gegensatz zur Vorläuferversion, dem Aktiven<br />
Wortschatztest für drei- bis sechsjährige Kinder AWST<br />
(Kiese & Kozielski, 1979), verwendet der AWST-R als<br />
Testmaterial durchgehend ansprechend gestaltete Farbfotografien.<br />
51 Items zeigen Gegenstände (substantivischer<br />
Wortschatz), z.B. ein Blatt, einen Pinsel, einen Liegestuhl,<br />
ein T-Shirt. 24 Items beziehen sich auf Tätigkeiten<br />
(Verb-Wortschatz), z.B. bügeln, stricken, telefonieren,<br />
kneifen. Bei der Testentwicklung wurde besonderer Wert<br />
darauf gelegt, unterschiedliche semantische Felder zu berücksichtigen<br />
und Begriffe aus dem „lebensnahen Wortschatz“<br />
der Kinder (Manual, S. 20) zu wählen. Bei der Auswahl<br />
stützte sich die Autorin u. a. auf Erfahrungen mit dem<br />
AWST, aktuelle Forschungsergebnisse zur Wortschatzentwicklung<br />
bei deutschsprachigen Kindern und detailliert<br />
dargestellte Pilotstudien.<br />
Der AWST-R wird stets im Einzelsetting in einem<br />
Durchgang ohne Zeitbegrenzung durchgeführt. Die Bildvorlagen<br />
werden den Kindern sukzessive mit der Aufforderung<br />
„Was ist das?“ (bei Substantiven) oder „Was<br />
macht die/der?“ (bei Verben) präsentiert. Es werden stets<br />
alle Bildkarten dargeboten. Auf die vollständige Durchführung<br />
wird nur verzichtet, wenn keines der ersten zehn<br />
Items korrekt gelöst wird. Die Aufgaben sind nach der<br />
Itemschwierigkeit geordnet. Um das Kind mit den Anforderungen<br />
vertraut zu machen, beginnt die Testung mit fünf<br />
„Eisbrecher“ genannten Items, die nicht in die quantitative<br />
Testauswertung eingehen. Ein weiteres leicht lösbares<br />
und nicht gewertetes Item beschließt den Test.<br />
Parallel- oder Kurzformen liegen nicht vor. Allgemeine<br />
Hinweise zur Testung und zu möglichen Störfaktoren,<br />
wörtliche Testanweisungen, ggf. erforderliche Nachfragen<br />
und weitere Erläuterungen sind im Manual hinreichend<br />
detailliert dargestellt. Die Durchführung des<br />
AWST-R kann zügig erlernt werden.<br />
Der Testbogen ist übersichtlich gegliedert. Die Protokollierung<br />
erfolgt in zwei Spalten für Spontanantworten
und Antworten auf Nachfrage und erlaubt eine (nicht normierte)<br />
Aufschlüsselung der Lösungen für Verben und<br />
Substantive. Außerdem kann unaufwändig vermerkt werden,<br />
ob das Kind verzögert (> 10 Sekunden) geantwortet<br />
hat. Die Bewertung der einzelnen Items wird dem geübten<br />
Anwender schon während der Testdurchführung gelingen,<br />
eine nachträgliche Bewertung ist auf Grund der geforderten<br />
genauen Protokollierung problemlos möglich.<br />
Das achtseitige Auswertungsprotokoll wird für die qualitative<br />
Auswertung benötigt, bei der die Antworten des<br />
Kindes nach semantischen Feldern und zahlreichen Fehlermerkmalen<br />
(z.B. nonverbale Antworten, Perseverationen,<br />
funktionale Umschreibungen, Wortneubildungen)<br />
kategorisiert werden können. Ob die qualitative Auswertung<br />
– wie in den ausführlich dargestellten Fallbeispielen<br />
impliziert – tatsächlich als Grundlage für differenzierte<br />
Therapievorschläge dienen sollte, kann angesichts fehlender<br />
Angaben zu allen Gütekriterien bezweifelt werden.<br />
Testanalyse und Normierung<br />
Auf Grund der exakten Testinstruktion, der weitgehend<br />
unkomplizierten Handhabung und standardisierten Reizdarbietung<br />
ist die Durchführungsobjektivität bei kooperativen<br />
Kindern gesichert. Die Auswertungsobjektivität<br />
erscheint – auch wenn keine empirischen Daten berichtet<br />
werden – ebenfalls unproblematisch. Übersichtliche Tabellen<br />
zeigen Musterlösungen und Fehlerbeispiele, allgemeine<br />
Bewertungskriterien werden im Manual ausführlich<br />
erläutert. Die Interpretationsobjektivität ist nur für die<br />
quantitative Auswertung durch den Bezug auf Normwerte<br />
gesichert.<br />
Als Reliabilitätskennwert wird für eine Stichprobe<br />
von 113 Kindern die Testhalbierungsreliabilität mit r tt = .86<br />
angegeben. Dieser Wert bezieht sich nur auf die Gesamtstichprobe,<br />
so dass eine Überschätzung der Reliabilität<br />
(s. Reynolds, 1989) denkbar wäre. Allerdings liegen die<br />
Angaben zur internen Konsistenz (Kuder-Richardson) für<br />
drei Altersgruppen der gleichen Stichprobe (r tt .80 bis .86)<br />
und fünf Altersgruppen in der Normstichprobe (r tt .85 bis<br />
.89) ebenfalls in einem für Entwicklungstests voll zufriedenstellenden<br />
Bereich. Die Retestreliabilität wurde<br />
nur an einer sehr kleinen Stichprobe (N = 19) über einen<br />
Zeitraum von 10 bis 14 Tagen mit r tt = .87 bestimmt, wobei<br />
nicht eindeutig zu erkennen ist, ob Testrohwerte (anfällig<br />
für Reliabilitätsüberschätzungen bei altersinhomogenen<br />
Stichproben, s.o.) oder Standardwerte korreliert wurden.<br />
Die Itemschwierigkeiten zeigen mit Werten zwischen<br />
.08 und .95 für die Gesamtstichprobe eine gute Verteilung,<br />
für die einzelnen Altersgruppen werden keine Angaben<br />
gemacht. Die Trennschärfe der Items liegt zwischen .25<br />
und .66 (Mittelwert .44). Der Gesamttestwert ist bei den<br />
älteren Kindern rechtssteil verteilt, zeigt aber keine kritischen<br />
Boden- oder Deckeneffekte.<br />
Die inhaltliche Validität des Verfahrens ist durch die<br />
sorgfältige Itemauswahl sowie den Bezug auf die relevante<br />
Theorienbildung und Forschung gut gesichert. Die<br />
<strong>Testbesprechung</strong><br />
147<br />
Testrohwerte zeigen – wie von einem Entwicklungstest zu<br />
fordern – einen engen Zusammenhang mit dem Lebensalter<br />
(r = .65 in der Normstichprobe).<br />
Empirische Untersuchungen zur konvergenten Validität<br />
wurden an unterschiedlich großen Substichproben<br />
(N zwischen 71 und 99) einer Gruppe von 113 deutschsprachigen<br />
Kindern durchgeführt. Der AWST-R Gesamtpunktwert<br />
korreliert demnach mit .41 (Rangkorrelationskoeffizient<br />
rho) mit einer globalen Einschätzung des Wortschatzes<br />
durch Kindergartenerzieherinnen. Als weitere<br />
sprachbezogene Validitätskriterien werden Korrelationen<br />
zu den Untertests „Sätze ergänzen“ (verbale Analogienbildung;<br />
r tc = .78) und „Wörter ergänzen“ (Erkennen akustisch<br />
unvollständig dargebotener Wörter; r tc = .58) des<br />
Psycholinguistischen Entwicklungstests PET (Angermaier,<br />
1977) angegeben. Der Zusammenhang zu anderen<br />
Wortschatztests oder Überprüfungen komplexerer<br />
sprachlicher Intelligenzleistungen wurde nicht empirisch<br />
untersucht. Bei einer nach Alter und Geschlecht parallelisierten<br />
Stichprobe von Kindern mit und ohne Sprachentwicklungsstörungen<br />
wurden die erwarteten besseren<br />
Testleistungen bei sprachlich unauffälligen Kindern gefunden.<br />
Als weitere Validitätsstudie wird ein Vergleich<br />
von monolingual und bilingual aufwachsenden Kindern<br />
berichtet. Die Annahme einer langsameren Entwicklung<br />
des Wortschatzes bei gleichzeitigem Erwerb von zwei<br />
Sprachen wird durch signifikant bessere AWST-R Ergebnisse<br />
der monolingualen Kinder gestützt.<br />
Im Kapitel zur Validität finden sich außerdem noch verschiedene<br />
deskriptive Daten, u.a. Vergleiche der Leistungen<br />
von Stadt- und Landkindern, Interkorrelationen der<br />
semantischen Kategorien und eine Darstellung der Altersentwicklung<br />
in den semantischen Kategorien.<br />
Normen (Prozentränge) werden in übersichtlichen Tabellen<br />
für fünf Altersgruppen, die jeweils sechs Monate<br />
umfassen, bereitgestellt. Da die Testautorin selbst der<br />
alternativen Skalierung in T-Werten die größere Brauchbarkeit<br />
zuspricht (Manual S. 64), überrascht, dass T-Werte<br />
nur über eine Transformationstabelle zugänglich sind.<br />
Die Berechnung von Konfidenzintervallen bleibt leider<br />
dem Anwender überlassen und ist unnötig umständlich,<br />
da erst Prozentränge in T-Werte umgewandelt werden<br />
müssen, ehe die Berechnung anhand der im Manual angegebenen<br />
Standardmessfehler erfolgen kann.<br />
Die Normierung erfolgte von Februar 2003 bis Oktober<br />
2004 an 551 „sinnesgesunden und vermeintlich normal<br />
begabten Kindern“ (Manual, S. 62) aus zehn Bundesländern.<br />
45% der Kinder stammen aus Niedersachsen. Das<br />
Manual lässt nicht erkennen, auf Grund welcher Kriterien<br />
die vermeintliche Normalbegabung festgestellt wurde und<br />
wie viele Kinder wegen kognitiver Retardierungen oder<br />
anderer Gründe von der Normierung ausgeschlossen wurden.<br />
Nähere Angaben zur Stichprobenrekrutierung und<br />
drop-outs werden nicht gemacht, ebenso fehlen Hinweise<br />
zur Qualitätssicherung der Normierung (z.B. Qualifikation,<br />
Schulung und Kontrolle der Testleiter). In den<br />
Altersgruppen liegt die Stichprobengröße zwischen 69<br />
(3;0–3;5 Jahre) und 124 (4;6–4;11 Jahre), bei einem ausge-
148 <strong>Testbesprechung</strong><br />
wogenen Verhältnis von Jungen und Mädchen. Die Normstichprobe<br />
wird nach Geschlecht, Alter und regionaler<br />
Herkunft beschrieben. Zu anderen demographischen oder<br />
sozialen Variablen werden keine statistischen Angaben<br />
gemacht.<br />
Plus/Minus<br />
Mit dem AWST-R liegt eine weitgehend gelungene Neubearbeitung<br />
eines Entwicklungstests zur Erfassung expressiver<br />
Sprachleistungen bei Kindern vor. Die vom<br />
AWST-R abgedeckte Altersspanne ist für die Indikationsstellung<br />
sprachtherapeutischer Interventionen besonders<br />
bedeutsam, wobei der Testeinsatz unmittelbar vor den<br />
üblichen Einschulungsterminen leider nicht mehr möglich<br />
ist. Das Testmaterial ist ansprechend und kindgerecht. Der<br />
Anspruch, die Testitems aus dem alltäglichen Wortschatz<br />
der Kinder zu entnehmen, ist erfüllt worden. Durch die<br />
Verwendung vielfältiger semantischer Felder ist die Gefahr<br />
einer Ergebnisverzerrung durch bereichsspezifische<br />
Leistungsstärken oder -defizite gering. Die Bedeutung<br />
einer aktuellen Normierung versteht sich von selbst. Die<br />
Testung kann objektiv und reliabel erfolgen. Als Bilderbenennungstest<br />
ist der AWST-R im deutschen Sprachraum<br />
konkurrenzlos.<br />
Allerdings sind auch kritische Punkte zu nennen. Die<br />
Normstichprobe ist zwar hinreichend groß, aber ungenau<br />
beschrieben. Bei der bekannten Abhängigkeit der Wortschatzentwicklung<br />
von der sprachlichen Anregung im<br />
Umfeld des Kindes wären Angaben über Bildungsstand<br />
und sozioökonomischen Status der Eltern sehr wichtig,<br />
um die Repräsentativität der Stichprobe beurteilen zu können.<br />
Ebenso vermissen wir Angaben über den Anteil an<br />
mehrsprachig aufwachsenden Kindern und eine präzise<br />
Darstellung der Ausschlusskriterien.<br />
Für einen eindimensionalen Entwicklungstest ohne<br />
jegliche Variation der Aufgabenstellung ist die Durchführungszeit<br />
mit 15–20 Minuten eher hoch. Nach eigenen Erfahrungen<br />
wird der AWST-R dennoch gut akzeptiert.<br />
Allerdings kann bei leistungs- und aufmerksamkeitsschwachen<br />
Kindern im Testverlauf die Motivation abbauen.<br />
Bei einem Mittelwert von knapp 31 gelösten Items in<br />
der jüngsten Normgruppe (3;0–3;5 Jahre) werden diese<br />
Kinder durchschnittlich mit 44 Items konfrontiert, die sie<br />
nicht lösen können. Bei einem Prozentrang von 10 werden<br />
sogar 60 der 75 Items nicht bewältigt. Für den Einsatz bei<br />
jüngeren stark sprachentwicklungsverzögerten Kindern<br />
wäre daher die Entwicklung einer Kurzform oder die – anhand<br />
der Normierungsdaten vermutlich auch empirisch<br />
begründbare – Definition von Abbruchkriterien sinnvoll.<br />
Auf die Notwendigkeit weiterer Validitätsstudien weist<br />
die Testautorin selbst hin, ohne näher über derzeit laufende<br />
oder geplante Forschungsarbeiten zu informieren. Zu<br />
wünschen sind Studien zur konvergenten Validität mit<br />
Sprachtests, die auch komplexere Ausdrucks- und Verständnisleistungen<br />
erfassen (z.B. bieten sich hier die Subtests<br />
„Wörter erklären“ und „Quiz“ aus dem Wiener Entwicklungstest<br />
an). Außerdem wären ergänzende Studien<br />
zur Testwiederholungszuverlässigkeit und insbesondere<br />
zur prognostischen Validität wünschenswert.<br />
Als Anregung für künftige Weiterentwicklungen sei<br />
darauf hingewiesen, dass im deutschen Sprachraum weiterhin<br />
– mit Ausnahme des nur im dritten Lebensjahr einsetzbaren<br />
Sprachentwicklungstests für zweijährige Kinder<br />
SETK-2 (Grimm, 2000) – kein aktuell normierter Wortschatztest<br />
existiert, der verschiedene Erfassungsmodi<br />
(z.B. aktiver und passiver Wortschatz) in einem Verfahren<br />
vereint. Gerade die Kontrastierung von konormierten<br />
expressiven und rezeptiven Sprachleistungen wäre für<br />
die klinische Untersuchung sprachentwicklungsgestörter<br />
Kinder sehr hilfreich.<br />
Literatur<br />
Angermaier, M. (1977). Psycholinguistischer Entwicklungstest<br />
(PET) (2., korrig. Aufl.). Weinheim: Beltz.<br />
Eggert, D. & Schuck, K. D. (1975). Hannover-Wechsler-Intelligenztest<br />
für das Vorschulalter (HAWIVA). Bern: Huber.<br />
Grimm, H. (2000). Sprachentwicklungstest für zweijährige Kinder<br />
(SETK-2). Göttingen: Hogrefe.<br />
Kastner-Koller, U. & Deimann, P. (2002). Wiener Entwicklungstest<br />
(WET) (2., überarb. u. neu norm. Aufl.). Göttingen:<br />
Hogrefe.<br />
Kiese, C. & Kozielski, P. M. (1979). Aktiver Wortschatztest für<br />
3- bis 6-jährige Kinder (AWST). Weinheim: Beltz.<br />
Reynolds, C. R. (1989). Measurement and Statistical Problems<br />
in Neuropsychological Assessment of Children. In C. R.<br />
Reynolds & E. Fletcher-Janzen (Eds.), Handbook of Clinical<br />
Child Neuropsychology (pp. 147–166). New York:<br />
Plenum Press.<br />
Suchodoletz, W. v. (2004). Zur Prognose von Kindern mit umschriebenen<br />
Sprachentwicklungsstörungen. In W. von Suchodoletz<br />
(Hrsg.), Welche Chancen haben Kinder mit Entwicklungsstörungen?<br />
(S. 155–199). Göttingen: Hogrefe.<br />
Dr. Gerolf Renner<br />
DOI: 10.1026/0049-8637.38.3.146