Testbesprechung - Testzentrale

Sonderdruck aus: Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 38 (3), 146–148 

146 Testbesprechung 

© Hogrefe Verlag Göttingen 2006 

Kiese-Himmel, C. (2005). AWST-R. Aktiver Wortschatztest 

für 3- bis 5-jährige Kinder – Revision. Göttingen: 

Beltz Test GmbH. 

Der Aufbau adäquater sprachlicher Kommunikationsleistungen 

stellt eine der wesentlichen Entwicklungsherausforderungen 

der ersten Lebensjahre dar. Allerdings zeigen 

epidemiologische Studien, dass bei einem nicht unerheblichen 

Anteil von Kindern Sprachentwicklungsverzögerungen 

oder -störungen bestehen, die sich nicht nur 

negativ auf die Kommunikationsfähigkeit auswirken, sondern 

auch zu sozialen und emotionalen Folgeproblemen 

und Lernstörungen führen können (z.B. Suchodoletz, 

2004). Die Notwendigkeit einer rechtzeitigen Intervention 

bei Sprachentwicklungsstörungen ist unstrittig. Die Indikationsstellung 

im Einzelfall kann jedoch nur gelingen, 

wenn zuverlässige diagnostische Instrumente zur Erfassung 

der zentralen Dimensionen des Spracherwerbs 

(pragmatische, morphologisch-syntaktische, semantischlexikalische 

und phonetisch-phonologische Ebene) zur 

Verfügung stehen. Der AWST-R will als Entwicklungstest 

zur Erfassung des aktiven Wortschatzes bei 3;0 bis 5;5jährigen 

Kindern zu einer gründlichen Diagnostik der sprachlichen 

Entwicklung beitragen. 

Theoretischer Hintergrund 

Im Theorieteil des Manuals erhält der Testanwender Informationen 

über die Bedeutung und Differenzierung von 

Wortkategorien sowie die Entwicklung des Wortschatzes 

und der Wortbedeutung. Worte als „Grundeinheit der 

Sprache“, als „Bausteine, um eine sprachliche Äußerung 

zu tätigen“ (Manual, S. 12) haben unstrittig eine besondere 

Bedeutung für die Entwicklung der Kommunikationsfähigkeit. 

Ohne ein umfassendes, im Langzeitgedächtnis 

repräsentiertes mentales Lexikon kann weder eine adäquate 

sprachliche Ausdrucksfähigkeit erreicht werden, noch 

können die sprachlichen Äußerungen anderer Menschen 

verstanden werden. Die frühe Wortschatzentwicklung ist 

zudem ein wichtiger Prädiktor für den späteren Sprachentwicklungsstand 

und somit bedeutsam für die Selektion zur 

sprachlichen Frühförderung, für die Indikationsstellung 

zur Sprachtherapie und für die Therapieevaluation. 

Bilderbenennen erscheint intuitiv als adäquater Zugang 

zur Erfassung des Wortschatzes. Eine kritische Auseinandersetzung 

mit alternativen Herangehensweisen – 

z.B. aktives Erklären und Definieren von dargebotenen 

Begriffen, wie im Subtest „Wortschatz“ des Hannover- 

Wechsler-Intelligenztests für das Vorschulalter (Eggert 

& Schuck, 1975) oder im Subtest „Wörter Erklären“ des 

Testbesprechung 

Wiener Entwicklungstests (Kastner-Koller & Deimann, 

2002) – findet sich im Manual leider nicht. 

Testaufbau, Material und Durchführung 

Der Testkoffer enthält das Manual (112 Seiten), zwei Spiralhefte 

mit insgesamt 81 Bildvorlagen sowie jeweils zehn 

Test- und Auswertungsprotokolle. Der AWST-R kann bei 

Kindern im Alter von 3;0 bis 5;5 Jahren eingesetzt werden. 

Die Zeit für die Durchführung beträgt nach Angaben der 

Testautorin 15–20 Minuten, ein auch nach eigenen Erfahrungen 

realistischer Wert. 

Im Gegensatz zur Vorläuferversion, dem Aktiven 

Wortschatztest für drei- bis sechsjährige Kinder AWST 

(Kiese & Kozielski, 1979), verwendet der AWST-R als 

Testmaterial durchgehend ansprechend gestaltete Farbfotografien. 

51 Items zeigen Gegenstände (substantivischer 

Wortschatz), z.B. ein Blatt, einen Pinsel, einen Liegestuhl, 

ein T-Shirt. 24 Items beziehen sich auf Tätigkeiten 

(Verb-Wortschatz), z.B. bügeln, stricken, telefonieren, 

kneifen. Bei der Testentwicklung wurde besonderer Wert 

darauf gelegt, unterschiedliche semantische Felder zu berücksichtigen 

und Begriffe aus dem „lebensnahen Wortschatz“ 

der Kinder (Manual, S. 20) zu wählen. Bei der Auswahl 

stützte sich die Autorin u. a. auf Erfahrungen mit dem 

AWST, aktuelle Forschungsergebnisse zur Wortschatzentwicklung 

bei deutschsprachigen Kindern und detailliert 

dargestellte Pilotstudien. 

Der AWST-R wird stets im Einzelsetting in einem 

Durchgang ohne Zeitbegrenzung durchgeführt. Die Bildvorlagen 

werden den Kindern sukzessive mit der Aufforderung 

„Was ist das?“ (bei Substantiven) oder „Was 

macht die/der?“ (bei Verben) präsentiert. Es werden stets 

alle Bildkarten dargeboten. Auf die vollständige Durchführung 

wird nur verzichtet, wenn keines der ersten zehn 

Items korrekt gelöst wird. Die Aufgaben sind nach der 

Itemschwierigkeit geordnet. Um das Kind mit den Anforderungen 

vertraut zu machen, beginnt die Testung mit fünf 

„Eisbrecher“ genannten Items, die nicht in die quantitative 

Testauswertung eingehen. Ein weiteres leicht lösbares 

und nicht gewertetes Item beschließt den Test. 

Parallel- oder Kurzformen liegen nicht vor. Allgemeine 

Hinweise zur Testung und zu möglichen Störfaktoren, 

wörtliche Testanweisungen, ggf. erforderliche Nachfragen 

und weitere Erläuterungen sind im Manual hinreichend 

detailliert dargestellt. Die Durchführung des 

AWST-R kann zügig erlernt werden. 

Der Testbogen ist übersichtlich gegliedert. Die Protokollierung 

erfolgt in zwei Spalten für Spontanantworten

und Antworten auf Nachfrage und erlaubt eine (nicht normierte) 

Aufschlüsselung der Lösungen für Verben und 

Substantive. Außerdem kann unaufwändig vermerkt werden, 

ob das Kind verzögert (> 10 Sekunden) geantwortet 

hat. Die Bewertung der einzelnen Items wird dem geübten 

Anwender schon während der Testdurchführung gelingen, 

eine nachträgliche Bewertung ist auf Grund der geforderten 

genauen Protokollierung problemlos möglich. 

Das achtseitige Auswertungsprotokoll wird für die qualitative 

Auswertung benötigt, bei der die Antworten des 

Kindes nach semantischen Feldern und zahlreichen Fehlermerkmalen 

(z.B. nonverbale Antworten, Perseverationen, 

funktionale Umschreibungen, Wortneubildungen) 

kategorisiert werden können. Ob die qualitative Auswertung 

– wie in den ausführlich dargestellten Fallbeispielen 

impliziert – tatsächlich als Grundlage für differenzierte 

Therapievorschläge dienen sollte, kann angesichts fehlender 

Angaben zu allen Gütekriterien bezweifelt werden. 

Testanalyse und Normierung 

Auf Grund der exakten Testinstruktion, der weitgehend 

unkomplizierten Handhabung und standardisierten Reizdarbietung 

ist die Durchführungsobjektivität bei kooperativen 

Kindern gesichert. Die Auswertungsobjektivität 

erscheint – auch wenn keine empirischen Daten berichtet 

werden – ebenfalls unproblematisch. Übersichtliche Tabellen 

zeigen Musterlösungen und Fehlerbeispiele, allgemeine 

Bewertungskriterien werden im Manual ausführlich 

erläutert. Die Interpretationsobjektivität ist nur für die 

quantitative Auswertung durch den Bezug auf Normwerte 

gesichert. 

Als Reliabilitätskennwert wird für eine Stichprobe 

von 113 Kindern die Testhalbierungsreliabilität mit r tt = .86 

angegeben. Dieser Wert bezieht sich nur auf die Gesamtstichprobe, 

so dass eine Überschätzung der Reliabilität 

(s. Reynolds, 1989) denkbar wäre. Allerdings liegen die 

Angaben zur internen Konsistenz (Kuder-Richardson) für 

drei Altersgruppen der gleichen Stichprobe (r tt .80 bis .86) 

und fünf Altersgruppen in der Normstichprobe (r tt .85 bis 

.89) ebenfalls in einem für Entwicklungstests voll zufriedenstellenden 

Bereich. Die Retestreliabilität wurde 

nur an einer sehr kleinen Stichprobe (N = 19) über einen 

Zeitraum von 10 bis 14 Tagen mit r tt = .87 bestimmt, wobei 

nicht eindeutig zu erkennen ist, ob Testrohwerte (anfällig 

für Reliabilitätsüberschätzungen bei altersinhomogenen 

Stichproben, s.o.) oder Standardwerte korreliert wurden. 

Die Itemschwierigkeiten zeigen mit Werten zwischen 

.08 und .95 für die Gesamtstichprobe eine gute Verteilung, 

für die einzelnen Altersgruppen werden keine Angaben 

gemacht. Die Trennschärfe der Items liegt zwischen .25 

und .66 (Mittelwert .44). Der Gesamttestwert ist bei den 

älteren Kindern rechtssteil verteilt, zeigt aber keine kritischen 

Boden- oder Deckeneffekte. 

Die inhaltliche Validität des Verfahrens ist durch die 

sorgfältige Itemauswahl sowie den Bezug auf die relevante 

Theorienbildung und Forschung gut gesichert. Die 

Testbesprechung 

147 

Testrohwerte zeigen – wie von einem Entwicklungstest zu 

fordern – einen engen Zusammenhang mit dem Lebensalter 

(r = .65 in der Normstichprobe). 

Empirische Untersuchungen zur konvergenten Validität 

wurden an unterschiedlich großen Substichproben 

(N zwischen 71 und 99) einer Gruppe von 113 deutschsprachigen 

Kindern durchgeführt. Der AWST-R Gesamtpunktwert 

korreliert demnach mit .41 (Rangkorrelationskoeffizient 

rho) mit einer globalen Einschätzung des Wortschatzes 

durch Kindergartenerzieherinnen. Als weitere 

sprachbezogene Validitätskriterien werden Korrelationen 

zu den Untertests „Sätze ergänzen“ (verbale Analogienbildung; 

r tc = .78) und „Wörter ergänzen“ (Erkennen akustisch 

unvollständig dargebotener Wörter; r tc = .58) des 

Psycholinguistischen Entwicklungstests PET (Angermaier, 

1977) angegeben. Der Zusammenhang zu anderen 

Wortschatztests oder Überprüfungen komplexerer 

sprachlicher Intelligenzleistungen wurde nicht empirisch 

untersucht. Bei einer nach Alter und Geschlecht parallelisierten 

Stichprobe von Kindern mit und ohne Sprachentwicklungsstörungen 

wurden die erwarteten besseren 

Testleistungen bei sprachlich unauffälligen Kindern gefunden. 

Als weitere Validitätsstudie wird ein Vergleich 

von monolingual und bilingual aufwachsenden Kindern 

berichtet. Die Annahme einer langsameren Entwicklung 

des Wortschatzes bei gleichzeitigem Erwerb von zwei 

Sprachen wird durch signifikant bessere AWST-R Ergebnisse 

der monolingualen Kinder gestützt. 

Im Kapitel zur Validität finden sich außerdem noch verschiedene 

deskriptive Daten, u.a. Vergleiche der Leistungen 

von Stadt- und Landkindern, Interkorrelationen der 

semantischen Kategorien und eine Darstellung der Altersentwicklung 

in den semantischen Kategorien. 

Normen (Prozentränge) werden in übersichtlichen Tabellen 

für fünf Altersgruppen, die jeweils sechs Monate 

umfassen, bereitgestellt. Da die Testautorin selbst der 

alternativen Skalierung in T-Werten die größere Brauchbarkeit 

zuspricht (Manual S. 64), überrascht, dass T-Werte 

nur über eine Transformationstabelle zugänglich sind. 

Die Berechnung von Konfidenzintervallen bleibt leider 

dem Anwender überlassen und ist unnötig umständlich, 

da erst Prozentränge in T-Werte umgewandelt werden 

müssen, ehe die Berechnung anhand der im Manual angegebenen 

Standardmessfehler erfolgen kann. 

Die Normierung erfolgte von Februar 2003 bis Oktober 

2004 an 551 „sinnesgesunden und vermeintlich normal 

begabten Kindern“ (Manual, S. 62) aus zehn Bundesländern. 

45% der Kinder stammen aus Niedersachsen. Das 

Manual lässt nicht erkennen, auf Grund welcher Kriterien 

die vermeintliche Normalbegabung festgestellt wurde und 

wie viele Kinder wegen kognitiver Retardierungen oder 

anderer Gründe von der Normierung ausgeschlossen wurden. 

Nähere Angaben zur Stichprobenrekrutierung und 

drop-outs werden nicht gemacht, ebenso fehlen Hinweise 

zur Qualitätssicherung der Normierung (z.B. Qualifikation, 

Schulung und Kontrolle der Testleiter). In den 

Altersgruppen liegt die Stichprobengröße zwischen 69 

(3;0–3;5 Jahre) und 124 (4;6–4;11 Jahre), bei einem ausge-

148 Testbesprechung 

wogenen Verhältnis von Jungen und Mädchen. Die Normstichprobe 

wird nach Geschlecht, Alter und regionaler 

Herkunft beschrieben. Zu anderen demographischen oder 

sozialen Variablen werden keine statistischen Angaben 

gemacht. 

Plus/Minus 

Mit dem AWST-R liegt eine weitgehend gelungene Neubearbeitung 

eines Entwicklungstests zur Erfassung expressiver 

Sprachleistungen bei Kindern vor. Die vom 

AWST-R abgedeckte Altersspanne ist für die Indikationsstellung 

sprachtherapeutischer Interventionen besonders 

bedeutsam, wobei der Testeinsatz unmittelbar vor den 

üblichen Einschulungsterminen leider nicht mehr möglich 

ist. Das Testmaterial ist ansprechend und kindgerecht. Der 

Anspruch, die Testitems aus dem alltäglichen Wortschatz 

der Kinder zu entnehmen, ist erfüllt worden. Durch die 

Verwendung vielfältiger semantischer Felder ist die Gefahr 

einer Ergebnisverzerrung durch bereichsspezifische 

Leistungsstärken oder -defizite gering. Die Bedeutung 

einer aktuellen Normierung versteht sich von selbst. Die 

Testung kann objektiv und reliabel erfolgen. Als Bilderbenennungstest 

ist der AWST-R im deutschen Sprachraum 

konkurrenzlos. 

Allerdings sind auch kritische Punkte zu nennen. Die 

Normstichprobe ist zwar hinreichend groß, aber ungenau 

beschrieben. Bei der bekannten Abhängigkeit der Wortschatzentwicklung 

von der sprachlichen Anregung im 

Umfeld des Kindes wären Angaben über Bildungsstand 

und sozioökonomischen Status der Eltern sehr wichtig, 

um die Repräsentativität der Stichprobe beurteilen zu können. 

Ebenso vermissen wir Angaben über den Anteil an 

mehrsprachig aufwachsenden Kindern und eine präzise 

Darstellung der Ausschlusskriterien. 

Für einen eindimensionalen Entwicklungstest ohne 

jegliche Variation der Aufgabenstellung ist die Durchführungszeit 

mit 15–20 Minuten eher hoch. Nach eigenen Erfahrungen 

wird der AWST-R dennoch gut akzeptiert. 

Allerdings kann bei leistungs- und aufmerksamkeitsschwachen 

Kindern im Testverlauf die Motivation abbauen. 

Bei einem Mittelwert von knapp 31 gelösten Items in 

der jüngsten Normgruppe (3;0–3;5 Jahre) werden diese 

Kinder durchschnittlich mit 44 Items konfrontiert, die sie 

nicht lösen können. Bei einem Prozentrang von 10 werden 

sogar 60 der 75 Items nicht bewältigt. Für den Einsatz bei 

jüngeren stark sprachentwicklungsverzögerten Kindern 

wäre daher die Entwicklung einer Kurzform oder die – anhand 

der Normierungsdaten vermutlich auch empirisch 

begründbare – Definition von Abbruchkriterien sinnvoll. 

Auf die Notwendigkeit weiterer Validitätsstudien weist 

die Testautorin selbst hin, ohne näher über derzeit laufende 

oder geplante Forschungsarbeiten zu informieren. Zu 

wünschen sind Studien zur konvergenten Validität mit 

Sprachtests, die auch komplexere Ausdrucks- und Verständnisleistungen 

erfassen (z.B. bieten sich hier die Subtests 

„Wörter erklären“ und „Quiz“ aus dem Wiener Entwicklungstest 

an). Außerdem wären ergänzende Studien 

zur Testwiederholungszuverlässigkeit und insbesondere 

zur prognostischen Validität wünschenswert. 

Als Anregung für künftige Weiterentwicklungen sei 

darauf hingewiesen, dass im deutschen Sprachraum weiterhin 

– mit Ausnahme des nur im dritten Lebensjahr einsetzbaren 

Sprachentwicklungstests für zweijährige Kinder 

SETK-2 (Grimm, 2000) – kein aktuell normierter Wortschatztest 

existiert, der verschiedene Erfassungsmodi 

(z.B. aktiver und passiver Wortschatz) in einem Verfahren 

vereint. Gerade die Kontrastierung von konormierten 

expressiven und rezeptiven Sprachleistungen wäre für 

die klinische Untersuchung sprachentwicklungsgestörter 

Kinder sehr hilfreich. 

Literatur 

Angermaier, M. (1977). Psycholinguistischer Entwicklungstest 

(PET) (2., korrig. Aufl.). Weinheim: Beltz. 

Eggert, D. & Schuck, K. D. (1975). Hannover-Wechsler-Intelligenztest 

für das Vorschulalter (HAWIVA). Bern: Huber. 

Grimm, H. (2000). Sprachentwicklungstest für zweijährige Kinder 

(SETK-2). Göttingen: Hogrefe. 

Kastner-Koller, U. & Deimann, P. (2002). Wiener Entwicklungstest 

(WET) (2., überarb. u. neu norm. Aufl.). Göttingen: 

Hogrefe. 

Kiese, C. & Kozielski, P. M. (1979). Aktiver Wortschatztest für 

3- bis 6-jährige Kinder (AWST). Weinheim: Beltz. 

Reynolds, C. R. (1989). Measurement and Statistical Problems 

in Neuropsychological Assessment of Children. In C. R. 

Reynolds & E. Fletcher-Janzen (Eds.), Handbook of Clinical 

Child Neuropsychology (pp. 147–166). New York: 

Plenum Press. 

Suchodoletz, W. v. (2004). Zur Prognose von Kindern mit umschriebenen 

Sprachentwicklungsstörungen. In W. von Suchodoletz 

(Hrsg.), Welche Chancen haben Kinder mit Entwicklungsstörungen? 

(S. 155–199). Göttingen: Hogrefe. 

Dr. Gerolf Renner 

DOI: 10.1026/0049-8637.38.3.146

Testbesprechung - Testzentrale

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?