Max, Mustermann - SCHUHFRIED GmbH

1.1 Die Leistungsuntersuchung mit dem Wiener Testsystem ................................................ 3 

1.1.1 Vorgabe der Verfahren .............................................................................................. 3 

1.1.2 Testergebnisse ......................................................................................................... 4 

1.1.3 Beurteilung des Ergebnisses der Leistungsuntersuchung (Report) ........................... 6 

1.2 Eingabemedien .............................................................................................................. 7 

1.3 Vernetzte Anlagen .......................................................................................................... 7 

2.1 Reaktionsfähigkeit .......................................................................................................... 8 

2.1.1 Reaktionstest (RT/S3) ............................................................................................... 8 

2.2 Konzentrationsleistung ..................................................................................................13 

2.2.1 (COG/S11) ...............................................................................................................13 

2.3 Orientierungsleistung .....................................................................................................19 

2.3.1 Linienverfolgungstest (LVT/S3) ................................................................................19 

2.4 Belastbarkeit ..................................................................................................................21 

2.4.1 Determinationstest (DT/S1) ......................................................................................21 

2.5 Aufmerksamkeitsleistung ...............................................................................................27 

2.5.1 Adaptiver Tachistoskopischer Verkehrsauffassungstest (ATAVT/S1) .......................27 

2.5.2 Äquivalenz von TAVTMB und ATAVT ......................................................................34

In Deutschland sind zur Eignungsuntersuchung für Bewerber und Inhaber der Fahrerlaubnis 

u.a. folgende Regelungen in Kraft (Bundesgesetzblatt Jahrgang 1998 Teil I Nr. 55 - 

Fahrerlaubnisverordnung-FeV nach Anlage 5): 

Anlage 5 Absatz 2: 

Bewerber um die Erteilung oder Verlängerung einer Fahrerlaubnis der Klassen D, D1, DE, 

D1E sowie eine Fahrerlaubnis zur Fahrgastbeförderung müssen besondere Anforderungen 

hinsichtlich: 

a) Belastbarkeit, 

b) Orientierungsleistung, 

c) Konzentrationsleistung, 

d) Aufmerksamkeitsleistung, 

e) Reaktionsfähigkeit 

erfüllen. 

Der Nachweis über die Erfüllung dieser Anforderungen ist durch Vorlage eines betriebs- oder 

arbeitsmedizinischen oder eines medizinisch-psychologischen Gutachtens zu erbringen. 

Die zur Untersuchung eingesetzten Verfahren müssen nach dem Stand der Wissenschaft 

standardisiert und unter Aspekten der Verkehrssicherheit validiert sein. Das Test-Set zur 

Leistungsuntersuchung nach FeV Anlage 5 Nr. 2 im Wiener Testsystem besteht aus fünf 

Tests, welche jeweils eine der geforderten Dimensionen abdeckt. Es handelt sich hierbei um 

eine fixe Testbatterie, die als Programmpaket verkauft wird. Zu jedem Test ist ausführliche 

wissenschaftliche Literatur vorhanden. 

Schuhfried blickt heute auf eine jahrzehntelange Tradition in der Verkehrseignungsdiagnostik 

zurück und ist mit dem Wiener Testsystem (WTS) weltweiter Marktführer in der 

computergestützten psychologischen Diagnostik. 

Um der Anforderungen nach wissenschaftlicher Aktualität der Testverfahren zu genügen, 

werden neben laufenden wissenschaftlichen Studien die Normen stets aktualisiert und 

psychometrische Weiterentwicklungen der Verfahren vorgenommen. 

Die Leistungsuntersuchung wird mit wenigen Programmschritten gestartet und kann 

besonders einfach vorgegeben werden. Eine übersichtliche und klar aufgebaute 

Administration macht die Anwendung angenehm und komfortabel. 

Nach Eingabe der Probandendaten kann sofort die Testbatterie gestartet werden. Die 

Vorgabe der Verfahren ist in über 20 verschiedenen Sprachen möglich. 

Wird die Landessprache der Testperson eingegeben, werden automatisch die einzelnen 

Tests in dieser Sprache vorgegeben. Die Sprache kann auch individuell definiert werden.

Nach der Eingabe der Probandendaten erfolgt eine standardisierte Instruktion zur Bedienung 

der Eingabemedien. Die Testverfahren zeichnen sich durch einen einheitlichen und klaren 

Aufbau aus. Instruktionen mit Lernschleifen sichern das Aufgabenverständnis bei den 

einzelnen Testverfahren. Akustische und visuelle Rückmeldungen in der Instruktions- und 

Lernphase gestalten die Testbearbeitung ökonomisch und zugleich motivierend. Die 

Testphase startet erst, wenn das Aufgabenverständnis sichergestellt ist. 

Nach Ende der Testung können die Ergebnisse in übersichtlicher Form ausgedruckt werden. 

Alle relevanten Ergebnisse werden übersichtlich in grafischer und numerischer Darstellung 

auf einer druckbaren Seite abgebildet.

Max, Mustermann 

geb. 01.01.1945, männlich, 67;4 Jahre, Bildungsgrad 3 

Auswertecode: 

Testdurchführung: 03.05.2012 

Profil: 

PR 

RT 

COG 

LVT 

DT 

ATAVT 

PR 

Reaktionsfähigkeit 

Konzentrationsleistung 

Orientierungsleistung 

Belastbarkeit 

Aufmerksamkeitsleistung 

0 20 40 60 80 100 

0 20 40 60 80 100 

Anmerkung(en): Der hervorgehobene Bereich zwischen 33 und 100 stellt den Sollbereich für die 

Testergebnisse dar. 

Testergebnisse: 

Testvariable Rohwert Parameter PR 1 

Reaktionsfähigkeit gemessen mit Reaktionstest (RT) 

Mittlere Reaktionszeit (msec) 444 44 

Richtig reagiert 15 

Falsch reagiert 0 

Konzentrationsleistung gemessen mit Cognitrone (COG) 

Mittlere Zeit "Korrekte Zurückweisung" (sec) 2.182 90 

Summe "Treffer" 24 

Summe "Korrekte Zurückweisung" 35 

Orientierungsleistung gemessen mit Linienverfolgungstest (LVT) 

Score 14 59 

Anzahl richtiger Antworten 17 

Belastbarkeit gemessen mit Determinationstest (DT) 

Richtige 243 59 

Falsche 2 

Ausgelassene 7 

Aufmerksamkeitsleistung gemessen mit Tachistoskopischem Verkehrsauffassungstest 

(ATAVT/TAVTMB) 

Überblicksgewinnung 11 1.856 94 

1 Der Prozentrang (PR) ergibt sich durch Vergleich mit der altersunabhängigen Normstichprobe. 

Diese Resultate dienen zur Beurteilung der Leistung nach Anlage 5 Nr. 2 FeV. 

Seriennummer der Untersuchungsstelle: 031662/01 

Abbildung 1: Ergebnisausdruck FEV Anlage 5/2

Diese Testergebnisse können zudem direkt in das Textverarbeitungsprogramm WinWord 

übertragen werden. Es muss nur die Schaltfläche „Befund“ angeklickt werden. 

Abbildung 2: Reportmuster 

Der Report schließt die Leistungsuntersuchung nach FeV Anlage 5 Nr. 2 ab. Die Gliederung 

dieses Befunds obliegt dem Diagnostiker, dennoch gleichen sich gewisse 

Gliederungselemente. 

Am Beginn jedes Reports stehen die Daten zur Person (Name, Geburtsdatum, Testdatum 

und Testdauer). Danach werden die Testergebnisse erläutert. Die Angabe dieser Ergebnisse 

soll Rohwerte und Prozentränge enthalten. Abschluss des Reports bildet die Beantwortung 

der Fragestellung. 

Wie beurteilen? 

Generell legt man zur Beurteilung der Leistungsuntersuchung nach FeV Anlage 5 Nr. 2 die 

Maßstäbe der EU-Führerscheingruppe 2 zu Grunde (Schubert, Schneider, Eisenmenger & 

Stephan, 2003). Die Durchführungserlässe zur Fahrerlaubnisverordnung werden von den 

einzelnen Bundesländern verfügt. 

Der Gutachter (Arbeits- oder Betriebsmediziner, MPU-Gutachter) richtet sich bei der 

Beurteilung des Einzelfalles nach Kriterien, die in den einzelnen Bundesländern zwar 

ähnlich, aber nicht identisch durch entsprechende Erlässe vorgegeben wurden. Einigkeit 

besteht in der Auffassung, dass Prozentränge (PR) von über 33 bei den einzelnen Variablen 

als ausreichend angesehen werden und dass Prozentränge von 16 und weniger in jedem 

Falle eine genauere Überprüfung erforderlich machen. In den Begutachtungsleitlinien zur 

Kraftfahrereignung (Schubert, Schneider, Eisenmenger & Stephan, 2003) wird davon 

ausgegangen, dass in der Mehrzahl der angewandten Verfahren ein PR von 33 erreicht sein 

muss und in keinem Verfahren derjenige von 16 unterschritten sein darf, um die

Fahrerlaubnis zu erteilen. Treffen diese Voraussetzungen nicht zu, ist der Frage 

vorhandener Kompensationsmöglichkeiten, meist u.a. auch im Rahmen einer praktischen 

Fahrprobe durch einen Verkehrspsychologen oder einen Sachverständigenprüfer (aaSoP), 

durch eine weiterführende Untersuchung nachzugehen. 

Da bei der Leistungsuntersuchung Reaktionszeitmessungen und Reaktionen auf 

Mehrfachreize notwendig sind, sind Maus oder PC-Tastatur als Eingabemedien ungeeignet. 

Die Bearbeitung der Leistungstests erfolgt mit einer ergonomisch optimierten 

Probandentastatur und erlaubt somit eine komfortable und faire Erfassung der 

Leistungsfähigkeit selbst bei Personen mit geringer oder fehlender Computererfahrung. 

Die Probandentastatur ist äußerst robust und wird einfach an die USB-Schnittstelle des PCs 

angesteckt. 

Die Probandentastatur besteht aus: 

7 Farbtasten; 10 Zifferntasten; 1 Sensortaste; Anschlussmöglichkeit für Fußtasten und USB- 

Schnittstelle 

Abbildung 3: Probandentastatur für die FEV Anlage 5/2 Untersuchung 

Vernetzte Anlagen werden eingerichtet, wenn eine große Anzahl an Probanden getestet 

werden soll. Eine vernetzte Anlage besteht aus einem Testleiterarbeitsplatz und aus einer 

nahezu beliebigen Anzahl von Testpersonenarbeitsplätzen. Der Ablauf der einzelnen 

Testdurchführungen erfolgt zentral und somit verfügt der Testleiter über alle notwendigen 

Informationen. Die Testpersonen können zeitlich versetzt die Tests starten und in ihrem 

eigenen Tempo bearbeiten. Mit dem Wiener Testsystem können Sie somit eine große 

Anzahl an Leistungsuntersuchungen zeitgleich durchführen.

Die verkehrspsychologisch relevanten Dimensionen Belastbarkeit, Orientierungs-, 

Konzentrations- und Aufmerksamkeitsleistung sowie Reaktionsfähigkeit werden mit dem 

Test-Set FEV untersucht. Tabelle 1 listet die einzelnen Testverfahren mit Angabe der 

Durchführungszeit auf. 

Tabelle 1: Testverfahren des Test-Sets FeV 

Tests Dimensionen Testformen Dauer 

RT- Reaktionstest Reaktionsfähigkeit S3 6 

COG - Cognitrone Konzentrationsleistung S11 10 

LVT - Linienverfolgungstest Orientierungsleistung S3 10 

DT - Determinationstest Belastbarkeit S1 6 

ATAVT - Adaptiver Tachistoskopischer 

Verkehrsauffassungstest 

Aufmerksamkeitsleistung S1 14 

Das Test-Set FEV zeichnet sich aufgrund der Durchführungsdauer von nur rund 45 Minuten 

durch eine hohe Ökonomie bei gleichzeitig hoher Messgenauigkeit der Testverfahren aus. 

Auf den folgenden Seiten werden die einzelnen Tests beschrieben. Die Gütekriterien der 

einzelnen Tests (Reliabilität, Validität, Normierung) sind in der Beschreibung dieser 

Verfahren angeführt. Für die Auswertung der Leistungsuntersuchung nach FeV Anlage 5 Nr. 

2 wird jeweils die Hauptvariable herangezogen. 

Hauptvariable: „Mittlere Reaktionszeit“: 

Hierbei handelt es sich um die Zeit, die zwischen einem Signal (gemeinsames Auftreten von 

gelbem Licht und Ton) und dem Beginn der mechanischen Bewegungsantwort auf dieses 

Signal vergeht, unter der Instruktion möglichst schnell zu reagieren. 

Hilfsvariable: „Richtig reagiert“: 

Anzahl richtiger Reaktionen. Als richtige Reaktionen gilt das Verlassen der Ruhetaste mit 

anschließender Betätigung der Reaktionstaste bei geforderten Signalen. Bei korrekter 

Durchführung des Tests sollte auf alle 16 geforderten Signale richtig reagiert worden sein. 

Ab einer Abweichung größer als vier könnte dies auf ein Motivationsproblem der Testperson 

hinweisen bzw. die Testperson hat Verständnisprobleme mit der Instruktion gehabt. Die 

Hauptvariable ist in diesem Fall nicht zu interpretieren. Eine Testwiederholung ist indiziert. 

Hilfsvariable: „Falsch reagiert“: 

Anzahl falscher Reaktionen. Als falsche Reaktion gilt das Verlassen der Ruhetaste mit anschließender 

Betätigung der Reaktionstaste bei nicht geforderten Signalen. Eine hohe

Anzahl an falschen Reaktionen deutet darauf hin, dass der Proband auf viele der 48 Signale 

reagiert ohne zu differenzieren, ob die Reaktion gefordert war oder nicht. Sollte die Anzahl 

der falschen Reaktionen größer als fünf sein, so könnte dies auf ein Motivationsproblem der 

Testperson hinweisen bzw. die Testperson hatte Verständnisprobleme mit der Instruktion. 

Die innere Konsistenz beträgt für die Variable Median Reaktionszeit r = 0.90. 

Konstruktvalidität 

Unter Reaktionszeit versteht man die Zeit, die zwischen einem Signal und dem Beginn einer 

mechanischen Bewegungsantwort vergeht, wenn die Testperson instruiert wurde, möglichst 

rasch zu reagieren (Dorsch, 1994). Bei der vorliegenden Form des Reaktionstests wird die 

Reaktionszeit auf eine einfache Wahlreaktion gemessen. Zur Ermittlung dieser 

Reaktionszeiten, die im Millisekundenbereich liegen, ist ein Testinstrument notwendig, das 

sehr zuverlässig und genau ist. Der Reaktionstest ist zur Bestimmung der Reaktionszeit 

bestens geeignet. 

Im täglichen Sprachgebrauch versteht man unter "Reaktionszeit" die Zeit zwischen einem 

Reiz und einer wie immer gearteten, in jedem Fall aber beobachtbaren Reaktion des 

Individuums. Soweit deckt sich die vorwissenschaftliche Verwendung dieses Begriffs mit 

wissenschaftlichen Definitionsversuchen, nach denen "Reaktionszeit" als Zeit, die vergeht 

zwischen einem Signal und dem Beginn der mechanischen Bewegungsantwort, unter der 

Instruktion, möglichst schnell zu reagieren, definiert ist (vgl. Dorsch, 1994). Da es sich hier 

um Genauigkeiten im Millisekundenbereich handelt, muss das eingesetzte Testinstrument 

sehr zuverlässig und genau sein. 

Der Reaktionstest ist zur Bestimmung der Reaktionszeit nach obiger Definition also bestens 

geeignet. 

Es wurde weiters versucht, eine Validierungsstudie durchzuführen, indem die Reaktions- und 

Motorischen Zeiten mit dem Rohwert der CPM (Raven’s Coloured Progressive Matrices) in 

Zusammenhang gebracht wurden (49 Schüler absolvierten zusätzlich zu drei RT-Testformen 

auch die CPM). Aufgrund einer Studie von Neubauer (1990) wurde eine signifikante 

Korrelation des Rohwertes der CPM mit der Motorischen Zeit erwartet, wobei der 

Zusammenhang mit der Motorischen Zeit höher als der mit der Reaktionszeit 

(=Entscheidungszeit) sein sollte. 

Diese Hypothesen konnten dann auch, trotz einer geringen Stichprobengröße, bei der 

statistischen Analyse beobachtet werden (siehe Tabelle 2). 

Tabelle 2: : Korrelationen der Leistungsmerkmale (Mediane) mit den Rohwerten der CPM 

Schulstufe 

Gesamt (N=49) Buben (N=27) Mädchen (N=22) 

RW-CPM RW-CPM RW-CPM 

S3 MZ (Licht &Ton) -0.49** -0.64** -0.30 

S3 RZ (Licht & Ton) -0.12 -0.33 0.03 

Anmerkung: RW: Rohwert; RZ: Reaktionszeit; MZ Motorische Zeit; * 0.01, ** 0.001; N=210.

Interkorrelationen 

Die Korrelationen zwischen den Testvariablen geben Aufschluss darüber, inwieweit nicht 

durch mehrere Variablen dasselbe gemessen wird. Tabelle 3 zeigt die Interkorrelationen der 

Zeitvariablen bei der Normstichprobe. 

Tabelle 3: Interkorrelationen der Zeitvariablen bei der Normstichprobe, Testform S3 

Variable SDRZ MMZ SDMZ 

MRZ 0.443** 0.375** 0.152** 

SDRZ 0.236** 0.296** 

MMZ 0.491** 

Anmerkung: MRZ: Mittlere Reaktionszeit, MMZ: Mittlere Motorische Zeit; SDRZ: Standardabweichung der 

Reaktionszeit; SDMZ: Standardabweichung der Motorischen Zeit; * 0.01, ** 0.001; N=210. 

Der wichtigste Befund ist sicher die Korrelation zwischen den Reaktions- und Motorischen 

Zeiten. Die Werte sind zwar signifikant (0.38 bis 0.62), d.h. die gegenseitig aufgeklärten 

Varianzanteile liegen zwischen 14% und 38%. Das bedeutet dennoch, dass die beiden 

Variablen etwas jeweils Anderes messen. 

Kriteriumsvalidität 

Validitätsuntersuchungen im Gebiet der Verkehrspsychologie bestätigen die vorhandene 

Gültigkeit dieses Verfahrens. 

Calé (1992) konnte anhand einer Vorgängerversion des RT zeigen, dass die Testergebnisse 

signifikant mit der Unfallhäufigkeit im Straßenverkehr korrelieren. 

Karner & Neuwirth (2000) konnten zwischen den Ergebnissen des RT und einer 

standardisierten Fahrprobe signifikante Korrelationen in der Höhe von r=0.38 feststellen. 

Sommer (2002) kam zu einem ähnlichen Ergebnis. 

Eine Studie von Sommer, Arendasy, Olbrich & Schuhfried (2004) zeigt, dass mittels einer 

Test¬batterie, in deren Rahmen RT vorgegeben wurde, über 74% der getroffenen Urteile 

über das Fahrverhalten innerhalb einer standardisierten Fahrprobe richtig vorhergesagt 

werden konnten. 

Hohe Korrelationen zeigen sich zudem zwischen den Testverfahren RT und DR2 des 

ART90, somit zeigt das Verfahren eine hinreichende konvergente Validität (Karner & Biehl; 

2000). 

In einer derzeit noch laufenden Studie zeigen sich zudem Korrelationskoeffizienten in der 

Höhe von r=0.034 zwischen der Variable Median Reaktionszeit und dem Globalurteil über 

das Fahrverhalten im Rahmen der Wiener Fahrprobe. 

Eine weitere Studie von Sommer & Häusler (2006) beschäftigte sich mit der 

Kriteriumsvalidität zweier Testbatterien zur Erfassung der kraftfahrspezifischen 

Leistungsfähigkeit aus dem Expertensystem Verkehr (Schuhfried, 2005), die ebenfalls den 

Reaktionstest beinhalten. Die beiden Testbatterien Standard und Plus unterschieden sich 

hierbei ausschließlich darin, ob die Periphere Wahrnehmung (PP) als Maß für das 

Gesichtfeld und die geteilte Aufmerksamkeit vorgegeben wurde. Als Kriteriumsvariable 

wurde das Globalurteil über das Fahrverhalten in einer standardisierten Fahrprobe 

herangezogen. Die von den Autoren untersuchte Stichprobe bestand aus 164 (74%) 

Männern und 58 (26%) Frauen im Alter von 19 bis 91 Jahren bei einem durchschnittlichen 

Alter von 59 Jahren und einer Standardabweichung von 18 Jahren. Der Altersmedian lag bei 

64 Jahren. Es handelte sich daher um Personen im mittleren bis höheren Lebensalter. Bei 

den Probanden handelte es sich zum Teil um bereits auffällige Kraftfahrer. Die

Studienteilnahme war jedoch freiwillig. Insgesamt 39 (18%) Personen hatten eine 

Pflichtschule oder Realschule ohne abgeschlossene Berufsausbildung absolviert (EU 

Bildungsgrad 2), 96 (43%) Personen hatten eine abgeschlossene Berufsausbildung bzw. 

eine Fachschule absolviert (EU Bildungsgrad 3), 35 (16%) Personen hatten einen Abituroder 

Fachhochschulabschluss (EU Bildungsgrad 4) und 52 (23%) Personen verfügten über 

einen Hochschulabschluss (EU Bildungsgrad 5). 

Aufgrund der Ergebnisse bisheriger Studien erfolgte die Berechnung der Kriteriumsvalidität 

mit Hilfe künstlicher Neuronaler Netze. Das Ergebnis zeigte, dass mit der Testbatterie 

Standard insgesamt 80.2% der Gesamtstichprobe richtig klassifiziert werden konnten. Bei 

der Testbatterie Plus lag die Klassifikationsrate bei 86.5%. Dies entspricht einem 

Validitätskoeffizienten von R=0.68 für die Testbatterie Standard und R=0.78 für die 

Testbatterie Plus. In der Jackknife-Validierung wurde für die Testbatterie Standard eine 

Klassifikationsrate von 80.2% und ein Validitätskoeffizient von R=0.67 erzielt. Für die 

Testbatterie Plus lagen die Werte in der Jackknife-Validierung bei einer Klassifikationsrate 

von 83.8% und einem Validitätskoeffizient von R=0.77. Die Intervalle für die 

Klassifikationsrate und den Validitätskoeffizient in der Bootstrap-Validierung lagen bei 

[74.2%; 85.2%] und [0.54; 0.73] für die Testbatterie Standard und für die Testbatterie Plus 

bei [77.5%; 87.2%] und [0.61; 0.79]. Die inkrementelle Validität und relative Relevanz der 

einzelnen Testverfahren der beiden Testbatterien können der Tabelle 4 entnommen werden. 

Die relative Relevanz gibt an, mit welchem Anteil der entsprechende Test zur Validität des 

Vorhersagemodells beiträgt. 

Tabelle 4: Inkrementelle Validitäten und relative Relevanzen der beiden Testbatterien Standard und Plus 

Prädiktorvariablen 

Inkrementelle 

Validität 

STANDARD 

Relative 

Relevanz 

Inkrementelle 

Validität 

PLUS 

Relative 

Relevanz 

AMT: Allgemeine Intelligenz 0.128 18.7% 0.078 11.5% 

DT: Richtige 0.124 18.2% 0.071 10.5% 

RT: Mittlere Reaktionszeit 0.036 5.7% 0.057 8.6% 

RT: Mittlere Motorische Zeit 0.132 19.2% 0.118 16.9% 

PP: Gesichtsfeld -- -- 0.090 13.2% 

PP: Tracking Abweichung -- -- 0.139 19.5% 

TAVT: Überblicksgewinnung 0.120 17.6% 0.038 5.8% 

COG: Mittlere Zeit korrekte 

Zurückweisung 

0.141 20.3% 0.093 13.6% 

Die Ergebnisse sprechen somit bei einer relativen Relevanz von 5.7% und 19.2% 

(Testbatterie Standard) bzw. 8.6% und16.9% für die Kriteriumsvalidität des RT. 

Es liegt eine Normierung der Testform S3 mit einer Stichprobe vom Umfang N=855 vor. 

Hierbei handelt es sich um 417 (48.8%) Männer und 438 (512%) Frauen im Alter von 16 bis 

89 (m=43.5; sd=16.8; skew=0.36; kurtosis=-0.78) Jahren (Erhebungszeitraum: 2007). 

Tabelle 5 zeigt die genaue Verteilung der Stichprobenmerkmale. 

Die Leistungsunterschiede in den beiden Variablen Reaktionszeit und Motorische Zeit 

zwischen den Teilstichproben 'Geschlecht' bzw. 'Alter' sind hochsignifikant (T-Test, 

Varianzanalyse). Kein signifikanter Unterschied ergab sich in der Teilstichprobe

'Bildungsgrad'. Daher wurden zusätzlich zur Gesamtstichprobe Teilstichproben für bestimmte 

Altersbereiche bzw. Teilstichproben für Männer und Frauen getrennt einer Normierung 

unterzogen. 

Die Stichprobengröße der Teilgruppen ist für eine Normierung hinreichend groß. Die 

genauen Verteilungscharakteristika der Leistungsmerkmale hinsichtlich der eben erwähnten 

Gruppierungen können der Tabelle 6 entnommen werden. 

Tabelle 5: Verteilung der Stichprobenmerkmale 

Schultyp (-abschluss) 

Altersgruppen 

Bildungsgrad 16-25 J. 26-35 J. 36-59 J. 60-70 J. 71-90 J. 

n 

(Schultyp) 

Kein Pflichtschulabschluss 1 / 1 1 / 0 2 / 2 0 / 1 0 / 1 4 / 5 

Keine abgeschlossene 

Berufsausbildung 

Abgeschlossene 

Berufsausbildung 

Abitur, Abschluss einer 

Fachhochschule 

Universität, 

Hochschulabschluss 

30 /11 10 / 9 21 / 17 5 / 6 6 / 2 72 / 45 

21 / 18 45 / 23 114 / 92 24 / 37 14 / 13 218 / 183 

20 / 43 24 / 38 29 / 61 8 / 19 10 / 5 91 / 166 

0 / 3 7 / 9 11 / 19 2 / 8 12 / 0 32 / 39 

N (Alter) 72 / 76 87 / 79 177 / 191 39 / 71 42 / 21 417 / 438 

Anmerkung: Die Zahlen links und rechts vom Schrägstrich stehen für die Anzahl der Männer bzw. Frauen. 

Entsprechend sind Zeilen- und Spaltensummen zu lesen. 

Tabelle 6: Verteilungscharakteristika der Leistungsmerkmale bei Vorgabe von S3 

Testvariable 

Stichprobe Maß MRZ SDRZ MMZ SDMZ 

Erwachsene 

MD 430 65 165 21 

QA 110 28 82 14 

Alter: 16 - 25 

MD 393 63 143 17 

QA 104 23 47 10 

Alter: 26 - 35 

MD 402 61 142 17 

QA 95 25 52 9 

Alter: 36 – 59 

MD 439 64 180 23 

QA 101 29 84 16 

Alter: 60 - 70 

MD 470 72 214 25 

QA 121 29 79 17 

Alter: 71 - 90 

MD 460 73 173 24 

QA 135 33 120 17 

Männer MD 427 63 149 19 

QA 102 29 63 12

Frauen 

Volksschule, 

Realschule 

Abitur, Universität 

MD 432 66 186 23 

QA 122 26 88 15 

MD 442 66 170 21 

QA 108 28 88 14 

MD 411 64 159 20 

QA 113 26 71 13 

Anmerkung: MD: Median, QA: Quartilabstand; MRZ: Mittlere Reaktionszeit (ms), MMZ: Mittlere Motorische Zeit 

(ms), SDRZ: Streuungsmaß Reaktionszeit (ms), Streuungsmaß Motorische Zeit (ms). 

Hauptvariable: „Mittlere Zeit Korrekte Zurückweisung“: 

Das persönliche Tempo, operationalisiert durch die Variable „Mittlere Zeit Korrekte Zurückweisung“ 

stellt einen guten Indikator der Konzentrationsfähigkeit dar. 

Hilfsvariable: „Summe Treffer“ & „Summe Korrekte Zurückweisungen“: 

Es wird davon ausgegangen, dass normalerweise 85% der Aufgaben richtig gelöst werden, 

konzentrierte Aufgabenbearbeitung ist dadurch gekennzeichnet, dass dieser Wert sogar 

noch überschritten wird. Eine „Summe Treffer“ kleiner als 21 und/oder eine „Summe Korrekte 

Zurückweisung“ kleiner als 30 ist ein Hinweis auf nicht angepasstes Arbeitstempo. In diesem 

Fall sollte der Wert für die Hauptvariable nur unter Vorbehalt interpretiert werden. 

Hilfsvariable: „Mittlere Zeit Treffer“ 

Während für eine korrekte Zurückweisung immer alle Figuren mit der Vorgabefigur 

verglichen werden müssen, sind für einen Treffer im Durchschnitt nicht so viele Vergleiche 

notwendig. Daher sollte die „Mittlere Zeit Treffer“ kürzer sein als die „Mittlere Zeit Korrekte 

Zurückweisung“. Anderenfalls ist dies möglicherweise ein Hinweis auf ineffiziente 

Musteranalysestrategien oder andere irreguläre Bearbeitungsstrategien. 

Für die Testform S11 ergibt sich eine Innere Konsistenz (Cronbach Alpha) für die Variable 

Mittlere Zeit „korrekte Zurückweisung“ von 0.95 und für die Variable Mittlere Zeit „Treffer“ von 

0.93 

In einer Längsschnittstudie an 82 Personen (48% Männer, 52% Frauen) im Altersbereich von 

17 bis 78 Jahren (m=44; s=17) ergibt sich eine Retest Reliabilität von r=0.88 und eine 

Stabilität über den Zeitraum von 5 Monaten von r=0.87. 

Die Gültigkeit des Cognitrone-Tests kann als gezeigt gelten, wenn ein inhaltlicher Bezug 

zwischen den Anforderungen der Items und den Anforderungen in Realsituationen erkennbar 

ist (inhaltliche Gültigkeit), wenn eine hohe Übereinstimmung mit anderen Testverfahren 

gegeben ist, die dieselben Fähigkeiten erfassen, und wenn keine Übereinstimmung mit 

Testverfahren besteht, die etwas anderes erfassen (konvergente und diskriminante Validität). 

Weiters ist die Gültigkeit dann gegeben, wenn der Test gewisse theoriegeleitete 

Vorstellungen erfüllt, das wäre beim Verfahren Cognitrone dann gegeben, wenn sich die

Schwierigkeitsunterschiede zwischen den Testteilen durch strukturelle Unterschiede erklären 

lassen (Konstruktvalidität). 


Die Philosophie bei der Messung von "Aufmerksamkeit" ist seit Jahrzehnten gleich 

geblieben: Immer werden intellektuell anspruchslose Aufgaben gestellt, die für eine gewisse 

Zeit möglichst rasch und fehlerfrei auszuführen sind. Die erhobenen Geschwindigkeits- und 

Genauigkeitsmaße liefern einen Hinweis über den Grad der "investierten" Aufmerksamkeit. 

Auch die Testformen des Cognitrone Tests sind in dieser Weise konzipiert: Die Aufgaben 

bestehen aus (mehr oder weniger) komplexen "Strichfiguren", die lediglich dahingehend zu 

beurteilen sind, ob sich unter ihnen identische "Figuren" befinden oder nicht. 

Über Befunde zur Konstruktvalidität für die Testformen mit freier Bearbeitungszeit berichtet 

Wagner (1999). Unter Zugrundelegung des Konzentrationsmodells von Reulecke (1991) 

schlägt sie vor, die Variable Mittlere Zeit „Korrekte Zurückweisung“ nur unter der Bedingung 

mind. 90% richtiger Antworten als Indikator für Konzentration zu interpretieren. Diese 90% 

beziehen sich auf eine Vorgabe von Reulecke (1991). 

Die Konstruktvalidierung der Variable Mittlere Zeit „Korrekte Zurückweisung“ erfolgt mit Hilfe 

des Rasch-Modells anhand einer Stichprobe von 625 Personen aus den Normdaten. Unter 

der Annahme einer optimalen Dosierung der “Energie” zum präzisen Ablauf der “Funktion” 

Mustervergleich, sollte die Bearbeitung von Vergleichsfiguren einer komplexeren Vorlage 

mehr Zeit in Anspruch nehmen als die Bearbeitung der weniger komplexen Vorlagen. Zur 

Schätzung der Itemparameter für die 20 Vorlagenblöcke mit Hilfe des Rasch-Modells war es 

notwendig, die Variable Mittlere Zeit „Korrekte Zurückweisung“ 1-20 zu dichotomisieren. Die 

erste Kategorie (1=schnelle Lösung) umfasst den Bereich 0-200 ms, die zweite Kategorie 

(0=langsame Lösung) umfasst den Bereich ab 201 ms. Die signifikanten LQTs (=Andersen 

Likelihood-Quotiententest) für das interne Teilungskriterium “Bearbeitungstempo” und für das 

externe Teilungskriterium “Angemessenheit des Arbeitstempos” (vgl. Tabelle 7) weisen 

darauf hin, dass zur vollständigen Erklärung der beobachteten Daten Parameterschätzungen 

für jede Gruppe gesondert notwendig sind. 

Diese Modellabweichungen sind durch die eingangs getroffene Annahme - nur bei präziser 

Ausführung wird Konzentration gemessen - erklärbar. 

Tabelle 7: Modelltest für die Gesamtstichprobe 

Modelltest 

Teilungskriterium 

Bearbeitungstempo (internes TK) 

Gruppe1: viele Aufgaben “schnell” bearbeitet 

Gruppe2: wenige Aufgaben “schnell” bearbeitet 

Angemessenheit des Arbeitstempos (externes TK) 

Gruppe1: viele “Richtige” unabhängig von der Komplexität der Figuren 

Gruppe2: wenig “Richtige” im Gesamttest, bzw. bei komplexen Figuren 

2 (df=18) 

LQT 

s./n.s. 5% 

50.53 s. 

85.37 s. 

Alter (externes TK) 19.10 n.s. 

Anmerkungen 

LQT: Der Anderson Likelihood-Quotiententest prüft, ob die Parameterschätzung für 

getrennte Teilstichproben die Datenstruktur besser erklärt als die Parameterschätzung 

gesamt. 

Für weitere Modellkontrollen werden daher aus der Gesamtstichprobe Personen 

ausgeschlossen, die für den Gesamttest das 90%-Kriterium nicht erfüllten. 479 Personen 

verbleiben in der Stichprobe. Die Betrachtung der Verteilung bezüglich dieses Kriteriums 

zeigt erwartungsgemäß, dass anhand dieses Kriteriums - bezogen auf den Gesamttest - 

nicht alle Personen mit inadäquatem Arbeitstempo ausgeschlossen werden, sondern nur die

“Extremfälle”. Die Ergebnisse der nunmehr nicht signifikanten Andersen Likelihood- 

Quotiententests (LQTs) zeigt Tabelle 8. 

Tabelle 8: Modelltest nach Ausscheiden der Personen mit inadäquatem Arbeitstempo 

Modelltest 

Teilungskriterium 

Bearbeitungstempo (internes TK) 

Gruppe1: viele Aufgaben “schnell” bearbeitet 

Gruppe2: wenige Aufgaben “schnell” bearbeitet 

Angemessenheit des Arbeitstempos (externes TK) 

Gruppe1: viele “Richtige” unabhängig von der Komplexität der Figuren 

Gruppe2: wenig “Richtige” im Gesamttest, bzw. bei komplexen Figuren 

2 (df=17) 

LQT 

s./n.s. 5% 

25.98 n.s. 

10.2 n.s. 

Alter (externes TK) 10.24 n.s. 

Anmerkungen: Kritische Wert der 2 Verteilung: 5% = 27.58 1% = 33.43 

LQT: Der Anderson Likelihood-Quotiententest prüft, ob die Parameterschätzung für getrennte Teilstichproben die 

Datenstruktur besser erklärt als die Parameterschätzung gesamt. 

Daraus kann geschlossen werden, dass die instruktionskonforme Bearbeitung des Tests 

eine zwingende Voraussetzung zur validen Interpretation der Variablen Mittlere Zeit 

„Korrekte Zurückweisung“ ist. 

In der Praxis hat sich jedoch gezeigt, dass die Herabsetzung dieses Kriteriums auf 85% 

sinnvoll ist und daher in der derzeitigen Version des Verfahrens COG verwendet wird. In 

einer hausinternen und noch nicht publizierten Weiterführung dieser Arbeit konnten die 

Ergebnisse allerdings bestätigt werden. 

Weitere Hinweise auf die Konstruktvalidität des COG-Tests ergeben sich aus verschiedenen 

Korrelationsstatistischen Studien mit konstruktnahen und konstruktfernen Testverfahren. 

Beim Versuch konstruktnahe (konvergente) und konstruktferne (diskriminante) Testverfahren 

für einen Aufmerksamkeitstest zu definieren, kommt der Umstand zu tragen, den Neumann 

(1992) unter dem Begriff "Dualitätsannahme der klassischen Aufmerksamkeitsforschung“ 

markant zusammenfasst: 

„Aufmerksamkeit ist nicht eine von vielen Komponenten in einem Gesamtsystem, sondern 

stellt sich den anderen Komponenten gegenüber und beeinflusst die Qualität ihrer Funktion.“ 

- d.h. in jeder Aufgabe spielt ein gewisses Maß an Aufmerksamkeit mit, allerdings ermöglicht 

die Sichtweise von Aufmerksamkeit als heterogenes Konstrukt einen Vergleich beobachteter 

Korrelationen bezüglich Ähnlichkeit der einzelnen Testverfahren. 

Wagner (1997) beurteilt die Testverfahren Cognitrone (COG), Linienverfolgungstest (LVT), 

Determinationstest (DT) und Tachistokopischer Verkehrsauffassungstest (TAVTMB) 

hinsichtlich Ähnlichkeit anhand des “allgemeinen Modells zur Unterscheidung verschiedener 

Arten von Aufmerksamkeit und Konzentration” (Berg, 1991) vorwiegend unter 

Berücksichtigung der Dimension “Personale Regulationsprozesse”. Diese Regulationsprozesse 

lassen sich in 4 hierarchischen Stufen beschreiben. In Ergänzung zu Berg (1991) 

wird hier die Anordnung der Stufen als Hierarchie verstanden, innerhalb der die Komplexität 

der Aufgaben steigt. Aufgaben höherer Stufen durchlaufen mehr "Klassifikationsschritte" und 

sind daher besser definiert als Verfahren niedriger Stufen (siehe Abbildung 4).

COG 

 

DT 

 

LVT 

 

“Suche nach 

Reizen” (aktiv)“ 

Erwartung von Reizen” 

(passiv) 

kein 

Testverfahren 

in der 

Testbatterie 

 

TAVTMB 

 

Geteilte 

Aspekte 

Vordergrund 

Reizoffenheit 

gegenüber 

unerwarteten 

Reizen 

im 

Ausblenden 

von Reizen im 

Vordergrund 

Aufnahme von Reizen im Vordergrund 

Selektive Aspekte im Vordergrund 

Keine Intention 

basale 

Aufmerksamkei 

tsdimension: 

(präattentive 

Prozesse) 

Intention zur Informationsaufnahme 

höhere Aufmerksamkeitsdimensionen 

Abbildung 4: Stufen zur Klassifikation verschiedener Arten von Aufmerksamkeit (und die zugeordneten 

Testverfahren). 

Die Korrelationen zwischen ähnlicheren Testverfahren sollten daher höher ausfallen 

(konvergente Validität) als die Korrelationen zwischen unähnlichen Testverfahren 

(diskriminante Validität). 

Die Studie von Wagner (1997) findet grundsätzlich die erwarteten Zusammenhänge 

zwischen den vier Testverfahren, was als Hinweis auf diskriminante Validität des Verfahrens 

Cognitrone zu werten ist (siehe Tabelle 9). 

Tabelle 9: Korrelationen zwischen den Testverfahren inkl. Konfidenzintervalle (N=114) 

Tests Korrelation Konfidenzintervall 

DT/LVT 0.206 [0.022; 0.375] 

DT/TAVT -0.118 [0.076; 0.296] 

COG/DT 0.482 [0.326; 0.611] 

COG/TAVT 0.2760 [0.097; 0.438] 

COG/LVT 0.423 [0.259; 0.563] 

LVT/TAVT -0.1267 [0.059; 0.304]

Nicht geklärt werden kann der Unterschied der Korrelationen COG/LVT - DT/LVT und 

COG/TAVT - DT/TAVT. Laut Theorie sollten sich die Korrelationen in ähnlichen 

Größenordnungen bewegen. Hier könnte eine differenziertere Betrachtung der Ähnlichkeit 

(Hinzunahme weiterer Dimensionen zur Klassifikation) vielleicht Klärung bringen. Unter 

Berücksichtigung der Konfidenzintervalle für Korrelationen wird dieses Ergebnis allerdings 

deutlich relativiert: COG/DT unterscheidet sich zwar nach wie vor von DT/TAVT und 

LVT/TAVT. Alle anderen Korrelationen unterscheiden sich nicht signifikant voneinander. Das 

Ergebnis ist ebenso unter Berücksichtigung der nicht optimalen Stichprobe zu bewerten: 

Diese ist mit N=114 nicht sehr groß und als sehr homogen zu bezeichnen. Für diese Studie 

konnten in Zusammenarbeit mit Verkehrspsychologen ausschließlich "Bewerber für 

Personenbeförderung" getestet werden (105 Männer/9 Frauen; Alter: Mittelwert=35,7 

min=20; max=57 Stdv=9). 

Ein Vergleich des Verfahrens Cognitrone mit einem älteren Verfahren zur Erfassung der 

Aufmerksamkeit, dem Q1, zeigte hochsignifikante Korrelationen zwischen den 

Testverfahren. (Karner & Biehl, 2001) 


Calé (1992) gelang der Nachweis, dass die Testergebnisse im Verfahren Cognitrone zur 

Vorhersage von Fahrertypologien geeignet sind (N=246). An einer Stichprobe von N=72 

Fahrern, die in kurzer Zeit in mehr als einen Unfall verwickelt waren, konnte Calé signifikante 

Korrelationen zwischen Testergebnis und Unfallhäufigkeit feststellen. 

Hinweise auf die Validität ergeben sich auch aus einer Studie mit einer Vorgängerversion 

des Testverfahrens (Bukasa, Wenninger & Brandstätter; 1990). 

Eine Studie von Karner (2000) zeigte signifikante Unterschiede zwischen alkoholauffälligen 

Kraftfahrern und der Normgruppe im Verfahren Cognitrone. Die Testergebnisse der 

alkoholauffälligen Kraftfahrer waren signifikant schlechter als die der Normpopulation. 

In einer Studie von Neuwirth (2001) konnte gezeigt werden, dass der Cognitrone-Test 

zwischen allen untersuchten Zuweisungsgruppen (psychiatrische und neurologische 

Probanden bzw. Probanden nach Alkoholabusus) und der Normgruppe trennt. Diese 

Validierungsstudie wurde an einer anfallenden Stichprobe von Probanden der 

Fahreignungsdiagnostik einer Südtiroler Untersuchungsstelle durchgeführt. 



Leistungsfähigkeit aus dem Expertensystem Verkehr (Schuhfried, 2005), die ebenfalls das 

Verfahren Cognitrone beinhalten. Die beiden Testbatterien Standard und Plus unterschieden 

sich hierbei ausschließlich darin, ob die Periphere Wahrnehmung (PP) als Maß für das 

Gesichtsfeld und die geteilte Aufmerksamkeit vorgegeben wurde. Als Kriteriumsvariable 

wurde das Globalurteil über das Fahrverhalten in einer standardisierten Fahrprobe 

herangezogen. Die von den Autoren untersuchte Stichprobe bestand aus 164 (74%) 

Männern und 58 (26%) Frauen im Alter von 19 bis 91 Jahren bei einem durchschnittlichen 

Alter von 59 Jahren und einer Standardabweichung von 18 Jahren. Der Altersmedian lag bei 

64 Jahren. Es handelte sich daher um Personen im mittleren bis höheren Lebensalter. Bei 

den Probanden handelte es sich zum Teil um bereits auffällige Kraftfahrer. Die 

Studienteilnahme war jedoch freiwillig. Insgesamt 39 (18%) Personen hatten eine 

Pflichtschule oder Realschule ohne abgeschlossene Berufsausbildung absolviert (EU 

Bildungsgrad 2), 96 (43%) Personen hatten eine abgeschlossene Berufsausbildung bzw. 

eine Fachschule absolviert (EU Bildungsgrad 3), 35 (16%) Personen hatten einen 

Abiturabschluss (EU Bildungsgrad 4) und 52 (23%) Personen verfügten über einen 

Hochschul- bzw. Fachhochschulabschluss (EU Bildungsgrad 5).




der Testbatterie Plus lag die Klassifikationsrate bei 86.5%. Dies entspricht einem 









einzelnen Testverfahren der beiden Testbatterien können der Tabelle 10 entnommen 

werden. Die relative Relevanz gibt an, mit welchem Anteil der entsprechende Test zur 

Validität des Vorhersagemodells beiträgt. 

Tabelle 10: Inkrementelle Validitäten und relative Relevanzen der beiden Testbatterien Standard und Plus 


Inkrementelle 

Validität 

STANDARD 

Relative 

Relevanz 

Inkrementelle 

Validität 

PLUS 

Relative 

Relevanz 


DT: Richtige 0.124 18.2% 0.071 10.5% 








0.141 20.3% 0.093 13.6% 

Die Testform S11 wurde zwischen 2005 und 2007 an 787 (53.4%) Männer und 688 (46.6%) 

Frauen im Altersbereich zwischen 15 und 91 Jahren (mean=42.53, sd=16.89) aus Österreich 

normiert. Insgesamt 32 (2.2%) Personen haben weniger als 9 Schuljahre absolviert (EU 

Bildungsgrad 1). 307 (20.8%%) Personen haben eine Pflichtschule oder Real¬schule 

absolviert, allerdings ohne abgeschlossene Berufs¬ausbildung (EU Bildungsgrad 2), 658 

(44.6%) Personen haben eine abgeschlossene Berufs¬aus¬bildung bzw. eine Fachschule 

absolviert (EU Bildungsgrad 3), 343 (23.3%) Personen haben einen Abitur- oder 

Fachhoch¬schulabschluss (EU Bildungsgrad 4) und 135 (9.2%) Personen verfügen über 

einen Hoch¬schul¬abschluss (EU Bildungsgrad 5). Die Altersverteilung der Normstichprobe 

kann der Tabelle 11 entnommen werden. 

Tabelle 11: Altersverteilung der Normstichprobe (N=1475) 

Altersgruppe in Jahren Beobachtete Häufigkeiten Erwartete Häufigkeiten 

15 bis 20 113 106 

21 bis 25 112 105

26 bis 30 148 119 

31 bis 35 198 148 

36 bis 40 152 156 

41 bis 45 148 137 

46 bis 50 124 115 

51 bis 55 105 114 

56 bis 60 88 100 

61 bis 65 101 99 

66 bis 70 73 74 

71 bis 75 51 72 

76 bis 80 31 65 

81 und älter 31 65 

Anmerkung: Beobachtete Häufigkeiten sind die Stichprobengrößen in der Normstichprobe. Die erwarteten 

Häufigkeiten entsprechenden Daten, die anhand der Volkszählung ermittelt wurden. 

Hauptvariable: „Score“: 

Diese Variable berücksichtigt sowohl die Tempoleistung als auch die Leistungsgüte. Hohe 

Ausprägungen sind als schnelle und genaue Wahrnehmungsleistung im Sinne einer 

Überblicksgewinnung zu interpretieren. 

Die innere Konsistenz beträgt r=0.92. 


Topserver, Isik, Ogelmann, Bastürk und Tunali (2000) führten in der Türkei eine 

verkehrspsychologische Validierungsstudie an mehr als 500 Personen durch und konnten 

unter anderem zeigen, dass verkehrsauffällige Kraftfahrer ein signifikant schlechteres 

Ergebnis erzielten (p


Eine Vorgängerversion des LVTs, der LL5, wurde von Bukasa, Wenninger und Brandstätter 

(1990) im Rahmen der Validierung einer verkehrspsychologischen Testbatterie eingesetzt. 

Beobachtet wurden Korrelationen zwischen verschiedenen Fahrverhaltensvariablen und der 

Variable LL5F% ("Prozentsatz von Falschen zu insgesamt bearbeiteten“): "Fehlerhafte 

Verlangsamung" (R=0.45), "Falsches Kreuzungsverhalten" (R=0.45), "Ungenaues 

Spurhalten" (R=0.42) und "Nicht sichern an Kreuzungen" (R=0.39). 

Calé (1992) gelang der Nachweis, dass die Testergebnisse des LVT zur Vorhersage von 

Fahrertypologien geeignet sind. An einer Stichprobe von N=72 Fahrern, die in kurzer Zeit in 

mehr als einen Unfall verwickelt waren, konnte Calé signifikante Korrelationen zwischen 

Testergebnis und Unfallhäufigkeit feststellen. 

Karner und Neuwirth (2000) konnten anhand ihrer Studie nachweisen, dass Personen mit 

einem PR33. 

Ein Vergleich des LVT mit dem LL5 aus dem ART90 zeigte hochsignifikante Korrelationen 

zwischen den Testverfahren LVT und LL5 (Karner & Biehl; 2001). 

Es liegt eine Normierung mit einer repräsentativen Stichprobe der „Normalbevölkerung“ im 

Umfang von N=646 Personen vor. Diese Stichprobe setzt sich aus 300 (46.4%) Männern 

und 346 (53.6%) Frauen zusammen. Diese Normen liegen auch in Teilstichproben nach der 

Variable Alter (bis 25 Jahre, 26 bis 35 Jahre, 36 bis 59 Jahre, 60 bis 70 Jahre und ab 71 

Jahre) vor. Die genaue Altersverteilung dieser Stichprobe ist der Tabelle 12 zu entnehmen. 

Tabelle 12: Altersverteilung der Normstichprobe 

Altersgruppe in Jahren Beobachtete Häufigkeit Erwartete Häufigkeit 

15 bis 20 39 19 

21 bis 25 67 52 

26 bis 30 66 71 

31 bis 35 78 71 

36 bis 40 69 58 

41 bis 45 55 58 

46 bis 50 54 45 

51 bis 55 34 58 

56 bis 60 50 52 

61 bis 65 38 39 

66 bis 70 46 39 

71 bis 75 26 32 


Anmerkung: Beobachtete Häufigkeiten sind die Stichprobengröße in der Normstichprobe. Erwartete Häufigkeiten 

entsprechenden Daten, die anhand der Volkszählung ermittelt wurden. 

Für jede Stichprobengröße wird die repräsentative Verteilung basierend auf Daten der 

österreichischen Volkszählung 1991 (Volkszählung 1991: Hauptergebnisse I – Österreich

Heft 1.030/10 der Beiträge zur Österreichischen Statistik, hg. vom österreichischen 

Statistischen Zentralamt, Wien 1993) und Daten aus Deutschland, die ebenfalls von einer 

Volkszählung stammen, die nach der Wiedervereinigung Deutschlands durchgeführt wurde, 

berechnet. Diese Daten entsprechen den erwarteten Häufigkeiten in Tabelle 12. 

Hauptvariable: „Anzahl der richtigen Reaktionen“: 

Diese Variable misst die Leistungsfähigkeit der Person, bei länger dauernden Folgen von 

einfachen Reaktionsaufgaben unter erheblicher Belastung rasch und adäquat zu reagieren. 

Hilfsvariable: „Anzahl der falschen Reaktionen“: 

Falsche Reaktionen zeigen die Tendenz zu Verwechslungen an. Sie entstehen hier nicht 

durch die kognitive Komplexität der Zuordnungsregeln zwischen Reiz und Reaktion, sondern 

weil es dem Probanden nicht immer gelingt, die adäquate Reaktion vor der Einwirkung 

konkurrierender irrelevanter Reaktionen abzuschirmen. 

Hilfsvariable: „Anzahl der ausgelassenen Reaktionen“: 

Diese Variable beschreibt, ob Reaktionen unter Zeitdruck abgebrochen werden. Sie ist damit 

ein Hinweis für Resignationstendenzen des Probanden. 

Tabelle 13: Innere Konsistenz der Testform S1, berechnet als Cronbach Alpha auf Itemniveau. 

Stichprobe Gesamt bis 25a 26a - 35a 36a - 59a >59a Bild. 1 * ) Bild 2 ** ) 

SUM.R 0.990 0.986 0.986 0.988 0.988 0.992 0.988 

SUM.F 0.990 0.986 0.986 0.988 0.988 0.992 0.988 

SUM.A 0.990 0.986 0.986 0.988 0.988 0.992 0.988 

MD.RT 0.991 0.995 0.995 0.995 0.995 0.996 0.993 

ANZ.S 0.991 0.995 0.995 0.995 0.995 0.996 0.993 

SUM.RF 0.995 0.996 0.989 0.995 0.996 0.996 0.993 

Anmerkung: *): Bildungsstufen „Volksschule, Realschule" **): Bildungsstufen „Abitur, Universität" 

In einer Längsschnittstudie an 82 Personen (48% Männer, 52% Frauen) im Altersbereich von 

17 bis 78 Jahren (m=44; s=17) ergab sich für die Hauptvariable der Testform S1 eine Retest 

Reliabilität von r=0.89 und eine Stabilität über den Zeitraum von 5 Monaten von r=0.84. 

Wie die Werte insgesamt zeigen, ist die Konsistenz der Messung in den einzelnen Variablen 

extrem hoch. Das bedeutet, dass der Determinationstest ein besonders messgenaues 

diagnostisches Instrument ist. 


Unter Reaktionszeit versteht man die Zeit, die zwischen einem Signal und dem Beginn einer 

mechanischen Bewegungsantwort vergeht, wenn der Proband instruiert wurde, möglichst 

rasch zu reagieren (Dorsch, 1994). Beim Determinationstest wird die Reaktionszeit auf 

komplexe Wahlreaktionen gemessen. Zur Ermittlung dieser Reaktionszeiten, die im

Millisekundenbereich liegen, ist ein Testinstrument notwendig, das sehr zuverlässig und 

genau ist. 

Der Determinationstest ist zur Bestimmung der Reaktionszeit auf komplexe Wahlreaktionen 

bestens geeignet. 

Im Rahmen der Normierungsstudie der Testform S1 (Weinkirn, 1996) wurde der 

Determinationstest gemeinsam mit dem Reaktionstest und dem Tachistoskopischen 

Verkehrsauffassungstest (TAVTMB) einer Stichprobe von 180 „gesunden Normalpersonen" 

vorgegeben. 

Tabelle 14: Korrelationen DT mit TAVT und RT 

RT 

DT: MD.RT 0.5896** 

DT 

MD.RT MD.RT SUM.R SUM.F 

DT: SUM.R -0.5191** -0.8997** 

DT: SUM.F -0.1606 -0.3513 -0.2706 

TAVTMB: R -0.3906** -0.6668 0.67** 0.2879** 

Anmerkung: * = r

Standardabweichung von 6.25 Jahren). Der Altersmedian lag bei 31 Jahren. Bei dieser 

Stichprobe handelte es sich um eine Freiwilligenstichprobe, die in Zusammenarbeit mit einer 

österreichischen Versicherungsgesellschaft rekrutiert wurde. Die Verteilung der 

Bildungsgrade in dieser Stichprobe gestaltete sich wie folgt: 7 (4.60%) Personen hatten eine 

Pflichtschule oder Realschule absolviert, allerdings ohne abgeschlossene Berufsausbildung 

(EU Bildungsgrad 2), 42 (27.50%) Personen hatten eine abgeschlossene Berufsausbildung 

bzw. eine Fachschule absolviert (EU Bildungsgrad 3), 83 (54.20%) Personen hatten einen 

Abitur- oder Fachhochschulabschluss (EU Bildungsgrad 4) und 21 (13.70%) Personen 

verfügten über einen Hochschulabschluss (EU Bildungsgrad 5). Insgesamt 75 (49%) 

Personen gaben in einem strukturierten Interview zur Erfassung ihrer Verkehrsunfälle an, 

bereits zwei oder mehr selbstverschuldete Verkehrsunfälle gehabt zu haben, während die 

übrigen untersuchten 78 (51%) Personen berichteten, bisher noch keine Verkehrsunfälle 

verursacht zu haben. Im Sinne eines Extremgruppenvergleichs wurden Personen mit nur 

einem selbstverschuldeten Unfall ausgeschlossen, da bei Vorliegen eines einzigen Unfalls 

noch nicht von einer relevanten Erhöhung der personenspezifischen Unfallverwicklung 

ausgegangen werden kann. Die beiden Gruppen unterschieden sich weder hinsichtlich ihrer 

Geschlechts- (Chi²=2.492; df=1; p=0.114) und Bildungsverteilung (Chi²=3.114; df=3; 

p=0.374) sowie ihres Lebensalters (Z=1.563; p=0.059) noch hinsichtlich ihrer Fahrumwelt 

oder in ihrem Fahrverhalten signifikant voneinander. Alle Untersuchungsteilnehmer hatten 

bereits seit mindestens fünf Jahren einen Führerschein und eine Fahrerfahrung von 

mindestens 50.000 Kilometer. Die beiden Gruppen unterschieden sich nicht signifikant 

(Z=1.616; p=0.053) in der Gesamtanzahl der zurückgelegten Kilometer. Alle 

Untersuchungsteilnehmer kamen aus Wien und benutzten ihr Kraftfahrzeug überwiegend im 

Stadtverkehr. 

In der für diese Studie verwendeten standardisierten, verkehrspsychologischen Testbatterie 

kam unter anderem auch der DT zur Anwendung. Die Autoren bedienten sich künstlicher 

Neuronaler Netze, um die Unfallbelastung der Probanden anhand ihrer Testkennwerte 

vorherzusagen. Das Ergebnis zeigte, dass insgesamt 92.2% der Gesamtstichprobe richtig 

klassifiziert werden konnten. Dies entspricht einem Validitätskoeffizienten von R=0.84. In der 

Jackknife-Validierung wurde eine Klassifikationsrate von 88.9% und ein Validitätskoeffizient 

von R=0.84 erzielt. Die Intervalle für die Klassifikationsrate und den Validitätskoeffizient in 

der Bootstrap-Validierung lagen bei [84.6%; 94.5%] und [0.70; 0.89]. Die inkrementelle 

Validität und relative Relevanz der einzelnen Testverfahren können der Tabelle 15 

entnommen werden. Die relative Relevanz gibt an, mit welchem Anteil der entsprechende 

Test zur Validität des Vorhersagemodells beiträgt. 

Tabelle 15. Inkrementelle Validität und relative Relevanz der einzelnen Tests 

Testbezeichnung Inkrementelle Validität Relative Relevanz 

AMT 0.011 1.4% 

DT 0.133 20.9% 

SIGNAL 0.075 9.2% 

TAVTMB 0.064 7.9% 

WRBTV 0.072 8.9% 

IVPE/PS 0.311 32.2% 

IVPE/VB 0.087 10.6% 

IVPE/SK 0.066 8.2% 

IVPE/TA 0.001 2.0%

Die Ergebnisse sprechen somit bei einer relativen Relevanz von rund 21% für die 

Kriteriumsvalidität des DT. 



Leistungsfähigkeit aus dem Expertensystem Verkehr (Schuhfried, 2005), die ebenfalls den 

DT beinhalten. Die beiden Testbatterien Standard und Plus unterschieden sich hierbei 

ausschließlich darin, ob die Periphere Wahrnehmung (PP) als Maß für das Gesichtsfeld und 

die geteilte Aufmerksamkeit vorgegeben wurde. Als Kriteriumsvariable wurde das 

Globalurteil über das Fahrverhalten in einer standardisierten Fahrprobe herangezogen. Die 

von den Autoren untersuchte Stichprobe bestand aus 164 (74%) Männern und 58 (26%) 

Frauen im Alter von 19 bis 91 Jahren bei einem durchschnittlichen Alter von 59 Jahren und 

einer Standardabweichung von 18 Jahren. Der Altersmedian lag bei 64 Jahren. Es handelte 

sich daher um Personen im mittleren bis höheren Lebensalter. Bei den Probanden handelte 

es sich zum Teil um bereits auffällige Kraftfahrer. Die Studienteilnahme war jedoch freiwillig. 

Insgesamt 39 (18%) Personen hatten eine Pflichtschule oder Realschule ohne 

abgeschlossene Berufsausbildung absolviert (EU Bildungsgrad 2), 96 (43%) Personen 

hatten eine abgeschlossene Berufsausbildung bzw. eine Fachschule absolviert (EU 

Bildungsgrad 3), 35 (16%) Personen hatten einen Abitur- oder Fachhochschulabschluss (EU 

Bildungsgrad 4) und 52 (23%) Personen verfügten über einen Hochschulabschluss (EU 

Bildungsgrad 5). 




der Testbatterie Plus lag die Klassifikationsrate bei 86.5% Dies entspricht einem 



Klassifikationsrate von 80.2% und ein Validitätskoeffizent von R=0.67 erzielt. Für die 


von 83.8% und einem Validitätskoeffizent von R=0.77. Die Intervalle für die 

Klassifikationsrate und den Validitätskoeffizent in der Bootstrap-Validierung lagen bei 



einzelnen Testverfahren der beiden Testbatterien können der Tabelle 16 entnommen 

werden. Die relative Relevanz gibt an, mit welchem Anteil der entsprechende Test zur 

Validität des Vorhersagemodells beiträgt.

Tabelle 16. Inkrementelle Validitäten und relative Relevanzen der beiden Testbatterien Standard und Plus 


Inkrementelle 

Validität 

STANDARD 

Relative 

Relevanz 

Inkrementelle 

Validität 

PLUS 

Relative 

Relevanz 


DT: Richtige 0.124 18.2% 0.071 10.5% 








0.141 20.3% 0.093 13.6% 

Die Ergebnisse sprechen somit bei einer relativen Relevanz von 18.2% (Testbatterie 

Standard) bzw. 10.5% (Testbatterie Plus) für die Kriteriumsvalidität des DT. 

Sommer, Arendasy, Hansen und Schuhfried. (2005) untersuchten die Kriteriumsvalidität 

einer umfassenden fliegerpsychologischen Testbatterie zur Auswahl geeigneter 

Militärpilotenanwärter. Die Studie gliederte sich in zwei Phasen. In der ersten Phase wurde 

eine umfassende Testbatterie administriert. Als Prädiktorvariablen dienten hierbei die 

Testvariablen Figural-Induktives Denken und Visuelles Kurzzeitgedächtnis aus der 

Intelligenz-Struktur-Batterie (Arendasy et al., 2005), die Testvariable Richtige aus dem 

Determinationstest Form S1 sowie die Testvariable Raumvorstellung aus dem Adaptiven 

Dreidimensionalen Würfeltest (Gittler, 2002) und die Testvariable Zeit im Idealbereich aus 

der Sensomotorischen Koordination (Bauer, Guttmann, Leodolter & Leodolter, 2002). In der 

zweiten Phase wurde die Performanz der Probanden in einem standardisierten Flugsimulator 

erhoben. Anhand der Globalbeurteilung der erbrachten Leistung im standardisierten 

Flugsimulator wurde die Stichprobe in geeignete Pilotenanwärter (53.54%) und weniger 

geeignete Pilotenanwärter (46.46%) unterteilt. Die Stichprobe besteht aus insgesamt 99 

männlichen Pilotenanwärtern im Alter von 16 bis 25 Jahren. Der Altersmittelwert liegt bei 

20.4 Jahren bei einer Standardabweichung von 1.85 Jahren. 1 Person (1%) verfügt über 

einen Pflichtschulabschluss ohne abgeschlossene Berufsausbildung während 19 Personen 

(19.2%) zudem auch über eine abgeschlossene Berufsausbildung verfügen. Insgesamt 74 

Personen (74.7%) können ein Abitur bzw. eine Matura vorweisen. 5 Personen (5.1%) haben 

einen Universitätsabschluss. Die Gruppe der positiv beurteilten Personen besteht aus 53 

Männern (53.54%) während 46 Männer (46.46%) keine positive bzw. eine nur beschränkt 

positive Bewertung erhalten haben. Unter Anwendung künstlicher Neuronaler Netze konnte 

anhand der hier verwendeten Testverfahren der Erfolg im Flugsimulator bei 79.8% der 

Probanden korrekt vorhergesagt werden. In der Jackknife-Validierung lag die 

Klassifikationsrate bei 73.8%. Das hier vorgestellte Testverfahren trug mit einer relativen 

Relevanz von 18% zum Vorhersagemodell bei, sodass von der Kriteriumsvalidität des DT im 

Bereich der fliegerpsychologischen Diagnostik ausgegangen werden kann. 

Normstichprobe 

Es liegt eine Normierung der Testform S1 mit einer Stichprobe vom Umfang N=1179 vor. 

Tabelle 17 zeigt die Verteilung der Stichprobenmerkmale.

Tabelle 17: Verteilung der Stichprobenmerkmale 

Altersgruppen -25 J. 26-35 J. 36-59 J. 60 - 70 J. ab 71 J. Gesamt 

N 136 222 477 205 139 581 / 598 

% 11,5 18,8 40,5 17,4 11,8 49 / 51 

Anmerkung: Die Zahlen links und rechts vom Schrägstrich stehen für die Anzahl der Männer bzw. Frauen. 

Bei der oben beschriebenen Stichprobe handelt es sich um „normale" Erwachsene, die im 

Rahmen von Normierungsstudien 1996 bis 2001 im Forschungs- und Schulungslabor der 

SCHUHFRIED GmbH erhoben wurden. 

Die Normstichprobe (N=1179) setzt sich aus 581 Männern (49%) und 598 Frauen (51%) 

zusammen. Die Stichprobe ist in Teilstichproben nach fünf Altersgruppen (bis 25, 26-35, 36- 

59, 60-70, 71 Jahre und älter) sowie in Teilstichproben nach den Bildungsstufen 1-3 

(Volksschule, Haupt- bzw. Realschule, Lehrabschluss) und 4-5 (Abitur, 

Universitätsabschluss) aufgeteilt, die sich voneinander signifikant unterscheiden. 

Tabelle 18: Erwartete und tatsächlich beobachtete Häufigkeiten in der Stichprobe 

Altersgruppe in Jahren Beobachtete Häufigkeiten Erwartete Häufigkeiten 

15 bis 20 36 35 

21 bis 25 100 94 

26 bis 30 106 130 

31 bis 35 116 130 

36 bis 40 115 106 

41 bis 45 67 106 

46 bis 50 82 83 

51 bis 55 108 106 

56 bis 60 132 94 

61 bis 65 101 71 

66 bis 70 77 71 

71 bis 75 72 59 

76 bis 80 54 35 

81 bis 85 11 35 


Anmerkung: Beobachtete Häufigkeiten sind die Stichprobengrößen in der Normstichprobe. Erwartete 

Häufigkeiten basieren auf den Daten, die anhand der Volkszählung 1991 ermittelt wurden. 

Für jede Stichprobengröße wird die repräsentative Verteilung basierend auf Daten der 

österreichischen Volkszählung 1991 (Volkszählung 1991: Hauptergebnisse I - Österreich 

Heft 1.030/10 der Beiträge zur Österreichischen Statistik, hg. vom österreichischen 

Statistischen Zentralamt, Wien 1993.) und Daten aus Deutschland, die ebenfalls von einer 

Volkszählung stammen, die nach der Wiedervereinigung Deutschlands durchgeführt wurde, 

berechnet. Diese Daten entsprechen den erwarteten Häufigkeiten in Tabelle 18.

Überblicksgewinnung 

Der Personenparameter der Variable Überblicksgewinnung stellt ein Maß für die Genauigkeit 

und Geschwindigkeit der visuellen Beobachtungsfähigkeit und Überblicksgewinnung sowie 

der visuellen Orientierungsleistung dar. In diesem Testkennwert kommen somit die 

Wahrnehmungskapazität und das Wahrnehmungstempo am deutlichsten zum Ausdruck. 

Ein hoher Prozentrang (PR>84) weist auf eine gut ausgeprägte Fähigkeit zur raschen und 

genauen Situationserfassung hin, während ein niedriger Prozentrang (PR

kognitiven Prozesse tatsächlich ansprechen und daher auch Unterschiede in den 

Itemschwierigkeitsparametern erklären können. Der Einfluss der Aufgabenmerkmale und der 

mit ihnen assoziierten kognitiven Prozesse kann mit Hilfe erklärender IRT-Modelle wie dem 

Linearen Logistischen Testmodell (LLTM, Fischer, 1974) oder multiplen Regressionen (z.B. 

Embretson, 1998; 2002) empirisch überprüft werden. 

Um von einer angemessenen Konstruktvalidität ausgehen zu können, sollten sich zudem 

auch die theoretisch zu erwartenden Zusammenhänge mit anderen Testverfahren zeigen. 

Hinsichtlich des letztgenannten Aspekts sprechen Embretson (1983) und Messick (1995) von 

einem Nachweis der nomothetischen Spanne. 

Hinweise zur Konstruktrepräsentation von ATAVT liefert eine Studie von Sommer, Herle, 

Häusler & Arendasy (2008), in der versucht wurde, die Itemschwierigkeitsparameter der 

k=84 neuen Items anhand des Konstruktionsrationals von ATAVT vorherzusagen. Die 

Autoren verwendeten in Anlehnung an Embretson (2002) eine schrittweise multiple 

Regression, wobei die folgenden Schwierigkeitsfaktoren in der hier genannten Reihenfolge 

einbezogen wurden: (1) „Anzahl der sichtbaren Objektklassen“, (2) „Relativer Anteil der 

notwendigen peripheren Objekte“, (3) „Relativer Anteil der notwendigen kleinen Objekte“, (4) 

„Erfahrungsbedingte Täuschung“, (5) „Schlechter Konturenkontrast“, (6) „Relativer Anteil der 

notwendigen verdeckten Objekte“ und (7) „Relativer Anteil typischer Objekte“. Die 

Modellzusammenfassung ist in Tabelle 19 dargestellt. 

Tabelle 19: Modellzusammenfassung der schrittweisen multiplen Regression 

Modell R R² adj. R² Δ R² Δ F df1 df2 p 

1 0.801 0.642 0.637 0.642 146.86 1 82

Wie aus Tabelle 20 deutlich hervorgeht, leisten alle der theoretisch postulierten 

Schwierigkeitsfaktoren einen signifikanten Beitrag zur Vorhersage der 

Itemschwierigkeitsparameter. Eine Inspektion der β-Gewichte zeigt jedoch, dass die „Anzahl 

der sichtbaren Objektklassen“ den vergleichsweise größten Beitrag zur Vorhersage der 

Itemschwierigkeitsparameter leistet. 

Hinweise auf die nomothetische Spanne (Embretson, 1983) des ATAVT ergeben sich aus 

der Studie von Zuschlag und Jacobshagen (1982). Die Autoren fanden in ihrer Untersuchung 

folgende Korrelation zwischen einer Vorversion des ATAVT und anderen Testverfahren zur 

visuellen Wahrnehmung: Labyrinth-Test: r=0.38; Fehler im Benton-Test: r=0.33; Fehler im 

Mehrfachwahl-Reaktionsversuch: r=0.30. Zudem untersuchten Karner und Biehl (2001) den 

Zusammenhang zwischen einer Vorversion des ATAVT und dem Tachistoskop-Test (TT15: 

Bukasa & Wenninger, 1986). Die Autoren berichten einen signifikanten 

Korrelationskoeffizienten in der Höhe von r=0.77. Die vorliegenden Befunde zur 

nomothetischen Spanne sprechen somit für die konvergente Validität von ATAVT. 


Hinweise auf die Kriteriumsvalidität von ATAVT liefern zahlreiche Studien aus dem Bereich 

der verkehrspsychologischen Diagnostik, die zum Teil mit einer Vorversion von ATAVT – 

dem TAVTMB - durchgeführt wurden. So berichtet beispielsweise Kamuf (1988) eine 

Korrelation zwischen der Fahrprobe und einer Vorversion von ATAVT (TAVTMB: Biehl, 

1996) in der Höhe von 0.74. In einer weiteren Untersuchung konnte Kamuf (1988) zeigen, 

dass unter Berücksichtigung des Alterseinflusses Betriebskraftfahrer und Fahrlehreranwärter 

beim TAVT signifikant bessere Ergebnisse erreichten als eine Kontrollgruppe. 

Eine Untersuchung von Schubert, Müller und Senf (1962) zeigte signifikante Unterschiede 

zwischen den Testleistungen bewährter und auffälliger Kraftfahrer. Hampel (1976) stellte 

signifikante Mittelwertunterschiede zwischen Fahrlehreranwärtern und tatauffälligen 

Kraftfahrern in einer Vorversion von ATAVT (TAVTMB: Biehl, 1996) fest. 

Eine Studie von Hartje, Pach, Willmes, Hannen und Weber (1991) zeigte eine Korrelation 

zwischen einer Vorversion von ATAVT (TAVTMB: Biehl, 1996) und einer Fahrprobe von 

r=0.42 bei Personen mit Schädel-Hirn-Traumata. 

Eine Untersuchung von Schlag (1994) zeigte hochsignifikante Unterschiede zwischen 

Personen unter 70 Jahren und Personen über 70 Jahren (N=110) bei Fahrversuch und 

Testung mittels einer Vorgängerversion von ATAVT (TAVTMB: Biehl, 1996). Ältere Personen 

waren beim Einfädeln auf Autobahnauffahrten langsamer, wählten einen engeren 

Abbiegeradius beim Einbiegen auf eine Landstraße, zeigten allgemein ein höheres 

Bestreben, den rechten Fahrstreifen zu wählen. Sie missachteten deutlich öfter die Vorfahrt 

und die rote Ampel. Ältere Personen übersahen öfter bevorrangte Verkehrsteilnehmer und 

querten einen unbeschrankten Bahnübergang ohne Geschwindigkeitsreduktion. 

Hinweise auf die Validität ergeben sich auch aus einer Studie mit einer Vorgängerversion 

des Testverfahrens (Bukasa, Wenninger & Brandstätter 1990). Diese Untersuchung 

umfasste eine Gruppe von N=248 freiwilligen Kraftfahrern. Die Vorversion von ATAVT 

(TAVTMB: Biehl, 1996) kann zwischen angepassten und unangepassten Fahrern trennen. 

Eine Zuordnung der Probanden zu Fahrertypologien aufgrund der Testergebnisse gelingt zu 

83%. Eine zweite Gruppe von N=120 verkehrsauffälligen Probanden aus der 

Fahreignungsdiagnostik wurde ebenfalls untersucht. Die Testergebnisse stehen mit den in 

der Fahrverhaltensbeobachtung registrierten Verhaltensfehlern und Konflikten in einem 

deutlichen Zusammenhang. Zusammenhänge zwischen folgenden Fahrverhaltenskategorien 

und der Vorversion des ATAVT (TAVTMB: Biehl, 1996) konnten festgestellt werden: 

Einordnen, Spurwechsel, Vorrang-Nachrang-Situationen, spätes Reagieren an Ampeln, 

Abstandhalten. Ein Extremgruppenvergleich bezüglich der Fahrverhaltenskategorien, d.h. die

Stichprobe wurde in die 40% Besten und 40% Schlechtesten gesplittet, ergab bei Fehlern 

aus der Fahrverhaltensbeobachtung signifikante Leistungsunterschiede im vorliegenden 

Testverfahren. 

Karner und Neuwirth (2000) konnten eine Korrelation von –0.42 zwischen dem Globalurteil 

des Fahrverhaltens in einer standardisierten Fahrprobe und dem Testergebnis in einer 

Vorversion des ATAVT (TAVTMB: Biehl, 1996) nachweisen. Darüber hinaus zeigen sich 

auch signifikante Unterschiede in der Gesamtbewertung des Fahrverhaltens zwischen 

Personen mit Leistungen PR

Tabelle 21: Inkrementelle Validität und relative Relevanz der einzelnen Tests 


AMT: Allgemeine Intelligenz 0.011 1.4% 

DT: Richtige 0.133 20.9% 

SIGNAL: Richtige und Verspätete 0.075 9.2% 

ATAVT: Überblicksgewinnung 0.064 7.9% 

WRBTV: Subjektiv akzeptiertes Risikoniveau 0.072 8.9% 

IVPE-PS: Psychische Stabilität 0.311 32.2% 

IVPE-VB: Soziales Verantwortungsbewusstsein 0.087 10.6% 

IVPE-SK: Selbstkontrolle 0.066 8.2% 

IVPE-TA: Spannungsbedürfnis und Abenteuerlust 0.001 2.0% 

Die Ergebnisse sprechen somit bei einer relativen Relevanz von rund 8% für die 

Kriteriumsvalidität von ATAVT. 

Eine weitere Studie von Risser et al. (2008) beschäftigte sich mit der Kriteriumsvalidität 

zweier Testbatterien zur Erfassung der kraftfahrspezifischen Leistungsfähigkeit aus dem 

Expertensystem Verkehr (Schuhfried, 2005), die ebenfalls eine Vorversion von ATAVT 

(TAVTMB: Biehl, 1996) beinhaltete. Die beiden Testbatterien Standard und Plus 

unterschieden sich hierbei ausschließlich darin, ob die Periphere Wahrnehmung (PP) als 

Maß für das Gesichtsfeld und die geteilte Aufmerksamkeit vorgegeben wurde. Als 

Kriteriumsvariable wurde das Globalurteil über das Fahrverhalten in einer standardisierten 

Fahrprobe herangezogen. Die von den Autoren untersuchte Stichprobe bestand aus 164 

(74%) Männern und 58 (26%) Frauen im Alter von 19 bis 91 Jahren bei einem 

durchschnittlichen Alter von 59 Jahren und einer Standardabweichung von 18 Jahren. Der 

Altersmedian lag bei 64 Jahren. Es handelte sich daher um Personen im mittleren bis 

höheren Lebensalter. Bei den Probanden handelte es sich zum Teil um bereits auffällige 

Kraftfahrer. 

Insgesamt 39 (18%) Personen hatten eine Pflichtschule oder Realschule ohne 

abgeschlossene Berufsausbildung absolviert (EU Bildungsgrad 2), 96 (43%) Personen 

hatten eine abgeschlossene Berufsausbildung bzw. eine Fachschule absolviert (EU 

Bildungsgrad 3), 35 (16%) Personen hatten eine höhere Schule mit Abitur/Matura 

abgeschlossen (EU Bildungsgrad 4) und 52 (23%) Personen verfügten über einen 

Hochschulabschluss (EU Bildungsgrad 5). 

Die Korrelationen zwischen den einzelnen Tests und dem Außenkriterium können Tab. 22 

entnommen werden. 

Tabelle 22: Korrelationen zwischen den Testverfahren und dem Außenkriterium 

AMT 

DT 

RT kogn. 

Geschw. 

RT mot. 

Geschw. 

PP 

Gesichtsfeld 

PP 

Tackingab 

weichung 

TAVT 

.22* .33** .27** -.25** .07 -.33* .42** .19 

*p

konnten. Bei der Testbatterie Plus lag die Klassifikationsrate bei 86.5% Dies entspricht 

einem Validitätskoeffizienten von R=0.68 für die Testbatterie Standard und R=0.78 für die 







bei [77.5%; 87.2%] und [0.61; 0.79]. Die Ergebnisse konnten zudem auch von Sommer et al. 

(2008) anhand einer weiteren unabhängigen Stichprobe repliziert werden. 

Die inkrementelle Validität und relative Relevanz der einzelnen Testverfahren der beiden 

Testbatterien können der Tabelle 23 entnommen werden. Die relative Relevanz gibt an, mit 

welchem Anteil der entsprechende Test zur Validität des Vorhersagemodells beiträgt. 

Tabelle 23:Inkrementelle Validität und relative Relevanz der einzelnen Tests 


Inkrementelle 

Validität 

STANDARD 

Relative 

Relevanz 

Inkrementelle 

Validität 

PLUS 

Relative 

Relevanz 


DT: Richtige 0.124 18.2% 0.071 10.5% 





ATAVT: Überblicksgewinnung 0.120 17.6% 0.038 5.8% 



0.141 20.3% 0.093 13.6% 

Die Ergebnisse sprechen somit bei einer relativen Relevanz von 17.6% (Testbatterie 

Standard) bzw. 5.8% (Testbatterie Plus) für die Kriteriumsvalidität von ATAVT. 

Hinweise auf die inkrementelle Kriteriumsvalidität einer Vorversion von ATAVT (TAVTMB: 

Biehl, 1996) ergeben sich auch aus den Ergebnissen einer Studie von Sommer et al. (2008). 

Die Autoren untersuchten die Kriteriumsvalidität einer Testbatterie zur Erfassung der 

kraftfahrspezifischen Leistungsfähigkeit und der Bereitschaft zur Verkehrsanpassung aus 

dem Expertensystem Verkehr (Schuhfried, 2005), die ebenfalls eine Vorversion von ATAVT 

beinhaltete. Als Kriteriumsvariable wurde das Globalurteil über das Fahrverhalten in einer 

standardisierten Fahrprobe herangezogen. Sommer et al. (2008b) untersuchten eine 

Stichprobe von 127 (79.9%) Männern and 32 (20.1%) Frauen im Alter von 19 bis 73 Jahren 

(Mean=39.41; SD=11.92). Insgesamt 29 (18.2%) Personen hatten eine Pflichtschule oder 

Realschule ohne abgeschlossene Berufsausbildung absolviert (EU Bildungsgrad 2), 96 

(43%) Personen hatten eine abgeschlossene Berufsausbildung bzw. eine Fachschule 

absolviert (EU Bildungsgrad 3), 35 (16%) Personen hatten eine höhere Schule mit 

Abitur/Matura abgeschlossen (EU Bildungsgrad 4) und 52 (23%) Personen verfügten über 

einen Hochschulabschluss (EU Bildungsgrad 5). Insgesamt 109 (68.6%) Personen wurden 

anhand ihrer Performanz in der standardisierten Fahrprobe (Wiener Fahrprobe) als sichere 

Fahrer beurteilt.

Die Korrelationen zwischen den einzelnen Tests und dem Außenkriterium können Tabelle 24 

entnommen werden. 

Tabelle 24: Korrelationen zwischen den Testverfahren und dem Außenkriterium 

AMT 

DT 

RT 

kogn. Geschw. 

RT 

motor. Geschw. 

TAVT 

- .120 -.390* .184* .201* -.393** .212* 

** p

Die inkrementelle Validität und relative Relevanz der einzelnen Tests kann der Tabelle 26 

entnommen werden. Die relative Relevanz gibt an, mit welchem Anteil der entsprechende 

Test zur Validität des Vorhersagemodells beiträgt. 

Tabelle 26:Inkrementelle Validität und relative Relevanz der einzelnen Testverfahren 


Numerisch-induktives Denken (INSBAT- 

NID) 

Arithmetische Kompetenz 

(INSBAT-AK) 

Betrachtungszeit 

(INSBAT-BZ) 

Entscheidungsfähigkeit 

(INSBAT-EF) 

Figural-induktives Denken 

(INSBAT-FID) 

0.157 13.4% 

0.205 16.9% 

0.195 16.2% 

0.167 14.1% 

0.324 24.6% 

Numerische Flexibilität (INSBAT-NF) 0.105 4.6% 

Tachistoskopischer 

Verkehrsauffassungstest (ATAVT) 

0.117 10.2% 

Die Ergebnisse sprechen bei einer relativen Relevanz von 10.2% für die Kriteriumsvalidität 

von ATAVT im Bereich der Pilotenauswahl. 

Ein grundlegendes Ziel der Testkonstruktion des ATAVT war die vollständige inhaltliche und 

psychometische Äquivalenz zwischen ATAVT und TAVTMB (Biehl, 1996). Um die 

Erreichung dieses Entwicklungsziels zu überprüfen, wurden bei der Untersuchung der 

Eindimensionalität des Itempools des ATAVT neben den neu konstruierten Aufgaben des 

ATAVT auch die Aufgaben des TAVTMB miteinbezogen. Gilt das Rasch-Modell (Rasch, 

1980) für den gemeinsamen Itempool aus den beiden Testverfahren, kann die Annahme 

einer Äquivalenz der beiden Tests beibehalten werden. Dies würde bedeuten, dass ATAVT 

und TAVTMB exakt dieselbe latente Fähigkeit messen. Diese Hypothese wurde von 

Sommer, Herle, Häusler & Arendasy (2008) mit Hilfe eines Link-Designs empirisch überprüft 

(für Details: Kapitel 2.2.4.). Die Autoren konnten in ihrer Studie nachweisen, dass für den 

gemeinsamen Itempool Rasch-Homogenität gilt. Dies bedeutet, dass die beiden 

Testverfahren nachweislich ein und dieselbe Fähigkeitsdimension messen. 

Durch die Verwendung des Link-Designs konnten zudem die Schwierigkeitsparameter der 

ATAVT-Items an die Itemschwierigkeitsparameter des TAVTMB abgeglichen werden (vgl. 

Holland & Dorans, 2006; Kolen & Brennan, 2004). Dies hat den Vorteil, dass der 

Personenparameter des ATAVT direkt auf den TAVTMB übertragen werden kann, sodass 

die Testergebnisse des ATAVT bzw. TAVTMB auf den jeweils anderen Test übertragbar 

sind. Die beiden Testverfahren sind somit nicht nur hinsichtlich der gemessenen 

Fähigkeitsdimension, sondern auch hinsichtlich der vom Probanden in den beiden 

Testverfahren erzielten Leistung direkt miteinander vergleichbar bzw. ineinander 

überführbar. Hieraus ergibt sich auch der Vorteil, dass Studien zur Validität mit einem der 

beiden Testverfahren direkt auf das andere Verfahren übertragen werden können. ATAVT 

und TAVTMB sind somit nicht nur inhaltlich, sondern auch psychometrisch äquivalent. Der 

wesentliche Vorteil des ATAVT gegenüber von TAVTMB besteht jedoch in (1) einer höheren 

Messpräzision auf Einzelfallebene durch die adaptive Testvorgabe sowie (2) in einer 

erhöhten Testsicherheit, die mit Hilfe der adaptiven Testvorgabe und der Item-Exposure- 

Control realisiert werden kann

Die Normdaten wurden in den Jahren 2007 bis 2008 im Forschungslabor der Firma 

SCHUHFRIED GmbH erhoben. Die Stichprobe umfasst 574 (48.3%) Männer und 615 

(51.7%) Frauen. Die Geschlechtsverteilung unterscheidet sich nicht von der zu erwartenden 

Verteilung. Die erwartete Verteilung wurde anhand der Daten der österreichischen 

Volkszählung 2001 und einer Volkszählung aus Deutschland nach der Wiedervereinigung 

berechnet. 

Die Probanden weisen ein Lebensalter von 15 bis 94 Jahren auf. Der Altersmedian liegt bei 

41 Jahren bei einem Altersmittelwert von 42 Jahren und 4 Monaten und einer 

Standardabweichung von 16 Jahren und 2 Monaten. Die genaue Altersverteilung der 

Normstichprobe kann Tabelle 14 entnommen werden. Insgesamt 6 (0.5%) Personen der 

Normstichprobe haben keinen Pflichtschulabschluss (EU Bildungsgrad 1), 125 (10.5%) 

Personen haben eine Pflichtschule oder Realschule absolviert, allerdings ohne 

abgeschlossene Berufsausbildung (EU Bildungsgrad 2), 500 (42.1%) Personen haben eine 

abgeschlossene Berufsausbildung (EU Bildungsgrad 3), 438 (36.8%) Personen haben eine 

höhere Schule mit Abitur/Matura abgeschlossen (EU Bildungsgrad 4) und 120 (10.1%) 

Personen verfügen über einen Hochschulabschluss (EU Bildungsgrad 5). 

Tabelle 27:Altersverteilung der Normstichprobe 

Altersgruppe in Jahren Beobachtete Häufigkeiten erwartete Häufigkeiten 

15 bis 20 58 86 

21 bis 25 122 84 

26 bis 30 143 96 

31 bis 35 111 119 

36 bis 40 136 126 

41 bis 45 110 111 

46 bis 50 109 93 

51 bis 55 100 92 

56 bis 60 93 81 

61 bis 65 83 80 

66 bis 70 52 59 

71 bis 75 37 58 

76 bis 80 28 52 

81 bis 85 5 27 


Hinweis: Beobachtete Häufigkeiten sind die Stichprobengrößen in der Normstichprobe. 

Erwartete Häufigkeiten entsprechen den Daten, die anhand der Volkszählung ermittelt 

wurden.

Bundesgesetzblatt Jahrgang 1998 Teil I Nr. 55 ausgegeben zu Bonn am 26. August 1998 

(Fahrerlaubnisverordnung-FEV). Bonn: August 1998. 

Bukasa, B., Wenninger, U. & Brandstätter, CH. (1990). Validierung Verkehrspsychologischer 

Testverfahren. Wien: Literas Universitätsverlag 

Calé, M. (1992). Minimal brain dysfunction and road accidents. Israel: Driver Institute 

Calé, M. (1992). Theory and practice of evaluating elderly drivers with ART90. Paper 

presented at the 13th National Conference on Specialised Transportation. Tampa, 

October 1992. 

Dorsch, F., Häcker, H., Stapf, K. (Hrsg.) (1994). Psychologisches Wörterbuch. Bern, 

Göttin¬gen, Toronto, Seattle: Verlag Hans Huber 

Färber, B. (1986). Zur Validität des TAVT-N. Zschr. f. Verkehrssicherheit, 32, 178-180. 

Grübel-Mathyl, U. (1987). Wirkung von Neuroleptika auf relevante Aspekte der 

Fahrtüchtigkeit bei schizophrenen Patienten. Bergisch Gladbach: Eigenverlag der 

Bundesanstalt für Straßenwesen 

Hampel, B. (1976). Neugestaltung des verkehrsgebundenen Tachistoskopischen 

Auffassungs-Versuchs (TAVT). Unveröff. Schlussbericht zum Forschungsvorhaben 

Nr. 42 der VdTÜV. Köln: TÜV Rheinland. 

Hartje, W., Pach, R., Willmes, K., Hannen, P. & Weber, E. (1991). Fahreignung 

hirngeschädigter Patienten. Zschr. f. Neuropsychologie, 2, 100-114 

Hornke, L.F. (1993). Mögliche Einspareffekte beim computergestützten Testen. Diagnostica, 

39, 109-119 

Hornke, L.F. & Etzel, S. (1995). Theoriegeleitete Konstruktion und Evaluation von 

computergestützten Tests zum Merkmalsbereich Gedächtnis und Orientierung. In: 

BM der Verteidigung PII 4. Untersuchungen des Psychologischen Dienstes der 

Bundes¬wehr 1993/1995 Band2. München. 

Kamuf, H. (1988). Entwicklung und Validierung eines Testverfahrens zur Überprüfung 

kom¬plexer visueller Wahrnehmungsleistungen bei Kraftfahrern. Unveröff. Dipl.Arbeit, 

Universität, Mannheim. 

Karner, T. (2000). Sind verkehrspsychologische Testverfahren geeignete Instrumente, um 

mögliche Leistungsminderungen alkoholauffälliger Kraftfahrer aufzuzeigen? Report 

Psychologie, 9/2000 

Karner, T., Biehl, B. (2000). Kriteriumsvalidierung Verkehrspsychologischer Verfahren: PC 

vs. ART90. (Zur Publikation eingereicht) 

Karner, T. & Neuwirth, W. (2000). Validation of traffic psychology tests by comparing with 

actual driving. International Conference on Traffic and Transport Psychology, 4-7 

September, Berne Switzerland. 

Klebelsberg, D. & Kallina, H. (1963). Verhaltensanalyse des Kraftfahrers. In: Verkehrspsychologie 

II. Wien: Kleine Fachbuchreihe des Kuratoriums f. Verkehrssicherheit

Klebelsberg, D. (1982). Verkehrspsychologie. Berlin: Springer Verlag. 

Kroj, G. (1995). Psychologisches Gutachten Kraftfahreignung. Bonn: Deutscher Psychologen 

Verlag 

Kubinger, K.D. (1995). Einführung in die psychologische Diagnostik. Weinheim: Psycholo-gie 

Verlags Union 

Lesky, J. (1998). Messung der einfachen Reaktionszeit mit dem Wiener Reaktionsgerät - 

Re¬liabilität und Testeichung. Tobelbad: Eigenverlag 

Lienert, G.A. (1969). Testaufbau und Testanalyse. München: Psychologie Verlags Union 

Neuwirth, W., (2001). Extremgruppenvalidierung verkehrspsychologischer Testverfahren 

anhand von Zuweisungsgruppen. Psychologie in Österreich 2/2001 

Richter, W. (1981). Ermittlung von Normwerten bei einem Aktions- und Reaktionsversuch am 

Wiener Determinationsgerät und Prüfung dieser Werte im Hinblick auf die 

Kraftfahreignung. Unveröff. Forschungsauftrag VdTÜV Nr.38 

Schlag, B. (1994). Fahrverhalten älterer Autofahrer/innen. In: Tränkle U (Hrsg.). Autofahren 

im Alter. Köln: Verlag TÜV Rheinland. 

Schubert, G., Müller, A. & Senf, E. (1962). Testserie zur Untersuchung der optischen 

Orientie¬rung bei Kraftfahrtauglichkeitsuntersuchungen. Psychologie und Praxis, 6, 

147-153. 

Schubert, W., Schneider, W., Eisenmenger, W. & Stephan E. 820039. 

Begutachtungsleitlinien zur Kraftfahrereignung. Kommentar. Bonn: Kirschbaum. 

Schuhfried, G. (2004). Zur Normstichprobenwahl in der Fahreignungsdiagnostik. Zschr. f. 

Verkehrssicherheit, 28, 97-98. 

Sommer, M. Arendasy, M., Olbrich, A. & Schuhfried, G. (2004). Qualitätsverbesserung in der 

verkehrspsychologischen Diagnostik mit neuronalen Netzen: Eine Pilotstudie. Zschr. 

f. Verkehrssicherheit, 50, 193-198. 

Strohbeck-Kühner, P. (1999). Testangst bei Fahreignungsbegutachtungen: Die Angst- 

Leistung-Relation. Zeitschrift für Differentielle und Diagnostische Psychologie, 20 (1), 

39-57. 

Zuschlag, B. & Jacobshagen, W. (1982). Einsatz des Aufmerksamkeits-Prüf-Geräts (APG) 

bei Fahreignungsuntersuchungen. Zschr. f. Verkehrssicherheit, 28, 63-73.

Tabelle 1: Testverfahren des Test-Sets FeV ......................................................................... 8 

Tabelle 2: : Korrelationen der Leistungsmerkmale (Mediane) mit den Rohwerten der CPM .. 9 

Tabelle 3: Interkorrelationen der Zeitvariablen bei der Normstichprobe, Testform S3 ...........10 

Tabelle 4: Inkrementelle Validitäten und relative Relevanzen der beiden Testbatterien 

Standard und Plus ................................................................................................................11 

Tabelle 5: Verteilung der Stichprobenmerkmale ...................................................................12 

Tabelle 6: Verteilungscharakteristika der Leistungsmerkmale bei Vorgabe von S3 ..............12 

Tabelle 7: Modelltest für die Gesamtstichprobe ....................................................................14 

Tabelle 8: Modelltest nach Ausscheiden der Personen mit inadäquatem Arbeitstempo........15 

Tabelle 9: Korrelationen zwischen den Testverfahren inkl. Konfidenzintervalle ....................16 

Tabelle 10: Inkrementelle Validitäten und relative Relevanzen der beiden Testbatterien 


Tabelle 11: Altersverteilung der Normstichprobe (N=1475) ..................................................18 

Tabelle 12: Altersverteilung der Normstichprobe ..................................................................20 

Tabelle 13: Innere Konsistenz der Testform S1, berechnet als Cronbach Alpha auf 

Itemniveau. ...........................................................................................................................21 

Tabelle 14: Korrelationen DT mit TAVT und RT....................................................................22 

Tabelle 15. Inkrementelle Validität und relative Relevanz der einzelnen Tests .....................23 

Tabelle 16. Inkrementelle Validitäten und relative Relevanzen der beiden Testbatterien 


Tabelle 17: Verteilung der Stichprobenmerkmale .................................................................26 

Tabelle 18: Erwartete und tatsächlich beobachtete Häufigkeiten in der Stichprobe ..............26 

Tabelle 19: Modellzusammenfassung der schrittweisen multiplen Regression .....................28 

Tabelle 20: Regressionsgewichte in Modell 7 der multiplen Regression ...............................28 

Tabelle 21: Inkrementelle Validität und relative Relevanz der einzelnen Tests .....................31 

Tabelle 22: Korrelationen zwischen den Testverfahren und dem Außenkriterium .................31 

Tabelle 23:Inkrementelle Validität und relative Relevanz der einzelnen Tests ......................32 

Tabelle 24: Korrelationen zwischen den Testverfahren und dem Außenkriterium .................33 

Tabelle 25:Inkrementelle Validität und relative Relevanz der einzelnen Tests ......................33 

Tabelle 26:Inkrementelle Validität und relative Relevanz der einzelnen Testverfahren .........34 

Tabelle 27:Altersverteilung der Normstichprobe ...................................................................35 

Abbildung 1: Ergebnisausdruck FEV Anlage 5/2 ................................................................... 5 

Abbildung 2: Reportmuster .................................................................................................... 6 

Abbildung 3: Probandentastatur für die FEV Anlage 5/2 Untersuchung ................................. 7 

Abbildung 4: Stufen zur Klassifikation verschiedener Arten von Aufmerksamkeit (und die 

zugeordneten Testverfahren). ..............................................................................................16

Max, Mustermann - SCHUHFRIED GmbH

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?