27.06.2014 Aufrufe

Max, Mustermann - SCHUHFRIED GmbH

Max, Mustermann - SCHUHFRIED GmbH

Max, Mustermann - SCHUHFRIED GmbH

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

1.1 Die Leistungsuntersuchung mit dem Wiener Testsystem ................................................ 3<br />

1.1.1 Vorgabe der Verfahren .............................................................................................. 3<br />

1.1.2 Testergebnisse ......................................................................................................... 4<br />

1.1.3 Beurteilung des Ergebnisses der Leistungsuntersuchung (Report) ........................... 6<br />

1.2 Eingabemedien .............................................................................................................. 7<br />

1.3 Vernetzte Anlagen .......................................................................................................... 7<br />

2.1 Reaktionsfähigkeit .......................................................................................................... 8<br />

2.1.1 Reaktionstest (RT/S3) ............................................................................................... 8<br />

2.2 Konzentrationsleistung ..................................................................................................13<br />

2.2.1 (COG/S11) ...............................................................................................................13<br />

2.3 Orientierungsleistung .....................................................................................................19<br />

2.3.1 Linienverfolgungstest (LVT/S3) ................................................................................19<br />

2.4 Belastbarkeit ..................................................................................................................21<br />

2.4.1 Determinationstest (DT/S1) ......................................................................................21<br />

2.5 Aufmerksamkeitsleistung ...............................................................................................27<br />

2.5.1 Adaptiver Tachistoskopischer Verkehrsauffassungstest (ATAVT/S1) .......................27<br />

2.5.2 Äquivalenz von TAVTMB und ATAVT ......................................................................34


In Deutschland sind zur Eignungsuntersuchung für Bewerber und Inhaber der Fahrerlaubnis<br />

u.a. folgende Regelungen in Kraft (Bundesgesetzblatt Jahrgang 1998 Teil I Nr. 55 -<br />

Fahrerlaubnisverordnung-FeV nach Anlage 5):<br />

Anlage 5 Absatz 2:<br />

Bewerber um die Erteilung oder Verlängerung einer Fahrerlaubnis der Klassen D, D1, DE,<br />

D1E sowie eine Fahrerlaubnis zur Fahrgastbeförderung müssen besondere Anforderungen<br />

hinsichtlich:<br />

a) Belastbarkeit,<br />

b) Orientierungsleistung,<br />

c) Konzentrationsleistung,<br />

d) Aufmerksamkeitsleistung,<br />

e) Reaktionsfähigkeit<br />

erfüllen.<br />

Der Nachweis über die Erfüllung dieser Anforderungen ist durch Vorlage eines betriebs- oder<br />

arbeitsmedizinischen oder eines medizinisch-psychologischen Gutachtens zu erbringen.<br />

Die zur Untersuchung eingesetzten Verfahren müssen nach dem Stand der Wissenschaft<br />

standardisiert und unter Aspekten der Verkehrssicherheit validiert sein. Das Test-Set zur<br />

Leistungsuntersuchung nach FeV Anlage 5 Nr. 2 im Wiener Testsystem besteht aus fünf<br />

Tests, welche jeweils eine der geforderten Dimensionen abdeckt. Es handelt sich hierbei um<br />

eine fixe Testbatterie, die als Programmpaket verkauft wird. Zu jedem Test ist ausführliche<br />

wissenschaftliche Literatur vorhanden.<br />

Schuhfried blickt heute auf eine jahrzehntelange Tradition in der Verkehrseignungsdiagnostik<br />

zurück und ist mit dem Wiener Testsystem (WTS) weltweiter Marktführer in der<br />

computergestützten psychologischen Diagnostik.<br />

Um der Anforderungen nach wissenschaftlicher Aktualität der Testverfahren zu genügen,<br />

werden neben laufenden wissenschaftlichen Studien die Normen stets aktualisiert und<br />

psychometrische Weiterentwicklungen der Verfahren vorgenommen.<br />

Die Leistungsuntersuchung wird mit wenigen Programmschritten gestartet und kann<br />

besonders einfach vorgegeben werden. Eine übersichtliche und klar aufgebaute<br />

Administration macht die Anwendung angenehm und komfortabel.<br />

Nach Eingabe der Probandendaten kann sofort die Testbatterie gestartet werden. Die<br />

Vorgabe der Verfahren ist in über 20 verschiedenen Sprachen möglich.<br />

Wird die Landessprache der Testperson eingegeben, werden automatisch die einzelnen<br />

Tests in dieser Sprache vorgegeben. Die Sprache kann auch individuell definiert werden.


Nach der Eingabe der Probandendaten erfolgt eine standardisierte Instruktion zur Bedienung<br />

der Eingabemedien. Die Testverfahren zeichnen sich durch einen einheitlichen und klaren<br />

Aufbau aus. Instruktionen mit Lernschleifen sichern das Aufgabenverständnis bei den<br />

einzelnen Testverfahren. Akustische und visuelle Rückmeldungen in der Instruktions- und<br />

Lernphase gestalten die Testbearbeitung ökonomisch und zugleich motivierend. Die<br />

Testphase startet erst, wenn das Aufgabenverständnis sichergestellt ist.<br />

Nach Ende der Testung können die Ergebnisse in übersichtlicher Form ausgedruckt werden.<br />

Alle relevanten Ergebnisse werden übersichtlich in grafischer und numerischer Darstellung<br />

auf einer druckbaren Seite abgebildet.


<strong>Max</strong>, <strong>Mustermann</strong><br />

geb. 01.01.1945, männlich, 67;4 Jahre, Bildungsgrad 3<br />

Auswertecode:<br />

Testdurchführung: 03.05.2012<br />

Profil:<br />

PR<br />

RT<br />

COG<br />

LVT<br />

DT<br />

ATAVT<br />

PR<br />

Reaktionsfähigkeit<br />

Konzentrationsleistung<br />

Orientierungsleistung<br />

Belastbarkeit<br />

Aufmerksamkeitsleistung<br />

0 20 40 60 80 100<br />

0 20 40 60 80 100<br />

Anmerkung(en): Der hervorgehobene Bereich zwischen 33 und 100 stellt den Sollbereich für die<br />

Testergebnisse dar.<br />

Testergebnisse:<br />

Testvariable Rohwert Parameter PR 1<br />

Reaktionsfähigkeit gemessen mit Reaktionstest (RT)<br />

Mittlere Reaktionszeit (msec) 444 44<br />

Richtig reagiert 15<br />

Falsch reagiert 0<br />

Konzentrationsleistung gemessen mit Cognitrone (COG)<br />

Mittlere Zeit "Korrekte Zurückweisung" (sec) 2.182 90<br />

Summe "Treffer" 24<br />

Summe "Korrekte Zurückweisung" 35<br />

Orientierungsleistung gemessen mit Linienverfolgungstest (LVT)<br />

Score 14 59<br />

Anzahl richtiger Antworten 17<br />

Belastbarkeit gemessen mit Determinationstest (DT)<br />

Richtige 243 59<br />

Falsche 2<br />

Ausgelassene 7<br />

Aufmerksamkeitsleistung gemessen mit Tachistoskopischem Verkehrsauffassungstest<br />

(ATAVT/TAVTMB)<br />

Überblicksgewinnung 11 1.856 94<br />

1 Der Prozentrang (PR) ergibt sich durch Vergleich mit der altersunabhängigen Normstichprobe.<br />

Diese Resultate dienen zur Beurteilung der Leistung nach Anlage 5 Nr. 2 FeV.<br />

Seriennummer der Untersuchungsstelle: 031662/01<br />

Abbildung 1: Ergebnisausdruck FEV Anlage 5/2


Diese Testergebnisse können zudem direkt in das Textverarbeitungsprogramm WinWord<br />

übertragen werden. Es muss nur die Schaltfläche „Befund“ angeklickt werden.<br />

Abbildung 2: Reportmuster<br />

Der Report schließt die Leistungsuntersuchung nach FeV Anlage 5 Nr. 2 ab. Die Gliederung<br />

dieses Befunds obliegt dem Diagnostiker, dennoch gleichen sich gewisse<br />

Gliederungselemente.<br />

Am Beginn jedes Reports stehen die Daten zur Person (Name, Geburtsdatum, Testdatum<br />

und Testdauer). Danach werden die Testergebnisse erläutert. Die Angabe dieser Ergebnisse<br />

soll Rohwerte und Prozentränge enthalten. Abschluss des Reports bildet die Beantwortung<br />

der Fragestellung.<br />

Wie beurteilen?<br />

Generell legt man zur Beurteilung der Leistungsuntersuchung nach FeV Anlage 5 Nr. 2 die<br />

Maßstäbe der EU-Führerscheingruppe 2 zu Grunde (Schubert, Schneider, Eisenmenger &<br />

Stephan, 2003). Die Durchführungserlässe zur Fahrerlaubnisverordnung werden von den<br />

einzelnen Bundesländern verfügt.<br />

Der Gutachter (Arbeits- oder Betriebsmediziner, MPU-Gutachter) richtet sich bei der<br />

Beurteilung des Einzelfalles nach Kriterien, die in den einzelnen Bundesländern zwar<br />

ähnlich, aber nicht identisch durch entsprechende Erlässe vorgegeben wurden. Einigkeit<br />

besteht in der Auffassung, dass Prozentränge (PR) von über 33 bei den einzelnen Variablen<br />

als ausreichend angesehen werden und dass Prozentränge von 16 und weniger in jedem<br />

Falle eine genauere Überprüfung erforderlich machen. In den Begutachtungsleitlinien zur<br />

Kraftfahrereignung (Schubert, Schneider, Eisenmenger & Stephan, 2003) wird davon<br />

ausgegangen, dass in der Mehrzahl der angewandten Verfahren ein PR von 33 erreicht sein<br />

muss und in keinem Verfahren derjenige von 16 unterschritten sein darf, um die


Fahrerlaubnis zu erteilen. Treffen diese Voraussetzungen nicht zu, ist der Frage<br />

vorhandener Kompensationsmöglichkeiten, meist u.a. auch im Rahmen einer praktischen<br />

Fahrprobe durch einen Verkehrspsychologen oder einen Sachverständigenprüfer (aaSoP),<br />

durch eine weiterführende Untersuchung nachzugehen.<br />

Da bei der Leistungsuntersuchung Reaktionszeitmessungen und Reaktionen auf<br />

Mehrfachreize notwendig sind, sind Maus oder PC-Tastatur als Eingabemedien ungeeignet.<br />

Die Bearbeitung der Leistungstests erfolgt mit einer ergonomisch optimierten<br />

Probandentastatur und erlaubt somit eine komfortable und faire Erfassung der<br />

Leistungsfähigkeit selbst bei Personen mit geringer oder fehlender Computererfahrung.<br />

Die Probandentastatur ist äußerst robust und wird einfach an die USB-Schnittstelle des PCs<br />

angesteckt.<br />

Die Probandentastatur besteht aus:<br />

7 Farbtasten; 10 Zifferntasten; 1 Sensortaste; Anschlussmöglichkeit für Fußtasten und USB-<br />

Schnittstelle<br />

Abbildung 3: Probandentastatur für die FEV Anlage 5/2 Untersuchung<br />

Vernetzte Anlagen werden eingerichtet, wenn eine große Anzahl an Probanden getestet<br />

werden soll. Eine vernetzte Anlage besteht aus einem Testleiterarbeitsplatz und aus einer<br />

nahezu beliebigen Anzahl von Testpersonenarbeitsplätzen. Der Ablauf der einzelnen<br />

Testdurchführungen erfolgt zentral und somit verfügt der Testleiter über alle notwendigen<br />

Informationen. Die Testpersonen können zeitlich versetzt die Tests starten und in ihrem<br />

eigenen Tempo bearbeiten. Mit dem Wiener Testsystem können Sie somit eine große<br />

Anzahl an Leistungsuntersuchungen zeitgleich durchführen.


Die verkehrspsychologisch relevanten Dimensionen Belastbarkeit, Orientierungs-,<br />

Konzentrations- und Aufmerksamkeitsleistung sowie Reaktionsfähigkeit werden mit dem<br />

Test-Set FEV untersucht. Tabelle 1 listet die einzelnen Testverfahren mit Angabe der<br />

Durchführungszeit auf.<br />

Tabelle 1: Testverfahren des Test-Sets FeV<br />

Tests Dimensionen Testformen Dauer<br />

RT- Reaktionstest Reaktionsfähigkeit S3 6<br />

COG - Cognitrone Konzentrationsleistung S11 10<br />

LVT - Linienverfolgungstest Orientierungsleistung S3 10<br />

DT - Determinationstest Belastbarkeit S1 6<br />

ATAVT - Adaptiver Tachistoskopischer<br />

Verkehrsauffassungstest<br />

Aufmerksamkeitsleistung S1 14<br />

Das Test-Set FEV zeichnet sich aufgrund der Durchführungsdauer von nur rund 45 Minuten<br />

durch eine hohe Ökonomie bei gleichzeitig hoher Messgenauigkeit der Testverfahren aus.<br />

Auf den folgenden Seiten werden die einzelnen Tests beschrieben. Die Gütekriterien der<br />

einzelnen Tests (Reliabilität, Validität, Normierung) sind in der Beschreibung dieser<br />

Verfahren angeführt. Für die Auswertung der Leistungsuntersuchung nach FeV Anlage 5 Nr.<br />

2 wird jeweils die Hauptvariable herangezogen.<br />

Hauptvariable: „Mittlere Reaktionszeit“:<br />

Hierbei handelt es sich um die Zeit, die zwischen einem Signal (gemeinsames Auftreten von<br />

gelbem Licht und Ton) und dem Beginn der mechanischen Bewegungsantwort auf dieses<br />

Signal vergeht, unter der Instruktion möglichst schnell zu reagieren.<br />

Hilfsvariable: „Richtig reagiert“:<br />

Anzahl richtiger Reaktionen. Als richtige Reaktionen gilt das Verlassen der Ruhetaste mit<br />

anschließender Betätigung der Reaktionstaste bei geforderten Signalen. Bei korrekter<br />

Durchführung des Tests sollte auf alle 16 geforderten Signale richtig reagiert worden sein.<br />

Ab einer Abweichung größer als vier könnte dies auf ein Motivationsproblem der Testperson<br />

hinweisen bzw. die Testperson hat Verständnisprobleme mit der Instruktion gehabt. Die<br />

Hauptvariable ist in diesem Fall nicht zu interpretieren. Eine Testwiederholung ist indiziert.<br />

Hilfsvariable: „Falsch reagiert“:<br />

Anzahl falscher Reaktionen. Als falsche Reaktion gilt das Verlassen der Ruhetaste mit anschließender<br />

Betätigung der Reaktionstaste bei nicht geforderten Signalen. Eine hohe


Anzahl an falschen Reaktionen deutet darauf hin, dass der Proband auf viele der 48 Signale<br />

reagiert ohne zu differenzieren, ob die Reaktion gefordert war oder nicht. Sollte die Anzahl<br />

der falschen Reaktionen größer als fünf sein, so könnte dies auf ein Motivationsproblem der<br />

Testperson hinweisen bzw. die Testperson hatte Verständnisprobleme mit der Instruktion.<br />

Die innere Konsistenz beträgt für die Variable Median Reaktionszeit r = 0.90.<br />

Konstruktvalidität<br />

Unter Reaktionszeit versteht man die Zeit, die zwischen einem Signal und dem Beginn einer<br />

mechanischen Bewegungsantwort vergeht, wenn die Testperson instruiert wurde, möglichst<br />

rasch zu reagieren (Dorsch, 1994). Bei der vorliegenden Form des Reaktionstests wird die<br />

Reaktionszeit auf eine einfache Wahlreaktion gemessen. Zur Ermittlung dieser<br />

Reaktionszeiten, die im Millisekundenbereich liegen, ist ein Testinstrument notwendig, das<br />

sehr zuverlässig und genau ist. Der Reaktionstest ist zur Bestimmung der Reaktionszeit<br />

bestens geeignet.<br />

Im täglichen Sprachgebrauch versteht man unter "Reaktionszeit" die Zeit zwischen einem<br />

Reiz und einer wie immer gearteten, in jedem Fall aber beobachtbaren Reaktion des<br />

Individuums. Soweit deckt sich die vorwissenschaftliche Verwendung dieses Begriffs mit<br />

wissenschaftlichen Definitionsversuchen, nach denen "Reaktionszeit" als Zeit, die vergeht<br />

zwischen einem Signal und dem Beginn der mechanischen Bewegungsantwort, unter der<br />

Instruktion, möglichst schnell zu reagieren, definiert ist (vgl. Dorsch, 1994). Da es sich hier<br />

um Genauigkeiten im Millisekundenbereich handelt, muss das eingesetzte Testinstrument<br />

sehr zuverlässig und genau sein.<br />

Der Reaktionstest ist zur Bestimmung der Reaktionszeit nach obiger Definition also bestens<br />

geeignet.<br />

Es wurde weiters versucht, eine Validierungsstudie durchzuführen, indem die Reaktions- und<br />

Motorischen Zeiten mit dem Rohwert der CPM (Raven’s Coloured Progressive Matrices) in<br />

Zusammenhang gebracht wurden (49 Schüler absolvierten zusätzlich zu drei RT-Testformen<br />

auch die CPM). Aufgrund einer Studie von Neubauer (1990) wurde eine signifikante<br />

Korrelation des Rohwertes der CPM mit der Motorischen Zeit erwartet, wobei der<br />

Zusammenhang mit der Motorischen Zeit höher als der mit der Reaktionszeit<br />

(=Entscheidungszeit) sein sollte.<br />

Diese Hypothesen konnten dann auch, trotz einer geringen Stichprobengröße, bei der<br />

statistischen Analyse beobachtet werden (siehe Tabelle 2).<br />

Tabelle 2: : Korrelationen der Leistungsmerkmale (Mediane) mit den Rohwerten der CPM<br />

Schulstufe<br />

Gesamt (N=49) Buben (N=27) Mädchen (N=22)<br />

RW-CPM RW-CPM RW-CPM<br />

S3 MZ (Licht &Ton) -0.49** -0.64** -0.30<br />

S3 RZ (Licht & Ton) -0.12 -0.33 0.03<br />

Anmerkung: RW: Rohwert; RZ: Reaktionszeit; MZ Motorische Zeit; * 0.01, ** 0.001; N=210.


Interkorrelationen<br />

Die Korrelationen zwischen den Testvariablen geben Aufschluss darüber, inwieweit nicht<br />

durch mehrere Variablen dasselbe gemessen wird. Tabelle 3 zeigt die Interkorrelationen der<br />

Zeitvariablen bei der Normstichprobe.<br />

Tabelle 3: Interkorrelationen der Zeitvariablen bei der Normstichprobe, Testform S3<br />

Variable SDRZ MMZ SDMZ<br />

MRZ 0.443** 0.375** 0.152**<br />

SDRZ 0.236** 0.296**<br />

MMZ 0.491**<br />

Anmerkung: MRZ: Mittlere Reaktionszeit, MMZ: Mittlere Motorische Zeit; SDRZ: Standardabweichung der<br />

Reaktionszeit; SDMZ: Standardabweichung der Motorischen Zeit; * 0.01, ** 0.001; N=210.<br />

Der wichtigste Befund ist sicher die Korrelation zwischen den Reaktions- und Motorischen<br />

Zeiten. Die Werte sind zwar signifikant (0.38 bis 0.62), d.h. die gegenseitig aufgeklärten<br />

Varianzanteile liegen zwischen 14% und 38%. Das bedeutet dennoch, dass die beiden<br />

Variablen etwas jeweils Anderes messen.<br />

Kriteriumsvalidität<br />

Validitätsuntersuchungen im Gebiet der Verkehrspsychologie bestätigen die vorhandene<br />

Gültigkeit dieses Verfahrens.<br />

Calé (1992) konnte anhand einer Vorgängerversion des RT zeigen, dass die Testergebnisse<br />

signifikant mit der Unfallhäufigkeit im Straßenverkehr korrelieren.<br />

Karner & Neuwirth (2000) konnten zwischen den Ergebnissen des RT und einer<br />

standardisierten Fahrprobe signifikante Korrelationen in der Höhe von r=0.38 feststellen.<br />

Sommer (2002) kam zu einem ähnlichen Ergebnis.<br />

Eine Studie von Sommer, Arendasy, Olbrich & Schuhfried (2004) zeigt, dass mittels einer<br />

Test¬batterie, in deren Rahmen RT vorgegeben wurde, über 74% der getroffenen Urteile<br />

über das Fahrverhalten innerhalb einer standardisierten Fahrprobe richtig vorhergesagt<br />

werden konnten.<br />

Hohe Korrelationen zeigen sich zudem zwischen den Testverfahren RT und DR2 des<br />

ART90, somit zeigt das Verfahren eine hinreichende konvergente Validität (Karner & Biehl;<br />

2000).<br />

In einer derzeit noch laufenden Studie zeigen sich zudem Korrelationskoeffizienten in der<br />

Höhe von r=0.034 zwischen der Variable Median Reaktionszeit und dem Globalurteil über<br />

das Fahrverhalten im Rahmen der Wiener Fahrprobe.<br />

Eine weitere Studie von Sommer & Häusler (2006) beschäftigte sich mit der<br />

Kriteriumsvalidität zweier Testbatterien zur Erfassung der kraftfahrspezifischen<br />

Leistungsfähigkeit aus dem Expertensystem Verkehr (Schuhfried, 2005), die ebenfalls den<br />

Reaktionstest beinhalten. Die beiden Testbatterien Standard und Plus unterschieden sich<br />

hierbei ausschließlich darin, ob die Periphere Wahrnehmung (PP) als Maß für das<br />

Gesichtfeld und die geteilte Aufmerksamkeit vorgegeben wurde. Als Kriteriumsvariable<br />

wurde das Globalurteil über das Fahrverhalten in einer standardisierten Fahrprobe<br />

herangezogen. Die von den Autoren untersuchte Stichprobe bestand aus 164 (74%)<br />

Männern und 58 (26%) Frauen im Alter von 19 bis 91 Jahren bei einem durchschnittlichen<br />

Alter von 59 Jahren und einer Standardabweichung von 18 Jahren. Der Altersmedian lag bei<br />

64 Jahren. Es handelte sich daher um Personen im mittleren bis höheren Lebensalter. Bei<br />

den Probanden handelte es sich zum Teil um bereits auffällige Kraftfahrer. Die


Studienteilnahme war jedoch freiwillig. Insgesamt 39 (18%) Personen hatten eine<br />

Pflichtschule oder Realschule ohne abgeschlossene Berufsausbildung absolviert (EU<br />

Bildungsgrad 2), 96 (43%) Personen hatten eine abgeschlossene Berufsausbildung bzw.<br />

eine Fachschule absolviert (EU Bildungsgrad 3), 35 (16%) Personen hatten einen Abituroder<br />

Fachhochschulabschluss (EU Bildungsgrad 4) und 52 (23%) Personen verfügten über<br />

einen Hochschulabschluss (EU Bildungsgrad 5).<br />

Aufgrund der Ergebnisse bisheriger Studien erfolgte die Berechnung der Kriteriumsvalidität<br />

mit Hilfe künstlicher Neuronaler Netze. Das Ergebnis zeigte, dass mit der Testbatterie<br />

Standard insgesamt 80.2% der Gesamtstichprobe richtig klassifiziert werden konnten. Bei<br />

der Testbatterie Plus lag die Klassifikationsrate bei 86.5%. Dies entspricht einem<br />

Validitätskoeffizienten von R=0.68 für die Testbatterie Standard und R=0.78 für die<br />

Testbatterie Plus. In der Jackknife-Validierung wurde für die Testbatterie Standard eine<br />

Klassifikationsrate von 80.2% und ein Validitätskoeffizient von R=0.67 erzielt. Für die<br />

Testbatterie Plus lagen die Werte in der Jackknife-Validierung bei einer Klassifikationsrate<br />

von 83.8% und einem Validitätskoeffizient von R=0.77. Die Intervalle für die<br />

Klassifikationsrate und den Validitätskoeffizient in der Bootstrap-Validierung lagen bei<br />

[74.2%; 85.2%] und [0.54; 0.73] für die Testbatterie Standard und für die Testbatterie Plus<br />

bei [77.5%; 87.2%] und [0.61; 0.79]. Die inkrementelle Validität und relative Relevanz der<br />

einzelnen Testverfahren der beiden Testbatterien können der Tabelle 4 entnommen werden.<br />

Die relative Relevanz gibt an, mit welchem Anteil der entsprechende Test zur Validität des<br />

Vorhersagemodells beiträgt.<br />

Tabelle 4: Inkrementelle Validitäten und relative Relevanzen der beiden Testbatterien Standard und Plus<br />

Prädiktorvariablen<br />

Inkrementelle<br />

Validität<br />

STANDARD<br />

Relative<br />

Relevanz<br />

Inkrementelle<br />

Validität<br />

PLUS<br />

Relative<br />

Relevanz<br />

AMT: Allgemeine Intelligenz 0.128 18.7% 0.078 11.5%<br />

DT: Richtige 0.124 18.2% 0.071 10.5%<br />

RT: Mittlere Reaktionszeit 0.036 5.7% 0.057 8.6%<br />

RT: Mittlere Motorische Zeit 0.132 19.2% 0.118 16.9%<br />

PP: Gesichtsfeld -- -- 0.090 13.2%<br />

PP: Tracking Abweichung -- -- 0.139 19.5%<br />

TAVT: Überblicksgewinnung 0.120 17.6% 0.038 5.8%<br />

COG: Mittlere Zeit korrekte<br />

Zurückweisung<br />

0.141 20.3% 0.093 13.6%<br />

Die Ergebnisse sprechen somit bei einer relativen Relevanz von 5.7% und 19.2%<br />

(Testbatterie Standard) bzw. 8.6% und16.9% für die Kriteriumsvalidität des RT.<br />

Es liegt eine Normierung der Testform S3 mit einer Stichprobe vom Umfang N=855 vor.<br />

Hierbei handelt es sich um 417 (48.8%) Männer und 438 (512%) Frauen im Alter von 16 bis<br />

89 (m=43.5; sd=16.8; skew=0.36; kurtosis=-0.78) Jahren (Erhebungszeitraum: 2007).<br />

Tabelle 5 zeigt die genaue Verteilung der Stichprobenmerkmale.<br />

Die Leistungsunterschiede in den beiden Variablen Reaktionszeit und Motorische Zeit<br />

zwischen den Teilstichproben 'Geschlecht' bzw. 'Alter' sind hochsignifikant (T-Test,<br />

Varianzanalyse). Kein signifikanter Unterschied ergab sich in der Teilstichprobe


'Bildungsgrad'. Daher wurden zusätzlich zur Gesamtstichprobe Teilstichproben für bestimmte<br />

Altersbereiche bzw. Teilstichproben für Männer und Frauen getrennt einer Normierung<br />

unterzogen.<br />

Die Stichprobengröße der Teilgruppen ist für eine Normierung hinreichend groß. Die<br />

genauen Verteilungscharakteristika der Leistungsmerkmale hinsichtlich der eben erwähnten<br />

Gruppierungen können der Tabelle 6 entnommen werden.<br />

Tabelle 5: Verteilung der Stichprobenmerkmale<br />

Schultyp (-abschluss)<br />

Altersgruppen<br />

Bildungsgrad 16-25 J. 26-35 J. 36-59 J. 60-70 J. 71-90 J.<br />

n<br />

(Schultyp)<br />

Kein Pflichtschulabschluss 1 / 1 1 / 0 2 / 2 0 / 1 0 / 1 4 / 5<br />

Keine abgeschlossene<br />

Berufsausbildung<br />

Abgeschlossene<br />

Berufsausbildung<br />

Abitur, Abschluss einer<br />

Fachhochschule<br />

Universität,<br />

Hochschulabschluss<br />

30 /11 10 / 9 21 / 17 5 / 6 6 / 2 72 / 45<br />

21 / 18 45 / 23 114 / 92 24 / 37 14 / 13 218 / 183<br />

20 / 43 24 / 38 29 / 61 8 / 19 10 / 5 91 / 166<br />

0 / 3 7 / 9 11 / 19 2 / 8 12 / 0 32 / 39<br />

N (Alter) 72 / 76 87 / 79 177 / 191 39 / 71 42 / 21 417 / 438<br />

Anmerkung: Die Zahlen links und rechts vom Schrägstrich stehen für die Anzahl der Männer bzw. Frauen.<br />

Entsprechend sind Zeilen- und Spaltensummen zu lesen.<br />

Tabelle 6: Verteilungscharakteristika der Leistungsmerkmale bei Vorgabe von S3<br />

Testvariable<br />

Stichprobe Maß MRZ SDRZ MMZ SDMZ<br />

Erwachsene<br />

MD 430 65 165 21<br />

QA 110 28 82 14<br />

Alter: 16 - 25<br />

MD 393 63 143 17<br />

QA 104 23 47 10<br />

Alter: 26 - 35<br />

MD 402 61 142 17<br />

QA 95 25 52 9<br />

Alter: 36 – 59<br />

MD 439 64 180 23<br />

QA 101 29 84 16<br />

Alter: 60 - 70<br />

MD 470 72 214 25<br />

QA 121 29 79 17<br />

Alter: 71 - 90<br />

MD 460 73 173 24<br />

QA 135 33 120 17<br />

Männer MD 427 63 149 19<br />

QA 102 29 63 12


Frauen<br />

Volksschule,<br />

Realschule<br />

Abitur, Universität<br />

MD 432 66 186 23<br />

QA 122 26 88 15<br />

MD 442 66 170 21<br />

QA 108 28 88 14<br />

MD 411 64 159 20<br />

QA 113 26 71 13<br />

Anmerkung: MD: Median, QA: Quartilabstand; MRZ: Mittlere Reaktionszeit (ms), MMZ: Mittlere Motorische Zeit<br />

(ms), SDRZ: Streuungsmaß Reaktionszeit (ms), Streuungsmaß Motorische Zeit (ms).<br />

Hauptvariable: „Mittlere Zeit Korrekte Zurückweisung“:<br />

Das persönliche Tempo, operationalisiert durch die Variable „Mittlere Zeit Korrekte Zurückweisung“<br />

stellt einen guten Indikator der Konzentrationsfähigkeit dar.<br />

Hilfsvariable: „Summe Treffer“ & „Summe Korrekte Zurückweisungen“:<br />

Es wird davon ausgegangen, dass normalerweise 85% der Aufgaben richtig gelöst werden,<br />

konzentrierte Aufgabenbearbeitung ist dadurch gekennzeichnet, dass dieser Wert sogar<br />

noch überschritten wird. Eine „Summe Treffer“ kleiner als 21 und/oder eine „Summe Korrekte<br />

Zurückweisung“ kleiner als 30 ist ein Hinweis auf nicht angepasstes Arbeitstempo. In diesem<br />

Fall sollte der Wert für die Hauptvariable nur unter Vorbehalt interpretiert werden.<br />

Hilfsvariable: „Mittlere Zeit Treffer“<br />

Während für eine korrekte Zurückweisung immer alle Figuren mit der Vorgabefigur<br />

verglichen werden müssen, sind für einen Treffer im Durchschnitt nicht so viele Vergleiche<br />

notwendig. Daher sollte die „Mittlere Zeit Treffer“ kürzer sein als die „Mittlere Zeit Korrekte<br />

Zurückweisung“. Anderenfalls ist dies möglicherweise ein Hinweis auf ineffiziente<br />

Musteranalysestrategien oder andere irreguläre Bearbeitungsstrategien.<br />

Für die Testform S11 ergibt sich eine Innere Konsistenz (Cronbach Alpha) für die Variable<br />

Mittlere Zeit „korrekte Zurückweisung“ von 0.95 und für die Variable Mittlere Zeit „Treffer“ von<br />

0.93<br />

In einer Längsschnittstudie an 82 Personen (48% Männer, 52% Frauen) im Altersbereich von<br />

17 bis 78 Jahren (m=44; s=17) ergibt sich eine Retest Reliabilität von r=0.88 und eine<br />

Stabilität über den Zeitraum von 5 Monaten von r=0.87.<br />

Die Gültigkeit des Cognitrone-Tests kann als gezeigt gelten, wenn ein inhaltlicher Bezug<br />

zwischen den Anforderungen der Items und den Anforderungen in Realsituationen erkennbar<br />

ist (inhaltliche Gültigkeit), wenn eine hohe Übereinstimmung mit anderen Testverfahren<br />

gegeben ist, die dieselben Fähigkeiten erfassen, und wenn keine Übereinstimmung mit<br />

Testverfahren besteht, die etwas anderes erfassen (konvergente und diskriminante Validität).<br />

Weiters ist die Gültigkeit dann gegeben, wenn der Test gewisse theoriegeleitete<br />

Vorstellungen erfüllt, das wäre beim Verfahren Cognitrone dann gegeben, wenn sich die


Schwierigkeitsunterschiede zwischen den Testteilen durch strukturelle Unterschiede erklären<br />

lassen (Konstruktvalidität).<br />

Konstruktvalidität<br />

Die Philosophie bei der Messung von "Aufmerksamkeit" ist seit Jahrzehnten gleich<br />

geblieben: Immer werden intellektuell anspruchslose Aufgaben gestellt, die für eine gewisse<br />

Zeit möglichst rasch und fehlerfrei auszuführen sind. Die erhobenen Geschwindigkeits- und<br />

Genauigkeitsmaße liefern einen Hinweis über den Grad der "investierten" Aufmerksamkeit.<br />

Auch die Testformen des Cognitrone Tests sind in dieser Weise konzipiert: Die Aufgaben<br />

bestehen aus (mehr oder weniger) komplexen "Strichfiguren", die lediglich dahingehend zu<br />

beurteilen sind, ob sich unter ihnen identische "Figuren" befinden oder nicht.<br />

Über Befunde zur Konstruktvalidität für die Testformen mit freier Bearbeitungszeit berichtet<br />

Wagner (1999). Unter Zugrundelegung des Konzentrationsmodells von Reulecke (1991)<br />

schlägt sie vor, die Variable Mittlere Zeit „Korrekte Zurückweisung“ nur unter der Bedingung<br />

mind. 90% richtiger Antworten als Indikator für Konzentration zu interpretieren. Diese 90%<br />

beziehen sich auf eine Vorgabe von Reulecke (1991).<br />

Die Konstruktvalidierung der Variable Mittlere Zeit „Korrekte Zurückweisung“ erfolgt mit Hilfe<br />

des Rasch-Modells anhand einer Stichprobe von 625 Personen aus den Normdaten. Unter<br />

der Annahme einer optimalen Dosierung der “Energie” zum präzisen Ablauf der “Funktion”<br />

Mustervergleich, sollte die Bearbeitung von Vergleichsfiguren einer komplexeren Vorlage<br />

mehr Zeit in Anspruch nehmen als die Bearbeitung der weniger komplexen Vorlagen. Zur<br />

Schätzung der Itemparameter für die 20 Vorlagenblöcke mit Hilfe des Rasch-Modells war es<br />

notwendig, die Variable Mittlere Zeit „Korrekte Zurückweisung“ 1-20 zu dichotomisieren. Die<br />

erste Kategorie (1=schnelle Lösung) umfasst den Bereich 0-200 ms, die zweite Kategorie<br />

(0=langsame Lösung) umfasst den Bereich ab 201 ms. Die signifikanten LQTs (=Andersen<br />

Likelihood-Quotiententest) für das interne Teilungskriterium “Bearbeitungstempo” und für das<br />

externe Teilungskriterium “Angemessenheit des Arbeitstempos” (vgl. Tabelle 7) weisen<br />

darauf hin, dass zur vollständigen Erklärung der beobachteten Daten Parameterschätzungen<br />

für jede Gruppe gesondert notwendig sind.<br />

Diese Modellabweichungen sind durch die eingangs getroffene Annahme - nur bei präziser<br />

Ausführung wird Konzentration gemessen - erklärbar.<br />

Tabelle 7: Modelltest für die Gesamtstichprobe<br />

Modelltest<br />

Teilungskriterium<br />

Bearbeitungstempo (internes TK)<br />

Gruppe1: viele Aufgaben “schnell” bearbeitet<br />

Gruppe2: wenige Aufgaben “schnell” bearbeitet<br />

Angemessenheit des Arbeitstempos (externes TK)<br />

Gruppe1: viele “Richtige” unabhängig von der Komplexität der Figuren<br />

Gruppe2: wenig “Richtige” im Gesamttest, bzw. bei komplexen Figuren<br />

2 (df=18)<br />

LQT<br />

s./n.s. 5%<br />

50.53 s.<br />

85.37 s.<br />

Alter (externes TK) 19.10 n.s.<br />

Anmerkungen<br />

LQT: Der Anderson Likelihood-Quotiententest prüft, ob die Parameterschätzung für<br />

getrennte Teilstichproben die Datenstruktur besser erklärt als die Parameterschätzung<br />

gesamt.<br />

Für weitere Modellkontrollen werden daher aus der Gesamtstichprobe Personen<br />

ausgeschlossen, die für den Gesamttest das 90%-Kriterium nicht erfüllten. 479 Personen<br />

verbleiben in der Stichprobe. Die Betrachtung der Verteilung bezüglich dieses Kriteriums<br />

zeigt erwartungsgemäß, dass anhand dieses Kriteriums - bezogen auf den Gesamttest -<br />

nicht alle Personen mit inadäquatem Arbeitstempo ausgeschlossen werden, sondern nur die


“Extremfälle”. Die Ergebnisse der nunmehr nicht signifikanten Andersen Likelihood-<br />

Quotiententests (LQTs) zeigt Tabelle 8.<br />

Tabelle 8: Modelltest nach Ausscheiden der Personen mit inadäquatem Arbeitstempo<br />

Modelltest<br />

Teilungskriterium<br />

Bearbeitungstempo (internes TK)<br />

Gruppe1: viele Aufgaben “schnell” bearbeitet<br />

Gruppe2: wenige Aufgaben “schnell” bearbeitet<br />

Angemessenheit des Arbeitstempos (externes TK)<br />

Gruppe1: viele “Richtige” unabhängig von der Komplexität der Figuren<br />

Gruppe2: wenig “Richtige” im Gesamttest, bzw. bei komplexen Figuren<br />

2 (df=17)<br />

LQT<br />

s./n.s. 5%<br />

25.98 n.s.<br />

10.2 n.s.<br />

Alter (externes TK) 10.24 n.s.<br />

Anmerkungen: Kritische Wert der 2 Verteilung: 5% = 27.58 1% = 33.43<br />

LQT: Der Anderson Likelihood-Quotiententest prüft, ob die Parameterschätzung für getrennte Teilstichproben die<br />

Datenstruktur besser erklärt als die Parameterschätzung gesamt.<br />

Daraus kann geschlossen werden, dass die instruktionskonforme Bearbeitung des Tests<br />

eine zwingende Voraussetzung zur validen Interpretation der Variablen Mittlere Zeit<br />

„Korrekte Zurückweisung“ ist.<br />

In der Praxis hat sich jedoch gezeigt, dass die Herabsetzung dieses Kriteriums auf 85%<br />

sinnvoll ist und daher in der derzeitigen Version des Verfahrens COG verwendet wird. In<br />

einer hausinternen und noch nicht publizierten Weiterführung dieser Arbeit konnten die<br />

Ergebnisse allerdings bestätigt werden.<br />

Weitere Hinweise auf die Konstruktvalidität des COG-Tests ergeben sich aus verschiedenen<br />

Korrelationsstatistischen Studien mit konstruktnahen und konstruktfernen Testverfahren.<br />

Beim Versuch konstruktnahe (konvergente) und konstruktferne (diskriminante) Testverfahren<br />

für einen Aufmerksamkeitstest zu definieren, kommt der Umstand zu tragen, den Neumann<br />

(1992) unter dem Begriff "Dualitätsannahme der klassischen Aufmerksamkeitsforschung“<br />

markant zusammenfasst:<br />

„Aufmerksamkeit ist nicht eine von vielen Komponenten in einem Gesamtsystem, sondern<br />

stellt sich den anderen Komponenten gegenüber und beeinflusst die Qualität ihrer Funktion.“<br />

- d.h. in jeder Aufgabe spielt ein gewisses Maß an Aufmerksamkeit mit, allerdings ermöglicht<br />

die Sichtweise von Aufmerksamkeit als heterogenes Konstrukt einen Vergleich beobachteter<br />

Korrelationen bezüglich Ähnlichkeit der einzelnen Testverfahren.<br />

Wagner (1997) beurteilt die Testverfahren Cognitrone (COG), Linienverfolgungstest (LVT),<br />

Determinationstest (DT) und Tachistokopischer Verkehrsauffassungstest (TAVTMB)<br />

hinsichtlich Ähnlichkeit anhand des “allgemeinen Modells zur Unterscheidung verschiedener<br />

Arten von Aufmerksamkeit und Konzentration” (Berg, 1991) vorwiegend unter<br />

Berücksichtigung der Dimension “Personale Regulationsprozesse”. Diese Regulationsprozesse<br />

lassen sich in 4 hierarchischen Stufen beschreiben. In Ergänzung zu Berg (1991)<br />

wird hier die Anordnung der Stufen als Hierarchie verstanden, innerhalb der die Komplexität<br />

der Aufgaben steigt. Aufgaben höherer Stufen durchlaufen mehr "Klassifikationsschritte" und<br />

sind daher besser definiert als Verfahren niedriger Stufen (siehe Abbildung 4).


COG<br />

<br />

DT<br />

<br />

LVT<br />

<br />

“Suche nach<br />

Reizen” (aktiv)“<br />

Erwartung von Reizen”<br />

(passiv)<br />

kein<br />

Testverfahren<br />

in der<br />

Testbatterie<br />

<br />

TAVTMB<br />

<br />

Geteilte<br />

Aspekte<br />

Vordergrund<br />

Reizoffenheit<br />

gegenüber<br />

unerwarteten<br />

Reizen<br />

im<br />

Ausblenden<br />

von Reizen im<br />

Vordergrund<br />

Aufnahme von Reizen im Vordergrund<br />

Selektive Aspekte im Vordergrund<br />

Keine Intention<br />

basale<br />

Aufmerksamkei<br />

tsdimension:<br />

(präattentive<br />

Prozesse)<br />

Intention zur Informationsaufnahme<br />

höhere Aufmerksamkeitsdimensionen<br />

Abbildung 4: Stufen zur Klassifikation verschiedener Arten von Aufmerksamkeit (und die zugeordneten<br />

Testverfahren).<br />

Die Korrelationen zwischen ähnlicheren Testverfahren sollten daher höher ausfallen<br />

(konvergente Validität) als die Korrelationen zwischen unähnlichen Testverfahren<br />

(diskriminante Validität).<br />

Die Studie von Wagner (1997) findet grundsätzlich die erwarteten Zusammenhänge<br />

zwischen den vier Testverfahren, was als Hinweis auf diskriminante Validität des Verfahrens<br />

Cognitrone zu werten ist (siehe Tabelle 9).<br />

Tabelle 9: Korrelationen zwischen den Testverfahren inkl. Konfidenzintervalle (N=114)<br />

Tests Korrelation Konfidenzintervall<br />

DT/LVT 0.206 [0.022; 0.375]<br />

DT/TAVT -0.118 [0.076; 0.296]<br />

COG/DT 0.482 [0.326; 0.611]<br />

COG/TAVT 0.2760 [0.097; 0.438]<br />

COG/LVT 0.423 [0.259; 0.563]<br />

LVT/TAVT -0.1267 [0.059; 0.304]


Nicht geklärt werden kann der Unterschied der Korrelationen COG/LVT - DT/LVT und<br />

COG/TAVT - DT/TAVT. Laut Theorie sollten sich die Korrelationen in ähnlichen<br />

Größenordnungen bewegen. Hier könnte eine differenziertere Betrachtung der Ähnlichkeit<br />

(Hinzunahme weiterer Dimensionen zur Klassifikation) vielleicht Klärung bringen. Unter<br />

Berücksichtigung der Konfidenzintervalle für Korrelationen wird dieses Ergebnis allerdings<br />

deutlich relativiert: COG/DT unterscheidet sich zwar nach wie vor von DT/TAVT und<br />

LVT/TAVT. Alle anderen Korrelationen unterscheiden sich nicht signifikant voneinander. Das<br />

Ergebnis ist ebenso unter Berücksichtigung der nicht optimalen Stichprobe zu bewerten:<br />

Diese ist mit N=114 nicht sehr groß und als sehr homogen zu bezeichnen. Für diese Studie<br />

konnten in Zusammenarbeit mit Verkehrspsychologen ausschließlich "Bewerber für<br />

Personenbeförderung" getestet werden (105 Männer/9 Frauen; Alter: Mittelwert=35,7<br />

min=20; max=57 Stdv=9).<br />

Ein Vergleich des Verfahrens Cognitrone mit einem älteren Verfahren zur Erfassung der<br />

Aufmerksamkeit, dem Q1, zeigte hochsignifikante Korrelationen zwischen den<br />

Testverfahren. (Karner & Biehl, 2001)<br />

Kriteriumsvalidität<br />

Calé (1992) gelang der Nachweis, dass die Testergebnisse im Verfahren Cognitrone zur<br />

Vorhersage von Fahrertypologien geeignet sind (N=246). An einer Stichprobe von N=72<br />

Fahrern, die in kurzer Zeit in mehr als einen Unfall verwickelt waren, konnte Calé signifikante<br />

Korrelationen zwischen Testergebnis und Unfallhäufigkeit feststellen.<br />

Hinweise auf die Validität ergeben sich auch aus einer Studie mit einer Vorgängerversion<br />

des Testverfahrens (Bukasa, Wenninger & Brandstätter; 1990).<br />

Eine Studie von Karner (2000) zeigte signifikante Unterschiede zwischen alkoholauffälligen<br />

Kraftfahrern und der Normgruppe im Verfahren Cognitrone. Die Testergebnisse der<br />

alkoholauffälligen Kraftfahrer waren signifikant schlechter als die der Normpopulation.<br />

In einer Studie von Neuwirth (2001) konnte gezeigt werden, dass der Cognitrone-Test<br />

zwischen allen untersuchten Zuweisungsgruppen (psychiatrische und neurologische<br />

Probanden bzw. Probanden nach Alkoholabusus) und der Normgruppe trennt. Diese<br />

Validierungsstudie wurde an einer anfallenden Stichprobe von Probanden der<br />

Fahreignungsdiagnostik einer Südtiroler Untersuchungsstelle durchgeführt.<br />

Eine weitere Studie von Sommer & Häusler (2006) beschäftigte sich mit der<br />

Kriteriumsvalidität zweier Testbatterien zur Erfassung der kraftfahrspezifischen<br />

Leistungsfähigkeit aus dem Expertensystem Verkehr (Schuhfried, 2005), die ebenfalls das<br />

Verfahren Cognitrone beinhalten. Die beiden Testbatterien Standard und Plus unterschieden<br />

sich hierbei ausschließlich darin, ob die Periphere Wahrnehmung (PP) als Maß für das<br />

Gesichtsfeld und die geteilte Aufmerksamkeit vorgegeben wurde. Als Kriteriumsvariable<br />

wurde das Globalurteil über das Fahrverhalten in einer standardisierten Fahrprobe<br />

herangezogen. Die von den Autoren untersuchte Stichprobe bestand aus 164 (74%)<br />

Männern und 58 (26%) Frauen im Alter von 19 bis 91 Jahren bei einem durchschnittlichen<br />

Alter von 59 Jahren und einer Standardabweichung von 18 Jahren. Der Altersmedian lag bei<br />

64 Jahren. Es handelte sich daher um Personen im mittleren bis höheren Lebensalter. Bei<br />

den Probanden handelte es sich zum Teil um bereits auffällige Kraftfahrer. Die<br />

Studienteilnahme war jedoch freiwillig. Insgesamt 39 (18%) Personen hatten eine<br />

Pflichtschule oder Realschule ohne abgeschlossene Berufsausbildung absolviert (EU<br />

Bildungsgrad 2), 96 (43%) Personen hatten eine abgeschlossene Berufsausbildung bzw.<br />

eine Fachschule absolviert (EU Bildungsgrad 3), 35 (16%) Personen hatten einen<br />

Abiturabschluss (EU Bildungsgrad 4) und 52 (23%) Personen verfügten über einen<br />

Hochschul- bzw. Fachhochschulabschluss (EU Bildungsgrad 5).


Aufgrund der Ergebnisse bisheriger Studien erfolgte die Berechnung der Kriteriumsvalidität<br />

mit Hilfe künstlicher Neuronaler Netze. Das Ergebnis zeigte, dass mit der Testbatterie<br />

Standard insgesamt 80.2% der Gesamtstichprobe richtig klassifiziert werden konnten. Bei<br />

der Testbatterie Plus lag die Klassifikationsrate bei 86.5%. Dies entspricht einem<br />

Validitätskoeffizienten von R=0.68 für die Testbatterie Standard und R=0.78 für die<br />

Testbatterie Plus. In der Jackknife-Validierung wurde für die Testbatterie Standard eine<br />

Klassifikationsrate von 80.2% und ein Validitätskoeffizient von R=0.67 erzielt. Für die<br />

Testbatterie Plus lagen die Werte in der Jackknife-Validierung bei einer Klassifikationsrate<br />

von 83.8% und einem Validitätskoeffizient von R=0.77. Die Intervalle für die<br />

Klassifikationsrate und den Validitätskoeffizient in der Bootstrap-Validierung lagen bei<br />

[74.2%; 85.2%] und [0.54; 0.73] für die Testbatterie Standard und für die Testbatterie Plus<br />

bei [77.5%; 87.2%] und [0.61; 0.79]. Die inkrementelle Validität und relative Relevanz der<br />

einzelnen Testverfahren der beiden Testbatterien können der Tabelle 10 entnommen<br />

werden. Die relative Relevanz gibt an, mit welchem Anteil der entsprechende Test zur<br />

Validität des Vorhersagemodells beiträgt.<br />

Tabelle 10: Inkrementelle Validitäten und relative Relevanzen der beiden Testbatterien Standard und Plus<br />

Prädiktorvariablen<br />

Inkrementelle<br />

Validität<br />

STANDARD<br />

Relative<br />

Relevanz<br />

Inkrementelle<br />

Validität<br />

PLUS<br />

Relative<br />

Relevanz<br />

AMT: Allgemeine Intelligenz 0.128 18.7% 0.078 11.5%<br />

DT: Richtige 0.124 18.2% 0.071 10.5%<br />

RT: Mittlere Reaktionszeit 0.036 5.7% 0.057 8.6%<br />

RT: Mittlere Motorische Zeit 0.132 19.2% 0.118 16.9%<br />

PP: Gesichtsfeld -- -- 0.090 13.2%<br />

PP: Tracking Abweichung -- -- 0.139 19.5%<br />

TAVT: Überblicksgewinnung 0.120 17.6% 0.038 5.8%<br />

COG: Mittlere Zeit korrekte<br />

Zurückweisung<br />

0.141 20.3% 0.093 13.6%<br />

Die Testform S11 wurde zwischen 2005 und 2007 an 787 (53.4%) Männer und 688 (46.6%)<br />

Frauen im Altersbereich zwischen 15 und 91 Jahren (mean=42.53, sd=16.89) aus Österreich<br />

normiert. Insgesamt 32 (2.2%) Personen haben weniger als 9 Schuljahre absolviert (EU<br />

Bildungsgrad 1). 307 (20.8%%) Personen haben eine Pflichtschule oder Real¬schule<br />

absolviert, allerdings ohne abgeschlossene Berufs¬ausbildung (EU Bildungsgrad 2), 658<br />

(44.6%) Personen haben eine abgeschlossene Berufs¬aus¬bildung bzw. eine Fachschule<br />

absolviert (EU Bildungsgrad 3), 343 (23.3%) Personen haben einen Abitur- oder<br />

Fachhoch¬schulabschluss (EU Bildungsgrad 4) und 135 (9.2%) Personen verfügen über<br />

einen Hoch¬schul¬abschluss (EU Bildungsgrad 5). Die Altersverteilung der Normstichprobe<br />

kann der Tabelle 11 entnommen werden.<br />

Tabelle 11: Altersverteilung der Normstichprobe (N=1475)<br />

Altersgruppe in Jahren Beobachtete Häufigkeiten Erwartete Häufigkeiten<br />

15 bis 20 113 106<br />

21 bis 25 112 105


26 bis 30 148 119<br />

31 bis 35 198 148<br />

36 bis 40 152 156<br />

41 bis 45 148 137<br />

46 bis 50 124 115<br />

51 bis 55 105 114<br />

56 bis 60 88 100<br />

61 bis 65 101 99<br />

66 bis 70 73 74<br />

71 bis 75 51 72<br />

76 bis 80 31 65<br />

81 und älter 31 65<br />

Anmerkung: Beobachtete Häufigkeiten sind die Stichprobengrößen in der Normstichprobe. Die erwarteten<br />

Häufigkeiten entsprechenden Daten, die anhand der Volkszählung ermittelt wurden.<br />

Hauptvariable: „Score“:<br />

Diese Variable berücksichtigt sowohl die Tempoleistung als auch die Leistungsgüte. Hohe<br />

Ausprägungen sind als schnelle und genaue Wahrnehmungsleistung im Sinne einer<br />

Überblicksgewinnung zu interpretieren.<br />

Die innere Konsistenz beträgt r=0.92.<br />

Konstruktvalidität<br />

Topserver, Isik, Ogelmann, Bastürk und Tunali (2000) führten in der Türkei eine<br />

verkehrspsychologische Validierungsstudie an mehr als 500 Personen durch und konnten<br />

unter anderem zeigen, dass verkehrsauffällige Kraftfahrer ein signifikant schlechteres<br />

Ergebnis erzielten (p


Kriteriumsvalidität<br />

Eine Vorgängerversion des LVTs, der LL5, wurde von Bukasa, Wenninger und Brandstätter<br />

(1990) im Rahmen der Validierung einer verkehrspsychologischen Testbatterie eingesetzt.<br />

Beobachtet wurden Korrelationen zwischen verschiedenen Fahrverhaltensvariablen und der<br />

Variable LL5F% ("Prozentsatz von Falschen zu insgesamt bearbeiteten“): "Fehlerhafte<br />

Verlangsamung" (R=0.45), "Falsches Kreuzungsverhalten" (R=0.45), "Ungenaues<br />

Spurhalten" (R=0.42) und "Nicht sichern an Kreuzungen" (R=0.39).<br />

Calé (1992) gelang der Nachweis, dass die Testergebnisse des LVT zur Vorhersage von<br />

Fahrertypologien geeignet sind. An einer Stichprobe von N=72 Fahrern, die in kurzer Zeit in<br />

mehr als einen Unfall verwickelt waren, konnte Calé signifikante Korrelationen zwischen<br />

Testergebnis und Unfallhäufigkeit feststellen.<br />

Karner und Neuwirth (2000) konnten anhand ihrer Studie nachweisen, dass Personen mit<br />

einem PR33.<br />

Ein Vergleich des LVT mit dem LL5 aus dem ART90 zeigte hochsignifikante Korrelationen<br />

zwischen den Testverfahren LVT und LL5 (Karner & Biehl; 2001).<br />

Es liegt eine Normierung mit einer repräsentativen Stichprobe der „Normalbevölkerung“ im<br />

Umfang von N=646 Personen vor. Diese Stichprobe setzt sich aus 300 (46.4%) Männern<br />

und 346 (53.6%) Frauen zusammen. Diese Normen liegen auch in Teilstichproben nach der<br />

Variable Alter (bis 25 Jahre, 26 bis 35 Jahre, 36 bis 59 Jahre, 60 bis 70 Jahre und ab 71<br />

Jahre) vor. Die genaue Altersverteilung dieser Stichprobe ist der Tabelle 12 zu entnehmen.<br />

Tabelle 12: Altersverteilung der Normstichprobe<br />

Altersgruppe in Jahren Beobachtete Häufigkeit Erwartete Häufigkeit<br />

15 bis 20 39 19<br />

21 bis 25 67 52<br />

26 bis 30 66 71<br />

31 bis 35 78 71<br />

36 bis 40 69 58<br />

41 bis 45 55 58<br />

46 bis 50 54 45<br />

51 bis 55 34 58<br />

56 bis 60 50 52<br />

61 bis 65 38 39<br />

66 bis 70 46 39<br />

71 bis 75 26 32<br />

76 und älter 24 51<br />

Anmerkung: Beobachtete Häufigkeiten sind die Stichprobengröße in der Normstichprobe. Erwartete Häufigkeiten<br />

entsprechenden Daten, die anhand der Volkszählung ermittelt wurden.<br />

Für jede Stichprobengröße wird die repräsentative Verteilung basierend auf Daten der<br />

österreichischen Volkszählung 1991 (Volkszählung 1991: Hauptergebnisse I – Österreich


Heft 1.030/10 der Beiträge zur Österreichischen Statistik, hg. vom österreichischen<br />

Statistischen Zentralamt, Wien 1993) und Daten aus Deutschland, die ebenfalls von einer<br />

Volkszählung stammen, die nach der Wiedervereinigung Deutschlands durchgeführt wurde,<br />

berechnet. Diese Daten entsprechen den erwarteten Häufigkeiten in Tabelle 12.<br />

Hauptvariable: „Anzahl der richtigen Reaktionen“:<br />

Diese Variable misst die Leistungsfähigkeit der Person, bei länger dauernden Folgen von<br />

einfachen Reaktionsaufgaben unter erheblicher Belastung rasch und adäquat zu reagieren.<br />

Hilfsvariable: „Anzahl der falschen Reaktionen“:<br />

Falsche Reaktionen zeigen die Tendenz zu Verwechslungen an. Sie entstehen hier nicht<br />

durch die kognitive Komplexität der Zuordnungsregeln zwischen Reiz und Reaktion, sondern<br />

weil es dem Probanden nicht immer gelingt, die adäquate Reaktion vor der Einwirkung<br />

konkurrierender irrelevanter Reaktionen abzuschirmen.<br />

Hilfsvariable: „Anzahl der ausgelassenen Reaktionen“:<br />

Diese Variable beschreibt, ob Reaktionen unter Zeitdruck abgebrochen werden. Sie ist damit<br />

ein Hinweis für Resignationstendenzen des Probanden.<br />

Tabelle 13: Innere Konsistenz der Testform S1, berechnet als Cronbach Alpha auf Itemniveau.<br />

Stichprobe Gesamt bis 25a 26a - 35a 36a - 59a >59a Bild. 1 * ) Bild 2 ** )<br />

SUM.R 0.990 0.986 0.986 0.988 0.988 0.992 0.988<br />

SUM.F 0.990 0.986 0.986 0.988 0.988 0.992 0.988<br />

SUM.A 0.990 0.986 0.986 0.988 0.988 0.992 0.988<br />

MD.RT 0.991 0.995 0.995 0.995 0.995 0.996 0.993<br />

ANZ.S 0.991 0.995 0.995 0.995 0.995 0.996 0.993<br />

SUM.RF 0.995 0.996 0.989 0.995 0.996 0.996 0.993<br />

Anmerkung: *): Bildungsstufen „Volksschule, Realschule" **): Bildungsstufen „Abitur, Universität"<br />

In einer Längsschnittstudie an 82 Personen (48% Männer, 52% Frauen) im Altersbereich von<br />

17 bis 78 Jahren (m=44; s=17) ergab sich für die Hauptvariable der Testform S1 eine Retest<br />

Reliabilität von r=0.89 und eine Stabilität über den Zeitraum von 5 Monaten von r=0.84.<br />

Wie die Werte insgesamt zeigen, ist die Konsistenz der Messung in den einzelnen Variablen<br />

extrem hoch. Das bedeutet, dass der Determinationstest ein besonders messgenaues<br />

diagnostisches Instrument ist.<br />

Konstruktvalidität<br />

Unter Reaktionszeit versteht man die Zeit, die zwischen einem Signal und dem Beginn einer<br />

mechanischen Bewegungsantwort vergeht, wenn der Proband instruiert wurde, möglichst<br />

rasch zu reagieren (Dorsch, 1994). Beim Determinationstest wird die Reaktionszeit auf<br />

komplexe Wahlreaktionen gemessen. Zur Ermittlung dieser Reaktionszeiten, die im


Millisekundenbereich liegen, ist ein Testinstrument notwendig, das sehr zuverlässig und<br />

genau ist.<br />

Der Determinationstest ist zur Bestimmung der Reaktionszeit auf komplexe Wahlreaktionen<br />

bestens geeignet.<br />

Im Rahmen der Normierungsstudie der Testform S1 (Weinkirn, 1996) wurde der<br />

Determinationstest gemeinsam mit dem Reaktionstest und dem Tachistoskopischen<br />

Verkehrsauffassungstest (TAVTMB) einer Stichprobe von 180 „gesunden Normalpersonen"<br />

vorgegeben.<br />

Tabelle 14: Korrelationen DT mit TAVT und RT<br />

RT<br />

DT: MD.RT 0.5896**<br />

DT<br />

MD.RT MD.RT SUM.R SUM.F<br />

DT: SUM.R -0.5191** -0.8997**<br />

DT: SUM.F -0.1606 -0.3513 -0.2706<br />

TAVTMB: R -0.3906** -0.6668 0.67** 0.2879**<br />

Anmerkung: * = r


Standardabweichung von 6.25 Jahren). Der Altersmedian lag bei 31 Jahren. Bei dieser<br />

Stichprobe handelte es sich um eine Freiwilligenstichprobe, die in Zusammenarbeit mit einer<br />

österreichischen Versicherungsgesellschaft rekrutiert wurde. Die Verteilung der<br />

Bildungsgrade in dieser Stichprobe gestaltete sich wie folgt: 7 (4.60%) Personen hatten eine<br />

Pflichtschule oder Realschule absolviert, allerdings ohne abgeschlossene Berufsausbildung<br />

(EU Bildungsgrad 2), 42 (27.50%) Personen hatten eine abgeschlossene Berufsausbildung<br />

bzw. eine Fachschule absolviert (EU Bildungsgrad 3), 83 (54.20%) Personen hatten einen<br />

Abitur- oder Fachhochschulabschluss (EU Bildungsgrad 4) und 21 (13.70%) Personen<br />

verfügten über einen Hochschulabschluss (EU Bildungsgrad 5). Insgesamt 75 (49%)<br />

Personen gaben in einem strukturierten Interview zur Erfassung ihrer Verkehrsunfälle an,<br />

bereits zwei oder mehr selbstverschuldete Verkehrsunfälle gehabt zu haben, während die<br />

übrigen untersuchten 78 (51%) Personen berichteten, bisher noch keine Verkehrsunfälle<br />

verursacht zu haben. Im Sinne eines Extremgruppenvergleichs wurden Personen mit nur<br />

einem selbstverschuldeten Unfall ausgeschlossen, da bei Vorliegen eines einzigen Unfalls<br />

noch nicht von einer relevanten Erhöhung der personenspezifischen Unfallverwicklung<br />

ausgegangen werden kann. Die beiden Gruppen unterschieden sich weder hinsichtlich ihrer<br />

Geschlechts- (Chi²=2.492; df=1; p=0.114) und Bildungsverteilung (Chi²=3.114; df=3;<br />

p=0.374) sowie ihres Lebensalters (Z=1.563; p=0.059) noch hinsichtlich ihrer Fahrumwelt<br />

oder in ihrem Fahrverhalten signifikant voneinander. Alle Untersuchungsteilnehmer hatten<br />

bereits seit mindestens fünf Jahren einen Führerschein und eine Fahrerfahrung von<br />

mindestens 50.000 Kilometer. Die beiden Gruppen unterschieden sich nicht signifikant<br />

(Z=1.616; p=0.053) in der Gesamtanzahl der zurückgelegten Kilometer. Alle<br />

Untersuchungsteilnehmer kamen aus Wien und benutzten ihr Kraftfahrzeug überwiegend im<br />

Stadtverkehr.<br />

In der für diese Studie verwendeten standardisierten, verkehrspsychologischen Testbatterie<br />

kam unter anderem auch der DT zur Anwendung. Die Autoren bedienten sich künstlicher<br />

Neuronaler Netze, um die Unfallbelastung der Probanden anhand ihrer Testkennwerte<br />

vorherzusagen. Das Ergebnis zeigte, dass insgesamt 92.2% der Gesamtstichprobe richtig<br />

klassifiziert werden konnten. Dies entspricht einem Validitätskoeffizienten von R=0.84. In der<br />

Jackknife-Validierung wurde eine Klassifikationsrate von 88.9% und ein Validitätskoeffizient<br />

von R=0.84 erzielt. Die Intervalle für die Klassifikationsrate und den Validitätskoeffizient in<br />

der Bootstrap-Validierung lagen bei [84.6%; 94.5%] und [0.70; 0.89]. Die inkrementelle<br />

Validität und relative Relevanz der einzelnen Testverfahren können der Tabelle 15<br />

entnommen werden. Die relative Relevanz gibt an, mit welchem Anteil der entsprechende<br />

Test zur Validität des Vorhersagemodells beiträgt.<br />

Tabelle 15. Inkrementelle Validität und relative Relevanz der einzelnen Tests<br />

Testbezeichnung Inkrementelle Validität Relative Relevanz<br />

AMT 0.011 1.4%<br />

DT 0.133 20.9%<br />

SIGNAL 0.075 9.2%<br />

TAVTMB 0.064 7.9%<br />

WRBTV 0.072 8.9%<br />

IVPE/PS 0.311 32.2%<br />

IVPE/VB 0.087 10.6%<br />

IVPE/SK 0.066 8.2%<br />

IVPE/TA 0.001 2.0%


Die Ergebnisse sprechen somit bei einer relativen Relevanz von rund 21% für die<br />

Kriteriumsvalidität des DT.<br />

Eine weitere Studie von Sommer & Häusler (2006) beschäftigte sich mit der<br />

Kriteriumsvalidität zweier Testbatterien zur Erfassung der kraftfahrspezifischen<br />

Leistungsfähigkeit aus dem Expertensystem Verkehr (Schuhfried, 2005), die ebenfalls den<br />

DT beinhalten. Die beiden Testbatterien Standard und Plus unterschieden sich hierbei<br />

ausschließlich darin, ob die Periphere Wahrnehmung (PP) als Maß für das Gesichtsfeld und<br />

die geteilte Aufmerksamkeit vorgegeben wurde. Als Kriteriumsvariable wurde das<br />

Globalurteil über das Fahrverhalten in einer standardisierten Fahrprobe herangezogen. Die<br />

von den Autoren untersuchte Stichprobe bestand aus 164 (74%) Männern und 58 (26%)<br />

Frauen im Alter von 19 bis 91 Jahren bei einem durchschnittlichen Alter von 59 Jahren und<br />

einer Standardabweichung von 18 Jahren. Der Altersmedian lag bei 64 Jahren. Es handelte<br />

sich daher um Personen im mittleren bis höheren Lebensalter. Bei den Probanden handelte<br />

es sich zum Teil um bereits auffällige Kraftfahrer. Die Studienteilnahme war jedoch freiwillig.<br />

Insgesamt 39 (18%) Personen hatten eine Pflichtschule oder Realschule ohne<br />

abgeschlossene Berufsausbildung absolviert (EU Bildungsgrad 2), 96 (43%) Personen<br />

hatten eine abgeschlossene Berufsausbildung bzw. eine Fachschule absolviert (EU<br />

Bildungsgrad 3), 35 (16%) Personen hatten einen Abitur- oder Fachhochschulabschluss (EU<br />

Bildungsgrad 4) und 52 (23%) Personen verfügten über einen Hochschulabschluss (EU<br />

Bildungsgrad 5).<br />

Aufgrund der Ergebnisse bisheriger Studien erfolgte die Berechnung der Kriteriumsvalidität<br />

mit Hilfe künstlicher Neuronaler Netze. Das Ergebnis zeigte, dass mit der Testbatterie<br />

Standard insgesamt 80.2% der Gesamtstichprobe richtig klassifiziert werden konnten. Bei<br />

der Testbatterie Plus lag die Klassifikationsrate bei 86.5% Dies entspricht einem<br />

Validitätskoeffizienten von R=0.68 für die Testbatterie Standard und R=0.78 für die<br />

Testbatterie Plus. In der Jackknife-Validierung wurde für die Testbatterie Standard eine<br />

Klassifikationsrate von 80.2% und ein Validitätskoeffizent von R=0.67 erzielt. Für die<br />

Testbatterie Plus lagen die Werte in der Jackknife-Validierung bei einer Klassifikationsrate<br />

von 83.8% und einem Validitätskoeffizent von R=0.77. Die Intervalle für die<br />

Klassifikationsrate und den Validitätskoeffizent in der Bootstrap-Validierung lagen bei<br />

[74.2%; 85.2%] und [0.54; 0.73] für die Testbatterie Standard und für die Testbatterie Plus<br />

bei [77.5%; 87.2%] und [0.61; 0.79]. Die inkrementelle Validität und relative Relevanz der<br />

einzelnen Testverfahren der beiden Testbatterien können der Tabelle 16 entnommen<br />

werden. Die relative Relevanz gibt an, mit welchem Anteil der entsprechende Test zur<br />

Validität des Vorhersagemodells beiträgt.


Tabelle 16. Inkrementelle Validitäten und relative Relevanzen der beiden Testbatterien Standard und Plus<br />

Prädiktorvariablen<br />

Inkrementelle<br />

Validität<br />

STANDARD<br />

Relative<br />

Relevanz<br />

Inkrementelle<br />

Validität<br />

PLUS<br />

Relative<br />

Relevanz<br />

AMT: Allgemeine Intelligenz 0.128 18.7% 0.078 11.5%<br />

DT: Richtige 0.124 18.2% 0.071 10.5%<br />

RT: Mittlere Reaktionszeit 0.036 5.7% 0.057 8.6%<br />

RT: Mittlere Motorische Zeit 0.132 19.2% 0.118 16.9%<br />

PP: Gesichtsfeld -- -- 0.090 13.2%<br />

PP: Tracking Abweichung -- -- 0.139 19.5%<br />

TAVT: Überblicksgewinnung 0.120 17.6% 0.038 5.8%<br />

COG: Mittlere Zeit korrekte<br />

Zurückweisung<br />

0.141 20.3% 0.093 13.6%<br />

Die Ergebnisse sprechen somit bei einer relativen Relevanz von 18.2% (Testbatterie<br />

Standard) bzw. 10.5% (Testbatterie Plus) für die Kriteriumsvalidität des DT.<br />

Sommer, Arendasy, Hansen und Schuhfried. (2005) untersuchten die Kriteriumsvalidität<br />

einer umfassenden fliegerpsychologischen Testbatterie zur Auswahl geeigneter<br />

Militärpilotenanwärter. Die Studie gliederte sich in zwei Phasen. In der ersten Phase wurde<br />

eine umfassende Testbatterie administriert. Als Prädiktorvariablen dienten hierbei die<br />

Testvariablen Figural-Induktives Denken und Visuelles Kurzzeitgedächtnis aus der<br />

Intelligenz-Struktur-Batterie (Arendasy et al., 2005), die Testvariable Richtige aus dem<br />

Determinationstest Form S1 sowie die Testvariable Raumvorstellung aus dem Adaptiven<br />

Dreidimensionalen Würfeltest (Gittler, 2002) und die Testvariable Zeit im Idealbereich aus<br />

der Sensomotorischen Koordination (Bauer, Guttmann, Leodolter & Leodolter, 2002). In der<br />

zweiten Phase wurde die Performanz der Probanden in einem standardisierten Flugsimulator<br />

erhoben. Anhand der Globalbeurteilung der erbrachten Leistung im standardisierten<br />

Flugsimulator wurde die Stichprobe in geeignete Pilotenanwärter (53.54%) und weniger<br />

geeignete Pilotenanwärter (46.46%) unterteilt. Die Stichprobe besteht aus insgesamt 99<br />

männlichen Pilotenanwärtern im Alter von 16 bis 25 Jahren. Der Altersmittelwert liegt bei<br />

20.4 Jahren bei einer Standardabweichung von 1.85 Jahren. 1 Person (1%) verfügt über<br />

einen Pflichtschulabschluss ohne abgeschlossene Berufsausbildung während 19 Personen<br />

(19.2%) zudem auch über eine abgeschlossene Berufsausbildung verfügen. Insgesamt 74<br />

Personen (74.7%) können ein Abitur bzw. eine Matura vorweisen. 5 Personen (5.1%) haben<br />

einen Universitätsabschluss. Die Gruppe der positiv beurteilten Personen besteht aus 53<br />

Männern (53.54%) während 46 Männer (46.46%) keine positive bzw. eine nur beschränkt<br />

positive Bewertung erhalten haben. Unter Anwendung künstlicher Neuronaler Netze konnte<br />

anhand der hier verwendeten Testverfahren der Erfolg im Flugsimulator bei 79.8% der<br />

Probanden korrekt vorhergesagt werden. In der Jackknife-Validierung lag die<br />

Klassifikationsrate bei 73.8%. Das hier vorgestellte Testverfahren trug mit einer relativen<br />

Relevanz von 18% zum Vorhersagemodell bei, sodass von der Kriteriumsvalidität des DT im<br />

Bereich der fliegerpsychologischen Diagnostik ausgegangen werden kann.<br />

Normstichprobe<br />

Es liegt eine Normierung der Testform S1 mit einer Stichprobe vom Umfang N=1179 vor.<br />

Tabelle 17 zeigt die Verteilung der Stichprobenmerkmale.


Tabelle 17: Verteilung der Stichprobenmerkmale<br />

Altersgruppen -25 J. 26-35 J. 36-59 J. 60 - 70 J. ab 71 J. Gesamt<br />

N 136 222 477 205 139 581 / 598<br />

% 11,5 18,8 40,5 17,4 11,8 49 / 51<br />

Anmerkung: Die Zahlen links und rechts vom Schrägstrich stehen für die Anzahl der Männer bzw. Frauen.<br />

Bei der oben beschriebenen Stichprobe handelt es sich um „normale" Erwachsene, die im<br />

Rahmen von Normierungsstudien 1996 bis 2001 im Forschungs- und Schulungslabor der<br />

<strong>SCHUHFRIED</strong> <strong>GmbH</strong> erhoben wurden.<br />

Die Normstichprobe (N=1179) setzt sich aus 581 Männern (49%) und 598 Frauen (51%)<br />

zusammen. Die Stichprobe ist in Teilstichproben nach fünf Altersgruppen (bis 25, 26-35, 36-<br />

59, 60-70, 71 Jahre und älter) sowie in Teilstichproben nach den Bildungsstufen 1-3<br />

(Volksschule, Haupt- bzw. Realschule, Lehrabschluss) und 4-5 (Abitur,<br />

Universitätsabschluss) aufgeteilt, die sich voneinander signifikant unterscheiden.<br />

Tabelle 18: Erwartete und tatsächlich beobachtete Häufigkeiten in der Stichprobe<br />

Altersgruppe in Jahren Beobachtete Häufigkeiten Erwartete Häufigkeiten<br />

15 bis 20 36 35<br />

21 bis 25 100 94<br />

26 bis 30 106 130<br />

31 bis 35 116 130<br />

36 bis 40 115 106<br />

41 bis 45 67 106<br />

46 bis 50 82 83<br />

51 bis 55 108 106<br />

56 bis 60 132 94<br />

61 bis 65 101 71<br />

66 bis 70 77 71<br />

71 bis 75 72 59<br />

76 bis 80 54 35<br />

81 bis 85 11 35<br />

86 und älter 2 24<br />

Anmerkung: Beobachtete Häufigkeiten sind die Stichprobengrößen in der Normstichprobe. Erwartete<br />

Häufigkeiten basieren auf den Daten, die anhand der Volkszählung 1991 ermittelt wurden.<br />

Für jede Stichprobengröße wird die repräsentative Verteilung basierend auf Daten der<br />

österreichischen Volkszählung 1991 (Volkszählung 1991: Hauptergebnisse I - Österreich<br />

Heft 1.030/10 der Beiträge zur Österreichischen Statistik, hg. vom österreichischen<br />

Statistischen Zentralamt, Wien 1993.) und Daten aus Deutschland, die ebenfalls von einer<br />

Volkszählung stammen, die nach der Wiedervereinigung Deutschlands durchgeführt wurde,<br />

berechnet. Diese Daten entsprechen den erwarteten Häufigkeiten in Tabelle 18.


Überblicksgewinnung<br />

Der Personenparameter der Variable Überblicksgewinnung stellt ein Maß für die Genauigkeit<br />

und Geschwindigkeit der visuellen Beobachtungsfähigkeit und Überblicksgewinnung sowie<br />

der visuellen Orientierungsleistung dar. In diesem Testkennwert kommen somit die<br />

Wahrnehmungskapazität und das Wahrnehmungstempo am deutlichsten zum Ausdruck.<br />

Ein hoher Prozentrang (PR>84) weist auf eine gut ausgeprägte Fähigkeit zur raschen und<br />

genauen Situationserfassung hin, während ein niedriger Prozentrang (PR


kognitiven Prozesse tatsächlich ansprechen und daher auch Unterschiede in den<br />

Itemschwierigkeitsparametern erklären können. Der Einfluss der Aufgabenmerkmale und der<br />

mit ihnen assoziierten kognitiven Prozesse kann mit Hilfe erklärender IRT-Modelle wie dem<br />

Linearen Logistischen Testmodell (LLTM, Fischer, 1974) oder multiplen Regressionen (z.B.<br />

Embretson, 1998; 2002) empirisch überprüft werden.<br />

Um von einer angemessenen Konstruktvalidität ausgehen zu können, sollten sich zudem<br />

auch die theoretisch zu erwartenden Zusammenhänge mit anderen Testverfahren zeigen.<br />

Hinsichtlich des letztgenannten Aspekts sprechen Embretson (1983) und Messick (1995) von<br />

einem Nachweis der nomothetischen Spanne.<br />

Hinweise zur Konstruktrepräsentation von ATAVT liefert eine Studie von Sommer, Herle,<br />

Häusler & Arendasy (2008), in der versucht wurde, die Itemschwierigkeitsparameter der<br />

k=84 neuen Items anhand des Konstruktionsrationals von ATAVT vorherzusagen. Die<br />

Autoren verwendeten in Anlehnung an Embretson (2002) eine schrittweise multiple<br />

Regression, wobei die folgenden Schwierigkeitsfaktoren in der hier genannten Reihenfolge<br />

einbezogen wurden: (1) „Anzahl der sichtbaren Objektklassen“, (2) „Relativer Anteil der<br />

notwendigen peripheren Objekte“, (3) „Relativer Anteil der notwendigen kleinen Objekte“, (4)<br />

„Erfahrungsbedingte Täuschung“, (5) „Schlechter Konturenkontrast“, (6) „Relativer Anteil der<br />

notwendigen verdeckten Objekte“ und (7) „Relativer Anteil typischer Objekte“. Die<br />

Modellzusammenfassung ist in Tabelle 19 dargestellt.<br />

Tabelle 19: Modellzusammenfassung der schrittweisen multiplen Regression<br />

Modell R R² adj. R² Δ R² Δ F df1 df2 p<br />

1 0.801 0.642 0.637 0.642 146.86 1 82


Wie aus Tabelle 20 deutlich hervorgeht, leisten alle der theoretisch postulierten<br />

Schwierigkeitsfaktoren einen signifikanten Beitrag zur Vorhersage der<br />

Itemschwierigkeitsparameter. Eine Inspektion der β-Gewichte zeigt jedoch, dass die „Anzahl<br />

der sichtbaren Objektklassen“ den vergleichsweise größten Beitrag zur Vorhersage der<br />

Itemschwierigkeitsparameter leistet.<br />

Hinweise auf die nomothetische Spanne (Embretson, 1983) des ATAVT ergeben sich aus<br />

der Studie von Zuschlag und Jacobshagen (1982). Die Autoren fanden in ihrer Untersuchung<br />

folgende Korrelation zwischen einer Vorversion des ATAVT und anderen Testverfahren zur<br />

visuellen Wahrnehmung: Labyrinth-Test: r=0.38; Fehler im Benton-Test: r=0.33; Fehler im<br />

Mehrfachwahl-Reaktionsversuch: r=0.30. Zudem untersuchten Karner und Biehl (2001) den<br />

Zusammenhang zwischen einer Vorversion des ATAVT und dem Tachistoskop-Test (TT15:<br />

Bukasa & Wenninger, 1986). Die Autoren berichten einen signifikanten<br />

Korrelationskoeffizienten in der Höhe von r=0.77. Die vorliegenden Befunde zur<br />

nomothetischen Spanne sprechen somit für die konvergente Validität von ATAVT.<br />

Kriteriumsvalidität<br />

Hinweise auf die Kriteriumsvalidität von ATAVT liefern zahlreiche Studien aus dem Bereich<br />

der verkehrspsychologischen Diagnostik, die zum Teil mit einer Vorversion von ATAVT –<br />

dem TAVTMB - durchgeführt wurden. So berichtet beispielsweise Kamuf (1988) eine<br />

Korrelation zwischen der Fahrprobe und einer Vorversion von ATAVT (TAVTMB: Biehl,<br />

1996) in der Höhe von 0.74. In einer weiteren Untersuchung konnte Kamuf (1988) zeigen,<br />

dass unter Berücksichtigung des Alterseinflusses Betriebskraftfahrer und Fahrlehreranwärter<br />

beim TAVT signifikant bessere Ergebnisse erreichten als eine Kontrollgruppe.<br />

Eine Untersuchung von Schubert, Müller und Senf (1962) zeigte signifikante Unterschiede<br />

zwischen den Testleistungen bewährter und auffälliger Kraftfahrer. Hampel (1976) stellte<br />

signifikante Mittelwertunterschiede zwischen Fahrlehreranwärtern und tatauffälligen<br />

Kraftfahrern in einer Vorversion von ATAVT (TAVTMB: Biehl, 1996) fest.<br />

Eine Studie von Hartje, Pach, Willmes, Hannen und Weber (1991) zeigte eine Korrelation<br />

zwischen einer Vorversion von ATAVT (TAVTMB: Biehl, 1996) und einer Fahrprobe von<br />

r=0.42 bei Personen mit Schädel-Hirn-Traumata.<br />

Eine Untersuchung von Schlag (1994) zeigte hochsignifikante Unterschiede zwischen<br />

Personen unter 70 Jahren und Personen über 70 Jahren (N=110) bei Fahrversuch und<br />

Testung mittels einer Vorgängerversion von ATAVT (TAVTMB: Biehl, 1996). Ältere Personen<br />

waren beim Einfädeln auf Autobahnauffahrten langsamer, wählten einen engeren<br />

Abbiegeradius beim Einbiegen auf eine Landstraße, zeigten allgemein ein höheres<br />

Bestreben, den rechten Fahrstreifen zu wählen. Sie missachteten deutlich öfter die Vorfahrt<br />

und die rote Ampel. Ältere Personen übersahen öfter bevorrangte Verkehrsteilnehmer und<br />

querten einen unbeschrankten Bahnübergang ohne Geschwindigkeitsreduktion.<br />

Hinweise auf die Validität ergeben sich auch aus einer Studie mit einer Vorgängerversion<br />

des Testverfahrens (Bukasa, Wenninger & Brandstätter 1990). Diese Untersuchung<br />

umfasste eine Gruppe von N=248 freiwilligen Kraftfahrern. Die Vorversion von ATAVT<br />

(TAVTMB: Biehl, 1996) kann zwischen angepassten und unangepassten Fahrern trennen.<br />

Eine Zuordnung der Probanden zu Fahrertypologien aufgrund der Testergebnisse gelingt zu<br />

83%. Eine zweite Gruppe von N=120 verkehrsauffälligen Probanden aus der<br />

Fahreignungsdiagnostik wurde ebenfalls untersucht. Die Testergebnisse stehen mit den in<br />

der Fahrverhaltensbeobachtung registrierten Verhaltensfehlern und Konflikten in einem<br />

deutlichen Zusammenhang. Zusammenhänge zwischen folgenden Fahrverhaltenskategorien<br />

und der Vorversion des ATAVT (TAVTMB: Biehl, 1996) konnten festgestellt werden:<br />

Einordnen, Spurwechsel, Vorrang-Nachrang-Situationen, spätes Reagieren an Ampeln,<br />

Abstandhalten. Ein Extremgruppenvergleich bezüglich der Fahrverhaltenskategorien, d.h. die


Stichprobe wurde in die 40% Besten und 40% Schlechtesten gesplittet, ergab bei Fehlern<br />

aus der Fahrverhaltensbeobachtung signifikante Leistungsunterschiede im vorliegenden<br />

Testverfahren.<br />

Karner und Neuwirth (2000) konnten eine Korrelation von –0.42 zwischen dem Globalurteil<br />

des Fahrverhaltens in einer standardisierten Fahrprobe und dem Testergebnis in einer<br />

Vorversion des ATAVT (TAVTMB: Biehl, 1996) nachweisen. Darüber hinaus zeigen sich<br />

auch signifikante Unterschiede in der Gesamtbewertung des Fahrverhaltens zwischen<br />

Personen mit Leistungen PR


Tabelle 21: Inkrementelle Validität und relative Relevanz der einzelnen Tests<br />

Testbezeichnung Inkrementelle Validität Relative Relevanz<br />

AMT: Allgemeine Intelligenz 0.011 1.4%<br />

DT: Richtige 0.133 20.9%<br />

SIGNAL: Richtige und Verspätete 0.075 9.2%<br />

ATAVT: Überblicksgewinnung 0.064 7.9%<br />

WRBTV: Subjektiv akzeptiertes Risikoniveau 0.072 8.9%<br />

IVPE-PS: Psychische Stabilität 0.311 32.2%<br />

IVPE-VB: Soziales Verantwortungsbewusstsein 0.087 10.6%<br />

IVPE-SK: Selbstkontrolle 0.066 8.2%<br />

IVPE-TA: Spannungsbedürfnis und Abenteuerlust 0.001 2.0%<br />

Die Ergebnisse sprechen somit bei einer relativen Relevanz von rund 8% für die<br />

Kriteriumsvalidität von ATAVT.<br />

Eine weitere Studie von Risser et al. (2008) beschäftigte sich mit der Kriteriumsvalidität<br />

zweier Testbatterien zur Erfassung der kraftfahrspezifischen Leistungsfähigkeit aus dem<br />

Expertensystem Verkehr (Schuhfried, 2005), die ebenfalls eine Vorversion von ATAVT<br />

(TAVTMB: Biehl, 1996) beinhaltete. Die beiden Testbatterien Standard und Plus<br />

unterschieden sich hierbei ausschließlich darin, ob die Periphere Wahrnehmung (PP) als<br />

Maß für das Gesichtsfeld und die geteilte Aufmerksamkeit vorgegeben wurde. Als<br />

Kriteriumsvariable wurde das Globalurteil über das Fahrverhalten in einer standardisierten<br />

Fahrprobe herangezogen. Die von den Autoren untersuchte Stichprobe bestand aus 164<br />

(74%) Männern und 58 (26%) Frauen im Alter von 19 bis 91 Jahren bei einem<br />

durchschnittlichen Alter von 59 Jahren und einer Standardabweichung von 18 Jahren. Der<br />

Altersmedian lag bei 64 Jahren. Es handelte sich daher um Personen im mittleren bis<br />

höheren Lebensalter. Bei den Probanden handelte es sich zum Teil um bereits auffällige<br />

Kraftfahrer.<br />

Insgesamt 39 (18%) Personen hatten eine Pflichtschule oder Realschule ohne<br />

abgeschlossene Berufsausbildung absolviert (EU Bildungsgrad 2), 96 (43%) Personen<br />

hatten eine abgeschlossene Berufsausbildung bzw. eine Fachschule absolviert (EU<br />

Bildungsgrad 3), 35 (16%) Personen hatten eine höhere Schule mit Abitur/Matura<br />

abgeschlossen (EU Bildungsgrad 4) und 52 (23%) Personen verfügten über einen<br />

Hochschulabschluss (EU Bildungsgrad 5).<br />

Die Korrelationen zwischen den einzelnen Tests und dem Außenkriterium können Tab. 22<br />

entnommen werden.<br />

Tabelle 22: Korrelationen zwischen den Testverfahren und dem Außenkriterium<br />

AMT<br />

DT<br />

RT kogn.<br />

Geschw.<br />

RT mot.<br />

Geschw.<br />

PP<br />

Gesichtsfeld<br />

PP<br />

Tackingab<br />

weichung<br />

TAVT<br />

.22* .33** .27** -.25** .07 -.33* .42** .19<br />

*p


konnten. Bei der Testbatterie Plus lag die Klassifikationsrate bei 86.5% Dies entspricht<br />

einem Validitätskoeffizienten von R=0.68 für die Testbatterie Standard und R=0.78 für die<br />

Testbatterie Plus. In der Jackknife-Validierung wurde für die Testbatterie Standard eine<br />

Klassifikationsrate von 80.2% und ein Validitätskoeffizient von R=0.67 erzielt. Für die<br />

Testbatterie Plus lagen die Werte in der Jackknife-Validierung bei einer Klassifikationsrate<br />

von 83.8% und einem Validitätskoeffizient von R=0.77. Die Intervalle für die<br />

Klassifikationsrate und den Validitätskoeffizient in der Bootstrap-Validierung lagen bei<br />

[74.2%; 85.2%] und [0.54; 0.73] für die Testbatterie Standard und für die Testbatterie Plus<br />

bei [77.5%; 87.2%] und [0.61; 0.79]. Die Ergebnisse konnten zudem auch von Sommer et al.<br />

(2008) anhand einer weiteren unabhängigen Stichprobe repliziert werden.<br />

Die inkrementelle Validität und relative Relevanz der einzelnen Testverfahren der beiden<br />

Testbatterien können der Tabelle 23 entnommen werden. Die relative Relevanz gibt an, mit<br />

welchem Anteil der entsprechende Test zur Validität des Vorhersagemodells beiträgt.<br />

Tabelle 23:Inkrementelle Validität und relative Relevanz der einzelnen Tests<br />

Prädiktorvariablen<br />

Inkrementelle<br />

Validität<br />

STANDARD<br />

Relative<br />

Relevanz<br />

Inkrementelle<br />

Validität<br />

PLUS<br />

Relative<br />

Relevanz<br />

AMT: Allgemeine Intelligenz 0.128 18.7% 0.078 11.5%<br />

DT: Richtige 0.124 18.2% 0.071 10.5%<br />

RT: Mittlere Reaktionszeit 0.036 5.7% 0.057 8.6%<br />

RT: Mittlere Motorische Zeit 0.132 19.2% 0.118 16.9%<br />

PP: Gesichtsfeld -- -- 0.090 13.2%<br />

PP: Tracking Abweichung -- -- 0.139 19.5%<br />

ATAVT: Überblicksgewinnung 0.120 17.6% 0.038 5.8%<br />

COG: Mittlere Zeit korrekte<br />

Zurückweisung<br />

0.141 20.3% 0.093 13.6%<br />

Die Ergebnisse sprechen somit bei einer relativen Relevanz von 17.6% (Testbatterie<br />

Standard) bzw. 5.8% (Testbatterie Plus) für die Kriteriumsvalidität von ATAVT.<br />

Hinweise auf die inkrementelle Kriteriumsvalidität einer Vorversion von ATAVT (TAVTMB:<br />

Biehl, 1996) ergeben sich auch aus den Ergebnissen einer Studie von Sommer et al. (2008).<br />

Die Autoren untersuchten die Kriteriumsvalidität einer Testbatterie zur Erfassung der<br />

kraftfahrspezifischen Leistungsfähigkeit und der Bereitschaft zur Verkehrsanpassung aus<br />

dem Expertensystem Verkehr (Schuhfried, 2005), die ebenfalls eine Vorversion von ATAVT<br />

beinhaltete. Als Kriteriumsvariable wurde das Globalurteil über das Fahrverhalten in einer<br />

standardisierten Fahrprobe herangezogen. Sommer et al. (2008b) untersuchten eine<br />

Stichprobe von 127 (79.9%) Männern and 32 (20.1%) Frauen im Alter von 19 bis 73 Jahren<br />

(Mean=39.41; SD=11.92). Insgesamt 29 (18.2%) Personen hatten eine Pflichtschule oder<br />

Realschule ohne abgeschlossene Berufsausbildung absolviert (EU Bildungsgrad 2), 96<br />

(43%) Personen hatten eine abgeschlossene Berufsausbildung bzw. eine Fachschule<br />

absolviert (EU Bildungsgrad 3), 35 (16%) Personen hatten eine höhere Schule mit<br />

Abitur/Matura abgeschlossen (EU Bildungsgrad 4) und 52 (23%) Personen verfügten über<br />

einen Hochschulabschluss (EU Bildungsgrad 5). Insgesamt 109 (68.6%) Personen wurden<br />

anhand ihrer Performanz in der standardisierten Fahrprobe (Wiener Fahrprobe) als sichere<br />

Fahrer beurteilt.


Die Korrelationen zwischen den einzelnen Tests und dem Außenkriterium können Tabelle 24<br />

entnommen werden.<br />

Tabelle 24: Korrelationen zwischen den Testverfahren und dem Außenkriterium<br />

AMT<br />

DT<br />

RT<br />

kogn. Geschw.<br />

RT<br />

motor. Geschw.<br />

TAVT<br />

- .120 -.390* .184* .201* -.393** .212*<br />

** p


Die inkrementelle Validität und relative Relevanz der einzelnen Tests kann der Tabelle 26<br />

entnommen werden. Die relative Relevanz gibt an, mit welchem Anteil der entsprechende<br />

Test zur Validität des Vorhersagemodells beiträgt.<br />

Tabelle 26:Inkrementelle Validität und relative Relevanz der einzelnen Testverfahren<br />

Testbezeichnung Inkrementelle Validität Relative Relevanz<br />

Numerisch-induktives Denken (INSBAT-<br />

NID)<br />

Arithmetische Kompetenz<br />

(INSBAT-AK)<br />

Betrachtungszeit<br />

(INSBAT-BZ)<br />

Entscheidungsfähigkeit<br />

(INSBAT-EF)<br />

Figural-induktives Denken<br />

(INSBAT-FID)<br />

0.157 13.4%<br />

0.205 16.9%<br />

0.195 16.2%<br />

0.167 14.1%<br />

0.324 24.6%<br />

Numerische Flexibilität (INSBAT-NF) 0.105 4.6%<br />

Tachistoskopischer<br />

Verkehrsauffassungstest (ATAVT)<br />

0.117 10.2%<br />

Die Ergebnisse sprechen bei einer relativen Relevanz von 10.2% für die Kriteriumsvalidität<br />

von ATAVT im Bereich der Pilotenauswahl.<br />

Ein grundlegendes Ziel der Testkonstruktion des ATAVT war die vollständige inhaltliche und<br />

psychometische Äquivalenz zwischen ATAVT und TAVTMB (Biehl, 1996). Um die<br />

Erreichung dieses Entwicklungsziels zu überprüfen, wurden bei der Untersuchung der<br />

Eindimensionalität des Itempools des ATAVT neben den neu konstruierten Aufgaben des<br />

ATAVT auch die Aufgaben des TAVTMB miteinbezogen. Gilt das Rasch-Modell (Rasch,<br />

1980) für den gemeinsamen Itempool aus den beiden Testverfahren, kann die Annahme<br />

einer Äquivalenz der beiden Tests beibehalten werden. Dies würde bedeuten, dass ATAVT<br />

und TAVTMB exakt dieselbe latente Fähigkeit messen. Diese Hypothese wurde von<br />

Sommer, Herle, Häusler & Arendasy (2008) mit Hilfe eines Link-Designs empirisch überprüft<br />

(für Details: Kapitel 2.2.4.). Die Autoren konnten in ihrer Studie nachweisen, dass für den<br />

gemeinsamen Itempool Rasch-Homogenität gilt. Dies bedeutet, dass die beiden<br />

Testverfahren nachweislich ein und dieselbe Fähigkeitsdimension messen.<br />

Durch die Verwendung des Link-Designs konnten zudem die Schwierigkeitsparameter der<br />

ATAVT-Items an die Itemschwierigkeitsparameter des TAVTMB abgeglichen werden (vgl.<br />

Holland & Dorans, 2006; Kolen & Brennan, 2004). Dies hat den Vorteil, dass der<br />

Personenparameter des ATAVT direkt auf den TAVTMB übertragen werden kann, sodass<br />

die Testergebnisse des ATAVT bzw. TAVTMB auf den jeweils anderen Test übertragbar<br />

sind. Die beiden Testverfahren sind somit nicht nur hinsichtlich der gemessenen<br />

Fähigkeitsdimension, sondern auch hinsichtlich der vom Probanden in den beiden<br />

Testverfahren erzielten Leistung direkt miteinander vergleichbar bzw. ineinander<br />

überführbar. Hieraus ergibt sich auch der Vorteil, dass Studien zur Validität mit einem der<br />

beiden Testverfahren direkt auf das andere Verfahren übertragen werden können. ATAVT<br />

und TAVTMB sind somit nicht nur inhaltlich, sondern auch psychometrisch äquivalent. Der<br />

wesentliche Vorteil des ATAVT gegenüber von TAVTMB besteht jedoch in (1) einer höheren<br />

Messpräzision auf Einzelfallebene durch die adaptive Testvorgabe sowie (2) in einer<br />

erhöhten Testsicherheit, die mit Hilfe der adaptiven Testvorgabe und der Item-Exposure-<br />

Control realisiert werden kann


Die Normdaten wurden in den Jahren 2007 bis 2008 im Forschungslabor der Firma<br />

<strong>SCHUHFRIED</strong> <strong>GmbH</strong> erhoben. Die Stichprobe umfasst 574 (48.3%) Männer und 615<br />

(51.7%) Frauen. Die Geschlechtsverteilung unterscheidet sich nicht von der zu erwartenden<br />

Verteilung. Die erwartete Verteilung wurde anhand der Daten der österreichischen<br />

Volkszählung 2001 und einer Volkszählung aus Deutschland nach der Wiedervereinigung<br />

berechnet.<br />

Die Probanden weisen ein Lebensalter von 15 bis 94 Jahren auf. Der Altersmedian liegt bei<br />

41 Jahren bei einem Altersmittelwert von 42 Jahren und 4 Monaten und einer<br />

Standardabweichung von 16 Jahren und 2 Monaten. Die genaue Altersverteilung der<br />

Normstichprobe kann Tabelle 14 entnommen werden. Insgesamt 6 (0.5%) Personen der<br />

Normstichprobe haben keinen Pflichtschulabschluss (EU Bildungsgrad 1), 125 (10.5%)<br />

Personen haben eine Pflichtschule oder Realschule absolviert, allerdings ohne<br />

abgeschlossene Berufsausbildung (EU Bildungsgrad 2), 500 (42.1%) Personen haben eine<br />

abgeschlossene Berufsausbildung (EU Bildungsgrad 3), 438 (36.8%) Personen haben eine<br />

höhere Schule mit Abitur/Matura abgeschlossen (EU Bildungsgrad 4) und 120 (10.1%)<br />

Personen verfügen über einen Hochschulabschluss (EU Bildungsgrad 5).<br />

Tabelle 27:Altersverteilung der Normstichprobe<br />

Altersgruppe in Jahren Beobachtete Häufigkeiten erwartete Häufigkeiten<br />

15 bis 20 58 86<br />

21 bis 25 122 84<br />

26 bis 30 143 96<br />

31 bis 35 111 119<br />

36 bis 40 136 126<br />

41 bis 45 110 111<br />

46 bis 50 109 93<br />

51 bis 55 100 92<br />

56 bis 60 93 81<br />

61 bis 65 83 80<br />

66 bis 70 52 59<br />

71 bis 75 37 58<br />

76 bis 80 28 52<br />

81 bis 85 5 27<br />

86 und älter 2 25<br />

Hinweis: Beobachtete Häufigkeiten sind die Stichprobengrößen in der Normstichprobe.<br />

Erwartete Häufigkeiten entsprechen den Daten, die anhand der Volkszählung ermittelt<br />

wurden.


Bundesgesetzblatt Jahrgang 1998 Teil I Nr. 55 ausgegeben zu Bonn am 26. August 1998<br />

(Fahrerlaubnisverordnung-FEV). Bonn: August 1998.<br />

Bukasa, B., Wenninger, U. & Brandstätter, CH. (1990). Validierung Verkehrspsychologischer<br />

Testverfahren. Wien: Literas Universitätsverlag<br />

Calé, M. (1992). Minimal brain dysfunction and road accidents. Israel: Driver Institute<br />

Calé, M. (1992). Theory and practice of evaluating elderly drivers with ART90. Paper<br />

presented at the 13th National Conference on Specialised Transportation. Tampa,<br />

October 1992.<br />

Dorsch, F., Häcker, H., Stapf, K. (Hrsg.) (1994). Psychologisches Wörterbuch. Bern,<br />

Göttin¬gen, Toronto, Seattle: Verlag Hans Huber<br />

Färber, B. (1986). Zur Validität des TAVT-N. Zschr. f. Verkehrssicherheit, 32, 178-180.<br />

Grübel-Mathyl, U. (1987). Wirkung von Neuroleptika auf relevante Aspekte der<br />

Fahrtüchtigkeit bei schizophrenen Patienten. Bergisch Gladbach: Eigenverlag der<br />

Bundesanstalt für Straßenwesen<br />

Hampel, B. (1976). Neugestaltung des verkehrsgebundenen Tachistoskopischen<br />

Auffassungs-Versuchs (TAVT). Unveröff. Schlussbericht zum Forschungsvorhaben<br />

Nr. 42 der VdTÜV. Köln: TÜV Rheinland.<br />

Hartje, W., Pach, R., Willmes, K., Hannen, P. & Weber, E. (1991). Fahreignung<br />

hirngeschädigter Patienten. Zschr. f. Neuropsychologie, 2, 100-114<br />

Hornke, L.F. (1993). Mögliche Einspareffekte beim computergestützten Testen. Diagnostica,<br />

39, 109-119<br />

Hornke, L.F. & Etzel, S. (1995). Theoriegeleitete Konstruktion und Evaluation von<br />

computergestützten Tests zum Merkmalsbereich Gedächtnis und Orientierung. In:<br />

BM der Verteidigung PII 4. Untersuchungen des Psychologischen Dienstes der<br />

Bundes¬wehr 1993/1995 Band2. München.<br />

Kamuf, H. (1988). Entwicklung und Validierung eines Testverfahrens zur Überprüfung<br />

kom¬plexer visueller Wahrnehmungsleistungen bei Kraftfahrern. Unveröff. Dipl.Arbeit,<br />

Universität, Mannheim.<br />

Karner, T. (2000). Sind verkehrspsychologische Testverfahren geeignete Instrumente, um<br />

mögliche Leistungsminderungen alkoholauffälliger Kraftfahrer aufzuzeigen? Report<br />

Psychologie, 9/2000<br />

Karner, T., Biehl, B. (2000). Kriteriumsvalidierung Verkehrspsychologischer Verfahren: PC<br />

vs. ART90. (Zur Publikation eingereicht)<br />

Karner, T. & Neuwirth, W. (2000). Validation of traffic psychology tests by comparing with<br />

actual driving. International Conference on Traffic and Transport Psychology, 4-7<br />

September, Berne Switzerland.<br />

Klebelsberg, D. & Kallina, H. (1963). Verhaltensanalyse des Kraftfahrers. In: Verkehrspsychologie<br />

II. Wien: Kleine Fachbuchreihe des Kuratoriums f. Verkehrssicherheit


Klebelsberg, D. (1982). Verkehrspsychologie. Berlin: Springer Verlag.<br />

Kroj, G. (1995). Psychologisches Gutachten Kraftfahreignung. Bonn: Deutscher Psychologen<br />

Verlag<br />

Kubinger, K.D. (1995). Einführung in die psychologische Diagnostik. Weinheim: Psycholo-gie<br />

Verlags Union<br />

Lesky, J. (1998). Messung der einfachen Reaktionszeit mit dem Wiener Reaktionsgerät -<br />

Re¬liabilität und Testeichung. Tobelbad: Eigenverlag<br />

Lienert, G.A. (1969). Testaufbau und Testanalyse. München: Psychologie Verlags Union<br />

Neuwirth, W., (2001). Extremgruppenvalidierung verkehrspsychologischer Testverfahren<br />

anhand von Zuweisungsgruppen. Psychologie in Österreich 2/2001<br />

Richter, W. (1981). Ermittlung von Normwerten bei einem Aktions- und Reaktionsversuch am<br />

Wiener Determinationsgerät und Prüfung dieser Werte im Hinblick auf die<br />

Kraftfahreignung. Unveröff. Forschungsauftrag VdTÜV Nr.38<br />

Schlag, B. (1994). Fahrverhalten älterer Autofahrer/innen. In: Tränkle U (Hrsg.). Autofahren<br />

im Alter. Köln: Verlag TÜV Rheinland.<br />

Schubert, G., Müller, A. & Senf, E. (1962). Testserie zur Untersuchung der optischen<br />

Orientie¬rung bei Kraftfahrtauglichkeitsuntersuchungen. Psychologie und Praxis, 6,<br />

147-153.<br />

Schubert, W., Schneider, W., Eisenmenger, W. & Stephan E. 820039.<br />

Begutachtungsleitlinien zur Kraftfahrereignung. Kommentar. Bonn: Kirschbaum.<br />

Schuhfried, G. (2004). Zur Normstichprobenwahl in der Fahreignungsdiagnostik. Zschr. f.<br />

Verkehrssicherheit, 28, 97-98.<br />

Sommer, M. Arendasy, M., Olbrich, A. & Schuhfried, G. (2004). Qualitätsverbesserung in der<br />

verkehrspsychologischen Diagnostik mit neuronalen Netzen: Eine Pilotstudie. Zschr.<br />

f. Verkehrssicherheit, 50, 193-198.<br />

Strohbeck-Kühner, P. (1999). Testangst bei Fahreignungsbegutachtungen: Die Angst-<br />

Leistung-Relation. Zeitschrift für Differentielle und Diagnostische Psychologie, 20 (1),<br />

39-57.<br />

Zuschlag, B. & Jacobshagen, W. (1982). Einsatz des Aufmerksamkeits-Prüf-Geräts (APG)<br />

bei Fahreignungsuntersuchungen. Zschr. f. Verkehrssicherheit, 28, 63-73.


Tabelle 1: Testverfahren des Test-Sets FeV ......................................................................... 8<br />

Tabelle 2: : Korrelationen der Leistungsmerkmale (Mediane) mit den Rohwerten der CPM .. 9<br />

Tabelle 3: Interkorrelationen der Zeitvariablen bei der Normstichprobe, Testform S3 ...........10<br />

Tabelle 4: Inkrementelle Validitäten und relative Relevanzen der beiden Testbatterien<br />

Standard und Plus ................................................................................................................11<br />

Tabelle 5: Verteilung der Stichprobenmerkmale ...................................................................12<br />

Tabelle 6: Verteilungscharakteristika der Leistungsmerkmale bei Vorgabe von S3 ..............12<br />

Tabelle 7: Modelltest für die Gesamtstichprobe ....................................................................14<br />

Tabelle 8: Modelltest nach Ausscheiden der Personen mit inadäquatem Arbeitstempo........15<br />

Tabelle 9: Korrelationen zwischen den Testverfahren inkl. Konfidenzintervalle ....................16<br />

Tabelle 10: Inkrementelle Validitäten und relative Relevanzen der beiden Testbatterien<br />

Standard und Plus ................................................................................................................18<br />

Tabelle 11: Altersverteilung der Normstichprobe (N=1475) ..................................................18<br />

Tabelle 12: Altersverteilung der Normstichprobe ..................................................................20<br />

Tabelle 13: Innere Konsistenz der Testform S1, berechnet als Cronbach Alpha auf<br />

Itemniveau. ...........................................................................................................................21<br />

Tabelle 14: Korrelationen DT mit TAVT und RT....................................................................22<br />

Tabelle 15. Inkrementelle Validität und relative Relevanz der einzelnen Tests .....................23<br />

Tabelle 16. Inkrementelle Validitäten und relative Relevanzen der beiden Testbatterien<br />

Standard und Plus ................................................................................................................25<br />

Tabelle 17: Verteilung der Stichprobenmerkmale .................................................................26<br />

Tabelle 18: Erwartete und tatsächlich beobachtete Häufigkeiten in der Stichprobe ..............26<br />

Tabelle 19: Modellzusammenfassung der schrittweisen multiplen Regression .....................28<br />

Tabelle 20: Regressionsgewichte in Modell 7 der multiplen Regression ...............................28<br />

Tabelle 21: Inkrementelle Validität und relative Relevanz der einzelnen Tests .....................31<br />

Tabelle 22: Korrelationen zwischen den Testverfahren und dem Außenkriterium .................31<br />

Tabelle 23:Inkrementelle Validität und relative Relevanz der einzelnen Tests ......................32<br />

Tabelle 24: Korrelationen zwischen den Testverfahren und dem Außenkriterium .................33<br />

Tabelle 25:Inkrementelle Validität und relative Relevanz der einzelnen Tests ......................33<br />

Tabelle 26:Inkrementelle Validität und relative Relevanz der einzelnen Testverfahren .........34<br />

Tabelle 27:Altersverteilung der Normstichprobe ...................................................................35<br />

Abbildung 1: Ergebnisausdruck FEV Anlage 5/2 ................................................................... 5<br />

Abbildung 2: Reportmuster .................................................................................................... 6<br />

Abbildung 3: Probandentastatur für die FEV Anlage 5/2 Untersuchung ................................. 7<br />

Abbildung 4: Stufen zur Klassifikation verschiedener Arten von Aufmerksamkeit (und die<br />

zugeordneten Testverfahren). ..............................................................................................16

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!