Max, Mustermann - SCHUHFRIED GmbH
Max, Mustermann - SCHUHFRIED GmbH
Max, Mustermann - SCHUHFRIED GmbH
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
1.1 Die Leistungsuntersuchung mit dem Wiener Testsystem ................................................ 3<br />
1.1.1 Vorgabe der Verfahren .............................................................................................. 3<br />
1.1.2 Testergebnisse ......................................................................................................... 4<br />
1.1.3 Beurteilung des Ergebnisses der Leistungsuntersuchung (Report) ........................... 6<br />
1.2 Eingabemedien .............................................................................................................. 7<br />
1.3 Vernetzte Anlagen .......................................................................................................... 7<br />
2.1 Reaktionsfähigkeit .......................................................................................................... 8<br />
2.1.1 Reaktionstest (RT/S3) ............................................................................................... 8<br />
2.2 Konzentrationsleistung ..................................................................................................13<br />
2.2.1 (COG/S11) ...............................................................................................................13<br />
2.3 Orientierungsleistung .....................................................................................................19<br />
2.3.1 Linienverfolgungstest (LVT/S3) ................................................................................19<br />
2.4 Belastbarkeit ..................................................................................................................21<br />
2.4.1 Determinationstest (DT/S1) ......................................................................................21<br />
2.5 Aufmerksamkeitsleistung ...............................................................................................27<br />
2.5.1 Adaptiver Tachistoskopischer Verkehrsauffassungstest (ATAVT/S1) .......................27<br />
2.5.2 Äquivalenz von TAVTMB und ATAVT ......................................................................34
In Deutschland sind zur Eignungsuntersuchung für Bewerber und Inhaber der Fahrerlaubnis<br />
u.a. folgende Regelungen in Kraft (Bundesgesetzblatt Jahrgang 1998 Teil I Nr. 55 -<br />
Fahrerlaubnisverordnung-FeV nach Anlage 5):<br />
Anlage 5 Absatz 2:<br />
Bewerber um die Erteilung oder Verlängerung einer Fahrerlaubnis der Klassen D, D1, DE,<br />
D1E sowie eine Fahrerlaubnis zur Fahrgastbeförderung müssen besondere Anforderungen<br />
hinsichtlich:<br />
a) Belastbarkeit,<br />
b) Orientierungsleistung,<br />
c) Konzentrationsleistung,<br />
d) Aufmerksamkeitsleistung,<br />
e) Reaktionsfähigkeit<br />
erfüllen.<br />
Der Nachweis über die Erfüllung dieser Anforderungen ist durch Vorlage eines betriebs- oder<br />
arbeitsmedizinischen oder eines medizinisch-psychologischen Gutachtens zu erbringen.<br />
Die zur Untersuchung eingesetzten Verfahren müssen nach dem Stand der Wissenschaft<br />
standardisiert und unter Aspekten der Verkehrssicherheit validiert sein. Das Test-Set zur<br />
Leistungsuntersuchung nach FeV Anlage 5 Nr. 2 im Wiener Testsystem besteht aus fünf<br />
Tests, welche jeweils eine der geforderten Dimensionen abdeckt. Es handelt sich hierbei um<br />
eine fixe Testbatterie, die als Programmpaket verkauft wird. Zu jedem Test ist ausführliche<br />
wissenschaftliche Literatur vorhanden.<br />
Schuhfried blickt heute auf eine jahrzehntelange Tradition in der Verkehrseignungsdiagnostik<br />
zurück und ist mit dem Wiener Testsystem (WTS) weltweiter Marktführer in der<br />
computergestützten psychologischen Diagnostik.<br />
Um der Anforderungen nach wissenschaftlicher Aktualität der Testverfahren zu genügen,<br />
werden neben laufenden wissenschaftlichen Studien die Normen stets aktualisiert und<br />
psychometrische Weiterentwicklungen der Verfahren vorgenommen.<br />
Die Leistungsuntersuchung wird mit wenigen Programmschritten gestartet und kann<br />
besonders einfach vorgegeben werden. Eine übersichtliche und klar aufgebaute<br />
Administration macht die Anwendung angenehm und komfortabel.<br />
Nach Eingabe der Probandendaten kann sofort die Testbatterie gestartet werden. Die<br />
Vorgabe der Verfahren ist in über 20 verschiedenen Sprachen möglich.<br />
Wird die Landessprache der Testperson eingegeben, werden automatisch die einzelnen<br />
Tests in dieser Sprache vorgegeben. Die Sprache kann auch individuell definiert werden.
Nach der Eingabe der Probandendaten erfolgt eine standardisierte Instruktion zur Bedienung<br />
der Eingabemedien. Die Testverfahren zeichnen sich durch einen einheitlichen und klaren<br />
Aufbau aus. Instruktionen mit Lernschleifen sichern das Aufgabenverständnis bei den<br />
einzelnen Testverfahren. Akustische und visuelle Rückmeldungen in der Instruktions- und<br />
Lernphase gestalten die Testbearbeitung ökonomisch und zugleich motivierend. Die<br />
Testphase startet erst, wenn das Aufgabenverständnis sichergestellt ist.<br />
Nach Ende der Testung können die Ergebnisse in übersichtlicher Form ausgedruckt werden.<br />
Alle relevanten Ergebnisse werden übersichtlich in grafischer und numerischer Darstellung<br />
auf einer druckbaren Seite abgebildet.
<strong>Max</strong>, <strong>Mustermann</strong><br />
geb. 01.01.1945, männlich, 67;4 Jahre, Bildungsgrad 3<br />
Auswertecode:<br />
Testdurchführung: 03.05.2012<br />
Profil:<br />
PR<br />
RT<br />
COG<br />
LVT<br />
DT<br />
ATAVT<br />
PR<br />
Reaktionsfähigkeit<br />
Konzentrationsleistung<br />
Orientierungsleistung<br />
Belastbarkeit<br />
Aufmerksamkeitsleistung<br />
0 20 40 60 80 100<br />
0 20 40 60 80 100<br />
Anmerkung(en): Der hervorgehobene Bereich zwischen 33 und 100 stellt den Sollbereich für die<br />
Testergebnisse dar.<br />
Testergebnisse:<br />
Testvariable Rohwert Parameter PR 1<br />
Reaktionsfähigkeit gemessen mit Reaktionstest (RT)<br />
Mittlere Reaktionszeit (msec) 444 44<br />
Richtig reagiert 15<br />
Falsch reagiert 0<br />
Konzentrationsleistung gemessen mit Cognitrone (COG)<br />
Mittlere Zeit "Korrekte Zurückweisung" (sec) 2.182 90<br />
Summe "Treffer" 24<br />
Summe "Korrekte Zurückweisung" 35<br />
Orientierungsleistung gemessen mit Linienverfolgungstest (LVT)<br />
Score 14 59<br />
Anzahl richtiger Antworten 17<br />
Belastbarkeit gemessen mit Determinationstest (DT)<br />
Richtige 243 59<br />
Falsche 2<br />
Ausgelassene 7<br />
Aufmerksamkeitsleistung gemessen mit Tachistoskopischem Verkehrsauffassungstest<br />
(ATAVT/TAVTMB)<br />
Überblicksgewinnung 11 1.856 94<br />
1 Der Prozentrang (PR) ergibt sich durch Vergleich mit der altersunabhängigen Normstichprobe.<br />
Diese Resultate dienen zur Beurteilung der Leistung nach Anlage 5 Nr. 2 FeV.<br />
Seriennummer der Untersuchungsstelle: 031662/01<br />
Abbildung 1: Ergebnisausdruck FEV Anlage 5/2
Diese Testergebnisse können zudem direkt in das Textverarbeitungsprogramm WinWord<br />
übertragen werden. Es muss nur die Schaltfläche „Befund“ angeklickt werden.<br />
Abbildung 2: Reportmuster<br />
Der Report schließt die Leistungsuntersuchung nach FeV Anlage 5 Nr. 2 ab. Die Gliederung<br />
dieses Befunds obliegt dem Diagnostiker, dennoch gleichen sich gewisse<br />
Gliederungselemente.<br />
Am Beginn jedes Reports stehen die Daten zur Person (Name, Geburtsdatum, Testdatum<br />
und Testdauer). Danach werden die Testergebnisse erläutert. Die Angabe dieser Ergebnisse<br />
soll Rohwerte und Prozentränge enthalten. Abschluss des Reports bildet die Beantwortung<br />
der Fragestellung.<br />
Wie beurteilen?<br />
Generell legt man zur Beurteilung der Leistungsuntersuchung nach FeV Anlage 5 Nr. 2 die<br />
Maßstäbe der EU-Führerscheingruppe 2 zu Grunde (Schubert, Schneider, Eisenmenger &<br />
Stephan, 2003). Die Durchführungserlässe zur Fahrerlaubnisverordnung werden von den<br />
einzelnen Bundesländern verfügt.<br />
Der Gutachter (Arbeits- oder Betriebsmediziner, MPU-Gutachter) richtet sich bei der<br />
Beurteilung des Einzelfalles nach Kriterien, die in den einzelnen Bundesländern zwar<br />
ähnlich, aber nicht identisch durch entsprechende Erlässe vorgegeben wurden. Einigkeit<br />
besteht in der Auffassung, dass Prozentränge (PR) von über 33 bei den einzelnen Variablen<br />
als ausreichend angesehen werden und dass Prozentränge von 16 und weniger in jedem<br />
Falle eine genauere Überprüfung erforderlich machen. In den Begutachtungsleitlinien zur<br />
Kraftfahrereignung (Schubert, Schneider, Eisenmenger & Stephan, 2003) wird davon<br />
ausgegangen, dass in der Mehrzahl der angewandten Verfahren ein PR von 33 erreicht sein<br />
muss und in keinem Verfahren derjenige von 16 unterschritten sein darf, um die
Fahrerlaubnis zu erteilen. Treffen diese Voraussetzungen nicht zu, ist der Frage<br />
vorhandener Kompensationsmöglichkeiten, meist u.a. auch im Rahmen einer praktischen<br />
Fahrprobe durch einen Verkehrspsychologen oder einen Sachverständigenprüfer (aaSoP),<br />
durch eine weiterführende Untersuchung nachzugehen.<br />
Da bei der Leistungsuntersuchung Reaktionszeitmessungen und Reaktionen auf<br />
Mehrfachreize notwendig sind, sind Maus oder PC-Tastatur als Eingabemedien ungeeignet.<br />
Die Bearbeitung der Leistungstests erfolgt mit einer ergonomisch optimierten<br />
Probandentastatur und erlaubt somit eine komfortable und faire Erfassung der<br />
Leistungsfähigkeit selbst bei Personen mit geringer oder fehlender Computererfahrung.<br />
Die Probandentastatur ist äußerst robust und wird einfach an die USB-Schnittstelle des PCs<br />
angesteckt.<br />
Die Probandentastatur besteht aus:<br />
7 Farbtasten; 10 Zifferntasten; 1 Sensortaste; Anschlussmöglichkeit für Fußtasten und USB-<br />
Schnittstelle<br />
Abbildung 3: Probandentastatur für die FEV Anlage 5/2 Untersuchung<br />
Vernetzte Anlagen werden eingerichtet, wenn eine große Anzahl an Probanden getestet<br />
werden soll. Eine vernetzte Anlage besteht aus einem Testleiterarbeitsplatz und aus einer<br />
nahezu beliebigen Anzahl von Testpersonenarbeitsplätzen. Der Ablauf der einzelnen<br />
Testdurchführungen erfolgt zentral und somit verfügt der Testleiter über alle notwendigen<br />
Informationen. Die Testpersonen können zeitlich versetzt die Tests starten und in ihrem<br />
eigenen Tempo bearbeiten. Mit dem Wiener Testsystem können Sie somit eine große<br />
Anzahl an Leistungsuntersuchungen zeitgleich durchführen.
Die verkehrspsychologisch relevanten Dimensionen Belastbarkeit, Orientierungs-,<br />
Konzentrations- und Aufmerksamkeitsleistung sowie Reaktionsfähigkeit werden mit dem<br />
Test-Set FEV untersucht. Tabelle 1 listet die einzelnen Testverfahren mit Angabe der<br />
Durchführungszeit auf.<br />
Tabelle 1: Testverfahren des Test-Sets FeV<br />
Tests Dimensionen Testformen Dauer<br />
RT- Reaktionstest Reaktionsfähigkeit S3 6<br />
COG - Cognitrone Konzentrationsleistung S11 10<br />
LVT - Linienverfolgungstest Orientierungsleistung S3 10<br />
DT - Determinationstest Belastbarkeit S1 6<br />
ATAVT - Adaptiver Tachistoskopischer<br />
Verkehrsauffassungstest<br />
Aufmerksamkeitsleistung S1 14<br />
Das Test-Set FEV zeichnet sich aufgrund der Durchführungsdauer von nur rund 45 Minuten<br />
durch eine hohe Ökonomie bei gleichzeitig hoher Messgenauigkeit der Testverfahren aus.<br />
Auf den folgenden Seiten werden die einzelnen Tests beschrieben. Die Gütekriterien der<br />
einzelnen Tests (Reliabilität, Validität, Normierung) sind in der Beschreibung dieser<br />
Verfahren angeführt. Für die Auswertung der Leistungsuntersuchung nach FeV Anlage 5 Nr.<br />
2 wird jeweils die Hauptvariable herangezogen.<br />
Hauptvariable: „Mittlere Reaktionszeit“:<br />
Hierbei handelt es sich um die Zeit, die zwischen einem Signal (gemeinsames Auftreten von<br />
gelbem Licht und Ton) und dem Beginn der mechanischen Bewegungsantwort auf dieses<br />
Signal vergeht, unter der Instruktion möglichst schnell zu reagieren.<br />
Hilfsvariable: „Richtig reagiert“:<br />
Anzahl richtiger Reaktionen. Als richtige Reaktionen gilt das Verlassen der Ruhetaste mit<br />
anschließender Betätigung der Reaktionstaste bei geforderten Signalen. Bei korrekter<br />
Durchführung des Tests sollte auf alle 16 geforderten Signale richtig reagiert worden sein.<br />
Ab einer Abweichung größer als vier könnte dies auf ein Motivationsproblem der Testperson<br />
hinweisen bzw. die Testperson hat Verständnisprobleme mit der Instruktion gehabt. Die<br />
Hauptvariable ist in diesem Fall nicht zu interpretieren. Eine Testwiederholung ist indiziert.<br />
Hilfsvariable: „Falsch reagiert“:<br />
Anzahl falscher Reaktionen. Als falsche Reaktion gilt das Verlassen der Ruhetaste mit anschließender<br />
Betätigung der Reaktionstaste bei nicht geforderten Signalen. Eine hohe
Anzahl an falschen Reaktionen deutet darauf hin, dass der Proband auf viele der 48 Signale<br />
reagiert ohne zu differenzieren, ob die Reaktion gefordert war oder nicht. Sollte die Anzahl<br />
der falschen Reaktionen größer als fünf sein, so könnte dies auf ein Motivationsproblem der<br />
Testperson hinweisen bzw. die Testperson hatte Verständnisprobleme mit der Instruktion.<br />
Die innere Konsistenz beträgt für die Variable Median Reaktionszeit r = 0.90.<br />
Konstruktvalidität<br />
Unter Reaktionszeit versteht man die Zeit, die zwischen einem Signal und dem Beginn einer<br />
mechanischen Bewegungsantwort vergeht, wenn die Testperson instruiert wurde, möglichst<br />
rasch zu reagieren (Dorsch, 1994). Bei der vorliegenden Form des Reaktionstests wird die<br />
Reaktionszeit auf eine einfache Wahlreaktion gemessen. Zur Ermittlung dieser<br />
Reaktionszeiten, die im Millisekundenbereich liegen, ist ein Testinstrument notwendig, das<br />
sehr zuverlässig und genau ist. Der Reaktionstest ist zur Bestimmung der Reaktionszeit<br />
bestens geeignet.<br />
Im täglichen Sprachgebrauch versteht man unter "Reaktionszeit" die Zeit zwischen einem<br />
Reiz und einer wie immer gearteten, in jedem Fall aber beobachtbaren Reaktion des<br />
Individuums. Soweit deckt sich die vorwissenschaftliche Verwendung dieses Begriffs mit<br />
wissenschaftlichen Definitionsversuchen, nach denen "Reaktionszeit" als Zeit, die vergeht<br />
zwischen einem Signal und dem Beginn der mechanischen Bewegungsantwort, unter der<br />
Instruktion, möglichst schnell zu reagieren, definiert ist (vgl. Dorsch, 1994). Da es sich hier<br />
um Genauigkeiten im Millisekundenbereich handelt, muss das eingesetzte Testinstrument<br />
sehr zuverlässig und genau sein.<br />
Der Reaktionstest ist zur Bestimmung der Reaktionszeit nach obiger Definition also bestens<br />
geeignet.<br />
Es wurde weiters versucht, eine Validierungsstudie durchzuführen, indem die Reaktions- und<br />
Motorischen Zeiten mit dem Rohwert der CPM (Raven’s Coloured Progressive Matrices) in<br />
Zusammenhang gebracht wurden (49 Schüler absolvierten zusätzlich zu drei RT-Testformen<br />
auch die CPM). Aufgrund einer Studie von Neubauer (1990) wurde eine signifikante<br />
Korrelation des Rohwertes der CPM mit der Motorischen Zeit erwartet, wobei der<br />
Zusammenhang mit der Motorischen Zeit höher als der mit der Reaktionszeit<br />
(=Entscheidungszeit) sein sollte.<br />
Diese Hypothesen konnten dann auch, trotz einer geringen Stichprobengröße, bei der<br />
statistischen Analyse beobachtet werden (siehe Tabelle 2).<br />
Tabelle 2: : Korrelationen der Leistungsmerkmale (Mediane) mit den Rohwerten der CPM<br />
Schulstufe<br />
Gesamt (N=49) Buben (N=27) Mädchen (N=22)<br />
RW-CPM RW-CPM RW-CPM<br />
S3 MZ (Licht &Ton) -0.49** -0.64** -0.30<br />
S3 RZ (Licht & Ton) -0.12 -0.33 0.03<br />
Anmerkung: RW: Rohwert; RZ: Reaktionszeit; MZ Motorische Zeit; * 0.01, ** 0.001; N=210.
Interkorrelationen<br />
Die Korrelationen zwischen den Testvariablen geben Aufschluss darüber, inwieweit nicht<br />
durch mehrere Variablen dasselbe gemessen wird. Tabelle 3 zeigt die Interkorrelationen der<br />
Zeitvariablen bei der Normstichprobe.<br />
Tabelle 3: Interkorrelationen der Zeitvariablen bei der Normstichprobe, Testform S3<br />
Variable SDRZ MMZ SDMZ<br />
MRZ 0.443** 0.375** 0.152**<br />
SDRZ 0.236** 0.296**<br />
MMZ 0.491**<br />
Anmerkung: MRZ: Mittlere Reaktionszeit, MMZ: Mittlere Motorische Zeit; SDRZ: Standardabweichung der<br />
Reaktionszeit; SDMZ: Standardabweichung der Motorischen Zeit; * 0.01, ** 0.001; N=210.<br />
Der wichtigste Befund ist sicher die Korrelation zwischen den Reaktions- und Motorischen<br />
Zeiten. Die Werte sind zwar signifikant (0.38 bis 0.62), d.h. die gegenseitig aufgeklärten<br />
Varianzanteile liegen zwischen 14% und 38%. Das bedeutet dennoch, dass die beiden<br />
Variablen etwas jeweils Anderes messen.<br />
Kriteriumsvalidität<br />
Validitätsuntersuchungen im Gebiet der Verkehrspsychologie bestätigen die vorhandene<br />
Gültigkeit dieses Verfahrens.<br />
Calé (1992) konnte anhand einer Vorgängerversion des RT zeigen, dass die Testergebnisse<br />
signifikant mit der Unfallhäufigkeit im Straßenverkehr korrelieren.<br />
Karner & Neuwirth (2000) konnten zwischen den Ergebnissen des RT und einer<br />
standardisierten Fahrprobe signifikante Korrelationen in der Höhe von r=0.38 feststellen.<br />
Sommer (2002) kam zu einem ähnlichen Ergebnis.<br />
Eine Studie von Sommer, Arendasy, Olbrich & Schuhfried (2004) zeigt, dass mittels einer<br />
Test¬batterie, in deren Rahmen RT vorgegeben wurde, über 74% der getroffenen Urteile<br />
über das Fahrverhalten innerhalb einer standardisierten Fahrprobe richtig vorhergesagt<br />
werden konnten.<br />
Hohe Korrelationen zeigen sich zudem zwischen den Testverfahren RT und DR2 des<br />
ART90, somit zeigt das Verfahren eine hinreichende konvergente Validität (Karner & Biehl;<br />
2000).<br />
In einer derzeit noch laufenden Studie zeigen sich zudem Korrelationskoeffizienten in der<br />
Höhe von r=0.034 zwischen der Variable Median Reaktionszeit und dem Globalurteil über<br />
das Fahrverhalten im Rahmen der Wiener Fahrprobe.<br />
Eine weitere Studie von Sommer & Häusler (2006) beschäftigte sich mit der<br />
Kriteriumsvalidität zweier Testbatterien zur Erfassung der kraftfahrspezifischen<br />
Leistungsfähigkeit aus dem Expertensystem Verkehr (Schuhfried, 2005), die ebenfalls den<br />
Reaktionstest beinhalten. Die beiden Testbatterien Standard und Plus unterschieden sich<br />
hierbei ausschließlich darin, ob die Periphere Wahrnehmung (PP) als Maß für das<br />
Gesichtfeld und die geteilte Aufmerksamkeit vorgegeben wurde. Als Kriteriumsvariable<br />
wurde das Globalurteil über das Fahrverhalten in einer standardisierten Fahrprobe<br />
herangezogen. Die von den Autoren untersuchte Stichprobe bestand aus 164 (74%)<br />
Männern und 58 (26%) Frauen im Alter von 19 bis 91 Jahren bei einem durchschnittlichen<br />
Alter von 59 Jahren und einer Standardabweichung von 18 Jahren. Der Altersmedian lag bei<br />
64 Jahren. Es handelte sich daher um Personen im mittleren bis höheren Lebensalter. Bei<br />
den Probanden handelte es sich zum Teil um bereits auffällige Kraftfahrer. Die
Studienteilnahme war jedoch freiwillig. Insgesamt 39 (18%) Personen hatten eine<br />
Pflichtschule oder Realschule ohne abgeschlossene Berufsausbildung absolviert (EU<br />
Bildungsgrad 2), 96 (43%) Personen hatten eine abgeschlossene Berufsausbildung bzw.<br />
eine Fachschule absolviert (EU Bildungsgrad 3), 35 (16%) Personen hatten einen Abituroder<br />
Fachhochschulabschluss (EU Bildungsgrad 4) und 52 (23%) Personen verfügten über<br />
einen Hochschulabschluss (EU Bildungsgrad 5).<br />
Aufgrund der Ergebnisse bisheriger Studien erfolgte die Berechnung der Kriteriumsvalidität<br />
mit Hilfe künstlicher Neuronaler Netze. Das Ergebnis zeigte, dass mit der Testbatterie<br />
Standard insgesamt 80.2% der Gesamtstichprobe richtig klassifiziert werden konnten. Bei<br />
der Testbatterie Plus lag die Klassifikationsrate bei 86.5%. Dies entspricht einem<br />
Validitätskoeffizienten von R=0.68 für die Testbatterie Standard und R=0.78 für die<br />
Testbatterie Plus. In der Jackknife-Validierung wurde für die Testbatterie Standard eine<br />
Klassifikationsrate von 80.2% und ein Validitätskoeffizient von R=0.67 erzielt. Für die<br />
Testbatterie Plus lagen die Werte in der Jackknife-Validierung bei einer Klassifikationsrate<br />
von 83.8% und einem Validitätskoeffizient von R=0.77. Die Intervalle für die<br />
Klassifikationsrate und den Validitätskoeffizient in der Bootstrap-Validierung lagen bei<br />
[74.2%; 85.2%] und [0.54; 0.73] für die Testbatterie Standard und für die Testbatterie Plus<br />
bei [77.5%; 87.2%] und [0.61; 0.79]. Die inkrementelle Validität und relative Relevanz der<br />
einzelnen Testverfahren der beiden Testbatterien können der Tabelle 4 entnommen werden.<br />
Die relative Relevanz gibt an, mit welchem Anteil der entsprechende Test zur Validität des<br />
Vorhersagemodells beiträgt.<br />
Tabelle 4: Inkrementelle Validitäten und relative Relevanzen der beiden Testbatterien Standard und Plus<br />
Prädiktorvariablen<br />
Inkrementelle<br />
Validität<br />
STANDARD<br />
Relative<br />
Relevanz<br />
Inkrementelle<br />
Validität<br />
PLUS<br />
Relative<br />
Relevanz<br />
AMT: Allgemeine Intelligenz 0.128 18.7% 0.078 11.5%<br />
DT: Richtige 0.124 18.2% 0.071 10.5%<br />
RT: Mittlere Reaktionszeit 0.036 5.7% 0.057 8.6%<br />
RT: Mittlere Motorische Zeit 0.132 19.2% 0.118 16.9%<br />
PP: Gesichtsfeld -- -- 0.090 13.2%<br />
PP: Tracking Abweichung -- -- 0.139 19.5%<br />
TAVT: Überblicksgewinnung 0.120 17.6% 0.038 5.8%<br />
COG: Mittlere Zeit korrekte<br />
Zurückweisung<br />
0.141 20.3% 0.093 13.6%<br />
Die Ergebnisse sprechen somit bei einer relativen Relevanz von 5.7% und 19.2%<br />
(Testbatterie Standard) bzw. 8.6% und16.9% für die Kriteriumsvalidität des RT.<br />
Es liegt eine Normierung der Testform S3 mit einer Stichprobe vom Umfang N=855 vor.<br />
Hierbei handelt es sich um 417 (48.8%) Männer und 438 (512%) Frauen im Alter von 16 bis<br />
89 (m=43.5; sd=16.8; skew=0.36; kurtosis=-0.78) Jahren (Erhebungszeitraum: 2007).<br />
Tabelle 5 zeigt die genaue Verteilung der Stichprobenmerkmale.<br />
Die Leistungsunterschiede in den beiden Variablen Reaktionszeit und Motorische Zeit<br />
zwischen den Teilstichproben 'Geschlecht' bzw. 'Alter' sind hochsignifikant (T-Test,<br />
Varianzanalyse). Kein signifikanter Unterschied ergab sich in der Teilstichprobe
'Bildungsgrad'. Daher wurden zusätzlich zur Gesamtstichprobe Teilstichproben für bestimmte<br />
Altersbereiche bzw. Teilstichproben für Männer und Frauen getrennt einer Normierung<br />
unterzogen.<br />
Die Stichprobengröße der Teilgruppen ist für eine Normierung hinreichend groß. Die<br />
genauen Verteilungscharakteristika der Leistungsmerkmale hinsichtlich der eben erwähnten<br />
Gruppierungen können der Tabelle 6 entnommen werden.<br />
Tabelle 5: Verteilung der Stichprobenmerkmale<br />
Schultyp (-abschluss)<br />
Altersgruppen<br />
Bildungsgrad 16-25 J. 26-35 J. 36-59 J. 60-70 J. 71-90 J.<br />
n<br />
(Schultyp)<br />
Kein Pflichtschulabschluss 1 / 1 1 / 0 2 / 2 0 / 1 0 / 1 4 / 5<br />
Keine abgeschlossene<br />
Berufsausbildung<br />
Abgeschlossene<br />
Berufsausbildung<br />
Abitur, Abschluss einer<br />
Fachhochschule<br />
Universität,<br />
Hochschulabschluss<br />
30 /11 10 / 9 21 / 17 5 / 6 6 / 2 72 / 45<br />
21 / 18 45 / 23 114 / 92 24 / 37 14 / 13 218 / 183<br />
20 / 43 24 / 38 29 / 61 8 / 19 10 / 5 91 / 166<br />
0 / 3 7 / 9 11 / 19 2 / 8 12 / 0 32 / 39<br />
N (Alter) 72 / 76 87 / 79 177 / 191 39 / 71 42 / 21 417 / 438<br />
Anmerkung: Die Zahlen links und rechts vom Schrägstrich stehen für die Anzahl der Männer bzw. Frauen.<br />
Entsprechend sind Zeilen- und Spaltensummen zu lesen.<br />
Tabelle 6: Verteilungscharakteristika der Leistungsmerkmale bei Vorgabe von S3<br />
Testvariable<br />
Stichprobe Maß MRZ SDRZ MMZ SDMZ<br />
Erwachsene<br />
MD 430 65 165 21<br />
QA 110 28 82 14<br />
Alter: 16 - 25<br />
MD 393 63 143 17<br />
QA 104 23 47 10<br />
Alter: 26 - 35<br />
MD 402 61 142 17<br />
QA 95 25 52 9<br />
Alter: 36 – 59<br />
MD 439 64 180 23<br />
QA 101 29 84 16<br />
Alter: 60 - 70<br />
MD 470 72 214 25<br />
QA 121 29 79 17<br />
Alter: 71 - 90<br />
MD 460 73 173 24<br />
QA 135 33 120 17<br />
Männer MD 427 63 149 19<br />
QA 102 29 63 12
Frauen<br />
Volksschule,<br />
Realschule<br />
Abitur, Universität<br />
MD 432 66 186 23<br />
QA 122 26 88 15<br />
MD 442 66 170 21<br />
QA 108 28 88 14<br />
MD 411 64 159 20<br />
QA 113 26 71 13<br />
Anmerkung: MD: Median, QA: Quartilabstand; MRZ: Mittlere Reaktionszeit (ms), MMZ: Mittlere Motorische Zeit<br />
(ms), SDRZ: Streuungsmaß Reaktionszeit (ms), Streuungsmaß Motorische Zeit (ms).<br />
Hauptvariable: „Mittlere Zeit Korrekte Zurückweisung“:<br />
Das persönliche Tempo, operationalisiert durch die Variable „Mittlere Zeit Korrekte Zurückweisung“<br />
stellt einen guten Indikator der Konzentrationsfähigkeit dar.<br />
Hilfsvariable: „Summe Treffer“ & „Summe Korrekte Zurückweisungen“:<br />
Es wird davon ausgegangen, dass normalerweise 85% der Aufgaben richtig gelöst werden,<br />
konzentrierte Aufgabenbearbeitung ist dadurch gekennzeichnet, dass dieser Wert sogar<br />
noch überschritten wird. Eine „Summe Treffer“ kleiner als 21 und/oder eine „Summe Korrekte<br />
Zurückweisung“ kleiner als 30 ist ein Hinweis auf nicht angepasstes Arbeitstempo. In diesem<br />
Fall sollte der Wert für die Hauptvariable nur unter Vorbehalt interpretiert werden.<br />
Hilfsvariable: „Mittlere Zeit Treffer“<br />
Während für eine korrekte Zurückweisung immer alle Figuren mit der Vorgabefigur<br />
verglichen werden müssen, sind für einen Treffer im Durchschnitt nicht so viele Vergleiche<br />
notwendig. Daher sollte die „Mittlere Zeit Treffer“ kürzer sein als die „Mittlere Zeit Korrekte<br />
Zurückweisung“. Anderenfalls ist dies möglicherweise ein Hinweis auf ineffiziente<br />
Musteranalysestrategien oder andere irreguläre Bearbeitungsstrategien.<br />
Für die Testform S11 ergibt sich eine Innere Konsistenz (Cronbach Alpha) für die Variable<br />
Mittlere Zeit „korrekte Zurückweisung“ von 0.95 und für die Variable Mittlere Zeit „Treffer“ von<br />
0.93<br />
In einer Längsschnittstudie an 82 Personen (48% Männer, 52% Frauen) im Altersbereich von<br />
17 bis 78 Jahren (m=44; s=17) ergibt sich eine Retest Reliabilität von r=0.88 und eine<br />
Stabilität über den Zeitraum von 5 Monaten von r=0.87.<br />
Die Gültigkeit des Cognitrone-Tests kann als gezeigt gelten, wenn ein inhaltlicher Bezug<br />
zwischen den Anforderungen der Items und den Anforderungen in Realsituationen erkennbar<br />
ist (inhaltliche Gültigkeit), wenn eine hohe Übereinstimmung mit anderen Testverfahren<br />
gegeben ist, die dieselben Fähigkeiten erfassen, und wenn keine Übereinstimmung mit<br />
Testverfahren besteht, die etwas anderes erfassen (konvergente und diskriminante Validität).<br />
Weiters ist die Gültigkeit dann gegeben, wenn der Test gewisse theoriegeleitete<br />
Vorstellungen erfüllt, das wäre beim Verfahren Cognitrone dann gegeben, wenn sich die
Schwierigkeitsunterschiede zwischen den Testteilen durch strukturelle Unterschiede erklären<br />
lassen (Konstruktvalidität).<br />
Konstruktvalidität<br />
Die Philosophie bei der Messung von "Aufmerksamkeit" ist seit Jahrzehnten gleich<br />
geblieben: Immer werden intellektuell anspruchslose Aufgaben gestellt, die für eine gewisse<br />
Zeit möglichst rasch und fehlerfrei auszuführen sind. Die erhobenen Geschwindigkeits- und<br />
Genauigkeitsmaße liefern einen Hinweis über den Grad der "investierten" Aufmerksamkeit.<br />
Auch die Testformen des Cognitrone Tests sind in dieser Weise konzipiert: Die Aufgaben<br />
bestehen aus (mehr oder weniger) komplexen "Strichfiguren", die lediglich dahingehend zu<br />
beurteilen sind, ob sich unter ihnen identische "Figuren" befinden oder nicht.<br />
Über Befunde zur Konstruktvalidität für die Testformen mit freier Bearbeitungszeit berichtet<br />
Wagner (1999). Unter Zugrundelegung des Konzentrationsmodells von Reulecke (1991)<br />
schlägt sie vor, die Variable Mittlere Zeit „Korrekte Zurückweisung“ nur unter der Bedingung<br />
mind. 90% richtiger Antworten als Indikator für Konzentration zu interpretieren. Diese 90%<br />
beziehen sich auf eine Vorgabe von Reulecke (1991).<br />
Die Konstruktvalidierung der Variable Mittlere Zeit „Korrekte Zurückweisung“ erfolgt mit Hilfe<br />
des Rasch-Modells anhand einer Stichprobe von 625 Personen aus den Normdaten. Unter<br />
der Annahme einer optimalen Dosierung der “Energie” zum präzisen Ablauf der “Funktion”<br />
Mustervergleich, sollte die Bearbeitung von Vergleichsfiguren einer komplexeren Vorlage<br />
mehr Zeit in Anspruch nehmen als die Bearbeitung der weniger komplexen Vorlagen. Zur<br />
Schätzung der Itemparameter für die 20 Vorlagenblöcke mit Hilfe des Rasch-Modells war es<br />
notwendig, die Variable Mittlere Zeit „Korrekte Zurückweisung“ 1-20 zu dichotomisieren. Die<br />
erste Kategorie (1=schnelle Lösung) umfasst den Bereich 0-200 ms, die zweite Kategorie<br />
(0=langsame Lösung) umfasst den Bereich ab 201 ms. Die signifikanten LQTs (=Andersen<br />
Likelihood-Quotiententest) für das interne Teilungskriterium “Bearbeitungstempo” und für das<br />
externe Teilungskriterium “Angemessenheit des Arbeitstempos” (vgl. Tabelle 7) weisen<br />
darauf hin, dass zur vollständigen Erklärung der beobachteten Daten Parameterschätzungen<br />
für jede Gruppe gesondert notwendig sind.<br />
Diese Modellabweichungen sind durch die eingangs getroffene Annahme - nur bei präziser<br />
Ausführung wird Konzentration gemessen - erklärbar.<br />
Tabelle 7: Modelltest für die Gesamtstichprobe<br />
Modelltest<br />
Teilungskriterium<br />
Bearbeitungstempo (internes TK)<br />
Gruppe1: viele Aufgaben “schnell” bearbeitet<br />
Gruppe2: wenige Aufgaben “schnell” bearbeitet<br />
Angemessenheit des Arbeitstempos (externes TK)<br />
Gruppe1: viele “Richtige” unabhängig von der Komplexität der Figuren<br />
Gruppe2: wenig “Richtige” im Gesamttest, bzw. bei komplexen Figuren<br />
2 (df=18)<br />
LQT<br />
s./n.s. 5%<br />
50.53 s.<br />
85.37 s.<br />
Alter (externes TK) 19.10 n.s.<br />
Anmerkungen<br />
LQT: Der Anderson Likelihood-Quotiententest prüft, ob die Parameterschätzung für<br />
getrennte Teilstichproben die Datenstruktur besser erklärt als die Parameterschätzung<br />
gesamt.<br />
Für weitere Modellkontrollen werden daher aus der Gesamtstichprobe Personen<br />
ausgeschlossen, die für den Gesamttest das 90%-Kriterium nicht erfüllten. 479 Personen<br />
verbleiben in der Stichprobe. Die Betrachtung der Verteilung bezüglich dieses Kriteriums<br />
zeigt erwartungsgemäß, dass anhand dieses Kriteriums - bezogen auf den Gesamttest -<br />
nicht alle Personen mit inadäquatem Arbeitstempo ausgeschlossen werden, sondern nur die
“Extremfälle”. Die Ergebnisse der nunmehr nicht signifikanten Andersen Likelihood-<br />
Quotiententests (LQTs) zeigt Tabelle 8.<br />
Tabelle 8: Modelltest nach Ausscheiden der Personen mit inadäquatem Arbeitstempo<br />
Modelltest<br />
Teilungskriterium<br />
Bearbeitungstempo (internes TK)<br />
Gruppe1: viele Aufgaben “schnell” bearbeitet<br />
Gruppe2: wenige Aufgaben “schnell” bearbeitet<br />
Angemessenheit des Arbeitstempos (externes TK)<br />
Gruppe1: viele “Richtige” unabhängig von der Komplexität der Figuren<br />
Gruppe2: wenig “Richtige” im Gesamttest, bzw. bei komplexen Figuren<br />
2 (df=17)<br />
LQT<br />
s./n.s. 5%<br />
25.98 n.s.<br />
10.2 n.s.<br />
Alter (externes TK) 10.24 n.s.<br />
Anmerkungen: Kritische Wert der 2 Verteilung: 5% = 27.58 1% = 33.43<br />
LQT: Der Anderson Likelihood-Quotiententest prüft, ob die Parameterschätzung für getrennte Teilstichproben die<br />
Datenstruktur besser erklärt als die Parameterschätzung gesamt.<br />
Daraus kann geschlossen werden, dass die instruktionskonforme Bearbeitung des Tests<br />
eine zwingende Voraussetzung zur validen Interpretation der Variablen Mittlere Zeit<br />
„Korrekte Zurückweisung“ ist.<br />
In der Praxis hat sich jedoch gezeigt, dass die Herabsetzung dieses Kriteriums auf 85%<br />
sinnvoll ist und daher in der derzeitigen Version des Verfahrens COG verwendet wird. In<br />
einer hausinternen und noch nicht publizierten Weiterführung dieser Arbeit konnten die<br />
Ergebnisse allerdings bestätigt werden.<br />
Weitere Hinweise auf die Konstruktvalidität des COG-Tests ergeben sich aus verschiedenen<br />
Korrelationsstatistischen Studien mit konstruktnahen und konstruktfernen Testverfahren.<br />
Beim Versuch konstruktnahe (konvergente) und konstruktferne (diskriminante) Testverfahren<br />
für einen Aufmerksamkeitstest zu definieren, kommt der Umstand zu tragen, den Neumann<br />
(1992) unter dem Begriff "Dualitätsannahme der klassischen Aufmerksamkeitsforschung“<br />
markant zusammenfasst:<br />
„Aufmerksamkeit ist nicht eine von vielen Komponenten in einem Gesamtsystem, sondern<br />
stellt sich den anderen Komponenten gegenüber und beeinflusst die Qualität ihrer Funktion.“<br />
- d.h. in jeder Aufgabe spielt ein gewisses Maß an Aufmerksamkeit mit, allerdings ermöglicht<br />
die Sichtweise von Aufmerksamkeit als heterogenes Konstrukt einen Vergleich beobachteter<br />
Korrelationen bezüglich Ähnlichkeit der einzelnen Testverfahren.<br />
Wagner (1997) beurteilt die Testverfahren Cognitrone (COG), Linienverfolgungstest (LVT),<br />
Determinationstest (DT) und Tachistokopischer Verkehrsauffassungstest (TAVTMB)<br />
hinsichtlich Ähnlichkeit anhand des “allgemeinen Modells zur Unterscheidung verschiedener<br />
Arten von Aufmerksamkeit und Konzentration” (Berg, 1991) vorwiegend unter<br />
Berücksichtigung der Dimension “Personale Regulationsprozesse”. Diese Regulationsprozesse<br />
lassen sich in 4 hierarchischen Stufen beschreiben. In Ergänzung zu Berg (1991)<br />
wird hier die Anordnung der Stufen als Hierarchie verstanden, innerhalb der die Komplexität<br />
der Aufgaben steigt. Aufgaben höherer Stufen durchlaufen mehr "Klassifikationsschritte" und<br />
sind daher besser definiert als Verfahren niedriger Stufen (siehe Abbildung 4).
COG<br />
<br />
DT<br />
<br />
LVT<br />
<br />
“Suche nach<br />
Reizen” (aktiv)“<br />
Erwartung von Reizen”<br />
(passiv)<br />
kein<br />
Testverfahren<br />
in der<br />
Testbatterie<br />
<br />
TAVTMB<br />
<br />
Geteilte<br />
Aspekte<br />
Vordergrund<br />
Reizoffenheit<br />
gegenüber<br />
unerwarteten<br />
Reizen<br />
im<br />
Ausblenden<br />
von Reizen im<br />
Vordergrund<br />
Aufnahme von Reizen im Vordergrund<br />
Selektive Aspekte im Vordergrund<br />
Keine Intention<br />
basale<br />
Aufmerksamkei<br />
tsdimension:<br />
(präattentive<br />
Prozesse)<br />
Intention zur Informationsaufnahme<br />
höhere Aufmerksamkeitsdimensionen<br />
Abbildung 4: Stufen zur Klassifikation verschiedener Arten von Aufmerksamkeit (und die zugeordneten<br />
Testverfahren).<br />
Die Korrelationen zwischen ähnlicheren Testverfahren sollten daher höher ausfallen<br />
(konvergente Validität) als die Korrelationen zwischen unähnlichen Testverfahren<br />
(diskriminante Validität).<br />
Die Studie von Wagner (1997) findet grundsätzlich die erwarteten Zusammenhänge<br />
zwischen den vier Testverfahren, was als Hinweis auf diskriminante Validität des Verfahrens<br />
Cognitrone zu werten ist (siehe Tabelle 9).<br />
Tabelle 9: Korrelationen zwischen den Testverfahren inkl. Konfidenzintervalle (N=114)<br />
Tests Korrelation Konfidenzintervall<br />
DT/LVT 0.206 [0.022; 0.375]<br />
DT/TAVT -0.118 [0.076; 0.296]<br />
COG/DT 0.482 [0.326; 0.611]<br />
COG/TAVT 0.2760 [0.097; 0.438]<br />
COG/LVT 0.423 [0.259; 0.563]<br />
LVT/TAVT -0.1267 [0.059; 0.304]
Nicht geklärt werden kann der Unterschied der Korrelationen COG/LVT - DT/LVT und<br />
COG/TAVT - DT/TAVT. Laut Theorie sollten sich die Korrelationen in ähnlichen<br />
Größenordnungen bewegen. Hier könnte eine differenziertere Betrachtung der Ähnlichkeit<br />
(Hinzunahme weiterer Dimensionen zur Klassifikation) vielleicht Klärung bringen. Unter<br />
Berücksichtigung der Konfidenzintervalle für Korrelationen wird dieses Ergebnis allerdings<br />
deutlich relativiert: COG/DT unterscheidet sich zwar nach wie vor von DT/TAVT und<br />
LVT/TAVT. Alle anderen Korrelationen unterscheiden sich nicht signifikant voneinander. Das<br />
Ergebnis ist ebenso unter Berücksichtigung der nicht optimalen Stichprobe zu bewerten:<br />
Diese ist mit N=114 nicht sehr groß und als sehr homogen zu bezeichnen. Für diese Studie<br />
konnten in Zusammenarbeit mit Verkehrspsychologen ausschließlich "Bewerber für<br />
Personenbeförderung" getestet werden (105 Männer/9 Frauen; Alter: Mittelwert=35,7<br />
min=20; max=57 Stdv=9).<br />
Ein Vergleich des Verfahrens Cognitrone mit einem älteren Verfahren zur Erfassung der<br />
Aufmerksamkeit, dem Q1, zeigte hochsignifikante Korrelationen zwischen den<br />
Testverfahren. (Karner & Biehl, 2001)<br />
Kriteriumsvalidität<br />
Calé (1992) gelang der Nachweis, dass die Testergebnisse im Verfahren Cognitrone zur<br />
Vorhersage von Fahrertypologien geeignet sind (N=246). An einer Stichprobe von N=72<br />
Fahrern, die in kurzer Zeit in mehr als einen Unfall verwickelt waren, konnte Calé signifikante<br />
Korrelationen zwischen Testergebnis und Unfallhäufigkeit feststellen.<br />
Hinweise auf die Validität ergeben sich auch aus einer Studie mit einer Vorgängerversion<br />
des Testverfahrens (Bukasa, Wenninger & Brandstätter; 1990).<br />
Eine Studie von Karner (2000) zeigte signifikante Unterschiede zwischen alkoholauffälligen<br />
Kraftfahrern und der Normgruppe im Verfahren Cognitrone. Die Testergebnisse der<br />
alkoholauffälligen Kraftfahrer waren signifikant schlechter als die der Normpopulation.<br />
In einer Studie von Neuwirth (2001) konnte gezeigt werden, dass der Cognitrone-Test<br />
zwischen allen untersuchten Zuweisungsgruppen (psychiatrische und neurologische<br />
Probanden bzw. Probanden nach Alkoholabusus) und der Normgruppe trennt. Diese<br />
Validierungsstudie wurde an einer anfallenden Stichprobe von Probanden der<br />
Fahreignungsdiagnostik einer Südtiroler Untersuchungsstelle durchgeführt.<br />
Eine weitere Studie von Sommer & Häusler (2006) beschäftigte sich mit der<br />
Kriteriumsvalidität zweier Testbatterien zur Erfassung der kraftfahrspezifischen<br />
Leistungsfähigkeit aus dem Expertensystem Verkehr (Schuhfried, 2005), die ebenfalls das<br />
Verfahren Cognitrone beinhalten. Die beiden Testbatterien Standard und Plus unterschieden<br />
sich hierbei ausschließlich darin, ob die Periphere Wahrnehmung (PP) als Maß für das<br />
Gesichtsfeld und die geteilte Aufmerksamkeit vorgegeben wurde. Als Kriteriumsvariable<br />
wurde das Globalurteil über das Fahrverhalten in einer standardisierten Fahrprobe<br />
herangezogen. Die von den Autoren untersuchte Stichprobe bestand aus 164 (74%)<br />
Männern und 58 (26%) Frauen im Alter von 19 bis 91 Jahren bei einem durchschnittlichen<br />
Alter von 59 Jahren und einer Standardabweichung von 18 Jahren. Der Altersmedian lag bei<br />
64 Jahren. Es handelte sich daher um Personen im mittleren bis höheren Lebensalter. Bei<br />
den Probanden handelte es sich zum Teil um bereits auffällige Kraftfahrer. Die<br />
Studienteilnahme war jedoch freiwillig. Insgesamt 39 (18%) Personen hatten eine<br />
Pflichtschule oder Realschule ohne abgeschlossene Berufsausbildung absolviert (EU<br />
Bildungsgrad 2), 96 (43%) Personen hatten eine abgeschlossene Berufsausbildung bzw.<br />
eine Fachschule absolviert (EU Bildungsgrad 3), 35 (16%) Personen hatten einen<br />
Abiturabschluss (EU Bildungsgrad 4) und 52 (23%) Personen verfügten über einen<br />
Hochschul- bzw. Fachhochschulabschluss (EU Bildungsgrad 5).
Aufgrund der Ergebnisse bisheriger Studien erfolgte die Berechnung der Kriteriumsvalidität<br />
mit Hilfe künstlicher Neuronaler Netze. Das Ergebnis zeigte, dass mit der Testbatterie<br />
Standard insgesamt 80.2% der Gesamtstichprobe richtig klassifiziert werden konnten. Bei<br />
der Testbatterie Plus lag die Klassifikationsrate bei 86.5%. Dies entspricht einem<br />
Validitätskoeffizienten von R=0.68 für die Testbatterie Standard und R=0.78 für die<br />
Testbatterie Plus. In der Jackknife-Validierung wurde für die Testbatterie Standard eine<br />
Klassifikationsrate von 80.2% und ein Validitätskoeffizient von R=0.67 erzielt. Für die<br />
Testbatterie Plus lagen die Werte in der Jackknife-Validierung bei einer Klassifikationsrate<br />
von 83.8% und einem Validitätskoeffizient von R=0.77. Die Intervalle für die<br />
Klassifikationsrate und den Validitätskoeffizient in der Bootstrap-Validierung lagen bei<br />
[74.2%; 85.2%] und [0.54; 0.73] für die Testbatterie Standard und für die Testbatterie Plus<br />
bei [77.5%; 87.2%] und [0.61; 0.79]. Die inkrementelle Validität und relative Relevanz der<br />
einzelnen Testverfahren der beiden Testbatterien können der Tabelle 10 entnommen<br />
werden. Die relative Relevanz gibt an, mit welchem Anteil der entsprechende Test zur<br />
Validität des Vorhersagemodells beiträgt.<br />
Tabelle 10: Inkrementelle Validitäten und relative Relevanzen der beiden Testbatterien Standard und Plus<br />
Prädiktorvariablen<br />
Inkrementelle<br />
Validität<br />
STANDARD<br />
Relative<br />
Relevanz<br />
Inkrementelle<br />
Validität<br />
PLUS<br />
Relative<br />
Relevanz<br />
AMT: Allgemeine Intelligenz 0.128 18.7% 0.078 11.5%<br />
DT: Richtige 0.124 18.2% 0.071 10.5%<br />
RT: Mittlere Reaktionszeit 0.036 5.7% 0.057 8.6%<br />
RT: Mittlere Motorische Zeit 0.132 19.2% 0.118 16.9%<br />
PP: Gesichtsfeld -- -- 0.090 13.2%<br />
PP: Tracking Abweichung -- -- 0.139 19.5%<br />
TAVT: Überblicksgewinnung 0.120 17.6% 0.038 5.8%<br />
COG: Mittlere Zeit korrekte<br />
Zurückweisung<br />
0.141 20.3% 0.093 13.6%<br />
Die Testform S11 wurde zwischen 2005 und 2007 an 787 (53.4%) Männer und 688 (46.6%)<br />
Frauen im Altersbereich zwischen 15 und 91 Jahren (mean=42.53, sd=16.89) aus Österreich<br />
normiert. Insgesamt 32 (2.2%) Personen haben weniger als 9 Schuljahre absolviert (EU<br />
Bildungsgrad 1). 307 (20.8%%) Personen haben eine Pflichtschule oder Real¬schule<br />
absolviert, allerdings ohne abgeschlossene Berufs¬ausbildung (EU Bildungsgrad 2), 658<br />
(44.6%) Personen haben eine abgeschlossene Berufs¬aus¬bildung bzw. eine Fachschule<br />
absolviert (EU Bildungsgrad 3), 343 (23.3%) Personen haben einen Abitur- oder<br />
Fachhoch¬schulabschluss (EU Bildungsgrad 4) und 135 (9.2%) Personen verfügen über<br />
einen Hoch¬schul¬abschluss (EU Bildungsgrad 5). Die Altersverteilung der Normstichprobe<br />
kann der Tabelle 11 entnommen werden.<br />
Tabelle 11: Altersverteilung der Normstichprobe (N=1475)<br />
Altersgruppe in Jahren Beobachtete Häufigkeiten Erwartete Häufigkeiten<br />
15 bis 20 113 106<br />
21 bis 25 112 105
26 bis 30 148 119<br />
31 bis 35 198 148<br />
36 bis 40 152 156<br />
41 bis 45 148 137<br />
46 bis 50 124 115<br />
51 bis 55 105 114<br />
56 bis 60 88 100<br />
61 bis 65 101 99<br />
66 bis 70 73 74<br />
71 bis 75 51 72<br />
76 bis 80 31 65<br />
81 und älter 31 65<br />
Anmerkung: Beobachtete Häufigkeiten sind die Stichprobengrößen in der Normstichprobe. Die erwarteten<br />
Häufigkeiten entsprechenden Daten, die anhand der Volkszählung ermittelt wurden.<br />
Hauptvariable: „Score“:<br />
Diese Variable berücksichtigt sowohl die Tempoleistung als auch die Leistungsgüte. Hohe<br />
Ausprägungen sind als schnelle und genaue Wahrnehmungsleistung im Sinne einer<br />
Überblicksgewinnung zu interpretieren.<br />
Die innere Konsistenz beträgt r=0.92.<br />
Konstruktvalidität<br />
Topserver, Isik, Ogelmann, Bastürk und Tunali (2000) führten in der Türkei eine<br />
verkehrspsychologische Validierungsstudie an mehr als 500 Personen durch und konnten<br />
unter anderem zeigen, dass verkehrsauffällige Kraftfahrer ein signifikant schlechteres<br />
Ergebnis erzielten (p
Kriteriumsvalidität<br />
Eine Vorgängerversion des LVTs, der LL5, wurde von Bukasa, Wenninger und Brandstätter<br />
(1990) im Rahmen der Validierung einer verkehrspsychologischen Testbatterie eingesetzt.<br />
Beobachtet wurden Korrelationen zwischen verschiedenen Fahrverhaltensvariablen und der<br />
Variable LL5F% ("Prozentsatz von Falschen zu insgesamt bearbeiteten“): "Fehlerhafte<br />
Verlangsamung" (R=0.45), "Falsches Kreuzungsverhalten" (R=0.45), "Ungenaues<br />
Spurhalten" (R=0.42) und "Nicht sichern an Kreuzungen" (R=0.39).<br />
Calé (1992) gelang der Nachweis, dass die Testergebnisse des LVT zur Vorhersage von<br />
Fahrertypologien geeignet sind. An einer Stichprobe von N=72 Fahrern, die in kurzer Zeit in<br />
mehr als einen Unfall verwickelt waren, konnte Calé signifikante Korrelationen zwischen<br />
Testergebnis und Unfallhäufigkeit feststellen.<br />
Karner und Neuwirth (2000) konnten anhand ihrer Studie nachweisen, dass Personen mit<br />
einem PR33.<br />
Ein Vergleich des LVT mit dem LL5 aus dem ART90 zeigte hochsignifikante Korrelationen<br />
zwischen den Testverfahren LVT und LL5 (Karner & Biehl; 2001).<br />
Es liegt eine Normierung mit einer repräsentativen Stichprobe der „Normalbevölkerung“ im<br />
Umfang von N=646 Personen vor. Diese Stichprobe setzt sich aus 300 (46.4%) Männern<br />
und 346 (53.6%) Frauen zusammen. Diese Normen liegen auch in Teilstichproben nach der<br />
Variable Alter (bis 25 Jahre, 26 bis 35 Jahre, 36 bis 59 Jahre, 60 bis 70 Jahre und ab 71<br />
Jahre) vor. Die genaue Altersverteilung dieser Stichprobe ist der Tabelle 12 zu entnehmen.<br />
Tabelle 12: Altersverteilung der Normstichprobe<br />
Altersgruppe in Jahren Beobachtete Häufigkeit Erwartete Häufigkeit<br />
15 bis 20 39 19<br />
21 bis 25 67 52<br />
26 bis 30 66 71<br />
31 bis 35 78 71<br />
36 bis 40 69 58<br />
41 bis 45 55 58<br />
46 bis 50 54 45<br />
51 bis 55 34 58<br />
56 bis 60 50 52<br />
61 bis 65 38 39<br />
66 bis 70 46 39<br />
71 bis 75 26 32<br />
76 und älter 24 51<br />
Anmerkung: Beobachtete Häufigkeiten sind die Stichprobengröße in der Normstichprobe. Erwartete Häufigkeiten<br />
entsprechenden Daten, die anhand der Volkszählung ermittelt wurden.<br />
Für jede Stichprobengröße wird die repräsentative Verteilung basierend auf Daten der<br />
österreichischen Volkszählung 1991 (Volkszählung 1991: Hauptergebnisse I – Österreich
Heft 1.030/10 der Beiträge zur Österreichischen Statistik, hg. vom österreichischen<br />
Statistischen Zentralamt, Wien 1993) und Daten aus Deutschland, die ebenfalls von einer<br />
Volkszählung stammen, die nach der Wiedervereinigung Deutschlands durchgeführt wurde,<br />
berechnet. Diese Daten entsprechen den erwarteten Häufigkeiten in Tabelle 12.<br />
Hauptvariable: „Anzahl der richtigen Reaktionen“:<br />
Diese Variable misst die Leistungsfähigkeit der Person, bei länger dauernden Folgen von<br />
einfachen Reaktionsaufgaben unter erheblicher Belastung rasch und adäquat zu reagieren.<br />
Hilfsvariable: „Anzahl der falschen Reaktionen“:<br />
Falsche Reaktionen zeigen die Tendenz zu Verwechslungen an. Sie entstehen hier nicht<br />
durch die kognitive Komplexität der Zuordnungsregeln zwischen Reiz und Reaktion, sondern<br />
weil es dem Probanden nicht immer gelingt, die adäquate Reaktion vor der Einwirkung<br />
konkurrierender irrelevanter Reaktionen abzuschirmen.<br />
Hilfsvariable: „Anzahl der ausgelassenen Reaktionen“:<br />
Diese Variable beschreibt, ob Reaktionen unter Zeitdruck abgebrochen werden. Sie ist damit<br />
ein Hinweis für Resignationstendenzen des Probanden.<br />
Tabelle 13: Innere Konsistenz der Testform S1, berechnet als Cronbach Alpha auf Itemniveau.<br />
Stichprobe Gesamt bis 25a 26a - 35a 36a - 59a >59a Bild. 1 * ) Bild 2 ** )<br />
SUM.R 0.990 0.986 0.986 0.988 0.988 0.992 0.988<br />
SUM.F 0.990 0.986 0.986 0.988 0.988 0.992 0.988<br />
SUM.A 0.990 0.986 0.986 0.988 0.988 0.992 0.988<br />
MD.RT 0.991 0.995 0.995 0.995 0.995 0.996 0.993<br />
ANZ.S 0.991 0.995 0.995 0.995 0.995 0.996 0.993<br />
SUM.RF 0.995 0.996 0.989 0.995 0.996 0.996 0.993<br />
Anmerkung: *): Bildungsstufen „Volksschule, Realschule" **): Bildungsstufen „Abitur, Universität"<br />
In einer Längsschnittstudie an 82 Personen (48% Männer, 52% Frauen) im Altersbereich von<br />
17 bis 78 Jahren (m=44; s=17) ergab sich für die Hauptvariable der Testform S1 eine Retest<br />
Reliabilität von r=0.89 und eine Stabilität über den Zeitraum von 5 Monaten von r=0.84.<br />
Wie die Werte insgesamt zeigen, ist die Konsistenz der Messung in den einzelnen Variablen<br />
extrem hoch. Das bedeutet, dass der Determinationstest ein besonders messgenaues<br />
diagnostisches Instrument ist.<br />
Konstruktvalidität<br />
Unter Reaktionszeit versteht man die Zeit, die zwischen einem Signal und dem Beginn einer<br />
mechanischen Bewegungsantwort vergeht, wenn der Proband instruiert wurde, möglichst<br />
rasch zu reagieren (Dorsch, 1994). Beim Determinationstest wird die Reaktionszeit auf<br />
komplexe Wahlreaktionen gemessen. Zur Ermittlung dieser Reaktionszeiten, die im
Millisekundenbereich liegen, ist ein Testinstrument notwendig, das sehr zuverlässig und<br />
genau ist.<br />
Der Determinationstest ist zur Bestimmung der Reaktionszeit auf komplexe Wahlreaktionen<br />
bestens geeignet.<br />
Im Rahmen der Normierungsstudie der Testform S1 (Weinkirn, 1996) wurde der<br />
Determinationstest gemeinsam mit dem Reaktionstest und dem Tachistoskopischen<br />
Verkehrsauffassungstest (TAVTMB) einer Stichprobe von 180 „gesunden Normalpersonen"<br />
vorgegeben.<br />
Tabelle 14: Korrelationen DT mit TAVT und RT<br />
RT<br />
DT: MD.RT 0.5896**<br />
DT<br />
MD.RT MD.RT SUM.R SUM.F<br />
DT: SUM.R -0.5191** -0.8997**<br />
DT: SUM.F -0.1606 -0.3513 -0.2706<br />
TAVTMB: R -0.3906** -0.6668 0.67** 0.2879**<br />
Anmerkung: * = r
Standardabweichung von 6.25 Jahren). Der Altersmedian lag bei 31 Jahren. Bei dieser<br />
Stichprobe handelte es sich um eine Freiwilligenstichprobe, die in Zusammenarbeit mit einer<br />
österreichischen Versicherungsgesellschaft rekrutiert wurde. Die Verteilung der<br />
Bildungsgrade in dieser Stichprobe gestaltete sich wie folgt: 7 (4.60%) Personen hatten eine<br />
Pflichtschule oder Realschule absolviert, allerdings ohne abgeschlossene Berufsausbildung<br />
(EU Bildungsgrad 2), 42 (27.50%) Personen hatten eine abgeschlossene Berufsausbildung<br />
bzw. eine Fachschule absolviert (EU Bildungsgrad 3), 83 (54.20%) Personen hatten einen<br />
Abitur- oder Fachhochschulabschluss (EU Bildungsgrad 4) und 21 (13.70%) Personen<br />
verfügten über einen Hochschulabschluss (EU Bildungsgrad 5). Insgesamt 75 (49%)<br />
Personen gaben in einem strukturierten Interview zur Erfassung ihrer Verkehrsunfälle an,<br />
bereits zwei oder mehr selbstverschuldete Verkehrsunfälle gehabt zu haben, während die<br />
übrigen untersuchten 78 (51%) Personen berichteten, bisher noch keine Verkehrsunfälle<br />
verursacht zu haben. Im Sinne eines Extremgruppenvergleichs wurden Personen mit nur<br />
einem selbstverschuldeten Unfall ausgeschlossen, da bei Vorliegen eines einzigen Unfalls<br />
noch nicht von einer relevanten Erhöhung der personenspezifischen Unfallverwicklung<br />
ausgegangen werden kann. Die beiden Gruppen unterschieden sich weder hinsichtlich ihrer<br />
Geschlechts- (Chi²=2.492; df=1; p=0.114) und Bildungsverteilung (Chi²=3.114; df=3;<br />
p=0.374) sowie ihres Lebensalters (Z=1.563; p=0.059) noch hinsichtlich ihrer Fahrumwelt<br />
oder in ihrem Fahrverhalten signifikant voneinander. Alle Untersuchungsteilnehmer hatten<br />
bereits seit mindestens fünf Jahren einen Führerschein und eine Fahrerfahrung von<br />
mindestens 50.000 Kilometer. Die beiden Gruppen unterschieden sich nicht signifikant<br />
(Z=1.616; p=0.053) in der Gesamtanzahl der zurückgelegten Kilometer. Alle<br />
Untersuchungsteilnehmer kamen aus Wien und benutzten ihr Kraftfahrzeug überwiegend im<br />
Stadtverkehr.<br />
In der für diese Studie verwendeten standardisierten, verkehrspsychologischen Testbatterie<br />
kam unter anderem auch der DT zur Anwendung. Die Autoren bedienten sich künstlicher<br />
Neuronaler Netze, um die Unfallbelastung der Probanden anhand ihrer Testkennwerte<br />
vorherzusagen. Das Ergebnis zeigte, dass insgesamt 92.2% der Gesamtstichprobe richtig<br />
klassifiziert werden konnten. Dies entspricht einem Validitätskoeffizienten von R=0.84. In der<br />
Jackknife-Validierung wurde eine Klassifikationsrate von 88.9% und ein Validitätskoeffizient<br />
von R=0.84 erzielt. Die Intervalle für die Klassifikationsrate und den Validitätskoeffizient in<br />
der Bootstrap-Validierung lagen bei [84.6%; 94.5%] und [0.70; 0.89]. Die inkrementelle<br />
Validität und relative Relevanz der einzelnen Testverfahren können der Tabelle 15<br />
entnommen werden. Die relative Relevanz gibt an, mit welchem Anteil der entsprechende<br />
Test zur Validität des Vorhersagemodells beiträgt.<br />
Tabelle 15. Inkrementelle Validität und relative Relevanz der einzelnen Tests<br />
Testbezeichnung Inkrementelle Validität Relative Relevanz<br />
AMT 0.011 1.4%<br />
DT 0.133 20.9%<br />
SIGNAL 0.075 9.2%<br />
TAVTMB 0.064 7.9%<br />
WRBTV 0.072 8.9%<br />
IVPE/PS 0.311 32.2%<br />
IVPE/VB 0.087 10.6%<br />
IVPE/SK 0.066 8.2%<br />
IVPE/TA 0.001 2.0%
Die Ergebnisse sprechen somit bei einer relativen Relevanz von rund 21% für die<br />
Kriteriumsvalidität des DT.<br />
Eine weitere Studie von Sommer & Häusler (2006) beschäftigte sich mit der<br />
Kriteriumsvalidität zweier Testbatterien zur Erfassung der kraftfahrspezifischen<br />
Leistungsfähigkeit aus dem Expertensystem Verkehr (Schuhfried, 2005), die ebenfalls den<br />
DT beinhalten. Die beiden Testbatterien Standard und Plus unterschieden sich hierbei<br />
ausschließlich darin, ob die Periphere Wahrnehmung (PP) als Maß für das Gesichtsfeld und<br />
die geteilte Aufmerksamkeit vorgegeben wurde. Als Kriteriumsvariable wurde das<br />
Globalurteil über das Fahrverhalten in einer standardisierten Fahrprobe herangezogen. Die<br />
von den Autoren untersuchte Stichprobe bestand aus 164 (74%) Männern und 58 (26%)<br />
Frauen im Alter von 19 bis 91 Jahren bei einem durchschnittlichen Alter von 59 Jahren und<br />
einer Standardabweichung von 18 Jahren. Der Altersmedian lag bei 64 Jahren. Es handelte<br />
sich daher um Personen im mittleren bis höheren Lebensalter. Bei den Probanden handelte<br />
es sich zum Teil um bereits auffällige Kraftfahrer. Die Studienteilnahme war jedoch freiwillig.<br />
Insgesamt 39 (18%) Personen hatten eine Pflichtschule oder Realschule ohne<br />
abgeschlossene Berufsausbildung absolviert (EU Bildungsgrad 2), 96 (43%) Personen<br />
hatten eine abgeschlossene Berufsausbildung bzw. eine Fachschule absolviert (EU<br />
Bildungsgrad 3), 35 (16%) Personen hatten einen Abitur- oder Fachhochschulabschluss (EU<br />
Bildungsgrad 4) und 52 (23%) Personen verfügten über einen Hochschulabschluss (EU<br />
Bildungsgrad 5).<br />
Aufgrund der Ergebnisse bisheriger Studien erfolgte die Berechnung der Kriteriumsvalidität<br />
mit Hilfe künstlicher Neuronaler Netze. Das Ergebnis zeigte, dass mit der Testbatterie<br />
Standard insgesamt 80.2% der Gesamtstichprobe richtig klassifiziert werden konnten. Bei<br />
der Testbatterie Plus lag die Klassifikationsrate bei 86.5% Dies entspricht einem<br />
Validitätskoeffizienten von R=0.68 für die Testbatterie Standard und R=0.78 für die<br />
Testbatterie Plus. In der Jackknife-Validierung wurde für die Testbatterie Standard eine<br />
Klassifikationsrate von 80.2% und ein Validitätskoeffizent von R=0.67 erzielt. Für die<br />
Testbatterie Plus lagen die Werte in der Jackknife-Validierung bei einer Klassifikationsrate<br />
von 83.8% und einem Validitätskoeffizent von R=0.77. Die Intervalle für die<br />
Klassifikationsrate und den Validitätskoeffizent in der Bootstrap-Validierung lagen bei<br />
[74.2%; 85.2%] und [0.54; 0.73] für die Testbatterie Standard und für die Testbatterie Plus<br />
bei [77.5%; 87.2%] und [0.61; 0.79]. Die inkrementelle Validität und relative Relevanz der<br />
einzelnen Testverfahren der beiden Testbatterien können der Tabelle 16 entnommen<br />
werden. Die relative Relevanz gibt an, mit welchem Anteil der entsprechende Test zur<br />
Validität des Vorhersagemodells beiträgt.
Tabelle 16. Inkrementelle Validitäten und relative Relevanzen der beiden Testbatterien Standard und Plus<br />
Prädiktorvariablen<br />
Inkrementelle<br />
Validität<br />
STANDARD<br />
Relative<br />
Relevanz<br />
Inkrementelle<br />
Validität<br />
PLUS<br />
Relative<br />
Relevanz<br />
AMT: Allgemeine Intelligenz 0.128 18.7% 0.078 11.5%<br />
DT: Richtige 0.124 18.2% 0.071 10.5%<br />
RT: Mittlere Reaktionszeit 0.036 5.7% 0.057 8.6%<br />
RT: Mittlere Motorische Zeit 0.132 19.2% 0.118 16.9%<br />
PP: Gesichtsfeld -- -- 0.090 13.2%<br />
PP: Tracking Abweichung -- -- 0.139 19.5%<br />
TAVT: Überblicksgewinnung 0.120 17.6% 0.038 5.8%<br />
COG: Mittlere Zeit korrekte<br />
Zurückweisung<br />
0.141 20.3% 0.093 13.6%<br />
Die Ergebnisse sprechen somit bei einer relativen Relevanz von 18.2% (Testbatterie<br />
Standard) bzw. 10.5% (Testbatterie Plus) für die Kriteriumsvalidität des DT.<br />
Sommer, Arendasy, Hansen und Schuhfried. (2005) untersuchten die Kriteriumsvalidität<br />
einer umfassenden fliegerpsychologischen Testbatterie zur Auswahl geeigneter<br />
Militärpilotenanwärter. Die Studie gliederte sich in zwei Phasen. In der ersten Phase wurde<br />
eine umfassende Testbatterie administriert. Als Prädiktorvariablen dienten hierbei die<br />
Testvariablen Figural-Induktives Denken und Visuelles Kurzzeitgedächtnis aus der<br />
Intelligenz-Struktur-Batterie (Arendasy et al., 2005), die Testvariable Richtige aus dem<br />
Determinationstest Form S1 sowie die Testvariable Raumvorstellung aus dem Adaptiven<br />
Dreidimensionalen Würfeltest (Gittler, 2002) und die Testvariable Zeit im Idealbereich aus<br />
der Sensomotorischen Koordination (Bauer, Guttmann, Leodolter & Leodolter, 2002). In der<br />
zweiten Phase wurde die Performanz der Probanden in einem standardisierten Flugsimulator<br />
erhoben. Anhand der Globalbeurteilung der erbrachten Leistung im standardisierten<br />
Flugsimulator wurde die Stichprobe in geeignete Pilotenanwärter (53.54%) und weniger<br />
geeignete Pilotenanwärter (46.46%) unterteilt. Die Stichprobe besteht aus insgesamt 99<br />
männlichen Pilotenanwärtern im Alter von 16 bis 25 Jahren. Der Altersmittelwert liegt bei<br />
20.4 Jahren bei einer Standardabweichung von 1.85 Jahren. 1 Person (1%) verfügt über<br />
einen Pflichtschulabschluss ohne abgeschlossene Berufsausbildung während 19 Personen<br />
(19.2%) zudem auch über eine abgeschlossene Berufsausbildung verfügen. Insgesamt 74<br />
Personen (74.7%) können ein Abitur bzw. eine Matura vorweisen. 5 Personen (5.1%) haben<br />
einen Universitätsabschluss. Die Gruppe der positiv beurteilten Personen besteht aus 53<br />
Männern (53.54%) während 46 Männer (46.46%) keine positive bzw. eine nur beschränkt<br />
positive Bewertung erhalten haben. Unter Anwendung künstlicher Neuronaler Netze konnte<br />
anhand der hier verwendeten Testverfahren der Erfolg im Flugsimulator bei 79.8% der<br />
Probanden korrekt vorhergesagt werden. In der Jackknife-Validierung lag die<br />
Klassifikationsrate bei 73.8%. Das hier vorgestellte Testverfahren trug mit einer relativen<br />
Relevanz von 18% zum Vorhersagemodell bei, sodass von der Kriteriumsvalidität des DT im<br />
Bereich der fliegerpsychologischen Diagnostik ausgegangen werden kann.<br />
Normstichprobe<br />
Es liegt eine Normierung der Testform S1 mit einer Stichprobe vom Umfang N=1179 vor.<br />
Tabelle 17 zeigt die Verteilung der Stichprobenmerkmale.
Tabelle 17: Verteilung der Stichprobenmerkmale<br />
Altersgruppen -25 J. 26-35 J. 36-59 J. 60 - 70 J. ab 71 J. Gesamt<br />
N 136 222 477 205 139 581 / 598<br />
% 11,5 18,8 40,5 17,4 11,8 49 / 51<br />
Anmerkung: Die Zahlen links und rechts vom Schrägstrich stehen für die Anzahl der Männer bzw. Frauen.<br />
Bei der oben beschriebenen Stichprobe handelt es sich um „normale" Erwachsene, die im<br />
Rahmen von Normierungsstudien 1996 bis 2001 im Forschungs- und Schulungslabor der<br />
<strong>SCHUHFRIED</strong> <strong>GmbH</strong> erhoben wurden.<br />
Die Normstichprobe (N=1179) setzt sich aus 581 Männern (49%) und 598 Frauen (51%)<br />
zusammen. Die Stichprobe ist in Teilstichproben nach fünf Altersgruppen (bis 25, 26-35, 36-<br />
59, 60-70, 71 Jahre und älter) sowie in Teilstichproben nach den Bildungsstufen 1-3<br />
(Volksschule, Haupt- bzw. Realschule, Lehrabschluss) und 4-5 (Abitur,<br />
Universitätsabschluss) aufgeteilt, die sich voneinander signifikant unterscheiden.<br />
Tabelle 18: Erwartete und tatsächlich beobachtete Häufigkeiten in der Stichprobe<br />
Altersgruppe in Jahren Beobachtete Häufigkeiten Erwartete Häufigkeiten<br />
15 bis 20 36 35<br />
21 bis 25 100 94<br />
26 bis 30 106 130<br />
31 bis 35 116 130<br />
36 bis 40 115 106<br />
41 bis 45 67 106<br />
46 bis 50 82 83<br />
51 bis 55 108 106<br />
56 bis 60 132 94<br />
61 bis 65 101 71<br />
66 bis 70 77 71<br />
71 bis 75 72 59<br />
76 bis 80 54 35<br />
81 bis 85 11 35<br />
86 und älter 2 24<br />
Anmerkung: Beobachtete Häufigkeiten sind die Stichprobengrößen in der Normstichprobe. Erwartete<br />
Häufigkeiten basieren auf den Daten, die anhand der Volkszählung 1991 ermittelt wurden.<br />
Für jede Stichprobengröße wird die repräsentative Verteilung basierend auf Daten der<br />
österreichischen Volkszählung 1991 (Volkszählung 1991: Hauptergebnisse I - Österreich<br />
Heft 1.030/10 der Beiträge zur Österreichischen Statistik, hg. vom österreichischen<br />
Statistischen Zentralamt, Wien 1993.) und Daten aus Deutschland, die ebenfalls von einer<br />
Volkszählung stammen, die nach der Wiedervereinigung Deutschlands durchgeführt wurde,<br />
berechnet. Diese Daten entsprechen den erwarteten Häufigkeiten in Tabelle 18.
Überblicksgewinnung<br />
Der Personenparameter der Variable Überblicksgewinnung stellt ein Maß für die Genauigkeit<br />
und Geschwindigkeit der visuellen Beobachtungsfähigkeit und Überblicksgewinnung sowie<br />
der visuellen Orientierungsleistung dar. In diesem Testkennwert kommen somit die<br />
Wahrnehmungskapazität und das Wahrnehmungstempo am deutlichsten zum Ausdruck.<br />
Ein hoher Prozentrang (PR>84) weist auf eine gut ausgeprägte Fähigkeit zur raschen und<br />
genauen Situationserfassung hin, während ein niedriger Prozentrang (PR
kognitiven Prozesse tatsächlich ansprechen und daher auch Unterschiede in den<br />
Itemschwierigkeitsparametern erklären können. Der Einfluss der Aufgabenmerkmale und der<br />
mit ihnen assoziierten kognitiven Prozesse kann mit Hilfe erklärender IRT-Modelle wie dem<br />
Linearen Logistischen Testmodell (LLTM, Fischer, 1974) oder multiplen Regressionen (z.B.<br />
Embretson, 1998; 2002) empirisch überprüft werden.<br />
Um von einer angemessenen Konstruktvalidität ausgehen zu können, sollten sich zudem<br />
auch die theoretisch zu erwartenden Zusammenhänge mit anderen Testverfahren zeigen.<br />
Hinsichtlich des letztgenannten Aspekts sprechen Embretson (1983) und Messick (1995) von<br />
einem Nachweis der nomothetischen Spanne.<br />
Hinweise zur Konstruktrepräsentation von ATAVT liefert eine Studie von Sommer, Herle,<br />
Häusler & Arendasy (2008), in der versucht wurde, die Itemschwierigkeitsparameter der<br />
k=84 neuen Items anhand des Konstruktionsrationals von ATAVT vorherzusagen. Die<br />
Autoren verwendeten in Anlehnung an Embretson (2002) eine schrittweise multiple<br />
Regression, wobei die folgenden Schwierigkeitsfaktoren in der hier genannten Reihenfolge<br />
einbezogen wurden: (1) „Anzahl der sichtbaren Objektklassen“, (2) „Relativer Anteil der<br />
notwendigen peripheren Objekte“, (3) „Relativer Anteil der notwendigen kleinen Objekte“, (4)<br />
„Erfahrungsbedingte Täuschung“, (5) „Schlechter Konturenkontrast“, (6) „Relativer Anteil der<br />
notwendigen verdeckten Objekte“ und (7) „Relativer Anteil typischer Objekte“. Die<br />
Modellzusammenfassung ist in Tabelle 19 dargestellt.<br />
Tabelle 19: Modellzusammenfassung der schrittweisen multiplen Regression<br />
Modell R R² adj. R² Δ R² Δ F df1 df2 p<br />
1 0.801 0.642 0.637 0.642 146.86 1 82
Wie aus Tabelle 20 deutlich hervorgeht, leisten alle der theoretisch postulierten<br />
Schwierigkeitsfaktoren einen signifikanten Beitrag zur Vorhersage der<br />
Itemschwierigkeitsparameter. Eine Inspektion der β-Gewichte zeigt jedoch, dass die „Anzahl<br />
der sichtbaren Objektklassen“ den vergleichsweise größten Beitrag zur Vorhersage der<br />
Itemschwierigkeitsparameter leistet.<br />
Hinweise auf die nomothetische Spanne (Embretson, 1983) des ATAVT ergeben sich aus<br />
der Studie von Zuschlag und Jacobshagen (1982). Die Autoren fanden in ihrer Untersuchung<br />
folgende Korrelation zwischen einer Vorversion des ATAVT und anderen Testverfahren zur<br />
visuellen Wahrnehmung: Labyrinth-Test: r=0.38; Fehler im Benton-Test: r=0.33; Fehler im<br />
Mehrfachwahl-Reaktionsversuch: r=0.30. Zudem untersuchten Karner und Biehl (2001) den<br />
Zusammenhang zwischen einer Vorversion des ATAVT und dem Tachistoskop-Test (TT15:<br />
Bukasa & Wenninger, 1986). Die Autoren berichten einen signifikanten<br />
Korrelationskoeffizienten in der Höhe von r=0.77. Die vorliegenden Befunde zur<br />
nomothetischen Spanne sprechen somit für die konvergente Validität von ATAVT.<br />
Kriteriumsvalidität<br />
Hinweise auf die Kriteriumsvalidität von ATAVT liefern zahlreiche Studien aus dem Bereich<br />
der verkehrspsychologischen Diagnostik, die zum Teil mit einer Vorversion von ATAVT –<br />
dem TAVTMB - durchgeführt wurden. So berichtet beispielsweise Kamuf (1988) eine<br />
Korrelation zwischen der Fahrprobe und einer Vorversion von ATAVT (TAVTMB: Biehl,<br />
1996) in der Höhe von 0.74. In einer weiteren Untersuchung konnte Kamuf (1988) zeigen,<br />
dass unter Berücksichtigung des Alterseinflusses Betriebskraftfahrer und Fahrlehreranwärter<br />
beim TAVT signifikant bessere Ergebnisse erreichten als eine Kontrollgruppe.<br />
Eine Untersuchung von Schubert, Müller und Senf (1962) zeigte signifikante Unterschiede<br />
zwischen den Testleistungen bewährter und auffälliger Kraftfahrer. Hampel (1976) stellte<br />
signifikante Mittelwertunterschiede zwischen Fahrlehreranwärtern und tatauffälligen<br />
Kraftfahrern in einer Vorversion von ATAVT (TAVTMB: Biehl, 1996) fest.<br />
Eine Studie von Hartje, Pach, Willmes, Hannen und Weber (1991) zeigte eine Korrelation<br />
zwischen einer Vorversion von ATAVT (TAVTMB: Biehl, 1996) und einer Fahrprobe von<br />
r=0.42 bei Personen mit Schädel-Hirn-Traumata.<br />
Eine Untersuchung von Schlag (1994) zeigte hochsignifikante Unterschiede zwischen<br />
Personen unter 70 Jahren und Personen über 70 Jahren (N=110) bei Fahrversuch und<br />
Testung mittels einer Vorgängerversion von ATAVT (TAVTMB: Biehl, 1996). Ältere Personen<br />
waren beim Einfädeln auf Autobahnauffahrten langsamer, wählten einen engeren<br />
Abbiegeradius beim Einbiegen auf eine Landstraße, zeigten allgemein ein höheres<br />
Bestreben, den rechten Fahrstreifen zu wählen. Sie missachteten deutlich öfter die Vorfahrt<br />
und die rote Ampel. Ältere Personen übersahen öfter bevorrangte Verkehrsteilnehmer und<br />
querten einen unbeschrankten Bahnübergang ohne Geschwindigkeitsreduktion.<br />
Hinweise auf die Validität ergeben sich auch aus einer Studie mit einer Vorgängerversion<br />
des Testverfahrens (Bukasa, Wenninger & Brandstätter 1990). Diese Untersuchung<br />
umfasste eine Gruppe von N=248 freiwilligen Kraftfahrern. Die Vorversion von ATAVT<br />
(TAVTMB: Biehl, 1996) kann zwischen angepassten und unangepassten Fahrern trennen.<br />
Eine Zuordnung der Probanden zu Fahrertypologien aufgrund der Testergebnisse gelingt zu<br />
83%. Eine zweite Gruppe von N=120 verkehrsauffälligen Probanden aus der<br />
Fahreignungsdiagnostik wurde ebenfalls untersucht. Die Testergebnisse stehen mit den in<br />
der Fahrverhaltensbeobachtung registrierten Verhaltensfehlern und Konflikten in einem<br />
deutlichen Zusammenhang. Zusammenhänge zwischen folgenden Fahrverhaltenskategorien<br />
und der Vorversion des ATAVT (TAVTMB: Biehl, 1996) konnten festgestellt werden:<br />
Einordnen, Spurwechsel, Vorrang-Nachrang-Situationen, spätes Reagieren an Ampeln,<br />
Abstandhalten. Ein Extremgruppenvergleich bezüglich der Fahrverhaltenskategorien, d.h. die
Stichprobe wurde in die 40% Besten und 40% Schlechtesten gesplittet, ergab bei Fehlern<br />
aus der Fahrverhaltensbeobachtung signifikante Leistungsunterschiede im vorliegenden<br />
Testverfahren.<br />
Karner und Neuwirth (2000) konnten eine Korrelation von –0.42 zwischen dem Globalurteil<br />
des Fahrverhaltens in einer standardisierten Fahrprobe und dem Testergebnis in einer<br />
Vorversion des ATAVT (TAVTMB: Biehl, 1996) nachweisen. Darüber hinaus zeigen sich<br />
auch signifikante Unterschiede in der Gesamtbewertung des Fahrverhaltens zwischen<br />
Personen mit Leistungen PR
Tabelle 21: Inkrementelle Validität und relative Relevanz der einzelnen Tests<br />
Testbezeichnung Inkrementelle Validität Relative Relevanz<br />
AMT: Allgemeine Intelligenz 0.011 1.4%<br />
DT: Richtige 0.133 20.9%<br />
SIGNAL: Richtige und Verspätete 0.075 9.2%<br />
ATAVT: Überblicksgewinnung 0.064 7.9%<br />
WRBTV: Subjektiv akzeptiertes Risikoniveau 0.072 8.9%<br />
IVPE-PS: Psychische Stabilität 0.311 32.2%<br />
IVPE-VB: Soziales Verantwortungsbewusstsein 0.087 10.6%<br />
IVPE-SK: Selbstkontrolle 0.066 8.2%<br />
IVPE-TA: Spannungsbedürfnis und Abenteuerlust 0.001 2.0%<br />
Die Ergebnisse sprechen somit bei einer relativen Relevanz von rund 8% für die<br />
Kriteriumsvalidität von ATAVT.<br />
Eine weitere Studie von Risser et al. (2008) beschäftigte sich mit der Kriteriumsvalidität<br />
zweier Testbatterien zur Erfassung der kraftfahrspezifischen Leistungsfähigkeit aus dem<br />
Expertensystem Verkehr (Schuhfried, 2005), die ebenfalls eine Vorversion von ATAVT<br />
(TAVTMB: Biehl, 1996) beinhaltete. Die beiden Testbatterien Standard und Plus<br />
unterschieden sich hierbei ausschließlich darin, ob die Periphere Wahrnehmung (PP) als<br />
Maß für das Gesichtsfeld und die geteilte Aufmerksamkeit vorgegeben wurde. Als<br />
Kriteriumsvariable wurde das Globalurteil über das Fahrverhalten in einer standardisierten<br />
Fahrprobe herangezogen. Die von den Autoren untersuchte Stichprobe bestand aus 164<br />
(74%) Männern und 58 (26%) Frauen im Alter von 19 bis 91 Jahren bei einem<br />
durchschnittlichen Alter von 59 Jahren und einer Standardabweichung von 18 Jahren. Der<br />
Altersmedian lag bei 64 Jahren. Es handelte sich daher um Personen im mittleren bis<br />
höheren Lebensalter. Bei den Probanden handelte es sich zum Teil um bereits auffällige<br />
Kraftfahrer.<br />
Insgesamt 39 (18%) Personen hatten eine Pflichtschule oder Realschule ohne<br />
abgeschlossene Berufsausbildung absolviert (EU Bildungsgrad 2), 96 (43%) Personen<br />
hatten eine abgeschlossene Berufsausbildung bzw. eine Fachschule absolviert (EU<br />
Bildungsgrad 3), 35 (16%) Personen hatten eine höhere Schule mit Abitur/Matura<br />
abgeschlossen (EU Bildungsgrad 4) und 52 (23%) Personen verfügten über einen<br />
Hochschulabschluss (EU Bildungsgrad 5).<br />
Die Korrelationen zwischen den einzelnen Tests und dem Außenkriterium können Tab. 22<br />
entnommen werden.<br />
Tabelle 22: Korrelationen zwischen den Testverfahren und dem Außenkriterium<br />
AMT<br />
DT<br />
RT kogn.<br />
Geschw.<br />
RT mot.<br />
Geschw.<br />
PP<br />
Gesichtsfeld<br />
PP<br />
Tackingab<br />
weichung<br />
TAVT<br />
.22* .33** .27** -.25** .07 -.33* .42** .19<br />
*p
konnten. Bei der Testbatterie Plus lag die Klassifikationsrate bei 86.5% Dies entspricht<br />
einem Validitätskoeffizienten von R=0.68 für die Testbatterie Standard und R=0.78 für die<br />
Testbatterie Plus. In der Jackknife-Validierung wurde für die Testbatterie Standard eine<br />
Klassifikationsrate von 80.2% und ein Validitätskoeffizient von R=0.67 erzielt. Für die<br />
Testbatterie Plus lagen die Werte in der Jackknife-Validierung bei einer Klassifikationsrate<br />
von 83.8% und einem Validitätskoeffizient von R=0.77. Die Intervalle für die<br />
Klassifikationsrate und den Validitätskoeffizient in der Bootstrap-Validierung lagen bei<br />
[74.2%; 85.2%] und [0.54; 0.73] für die Testbatterie Standard und für die Testbatterie Plus<br />
bei [77.5%; 87.2%] und [0.61; 0.79]. Die Ergebnisse konnten zudem auch von Sommer et al.<br />
(2008) anhand einer weiteren unabhängigen Stichprobe repliziert werden.<br />
Die inkrementelle Validität und relative Relevanz der einzelnen Testverfahren der beiden<br />
Testbatterien können der Tabelle 23 entnommen werden. Die relative Relevanz gibt an, mit<br />
welchem Anteil der entsprechende Test zur Validität des Vorhersagemodells beiträgt.<br />
Tabelle 23:Inkrementelle Validität und relative Relevanz der einzelnen Tests<br />
Prädiktorvariablen<br />
Inkrementelle<br />
Validität<br />
STANDARD<br />
Relative<br />
Relevanz<br />
Inkrementelle<br />
Validität<br />
PLUS<br />
Relative<br />
Relevanz<br />
AMT: Allgemeine Intelligenz 0.128 18.7% 0.078 11.5%<br />
DT: Richtige 0.124 18.2% 0.071 10.5%<br />
RT: Mittlere Reaktionszeit 0.036 5.7% 0.057 8.6%<br />
RT: Mittlere Motorische Zeit 0.132 19.2% 0.118 16.9%<br />
PP: Gesichtsfeld -- -- 0.090 13.2%<br />
PP: Tracking Abweichung -- -- 0.139 19.5%<br />
ATAVT: Überblicksgewinnung 0.120 17.6% 0.038 5.8%<br />
COG: Mittlere Zeit korrekte<br />
Zurückweisung<br />
0.141 20.3% 0.093 13.6%<br />
Die Ergebnisse sprechen somit bei einer relativen Relevanz von 17.6% (Testbatterie<br />
Standard) bzw. 5.8% (Testbatterie Plus) für die Kriteriumsvalidität von ATAVT.<br />
Hinweise auf die inkrementelle Kriteriumsvalidität einer Vorversion von ATAVT (TAVTMB:<br />
Biehl, 1996) ergeben sich auch aus den Ergebnissen einer Studie von Sommer et al. (2008).<br />
Die Autoren untersuchten die Kriteriumsvalidität einer Testbatterie zur Erfassung der<br />
kraftfahrspezifischen Leistungsfähigkeit und der Bereitschaft zur Verkehrsanpassung aus<br />
dem Expertensystem Verkehr (Schuhfried, 2005), die ebenfalls eine Vorversion von ATAVT<br />
beinhaltete. Als Kriteriumsvariable wurde das Globalurteil über das Fahrverhalten in einer<br />
standardisierten Fahrprobe herangezogen. Sommer et al. (2008b) untersuchten eine<br />
Stichprobe von 127 (79.9%) Männern and 32 (20.1%) Frauen im Alter von 19 bis 73 Jahren<br />
(Mean=39.41; SD=11.92). Insgesamt 29 (18.2%) Personen hatten eine Pflichtschule oder<br />
Realschule ohne abgeschlossene Berufsausbildung absolviert (EU Bildungsgrad 2), 96<br />
(43%) Personen hatten eine abgeschlossene Berufsausbildung bzw. eine Fachschule<br />
absolviert (EU Bildungsgrad 3), 35 (16%) Personen hatten eine höhere Schule mit<br />
Abitur/Matura abgeschlossen (EU Bildungsgrad 4) und 52 (23%) Personen verfügten über<br />
einen Hochschulabschluss (EU Bildungsgrad 5). Insgesamt 109 (68.6%) Personen wurden<br />
anhand ihrer Performanz in der standardisierten Fahrprobe (Wiener Fahrprobe) als sichere<br />
Fahrer beurteilt.
Die Korrelationen zwischen den einzelnen Tests und dem Außenkriterium können Tabelle 24<br />
entnommen werden.<br />
Tabelle 24: Korrelationen zwischen den Testverfahren und dem Außenkriterium<br />
AMT<br />
DT<br />
RT<br />
kogn. Geschw.<br />
RT<br />
motor. Geschw.<br />
TAVT<br />
- .120 -.390* .184* .201* -.393** .212*<br />
** p
Die inkrementelle Validität und relative Relevanz der einzelnen Tests kann der Tabelle 26<br />
entnommen werden. Die relative Relevanz gibt an, mit welchem Anteil der entsprechende<br />
Test zur Validität des Vorhersagemodells beiträgt.<br />
Tabelle 26:Inkrementelle Validität und relative Relevanz der einzelnen Testverfahren<br />
Testbezeichnung Inkrementelle Validität Relative Relevanz<br />
Numerisch-induktives Denken (INSBAT-<br />
NID)<br />
Arithmetische Kompetenz<br />
(INSBAT-AK)<br />
Betrachtungszeit<br />
(INSBAT-BZ)<br />
Entscheidungsfähigkeit<br />
(INSBAT-EF)<br />
Figural-induktives Denken<br />
(INSBAT-FID)<br />
0.157 13.4%<br />
0.205 16.9%<br />
0.195 16.2%<br />
0.167 14.1%<br />
0.324 24.6%<br />
Numerische Flexibilität (INSBAT-NF) 0.105 4.6%<br />
Tachistoskopischer<br />
Verkehrsauffassungstest (ATAVT)<br />
0.117 10.2%<br />
Die Ergebnisse sprechen bei einer relativen Relevanz von 10.2% für die Kriteriumsvalidität<br />
von ATAVT im Bereich der Pilotenauswahl.<br />
Ein grundlegendes Ziel der Testkonstruktion des ATAVT war die vollständige inhaltliche und<br />
psychometische Äquivalenz zwischen ATAVT und TAVTMB (Biehl, 1996). Um die<br />
Erreichung dieses Entwicklungsziels zu überprüfen, wurden bei der Untersuchung der<br />
Eindimensionalität des Itempools des ATAVT neben den neu konstruierten Aufgaben des<br />
ATAVT auch die Aufgaben des TAVTMB miteinbezogen. Gilt das Rasch-Modell (Rasch,<br />
1980) für den gemeinsamen Itempool aus den beiden Testverfahren, kann die Annahme<br />
einer Äquivalenz der beiden Tests beibehalten werden. Dies würde bedeuten, dass ATAVT<br />
und TAVTMB exakt dieselbe latente Fähigkeit messen. Diese Hypothese wurde von<br />
Sommer, Herle, Häusler & Arendasy (2008) mit Hilfe eines Link-Designs empirisch überprüft<br />
(für Details: Kapitel 2.2.4.). Die Autoren konnten in ihrer Studie nachweisen, dass für den<br />
gemeinsamen Itempool Rasch-Homogenität gilt. Dies bedeutet, dass die beiden<br />
Testverfahren nachweislich ein und dieselbe Fähigkeitsdimension messen.<br />
Durch die Verwendung des Link-Designs konnten zudem die Schwierigkeitsparameter der<br />
ATAVT-Items an die Itemschwierigkeitsparameter des TAVTMB abgeglichen werden (vgl.<br />
Holland & Dorans, 2006; Kolen & Brennan, 2004). Dies hat den Vorteil, dass der<br />
Personenparameter des ATAVT direkt auf den TAVTMB übertragen werden kann, sodass<br />
die Testergebnisse des ATAVT bzw. TAVTMB auf den jeweils anderen Test übertragbar<br />
sind. Die beiden Testverfahren sind somit nicht nur hinsichtlich der gemessenen<br />
Fähigkeitsdimension, sondern auch hinsichtlich der vom Probanden in den beiden<br />
Testverfahren erzielten Leistung direkt miteinander vergleichbar bzw. ineinander<br />
überführbar. Hieraus ergibt sich auch der Vorteil, dass Studien zur Validität mit einem der<br />
beiden Testverfahren direkt auf das andere Verfahren übertragen werden können. ATAVT<br />
und TAVTMB sind somit nicht nur inhaltlich, sondern auch psychometrisch äquivalent. Der<br />
wesentliche Vorteil des ATAVT gegenüber von TAVTMB besteht jedoch in (1) einer höheren<br />
Messpräzision auf Einzelfallebene durch die adaptive Testvorgabe sowie (2) in einer<br />
erhöhten Testsicherheit, die mit Hilfe der adaptiven Testvorgabe und der Item-Exposure-<br />
Control realisiert werden kann
Die Normdaten wurden in den Jahren 2007 bis 2008 im Forschungslabor der Firma<br />
<strong>SCHUHFRIED</strong> <strong>GmbH</strong> erhoben. Die Stichprobe umfasst 574 (48.3%) Männer und 615<br />
(51.7%) Frauen. Die Geschlechtsverteilung unterscheidet sich nicht von der zu erwartenden<br />
Verteilung. Die erwartete Verteilung wurde anhand der Daten der österreichischen<br />
Volkszählung 2001 und einer Volkszählung aus Deutschland nach der Wiedervereinigung<br />
berechnet.<br />
Die Probanden weisen ein Lebensalter von 15 bis 94 Jahren auf. Der Altersmedian liegt bei<br />
41 Jahren bei einem Altersmittelwert von 42 Jahren und 4 Monaten und einer<br />
Standardabweichung von 16 Jahren und 2 Monaten. Die genaue Altersverteilung der<br />
Normstichprobe kann Tabelle 14 entnommen werden. Insgesamt 6 (0.5%) Personen der<br />
Normstichprobe haben keinen Pflichtschulabschluss (EU Bildungsgrad 1), 125 (10.5%)<br />
Personen haben eine Pflichtschule oder Realschule absolviert, allerdings ohne<br />
abgeschlossene Berufsausbildung (EU Bildungsgrad 2), 500 (42.1%) Personen haben eine<br />
abgeschlossene Berufsausbildung (EU Bildungsgrad 3), 438 (36.8%) Personen haben eine<br />
höhere Schule mit Abitur/Matura abgeschlossen (EU Bildungsgrad 4) und 120 (10.1%)<br />
Personen verfügen über einen Hochschulabschluss (EU Bildungsgrad 5).<br />
Tabelle 27:Altersverteilung der Normstichprobe<br />
Altersgruppe in Jahren Beobachtete Häufigkeiten erwartete Häufigkeiten<br />
15 bis 20 58 86<br />
21 bis 25 122 84<br />
26 bis 30 143 96<br />
31 bis 35 111 119<br />
36 bis 40 136 126<br />
41 bis 45 110 111<br />
46 bis 50 109 93<br />
51 bis 55 100 92<br />
56 bis 60 93 81<br />
61 bis 65 83 80<br />
66 bis 70 52 59<br />
71 bis 75 37 58<br />
76 bis 80 28 52<br />
81 bis 85 5 27<br />
86 und älter 2 25<br />
Hinweis: Beobachtete Häufigkeiten sind die Stichprobengrößen in der Normstichprobe.<br />
Erwartete Häufigkeiten entsprechen den Daten, die anhand der Volkszählung ermittelt<br />
wurden.
Bundesgesetzblatt Jahrgang 1998 Teil I Nr. 55 ausgegeben zu Bonn am 26. August 1998<br />
(Fahrerlaubnisverordnung-FEV). Bonn: August 1998.<br />
Bukasa, B., Wenninger, U. & Brandstätter, CH. (1990). Validierung Verkehrspsychologischer<br />
Testverfahren. Wien: Literas Universitätsverlag<br />
Calé, M. (1992). Minimal brain dysfunction and road accidents. Israel: Driver Institute<br />
Calé, M. (1992). Theory and practice of evaluating elderly drivers with ART90. Paper<br />
presented at the 13th National Conference on Specialised Transportation. Tampa,<br />
October 1992.<br />
Dorsch, F., Häcker, H., Stapf, K. (Hrsg.) (1994). Psychologisches Wörterbuch. Bern,<br />
Göttin¬gen, Toronto, Seattle: Verlag Hans Huber<br />
Färber, B. (1986). Zur Validität des TAVT-N. Zschr. f. Verkehrssicherheit, 32, 178-180.<br />
Grübel-Mathyl, U. (1987). Wirkung von Neuroleptika auf relevante Aspekte der<br />
Fahrtüchtigkeit bei schizophrenen Patienten. Bergisch Gladbach: Eigenverlag der<br />
Bundesanstalt für Straßenwesen<br />
Hampel, B. (1976). Neugestaltung des verkehrsgebundenen Tachistoskopischen<br />
Auffassungs-Versuchs (TAVT). Unveröff. Schlussbericht zum Forschungsvorhaben<br />
Nr. 42 der VdTÜV. Köln: TÜV Rheinland.<br />
Hartje, W., Pach, R., Willmes, K., Hannen, P. & Weber, E. (1991). Fahreignung<br />
hirngeschädigter Patienten. Zschr. f. Neuropsychologie, 2, 100-114<br />
Hornke, L.F. (1993). Mögliche Einspareffekte beim computergestützten Testen. Diagnostica,<br />
39, 109-119<br />
Hornke, L.F. & Etzel, S. (1995). Theoriegeleitete Konstruktion und Evaluation von<br />
computergestützten Tests zum Merkmalsbereich Gedächtnis und Orientierung. In:<br />
BM der Verteidigung PII 4. Untersuchungen des Psychologischen Dienstes der<br />
Bundes¬wehr 1993/1995 Band2. München.<br />
Kamuf, H. (1988). Entwicklung und Validierung eines Testverfahrens zur Überprüfung<br />
kom¬plexer visueller Wahrnehmungsleistungen bei Kraftfahrern. Unveröff. Dipl.Arbeit,<br />
Universität, Mannheim.<br />
Karner, T. (2000). Sind verkehrspsychologische Testverfahren geeignete Instrumente, um<br />
mögliche Leistungsminderungen alkoholauffälliger Kraftfahrer aufzuzeigen? Report<br />
Psychologie, 9/2000<br />
Karner, T., Biehl, B. (2000). Kriteriumsvalidierung Verkehrspsychologischer Verfahren: PC<br />
vs. ART90. (Zur Publikation eingereicht)<br />
Karner, T. & Neuwirth, W. (2000). Validation of traffic psychology tests by comparing with<br />
actual driving. International Conference on Traffic and Transport Psychology, 4-7<br />
September, Berne Switzerland.<br />
Klebelsberg, D. & Kallina, H. (1963). Verhaltensanalyse des Kraftfahrers. In: Verkehrspsychologie<br />
II. Wien: Kleine Fachbuchreihe des Kuratoriums f. Verkehrssicherheit
Klebelsberg, D. (1982). Verkehrspsychologie. Berlin: Springer Verlag.<br />
Kroj, G. (1995). Psychologisches Gutachten Kraftfahreignung. Bonn: Deutscher Psychologen<br />
Verlag<br />
Kubinger, K.D. (1995). Einführung in die psychologische Diagnostik. Weinheim: Psycholo-gie<br />
Verlags Union<br />
Lesky, J. (1998). Messung der einfachen Reaktionszeit mit dem Wiener Reaktionsgerät -<br />
Re¬liabilität und Testeichung. Tobelbad: Eigenverlag<br />
Lienert, G.A. (1969). Testaufbau und Testanalyse. München: Psychologie Verlags Union<br />
Neuwirth, W., (2001). Extremgruppenvalidierung verkehrspsychologischer Testverfahren<br />
anhand von Zuweisungsgruppen. Psychologie in Österreich 2/2001<br />
Richter, W. (1981). Ermittlung von Normwerten bei einem Aktions- und Reaktionsversuch am<br />
Wiener Determinationsgerät und Prüfung dieser Werte im Hinblick auf die<br />
Kraftfahreignung. Unveröff. Forschungsauftrag VdTÜV Nr.38<br />
Schlag, B. (1994). Fahrverhalten älterer Autofahrer/innen. In: Tränkle U (Hrsg.). Autofahren<br />
im Alter. Köln: Verlag TÜV Rheinland.<br />
Schubert, G., Müller, A. & Senf, E. (1962). Testserie zur Untersuchung der optischen<br />
Orientie¬rung bei Kraftfahrtauglichkeitsuntersuchungen. Psychologie und Praxis, 6,<br />
147-153.<br />
Schubert, W., Schneider, W., Eisenmenger, W. & Stephan E. 820039.<br />
Begutachtungsleitlinien zur Kraftfahrereignung. Kommentar. Bonn: Kirschbaum.<br />
Schuhfried, G. (2004). Zur Normstichprobenwahl in der Fahreignungsdiagnostik. Zschr. f.<br />
Verkehrssicherheit, 28, 97-98.<br />
Sommer, M. Arendasy, M., Olbrich, A. & Schuhfried, G. (2004). Qualitätsverbesserung in der<br />
verkehrspsychologischen Diagnostik mit neuronalen Netzen: Eine Pilotstudie. Zschr.<br />
f. Verkehrssicherheit, 50, 193-198.<br />
Strohbeck-Kühner, P. (1999). Testangst bei Fahreignungsbegutachtungen: Die Angst-<br />
Leistung-Relation. Zeitschrift für Differentielle und Diagnostische Psychologie, 20 (1),<br />
39-57.<br />
Zuschlag, B. & Jacobshagen, W. (1982). Einsatz des Aufmerksamkeits-Prüf-Geräts (APG)<br />
bei Fahreignungsuntersuchungen. Zschr. f. Verkehrssicherheit, 28, 63-73.
Tabelle 1: Testverfahren des Test-Sets FeV ......................................................................... 8<br />
Tabelle 2: : Korrelationen der Leistungsmerkmale (Mediane) mit den Rohwerten der CPM .. 9<br />
Tabelle 3: Interkorrelationen der Zeitvariablen bei der Normstichprobe, Testform S3 ...........10<br />
Tabelle 4: Inkrementelle Validitäten und relative Relevanzen der beiden Testbatterien<br />
Standard und Plus ................................................................................................................11<br />
Tabelle 5: Verteilung der Stichprobenmerkmale ...................................................................12<br />
Tabelle 6: Verteilungscharakteristika der Leistungsmerkmale bei Vorgabe von S3 ..............12<br />
Tabelle 7: Modelltest für die Gesamtstichprobe ....................................................................14<br />
Tabelle 8: Modelltest nach Ausscheiden der Personen mit inadäquatem Arbeitstempo........15<br />
Tabelle 9: Korrelationen zwischen den Testverfahren inkl. Konfidenzintervalle ....................16<br />
Tabelle 10: Inkrementelle Validitäten und relative Relevanzen der beiden Testbatterien<br />
Standard und Plus ................................................................................................................18<br />
Tabelle 11: Altersverteilung der Normstichprobe (N=1475) ..................................................18<br />
Tabelle 12: Altersverteilung der Normstichprobe ..................................................................20<br />
Tabelle 13: Innere Konsistenz der Testform S1, berechnet als Cronbach Alpha auf<br />
Itemniveau. ...........................................................................................................................21<br />
Tabelle 14: Korrelationen DT mit TAVT und RT....................................................................22<br />
Tabelle 15. Inkrementelle Validität und relative Relevanz der einzelnen Tests .....................23<br />
Tabelle 16. Inkrementelle Validitäten und relative Relevanzen der beiden Testbatterien<br />
Standard und Plus ................................................................................................................25<br />
Tabelle 17: Verteilung der Stichprobenmerkmale .................................................................26<br />
Tabelle 18: Erwartete und tatsächlich beobachtete Häufigkeiten in der Stichprobe ..............26<br />
Tabelle 19: Modellzusammenfassung der schrittweisen multiplen Regression .....................28<br />
Tabelle 20: Regressionsgewichte in Modell 7 der multiplen Regression ...............................28<br />
Tabelle 21: Inkrementelle Validität und relative Relevanz der einzelnen Tests .....................31<br />
Tabelle 22: Korrelationen zwischen den Testverfahren und dem Außenkriterium .................31<br />
Tabelle 23:Inkrementelle Validität und relative Relevanz der einzelnen Tests ......................32<br />
Tabelle 24: Korrelationen zwischen den Testverfahren und dem Außenkriterium .................33<br />
Tabelle 25:Inkrementelle Validität und relative Relevanz der einzelnen Tests ......................33<br />
Tabelle 26:Inkrementelle Validität und relative Relevanz der einzelnen Testverfahren .........34<br />
Tabelle 27:Altersverteilung der Normstichprobe ...................................................................35<br />
Abbildung 1: Ergebnisausdruck FEV Anlage 5/2 ................................................................... 5<br />
Abbildung 2: Reportmuster .................................................................................................... 6<br />
Abbildung 3: Probandentastatur für die FEV Anlage 5/2 Untersuchung ................................. 7<br />
Abbildung 4: Stufen zur Klassifikation verschiedener Arten von Aufmerksamkeit (und die<br />
zugeordneten Testverfahren). ..............................................................................................16