download pdf - Psychologie - Universität Mannheim
Logisches Denken
Entwicklung und Erprobung von Tests zur Erfassung des logischen Denkens
Development and evaluation of deductive reasoning tests
Wilhelm, Oliver & Conrad, Wolfgang
Lehrstuhl Psychologie II
Universität Mannheim
Berichte des LS Psychologie II
Heft: 5
Dezember 1996
e-mail: wilhelm@tnt.psychologie.uni-mannheim.de
1
Logisches Denken
Zusammenfassung:
Die Fähigkeit zum Lösen logischer Denkprobleme wird in vielen Intelligenzstrukturtheorien
zum Kernbereich menschlicher Intelligenz gezählt. Die heute verfügbaren Aufgaben zur
Erfassung des logischen Denkvermögens weisen aber häufig zwei Schwächen auf: Erstens
sind sie das Produkt einer Testkonstruktion, der kognitionspsychologische Grundlagen
weitgehend fremd sind, und zweitens bauen sie auf Modellvorstellungen auf, die den Bereich
denkbarer logischer Probleme nur unvollständig abbilden. Die beiden neuen Verfahren zur
Erfassung des deduktiven Denkens, die auf der Grundlage der Theorie mentaler Modelle
Johnson-Laird und Byrne (1991) konstruiert wurden, sollen diesen Mängeln abhelfen.
Entsprechend der Modelltheorie wurden Items aus den Gebieten syllogistisches und räumlich
relationales Schließen entwickelt und erprobt. Zur Validierung der neuen Verfahren wurde
eine Kurzform des Berliner Intelligenz Strukturtests zur Erfassung der Verarbeitungskapazität
eingesetzt. Anhand der Modelltheorie lassen sich Erwartungen über die Schwierigkeit der
Aufgaben und den Zusammenhang der Tests zum Kriterium abgeleitet werden. Insgesamt 855
Personen nahmen an der Erprobung der beiden Tests teil. Für den syllogistischen Test konnten
die Hypothesen über die Aufgabenschwierigkeit bestätigt werden, die angenommenen
Zusammenhänge mit dem BIS-Test jedoch nur eingeschränkt . Für die relationalen Aufgaben
konnte eine Hypothese über die Aufgabenschwierigkeit nicht bestätigt werden, dagegen trafen
die Annahmen über den Zusammenhang mit Intelligenz zu. Die beiden neuen Meßinstrumente
weisen neben gemeinsamer Varianzen mit der erfaßten Verarbeitungskapazität weitere
spezifische Varianzen auf.
Schlüsselworte: logisches Denken, Intelligenz, Leistungsdiagnostik
Abstract:
The ability to solve deductive reasoning tasks is in the centre of human intelligence in most of
the current theories of intelligence structure. Available Tests which are constructed to capture
deductive reasoning have two major flaws: First, they are the result of a testconstruction
strategy that has no reference to theories of cognitive psychology. Second, the range of
deductive reasoning is not appropriately mapped into corresponding tests. To overcome these
deficits new tests are developed and evaluated which are based on the modeltheory of
deductive reasoning (Johnson-Laird & Byrne, 1991). A syllogistic and spatial relational test
with 18 items each were constructed. To validate the two new tests a short form of the
reasoning scale of the Berlin Test of intelligence structure (Jäger, Süß & Beauducel, 1996)
was used. The modeltheory of deductive reasoning allows the formulation of assumptions
about difficulties and correlations. A total of 855 subjects participated in the evaluation study.
For the syllogistic reasoning tests assumptions about the difficulty are correct. However the
correlations satisfy the assumptions only partially. For the spatial relational test one of three
difficulty assumptions is false. However the correlations satisfy all the assumptions. Beside
common variance with the reasoning test, both deductive reasoning tests show systematic
specific variance.
Key terms: deductive reasoning, intelligence
1
1. Problemstellung:
2
Logisches Denken
Während sich die allgemeine Psychologie bereits seit Beginn dieses Jahrhunderts explizit mit
dem logischen Denken befaßte (vgl. z.B. Störing, 1908), wurde diese Fähigkeit in der
differentiellen Psychologie erstmals von Wilkins (1928) thematisiert. Allerdings finden sich
bereits in den von Burt (1919) entwickelten Tests Items zur Erfassung des logischen Denkens.
Aufgaben, die die Fähigkeit zum schlußfolgernden Denken erfassen sollen, sind heute
Bestandteil aller verbreiteten Intelligenztests (Carroll, 1993). Jedoch wird unter
schlußfolgerndem Denken in erster Linie die Fähigkeit zum Lösen induktiver Denkprobleme
verstanden. In heute verbreiteten Intelligenztests findet die Erfassung des logischen
Denkvermögens im Sinne deduktiven Denkens fast keinen Raum.
So bestehen beispielsweise die häufig eingesetzten Tests von Raven (beispielsweise
Kratzmeier, 1976) sowie die verschiedenen CFT-Versionen von Cattell (beispielsweise Weiß,
1987, siehe jedoch die Diskussion von Hager & Hasselhorn, 1995 S. 213ff) ausschließlich aus
induktiven Denkproblemen. Im Mannheimer Intelligenz Test (Conrad, Büscher, Hornke,
Jäger, Schweizer, Stünzner & Wiencke 1986a; 1986b) sind neun von zehn Aufgaben zur
Erfassung der allgemeinen Intelligenz als induktiv zu klassifizieren. In der Version für Kinder
und Jugendliche (Conrad, Eberle, Hornke, Kierdorf & Nagel, 1976a; 1976b) kann nur eine
Aufgabe als bedingt deduktiv klassifiziert werden. Im Berliner Intelligenz Struktur Test
(Jäger, Süß & Beauducel, 1996) sind zwei von fünfzehn Aufgaben zur Erfassung der
Verarbeitungskapazität eindeutig deduktiv, zwei weitere haben deduktive Bestandteile,
dagegen können acht Aufgaben eindeutig als induktiv identifiziert werden.
Zu den heute noch eingesetzten Verfahren zur Erfassung des logischen Denkens (die im BIS-
Modell nur den Status von Aufgaben besitzen) zählen zwei Aufgabenarten aus dem „kit of
factor referenced tests for cognitive factors“ (French, Ekstrom & Price, 1963, Ekstrom, French
& Harman, 1976, s.a. Hertzka, Guilford, Christensen & Berger, 1954 sowie Guilford,
Christensen, Kettner, Green & Hertzka, 1954). Beschreibungen von weiteren Verfahren, die
zumindest in erster Linie als deduktive Tests verstanden werden können, finden sich in
Carroll (Carroll, 1993, S.201ff).
Möglicherweise ist die Dominanz induktiver Denkaufgaben zur Erfassung der Intelligenz
durch die psychometrisch gesehen hervorragenden Eigenschaften dieser Aufgaben begründet
(Marshalek, Lohman & Snow, 1983). Allerdings hatten deduktive Denkaufgaben nicht alle
Chancen, ihre psychometrische Brauchbarkeit unter Beweis zu stellen.
Dies ist in erster Linie auf verbreitete Intelligenzstrukturtheorien zurückzuführen. Das
logische Denkvermögen wird in fast allen Intelligenzstrukturtheorien einem Konstrukt
zugeordnet, das durch komplexe Denkprobleme markiert wird. Eine Binnendifferenzierung
dieser Denkprobleme wird allenfalls entlang einer Inhaltsdimension versucht. Die Fähigkeit
zum Lösen komplexer Denkprobleme wird im angloamerikanischen Sprachraum
üblicherweise als reasoning bezeichnet (beispielsweise Horn, 1962, Guilford, 1967, Royce,
1973), ein Konstrukt, dem in der deutschsprachigen Psychologie am ehesten die
Verarbeitungskapazität aus dem Berliner-Intelligenz-Struktur-Modell (BIS-Modell) (Jäger,
1984) entspricht. Im BIS-Modell wird das Konstrukt der Verarbeitungskapazität (K) nach
Inhaltsdomänen (figural, verbal und numerisch) binnendifferenziert, nicht jedoch nach
operativen Domänen wie deduktives und induktives Denken.
Formal können deduktive von induktiven Schlüssen dadurch unterschieden werden, daß
erstere notwendig wahr und gehalterhaltend sind, während letztere nicht notwendig wahr,
dafür aber gehaltvermehrend sind. Auf einer psychologischen Ebene, die sich an den
Aufgabenanforderungen orientieren sollte, können deduktive und induktive Aufgaben
ebenfalls unterschieden werden. Bei deduktiven Aufgaben sollen aus Prämissen notwendige
Logisches Denken
Schlußfolgerungen abgeleitet werden oder vorgegebene Schlußfolgerungen hinsichtlich ihrer
formalen Korrektheit beurteilt werden. Bei induktiven Aufgaben muß demgegenüber eine
Regel erkannt bzw. gefunden werden, die anschließend angewandt wird. Bei induktiven
Aufgaben sollte der Teil der Regelanwendung nicht leistungsbegrenzend wirken, sondern nur
das Regelerkennen.
Der Versuch einer Binnendifferenzierung der Verarbeitungskapazität anhand der
Unterscheidung induktive vs. deduktive Aufgaben ist mit dem Aufgabenmaterial des BIS-4
Tests (Jäger, Süß & Beauducel, 1996) nicht gelungen (Süß, 1996). Ähnliche Versuche wurden
bereits in den achtziger Jahren unternommen, hier jedoch ohne eindeutige Ergebnisse.
Basierend auf einer Reklassifikation üblicher induktiver und deduktiver
Intelligenztestaufgaben gelangen Colberg, Nester und Cormier (1982) zu der Auffassung, daß
die bisherige Aufgabenauswahl die Diskriminierung der Fähigkeiten „induktives
Denkvermögen“ und „deduktives Denkvermögen“ begünstigen. Anhand der gezielten
Entwicklung induktiver und deduktiver Aufgaben versuchten sie zu belegen, daß die
Leistungen bei induktiven und deduktiven Aufgaben nicht sinnvoll unterschieden werden
können (Colberg, Nester & Tratner, 1985). Dieses Ergebnis hielt Reanalysen der gleichen
Daten mit einer entscheidend veränderten Aufgabenklassifikation und anderen Methoden
jedoch nicht stand (Shye, 1988).
Obwohl die Bemühungen einer Unterscheidung von mindestens zwei Bereichen des
Konstruktes „Verarbeitungskapazität“ keineswegs endgültig gelungen oder gescheitert sind,
kann beobachtet werden, daß der Einsatz logischer Denkprobleme in Intelligenzstrukturtests
sehr viel seltener ist als der Einsatz induktiver Denkprobleme, obwohl in den Beschreibungen
der entsprechenden Konstrukte die Fähigkeit, zu logisch zwingenden Schlußfolgerungen zu
kommen oder notwendig richtige Schlüsse als solche zu erkennen, nach wie vor zu den
zentralen Bestandteilen des Konstrukts zählt.
Zielsetzung dieser Arbeit war es, geeignete Instrumente zur Erfassung deduktiver
Denkleistungen zu entwickeln und zu erproben, um die Diagnose derselben zu verbessern.
Um dieses Ziel zu erreichen, wurde die Testkonstruktion konsequent auf einer
kognitionspsychologischen Grundlage betrieben.
Abgesehen von den experimentellen Arbeiten Sternbergs (Sternberg, 1980, Guyote &
Sternberg, 1981, Sternberg & Turner, 1981) liegen jedoch nur wenige
kognitionspsychologisch motivierte Arbeiten zur Differentialpsychologie des logischen
Denken vor. Über die kognitiven Grundlagen interindividueller Unterschiede in der Fähigkeit
deduktiven Denkens ist mithin wenig bekannt.
2. Kognitionspsychologische Theorien des logischen Denkens
In den Arbeiten von Woodworth und Sells (1935) wird Menschen erstmals eine völlig
unlogische Strategie bei der Bearbeitung deduktiver Probleme (hier Syllogismen) unterstellt.
Evans (Evans 1984, 1989) nimmt mit seiner Zwei-Stufen-Theorie des logischen Denkens
ebenfalls an, daß während der Bearbeitung logischer Aufgaben zunächst ein für Fehler
anfälliger heuristischer Prozeß wirkt. Demgegenüber können zwei theoretische Perspektiven
abgegrenzt werden, die davon ausgehen, daß Personen beim Bearbeiten deduktiver Probleme
im engeren Sinne logisch denken:
- sog. Regeltheorien des logischen Denkens (beispielsweise Rips, 1994) und
- die Modelltheorie des logischen Denkens (beispielsweise Johnson-Laird & Byrne, 1991).
3
Logisches Denken
Diese beiden Perspektiven sind auch in dem Sinne umfassend, daß sie logisches Denken in
zahlreichen Bereichen erklären. In Tabelle 1 sind diejenigen Bereiche der Logik aufgeführt,
die durch die beiden allgemeinen Perspektiven thematisiert wurden.
Tabelle 1: Bereiche der Logik, die in der Denkpsychologie untersucht wurden
Bereich der Logik Beispiel
syllogistisch
Alle A sind B; Alle B sind C
⇒ Alle A sind C
propositional
A oder B, nicht A, wenn B oder C dann E
⇒ E
räumlich relational A ist rechts von B, C ist links von B, D ist vor C, E ist vor B
⇒ D ist links von E
zeitlich relational A passiert vor B, B passiert vor C, D passiert während A,
E passiert während C
⇒ D passiert vor E
mehrfachquantifiziert Kein A ist wo einige B sind, alle B sind wo einige C sind
⇒ Kein A ist wo ein C ist
metadeduktiv
Für drei Personen soll folgende Regel gelten: Eine Person lügt immer, eine
Person lügt manchmal, eine Person lügt nie
Person A sagt: Ich lüge manchmal,
Person B sagt: A lügt nicht
Person C sagt: Ich lüge nicht manchmal
⇒ C sagt die Wahrheit, B lügt manchmal, A lügt immer.
Daneben gibt es spezifischere Theorien für einzelne Bereiche der Logik, wie beispielsweise
die Theorie pragmatischer Inferenzschemata (Cheng & Holyoak, 1985, 1989), die Theorie
linguistischen und graphischen Denkens (Stenning & Oberlander, 1995), die Theorie der
optimalen Datenauswahl (Oaksford & Chater, 1994) sowie Theorien, die auf klassischen
Methoden der Logik-Didaktik - wie Euler-Kreisen und Venn-Diagrammen - beruhen.
Etwas vereinfachend können Regeltheorien als syntaktische Systeme verstanden werden, in
denen korrektes (und ggf. falsches) logisches Schließen durch eine Menge verfügbarer
Inferenzschemata gewährleistet wird. Logische Denkprobleme werden im Arbeitsgedächtnis
in Form mentaler Sätze repräsentiert. Die Symbole, aus denen sich die mentalen
Repräsentationen zusammensetzen, werden gemäß einer Menge verfügbarer Regeln
manipuliert. Das Ergebnis dieser Manipulationen ist in der Regel eine korrekte
Schlußfolgerung. Regeltheorien variieren erheblich in Art und Umfang der postulierten
Inferenzschemata (Braine & Rumain, 1983, Braine, Reiser & Rumain, 1984, Osherson 1974,
1975, 1976, Rips, 1983, 1994).
Die empirischen Belege für die vorhandenen Regeltheorien sind jedoch äußerst spärlich, und
die Theorien sind oft so flexibel, daß kaum Bedingungen angegeben werden können, die sie
falsifizieren. Die Inhaltsgebundenheit menschlichen Denkens wird von keiner Regeltheorie
adäquat berücksichtigt. Das stärkste Argument gegen verschiedene Regeltheorien ist jedoch
ihre empirische Schwäche. Während Regeltheorien erst auf einige Teilbereiche der Logik mit
eher bescheidenem empirischen Erfolg angewandt wurden (Rips, 1994) erwies sich die
Modelltheorie als äußerst fruchtbar bei der Erklärung und Vorhersage zahlreicher Phänomene
in verschiedenen Bereichen des deduktiven Denkens (Johnson-Laird & Byrne, 1991)
Die Grundidee der Theorie mentaler Modelle ist, daß schlußfolgerndes Denken die
Manipulation von Modellen ist (Johnson-Laird, 1983, DeSoto, London & Handel, 1965).
Deduktives Denken ist bei weitem nicht die einzige Denkart, die die Manipulation mentaler
4
Logisches Denken
Modelle erfordert. Ähnliches gilt für induktives und analoges Denken, Problemlösen und die
Erzeugung neuer Ideen, jedoch nicht für eher prozeduralisierte Tätigkeiten wie beispielsweise
Kopfrechnen (Johnson-Laird, 1993). Die Theorie mentaler Modelle ist für den Bereich des
deduktiven Denkens am weitesten ausgearbeitet und überprüft.
Genau wie die Regeltheorien des logischen Denkens postuliert auch die Theorie mentaler
Modelle eine deduktive Kompetenz. Mit diesem Postulat ist die Auffassung verbunden, daß
Personen prinzipiell rational denken, auch wenn sie bei gegebenen Problemen von diesem
Standard gelegentlich abweichen. Im Gegensatz zu den Regeltheorien ist der entscheidende
Mechanismus in der Modelltheorie deduktiven Denkens jedoch semantischer und nicht
syntaktischer Art (Johnson-Laird, 1983, Hinnersmann, 1989).
Der Schlußfolgerungsprozeß läuft in drei Phasen ab. In Phase eins werden die Prämissen
verstanden. Hierbei kommen sowohl Sprachverständnis als auch Weltwissen ins Spiel. Ein
internes Modell des von den Prämissen beschriebenen Weltzustandes wird konstruiert. In der
zweiten Phase des logischen Denkens wird eine sparsame Beschreibung des konstruierten
Modells vorgenommen. Dabei soll die Beschreibung etwas enthalten, das in den Prämissen
selbst nicht explizit formuliert war. Kann eine solche Beschreibung der internen Modelle nicht
erzeugt werden, so wird der Prozeß mit dem Ergebnis „keine Schlußfolgerung möglich“
abgebrochen. Die dritte Phase ist der Suche von Gegenbeispielen zu der in Phase zwei
gefundenen Schlußfolgerung vorbehalten. Kann kein Modell konstruiert werden, das mit den
Prämissen vereinbar und mit der Konklusion unvereinbar ist, so ist die Konklusion logisch
notwendig wahr. Kann ein Modell mit einem Gegenbeispiel konstruiert werden, so ist die
Schlußfolgerung nicht notwendig wahr und kann daher nicht logisch erschlossen werden.
Existiert ein Gegenbeispiel zum konstruierten Modell, beginnt der Prozeß erneut in Phase
zwei. Der Prozeß ist spätestens dann beendet, wenn alle möglichen Modelle bearbeitet
wurden. Ist die Anzahl möglicher Modelle hoch, wird der Prozeß in der Regel aufgrund von
Einschränkungen der Arbeitsgedächtniskapazität abgebrochen.
In den beiden ersten Phasen der Schlußfolgerung wird keine speziell deduktive Arbeit
verrichtet. Das deduktive Denken unterscheidet sich hinsichtlich der Verstehens- und
Beschreibensaspekte nicht von anderen „Denkarten“. Nur in der dritten Phase des
Deduktionsprozesses wird besondere logische Arbeit verrichtet: Die Suche nach
Gegenbeispielen. Der Schlußfolgerungsprozeß beschränkt sich aufgrund der limitierten
Arbeitsgedächtniskapazität auf die Konstruktion einer möglichst minimalen Anzahl mentaler
Modelle, die auch nur die erforderlichen Elemente enthalten.
Die Modelltheorie erklärt das Schlußfolgern mit Propositionen (Johnson-Laird, Byrne &
Schaecken, 1992; Johnson-Laird, Byrne & Schaecken, 1994; Klauer & Oberauer, 1995),
räumlichen (Ehrlich & Johnson-Laird, 1982; Mani & Johnson-Laird, 1982; Byrne & Johnson-
Laird, 1989) und zeitlichen Relationen (Schaecken & Johnson-Laird, 1995, Schaecken,
Johnson-Laird & d’Ydewalle, 1996), Syllogismen (Johnson-Laird & Steedman, 1978;
Johnson-Laird & Bara; 1984, Oakhill & Johnson-Laird, 1985, 1989; Johnson-Laird, Oakhill &
Bull, 1986, Johnson-Laird & Byrne, 1989), multipel quantifizierten Aussagen (Johnson-Laird
& Tabossi, 1989) und metadeduktiven Schlüssen (Johnson-Laird & Byrne, 1990; Johnson-
Laird & Byrne, 1991). Zu einem der neueren Anwendungsfelder gehört das probabilistische
Denken (Johnson-Laird, 1994). Der gegenwärtige Stand der Modelltheorie wird von Johnson-
Laird und Byrne (1991, 1993a, 1993b) zusammengefaßt.
Syllogismen sind logische Schlüsse auf der Basis der Quantoren „Alle“, „Einige“, Einige
nicht“ und „Kein“. Für die vier syllogistischen Prämissen sehen die Ausgangsmodelle so aus:
5
„Alle A sind B“:
[A] B
[A] B
...
„Einige A sind B“:
A B
A B
...
„Kein A ist B“:
[A]
[A]
B
B
...
Logisches Denken
„Einige A sind nicht B“:
A
A
A
A
[B]
[B]
...
Die eckigen Klammern zeigen hier an, daß die A (in Relation zu den B) erschöpfend
repräsentiert sind. Die drei Punkte zeigen an, daß nicht erschöpfend oder gar nicht
repräsentierte Entitäten noch auftauchen können, d.h. durch die Repräsentation nicht
ausgeschlossen sind. Wenn ein Element in Relation zu den anderen repräsentierten Elementen
erschöpfend repräsentiert ist, werden die einzelnen Elemente in Klammern gesetzt.
Für die Prämisse „Kein A ist B“ ist es durchaus auch möglich, die B’s in eckige Klammern zu
setzen. Für die Prämisse „Einige A sind nicht B“ müssen die A, die neben den B in eckigen
Klammern stehen, nicht notwendig auftreten.
Die Information aus der zweiten Prämisse wird dem Modell der ersten Prämisse hinzugefügt.
Übereinstimmende Elemente werden dabei in Deckung gebracht. Liegen die beiden Prämissen
„Alle B sind A“ und „Kein B ist C“ vor, so resultieren die folgenden drei alternativen
Modelle:
[A [B]] [A [B]] [A [B]]
[A [B]] [A [B]] [A [B]]
[C] A [C] A [C]
[C] [C] A [C]
... ... ...
Die drei Modelle unterstützen die folgenden Schlußfolgerungen:
Modell 1 Modell 2 Modell 3
Kein A ist C Einige C sind nicht A Einige A sind nicht C
Nur die Schlußfolgerung „Einige A sind nicht C“ wird durch keines dieser Modelle
zurückgewiesen. Sie ist daher als einzige logisch gültig. Der Theorie mentaler Modelle
entsprechend sind Syllogismen, die die Konstruktion von drei Modellen erfordern,
entschieden schwerer als Syllogismen, die die Konstruktion nur eines Modells erfordern.
Diese Vorhersage ist inzwischen empirisch gut belegt (beispielsweise Johnson-Laird & Bara,
1984).
Völlig äquivalent wird die Modelltheorie auch auf räumlich relationales Schließen angewandt.
Aus den Prämissen: „A ist links von B.“, „B ist rechts von C.“ und „A ist links von C.“, kann
das mentale Modell
A C B
gebildet werden.
Für die Prämissen: „A ist links von B.“, „B ist rechts von C.“, „D ist über C.“ und „E ist über
B.“, ist die Bildung von zwei mentalen Modellen erforderlich, die die folgende Form haben:
Modell 1 Modell 2
D E D E
C A B A C B
Beide Modelle unterstützen die Schlußfolgerung, daß D links von E ist.
Anhand der syllogistischen und räumlich relationalen Beispiele kann leicht gesehen werden,
daß Aufgaben, die die Konstruktion mehrerer mentaler Modelle erfordern, die Arbeitsgedächtniskapazität
deutlich höher belasten als Aufgaben, zu deren Lösung die Konstruktion
6
Logisches Denken
nur eines mentalen Modells erforderlich ist. Die Modelltheorie prognostiziert, daß Schlüsse
insbesondere dann schwer sind, wenn sie die Konstruktion mehrerer mentaler Modelle
erfordern, da mit jedem mentalen Modell die Arbeitsgedächtnisbelastung ansteigt. Es besteht
jedoch die Möglichkeit, daß Denkprobleme, die die Konstruktion mehrerer Modelle erfordern,
auch aus regeltheoretischer Sicht komplexer sind. In Ermangelung einer Regeltheorie, die die
kognitiven Prozesse beim Beantworten räumlich relationaler Fragen erklärt, wurde von
Johnson-Laird und Byrne (1991) die Länge der logischen Ableitung als Maß für die
vorhergesagte Schwierigkeit von Aufgaben aus der Perspektive der Regeltheorie gewählt. Die
empirischen Befunde stützen die Modelltheorie des räumlich relationalen Schließen. Die
Länge der formalen Ableitung ist kein geeignetes Maß zur Vorhersage von
Schwierigkeitsunterschieden zwischen verschiedenen räumlich relationalen Problemen (für
das zeitlich relationale Schließen siehe jedoch Vandierendonck & De Vooght, 1996).
Zwei Aspekte der Modelltheorie bedürfen in Zukunft jedoch weiterer Erforschung. Zum einen
ist gegenwärtig kein Mechanismus bekannt, der die Suche nach Gegenbeispielen steuert und
überwacht. Zum anderen wird der häufig beobachtete Figureneffekt (Figur bezieht sich dabei
auf die Abfolge der in den Prämissen genannten Mengen bzw. Objekte und kann die vier
Ausprägungen A-B/B-C, A-B/C-B, B-A/B-C und B-A/C-B annehmen) durch das sogenannten
„first in first out“- Prinzip (Johnson-Laird & Bara, 1984, Bara, Bucciarelli & Johnson-Laird,
1995) nicht vollständig erklärt (Oberauer & Wilhelm, 1996).
Die Theorie mentaler Modelle liefert die bisher am besten und umfangreichsten ausgearbeitete
Erklärung deduktiven Denkens. Die Berücksichtigung systematischer Antworttendenzen ist
vergleichsweise einfach möglich, und die Theorie der mentalen Modelle ist empirisch weit
besser bestätigt als jede gegenwärtig verfügbare Alternativerklärung des logischen Denkens.
Auf Kritik (Ford, 1985, 1995; Evans, 1993a; Ormerod, Manktelow & Jones, 1993) auch von
Seiten der mentalen Logik (Bonatti, 1994; O´Brien, Braine & Yang, 1994) antworten
Johnson-Laird, Byrne und Schaecken (1994). Daher stützt sich die Testkonstruktion auf die
Modelltheorie
3. Die Entwicklung der Testverfahren
Tests zur Erfassung des logischen Denkens wurden bislang in den verschiedensten
Einkleidungen entwickelt und erprobt. Die Einkleidungen können zunächst danach
unterschieden werden, ob sie abstrakt oder konkret sind. Abstrakte Einkleidungen werden hier
von den weiteren Überlegungen ausgeschlossen, da sie die Vorstellung der beschriebenen
Sachverhalte und damit den Aufbau mentaler Modelle erschweren. Empirisch weisen logische
Denkaufgaben mit abstrakter Einkleidung außerdem den geringsten Zusammenhang zur
Arbeitsgedächtniskapazität auf (Tabelle 5 und 6 in Gilinsky & Judd, 1993). Eine weitere
Unterteilung konkreter Aufgaben betrifft den Zusammenhang mit dem Vorwissen.
Einkleidungen logischer Probleme können mit dem Vorwissen vereinbar oder unvereinbar
sein. Probleme, die mit dem Vorwissen unvereinbar sind weisen eine höhere Schwierigkeit
auf (Gilinsky & Judd, 1993). Diese Schwierigkeit kommt vermutlich durch
Aufgabenanforderungen zustande, die nichts mit dem logischen Denken im engeren Sinne
(der Suche nach Gegenbeispielen zu vorläufig konstruierten Konklusionen) zu tun haben,
nämlich die Inhibition konträren Vorwissens. Daher werden auch sie von den weiteren
Überlegungen ausgeschlossen. Der in konkreten Problemen vorgegebene Sachverhalt, der mit
dem Vorwissen vereinbar ist, kann nun eine Möglichkeit ausdrücken oder der Wissensbasis
der Person entsprechen. Im zweiten Fall ist es nicht erforderlich eine Schlußfolgerung zu
konstruieren, da die Denkprobleme auf der Grundlage des Vorwissens gelöst werden können.
7
Logisches Denken
Die folgende Abbildung gibt die diskutierten Einkleidungen logischer Denkprobleme mit
Beispielen wieder.
Abbildung 1: Mögliche Einkleidungen logischer Denkprobleme
Zahlreiche der bisher entwickelten Verfahren weisen keine Einkleidung auf, die geeignet ist,
die angezielten Denkprozesse auch tatsächlich auszulösen. Eine konkrete mit dem Vorwissen
vereinbare Einkleidung, die eine Möglichkeit ausdrückt, ist zur Erfassung der Fähigkeit zum
Lösen logischer Denkprobleme am besten geeignet und soll daher hier realisiert werden.
Wichtiger noch als die Einkleidung der logischen Probleme ist die Auswahl logischer
Domänen (vgl. Tabelle 1). Das mehrfachquantifizierte Schließen und das metadeduktive
Schließen sind weniger geeignet, bereits differentialpsychologisch untersucht zu werden. Für
mehrfachquantifiziertes Schließen liegen gegenwärtig nicht genug experimentelle Daten vor,
die einen solchen Schritt rechtfertigen könnten. Außerdem ist es nicht unplausibel
anzunehmen, daß in Analogie zur Negation von Komponenten von Syllogismen die
Einführung zusätzlicher Quantifizierungen die Aufgaben erschwert und die Trennschärfen
senkt (Nester & Colberg, 1984). In der Theorie mentaler Modelle wird angenommen, daß
beim Bearbeiten metadeduktiver Aufgaben neben dem gewöhnlichen Schließen eine
Komponente höherer Ordnung, die den Schlußfolgerungsprozeß erst in Gang bringt, sowie
verschiedene Strategien eingesetzt werden. Metadeduktives Schließen fällt also aus
modelltheoretischer Sicht aus dem Rahmen des gewöhnlichen logischen Denkens heraus.
Schließlich liegen auch aus regeltheoretischer Perspektive einige erfolgreiche Arbeiten zum
metadeduktiven Denken vor (Rips, 1989, 1990). Hinsichtlich des zeitlich relationalen
Schließens sind die empirischen Befunde derzeit nicht einheitlich zu interpretieren
(Vandierendonck & De Vooght, 1996 sowie Schaecken, Johnson-Laird & d’Ydewalle, 1996
berichten widersprüchliche Befunde).
Für syllogistisches und relationales Schließen liefert die Modelltheorie die am besten
geeignete kognitionspsychologische Erklärung. Daher wurden zunächst Tests aus diesen
Bereichen entwickelt und erprobt. Ein Test zur Erfassung des propositionalen Denkens ist
derzeit in Entwicklung.
Für das syllogistische Schließen wurden zwei Parallelversionen entwickelt, für das räumlich
relationale Schließen vier. Die Bearbeitungszeiten für beide Tests wurden anhand von
Erfahrungen in Vorversuchen festgelegt. Um die Wirksamkeit von Speedeffekten eindämmen
zu können, bzw. in den drei Teilabschnitten auf einem vergleichbaren Niveau zu halten,
wurden beide Tests in je drei Teile gleicher Itemanzahl geteilt, die nacheinander in großzügig
bemessenen, gleich großen Zeitintervallen bearbeitet wurden. Durch diese Maßnahme sind
Speedeffekte zumindest für alle Itemblöcke in gleichem Umfang wirksam und nicht selektiv
bei den schwierigen Items am Testende. Durch die Wahl geeigneter Bearbeitungsintervalle für
8
Logisches Denken
die einzelnen Itemblöcke sollte die Wirksamkeit von Speedeffekten möglichst reduziert
werden. Für jeden Aufgabenblock (zu je sechs Items) wurde ein großzügiges Zeitlimit von
zwölf Minuten vorgegeben.
Die drei Aufgabenblöcke wurden nach aufsteigender erwarteter Schwierigkeit angeordnet.
Während für die räumlich relationalen Tests je sechs Ein-, Zwei- und Dreimodellitems
entwickelt wurden, war dies für die syllogistischen Tests nicht möglich, ohne logisch
äquivalentes Material in ein und demselben Test mehrfach unterbringen zu müssen. Die
syllogistischen Items wurden ebenfalls nach aufsteigender erwarteter Schwierigkeit
angeordnet. Im ersten Block von 6 Items sind nur Einmodellschlüsse enthalten, im zweiten
Block drei Ein- und zwei Zweimodellschlüsse sowie ein Dreimodellschluß. Im dritten Block
sind nur Dreimodellschlüsse enthalten.
Kombiniert man die 4 verschiedenen syllogistischen Aussagen „Alle A sind B“, „Einige A
sind B“, „Kein A ist B“ und „Einige A sind nicht B“ paarweise miteinander, so ergeben sich
16 Alternativen. Jede dieser Alternativen kann in vier Figuren dargeboten werden, so daß
insgesamt 64 Syllogismen resultieren. Von diesen 64 möglichen Kombinationen führen aber
nur 27 zu gültigen und sinnvollen Schlußfolgerungen. Tabelle 2 gibt für jede Figur die
Prämissenkombinationen an, die zu gültigen Schlüssen führen. Dabei steht „a“ für Prämissen
der Form „Alle _ sind _.“, „i“ für „Einige _ sind _.“, „e“ für „Kein _ ist _.“ und „o“ für
„Einige _ sind nicht _.“.
Tabelle 2: Syllogistische Prämissenkombinationen mit gültigen Schlußfolgerungen
A-B / B-C a 1 i e o Σ
a X X X 3
i X 1
e X X 2
o 0
Σ 2 2 2 0 6
B-A / C-B a i e o Σ
a X X 2
i X X 2
e X X 2
o 0
Σ 3 1 2 0 6
A-B / C-B a i e o Σ
a X X 2
i X 1
e X X 2
o X 1
Σ 2 1 2 1 6
B-A / B-C a i e o Σ
a X X X X 4
i X X 2
e X X 2
o X 1
Σ 4 2 2 1 9
1
Diese 27 Syllogismen erlauben eine Schlußfolgerung von A nach C. Elf dieser 27 Prämissenkombinationen
erlauben jedoch zusätzlich eine Schlußfolgerung von C nach A, so daß die Anzahl
korrekter Deduktionen insgesamt 38 beträgt.
Aus Tabelle 2 geht auch hervor, daß für einige Prämissenkombinationen in keiner Figur eine
gehaltvolle Schlußfolgerung existiert.
9
10
Logisches Denken
Für 11 der 27 gültigen Syllogismen sind zwei Schlußfolgerungen korrekt. Insgesamt
existieren daher zu den Syllogismen des aristotelischen Namenskalküls 38 korrekte
Schlußfolgerungen. Nimmt man einen (den einfachsten) dieser 38 Syllogismen als Beispiel in
die Instruktion auf, so verbleiben 37 Schlüsse. Der einfachste Syllogismus weist die
Prämissenkombination aa in der Figur A-B / B-C auf. Da dieser Syllogismus zwei gültige
Schlußfolgerungen hat („Alle A sind C“ sowie „Einige C sind A“) entfallen beide
Syllogismen für den eigentlichen Test (um Mißverständnissen vorzubeugen). Es verbleiben
also 36 Syllogismen, die, in zwei gleich große Gruppen aufgeteilt, die beiden Paralleltests
bilden, die hier entwickelt wurden. Tabelle 3 informiert über die Zuordnung der Items zu den
Tests A und B für die jeweils eine gleich hohe, insgesamt mittlere Schwierigkeit zu erwarten
war. Da bisherige Untersuchungen in der Regel ein offenes Antwortformat benutzten, ist es
schwer, zuverlässig abzuschätzen, wie sich die Schwierigkeit der Items verändert, die zwei
gültige Schlußfolgerungen aufweisen, von denen allerdings nur eine in den
Antwortalternativen enthalten ist. Zwar wurde beiden Schlüssen die gleiche erwartete
Schwierigkeit zugeordnet es ist jedoch davon auszugehen, daß der zweite Schluß mit der
generellen Schlußrichtung C-A schwerer als der erste Schluß ist (der generell die
Schlußrichtung A-C aufweist) (Oberauer & Wilhelm, 1996). Diese Regel sollte insbesondere
dann gelten, wenn die Schlußfolgerung partikulär ist. Experimentelle Untersuchungen, die
Syllogismen in einem offenen Antwortformat vorgaben (beispielsweise Johnson-Laird &
Bara, 1984) belegen diese Annahme, ohne eine Aussage darüber zu erlauben, wie schwer die
jeweils zweite Schlußfolgerung tatsächlich ist (d. h. wenn sie die einzig mögliche richtige
Antwortalternative ist). Um die Parallelität der Tests durch diese Ungewißheit nicht zu
gefährden, wurden die zweiten Schlußfolgerungen nach ihrer Prämissenkombination soweit
wie möglich gleich verteilt. Neben der angestrebten Gleichverteilung der zweiten Prämissen
auf die beiden Parallelvarianten sollten auch die Items pro Figur und die Prämissenart soweit
wie möglich für beide syllogistischen Tests übereinstimmen. Daß dieser Plan nicht perfekt
umgesetzt werden konnte, kann Tabelle 3 entnommen werden. Aufgrund der eingeschränkten
Kombinationsmöglichkeiten, waren kleinere Abweichungen nicht zu vermeiden.
Tabelle 3: Zuordnung der Items zu den beiden syllogistischen Paralleltests (erwartete Schwierigkeiten
aus Johnson-Laird & Byrne, 1991)
Test A
Test B
1. Schluß 2. Schluß 1. Schluß 2. Schluß
1 Modell A-B / B-C ia (,88) ia (,88)
A-B / B-C ae (,74) ae (,74)
B-A / C-B aa (,63) ai (,86) ai (,86) aa (,63)
B-A / C-B ea (,70) ea (,70)
A-B / C-B ea (,79) ae (,75) ae (,75) ea (,79)
B-A / B-C ai (,69) ia (,68) ia (,68) ai (,69)
2 Modelle A-B / C-B ao (,41)
A-B / C-B oa (,34)
B-A / B-C ao (,51)
B-A / B-C oa (,31)
3 Modelle A-B / B-C ie (,38) ei (,20)
A-B / B-C ea (,11)
B-A / C-B ie (,15) ae (,8)
B-A / C-B ei (,38)
A-B / C-B ei (,28) ie (,19)
A-B / C-B
B-A / B-C ae (,15) aa (,19) aa (,19)
B-A / B-C ie (,26) ea (,16)
B-A / B-C ei (,23)
durchschnittliche erwartete
Schwierigkeit
0,499 0,498
Logisches Denken
Die Einkleidung der syllogistischen Tests sollte möglichst neutral sein. Daher wurden Wörter
gesucht, die möglichst allgemein bekannt sind. Dazu passende Relationen sollten es erlauben,
Prämissen und Konklusionen zu generieren, die inhaltlich möglichst wenig Bezug zum
Vorwissen haben, aber trotzdem keine Unmöglichkeiten bzw. Absurditäten ausdrücken.
Obwohl räumlich relationale Denkprobleme durch zahlreiche Möglichkeiten der
Itemgestaltung einen weit besseren Rahmen für den Entwurf psychometrischer
Meßinstrumente bieten als Syllogismen, ist die Erforschung des räumlichen relationalen
Denkens weit hinter der Erforschung des syllogistischen Denkens zurück. Dieses
Forschungsdefizit erschwert die Testkonstruktion dahingehend, daß Schwierigkeitsquellen
räumlich relationaler Probleme weniger gut bekannt sind und daher die
Erwartungen hinsichtlich der Schwierigkeit der Fragen weniger präzise ausfallen müssen und
mit größerer Unsicherheit behaftet sind. Antworttendenzen bei der Bearbeitung räumlich
relationaler Probleme sind ebenfalls weniger gut erforscht als für syllogistische Probleme. Für
räumliche Denkprobleme sind dagegen Zeit- und Schwierigkeitsschätzungen
einzelner elementarer Informationsver-arbeitungsschritte bekannt (Sternberg, 1980).
Von besonderem Interesse für die Konstruktion des räumlich relationalen Tests ist natürlich
die Anzahl zu konstruierender mentaler Modelle. Ein Item mit der Form: „A ist links von B, B
ist links von C, C ist links von D, D ist links von E, E ist links von F, und F ist links von G“
führt zu einem mentalen Modell der Art:
A B C D E F G
das beispielsweise die gültige Schlußfolgerung „A ist links von G“ unterstützt.
Durch Vertauschung der Buchstaben in einem Satz oder der Umkehrung der Relation einer
Aussage kann die Anzahl zu konstruierender Modelle recht einfach manipuliert werden.
Tauschen im Beispiel in der ersten Prämisse A und B ihren Platz, so sind zwei räumliche
Anordnungen der Objekte mit den Prämissen vereinbar. Durch mehrere solcher
Manipulationen kann die Anzahl erforderlicher mentaler Modelle leicht auf fünf und mehr
erhöht werden.
In der erprobten Form des Tests wurden je sechs Ein-, Zwei und Dreimodellschlüsse
eingesetzt. Neben der Modellzahl wurden noch zwei weitere Itemeigenschaften gezielt
variiert. Die Länge der relationalen Items wirkt sich, schließt man die Wirksamkeit von
Strategien aus, auf die Speicherbelastung des Arbeitsgedächtnisses aus. Für jeden der drei
Itemblöcke wurden je zwei Items mit vier, sechs und acht Prämissen entwickelt. Die
Homogenität der Relation ist das dritte Merkmal, von dem angenommen werden kann, daß es
die Schwierigkeit der Items beeinflußt. Vermutlich werden heterogene Relationen durch
gedankliche Operationen „homogenisiert“. Wie in der kognitiven Psychologie üblich, ist auch
hier davon auszugehen, daß mehr Operationen zu mehr Fehlern führen. Im Test kamen je
neun Items mit homogenen und heterogenen Relationen zum Einsatz.
Die Items beschreiben grundsätzlich ein- bzw. zweidimensionale Anordnungen von
Gegenständen. Von diesen Itempaaren ist je eines mit homogenen bzw. heterogenen
Relationen versehen. Items mit homogenen Relationen weisen für die drei eingesetzten
Relationspaare links - rechts, vor - hinter und über - unter nur je eine Ausprägung auf,
während die neun heterogenen Items für ein Relationspaar beide Ausprägungen annehmen.
Weitere Möglichkeiten zur Manipulation der Schwierigkeiten relationaler Items, die nicht in
die Testkonstruktion einfließen konnten, sind die Kontinuität der räumlichen Beschreibung
(Ehrlich & Johnson-Laird, 1982), die Anzahl zu speichernder Objekte sowie die Polung der
Relationen (Clark, 1969). In Evans, Newstead und Byrne (1993) findet sich ein Überblick
über bisher untersuchte Schwierigkeitsquellen relationaler Probleme.
11
Logisches Denken
Da der Einflusses der meisten der oben genannten Komponenten auf die Schwierigkeit
unbekannt ist, muß erwartet werden, daß die Eigenschaften der Items nicht so gut
prognostiziert werden können, wie dies für die syllogistischen Tests erwartet wird. In der
Testkonstruktion können außerdem einige Komponenten keine Berücksichtigung finden.
In den Tests sollten in jedem Item verschiedene Begriffe enthalten sein, um auszuschließen,
daß Personen die räumlichen Anordnungen einzelner Aufgaben, bei der Bearbeitung anderer
Items berücksichtigen. Aus einem Wörterbuch wurden 150 Begriffe entnommen, von denen
angenommen wird, daß sie der angezielten Zielpopulation mindestens so gut bekannt sind,
daß durch Unterschiede in der Vertrautheit mit den Objekten keine Varianz zwischen
Personen entsteht.
Die Parallelvarianten des so erzeugten Tests wurden durch Permutationen der angesprochenen
Relationen erzeugt. Die Objekte, die in den Items genannt werden, wurden nicht verändert.
Ein wichtiger Punkt ist der Beschreibung der relationalen Tests hinzuzufügen. Die
kognitionspsychologischen Experimente, die im Kontext der Theorie mentaler Modelle
durchgeführt wurden, bieten die Prämissen der räumlich oder zeitlich relationalen Probleme
häufig sequentiell dar. Unter diesen sequentiellen Bedingungen müssen Versuchspersonen die
Prämissen verstehen, im Arbeitsgedächtnis speichern, vermutlich eine kontinuierliche
Ordnung der beschriebenen Objekte erzeugen und nach Widersprüchen zwischen den
erzeugten Anordnungen und den Prämissen suchen. Versuchspersonen sind vermutlich also
hauptsächlich mit dem Speichern relevanter Information beschäftigt. Da beim Lesen der
Prämissen unklar ist, nach welchen Objekten später gefragt wird, müssen alle Prämissen
gespeichert werden (evt. nach der Konstruktion einer kontinuierlichen Anordnung). Werden
die Prämissen alle gleichzeitig dargeboten, können die Objekte in eine kontinuierliche
Anordnung gebracht werden, die jederzeit von den Vpn überprüft werden kann. Zumindest die
Ausgangsprämissen müssen nicht bis zur Antwort gespeichert werden. Eine mögliche
Strategie könnte sein: „Wähle die Objekte aus, nach denen gefragt wird, und suche andere
Objekte in den Prämissen, die es erlauben, eine kontinuierliche Anordnung zu konstruieren“.
Eine potentielle Zusatzstrategie könnte sein, daß nach Möglichkeit solche Objekte ausgewählt
werden, die eine direkte Verbindung zwischen den in Frage stehenden Objekten herstellen
(Schaecken, Johnson-Laird & d’Ydewalle, 1996). Möglicherweise treten solche Strategien
insbesondere dann auf, wenn die Speicherkapazität der Versuchspersonen überschritten ist.
Diese Strategien sollten insbesondere bei Mehrmodellitems eingesetzt werden, da es
unwahrscheinlich ist, daß untrainierte Personen, fünf oder noch mehr mögliche Modelle
vollständig ausformulieren. Für das propositionale Denken liefern Johnson-Laird, Byrne und
Schaecken (1992) sowie O´Brien, Braine und Yang, (1994) einige illustrative Beispiele.
Welche Strategien mit welchem Effekt bei der Bearbeitung räumlicher Probleme eingesetzt
werden können, ist jedoch unerforscht.
Je höher die Anzahl zu konstruierender mentaler Modelle, je mehr Prämissen und je mehr
Relationswechsel eine räumliche Beschreibung enthält, um so schwieriger sollte eine
relationale Aufgabe sein.
In Tabelle 4 ist je ein Beispielitem aus den beiden logischen Denktests wiedergegeben. Für die
syllogistischen Items wurde ein Mehrfachwahl - Antwortformat vorgegeben; für die
relationalen Items mußten die Schlußfolgerungen produziert werden.
12
Logisches Denken
Tabelle 4: Beispielitems
Keine große Tasse ist rund.
Alle runde Tassen sind blau.
Einige blaue Tassen sind nicht groß.
Einige große Tassen sind nicht blau.
Keine große Tasse ist blau.
Alle blauen Tassen sind groß.
Einige blaue Tassen sind groß.
Der Kanister ist hinter der Fernbedienung.
Die Fernbedienung ist vor der Brille.
Der Mantel ist hinter dem Kanister.
Die Blume ist vor der Fernbedienung.
Die Pinzette ist unter der Fernbedienung.
Die Hose ist unter dem Mantel.
In welcher räumlichen Beziehung steht die Hose
zur Pinzette?
4. Stichprobe und Durchführung
Die Datenerhebung wurde an drei Schulen (zwei Gymnasien, eine Haupt- und Realschule)
sowie an der Universität Mannheim (bei Psychologiestudierenden der Anfangssemster sowie
TeilnehmerInnen an einem Kurs für ExistenzgründerInnen) mit insgesamt 855 Personen
durchgeführt. Die Erhebung wurde in Gruppenversuchen durchgeführt. Die Gruppengröße
schwankte zwischen fünf und 30 Personen. In Tabelle 5 sind die wichtigsten
Stichprobencharakteristika wiedergegeben.
Tabelle 5: Stichprobenbeschreibung
Jahrgang n 13 14 15 16 17 18 19 20+
8 216 106 110 110 84 20 2
9 161 75 86 88 58 12 1
10 181 94 87 87 72 16 3
11 128 57 71 60 55 8 3 2
12 46 17 29 22 23 1
13 62 29 32 33 27 2
Universität 61 40 21 4 55
Σ 855 418 436 110 172 165 146 94 67 35 59
1 Person hat keine Angaben zum Geschlecht gemacht, 7 Personen haben keine Altersangabe gemacht.
Neben den beiden Tests zur Erfassung des logischen Denkvermögens wurde zur Validierung
der neuen Verfahren eine Kurzskala zur Erfassung der Verarbeitungskapazität aus dem
Berliner Intelligenz Struktur Test (Jäger, Süß & Beauducel, 1996) vorgegeben. Neben den 6
Aufgaben, die der Kurzform des Tests entsprechen wurden zwei weitere (verbale) Aufgaben
ausgewählt, die die Bewertung der logischen Korrektheit vorgegebener Schlußfolgerungen
erfordern. Die acht eingesetzten Aufgaben sind: (1) Analogien (figural), (2) Charkow (figural)
(3) Schätzen (numerisch) (4) Tatsache-Meinung (verbal) (5) Wortanalogien (verbal) (6)
Zahlenreihen (numerisch) (7) Schlüsse (verbal) sowie (8) Schlüsse Vergleichen (verbal).
Die Gesamtstichprobe zerfällt in drei Teilstichproben. Aus organisatorischen Gründen mußte
die Datenerhebung auf 90 Minuten pro Vpn beschränkt werden. Innerhalb dieser Zeitspanne
waren jedoch nur zwei der drei Tests zu bearbeiten. Eine Gruppe bearbeitete den relationalen
Test und die BIS Aufgabenbatterie (n=301), eine weitere Gruppe bearbeitete die beiden
Logiktests (n=273) und eine dritte Gruppe bearbeitete neben dem syllogistischen Test die BIS
Aufgabenbatterie (n=277).
5. Ergebnisse
Die beiden Testverfahren weisen Mittelwerte von 9,47 (syllogistisch) bzw. 9,91 (relational)
korrekt beantworteten Items bei einer Streuung von 3,43 (syllogistisch) bzw. 4,46 (relational)
auf. Aufgrund der mittleren Schwierigkeit beider Tests kann erwartet werden, daß sie
zwischen Personen diskriminieren können. Die Häufigkeitsverteilung des relationalen Tests
weist auch im oberen Rohwertbereich noch substantielle Anteile von Personen auf (21 von
13
Logisches Denken
575 Fällen lösten alle Aufgaben korrekt), während im syllogistischen Test nur eine von 553
Personen alle Aufgaben richtig gelöst hat. Beide Testverfahren zeigten signifikante
Abweichungen von der Normalverteilung (syllogistischer Test chi 2 (15)=38,65, p
Logisches Denken
Schwierigkeiten zwischen den hier eingesetzten Items und den Ergebnissen aus Johnson-Laird
und Byrne (1991) für diese Schlüsse liegt bei 0,89, sie zeigt, daß die Veränderungen der Items
keinen nennenswerten Einfluß auf die Abfolge und Distanzen der Itemschwierigkeiten hat.
Abbildung 2: Metrischer Boxplot der syllogistischen Items
1,0
0,8
0,6
0,4
0,2
0,0
Einmodellitems
Mehrmodellitems
m+-sd
m+-2se
Die Schwierigkeiten der relationalen Items schwanken zwischen 0,34 und 0,83. Da keine
Frage eine extreme Schwierigkeit aufweist, ist nicht zu erwarten, daß die
schwierigkeitsproportionale Stichprobenteilung einen großen Effekt auf die Trennschärfen hat
(vgl. Tabelle 7). Die Teil-Ganzes korrigierten Item-Test Korrelationen schwanken zwischen
0,29 und 0,58, liegen also ausnahmslos in einem akzeptablen Bereich. Ein ähnliches Bild zeigt
sich auch für die anderen Trennschärfemaße, die im direkten Vergleich mit den
syllogistischen Items eine deutlich geringere Streuung aufweisen.
Tabelle 7: Schwierigkeiten und Trennschärfen für den räumlich relationalen Test
Item m sd
1
r it kom 2 sps 3 slope 4 Q-Index 5
1 ,81 ,40 ,31 ,13 .39 ,38 ,18
2 ,59 ,49 ,29 ,12 .30 ,30 ,24
3 ,34 ,47 ,38 ,21 .43 ,39 ,21
4 ,67 ,47 ,48 ,32 .48 ,49 ,12
5 ,45 ,50 ,45 ,28 .51 ,43 ,17
6 ,34 ,48 ,54 ,39 .56 ,52 ,12
7 ,68 ,47 ,31 ,13 .42 ,33 ,22
8 ,54 ,50 ,34 ,16 .34 ,34 ,22
9 ,36 ,48 ,53 ,39 .56 ,51 ,13
10 ,81 ,39 ,41 ,23 .49 ,48 ,12
11 ,45 ,50 ,56 ,43 .59 ,53 ,12
12 ,36 ,48 ,46 ,30 .51 ,45 ,16
13 ,71 ,45 ,35 ,17 .41 ,38 ,18
14 ,55 ,50 ,57 ,44 .58 ,57 ,10
15 ,45 ,50 ,62 ,52 .63 ,60 ,09
16 ,83 ,38 ,30 ,13 .38 ,38 ,19
17 ,49 ,50 ,58 ,44 .61 ,54 ,11
18 ,50 ,50 ,50 ,35 .50 ,47 ,14
1
: Teil-Ganzes korrigierte Item-Test Korrelation
2
: Ladung auf dem ersten unrotierten Faktor der Hauptkomponentenanalyse
3
: Schwierigkeitsproportionale Trennschärfe
4
: normierter Diskriminationsparameter der Birnbaumanalyse
5
: Q-Index (maximale Trennschärfe bei 0, 0 Trennschärfe bei ,5 maximal neg. Trennschärfe bei 1)
15
Logisches Denken
Die Vorhersage der Schwierigkeiten der relationalen Items kann dagegen nur bedingt bestätigt
werden. Zwar übt die Anzahl der Prämissen einen deutlichen Effekt auf die Schwierigkeit der
Items aus (F(2, 1148)=527,66, p
Logisches Denken
durch die Auswahl von je zwei Aufgaben, entsprechend der Auswahl in der Kurzform des
Tests (Jäger, Süß & Beauducel, 1996) ergibt sich ein α von 0,80 bei einer durchschnittlichen
Interitemkorrelation von 0,4.
Problematischer als der Einsatz einer gekürzten Variante ist die Analyse der Daten auf dem
Zellenniveau des BIS-Tests. Ob die Zellen des BIS-Modells bestimmten Fähigkeiten
entsprechen, ist nicht sicher, und ob die Erfassung dieser Zellen mit nur zwei Aufgaben für
die Zellen KN und KF überhaupt zuverlässig gelingt, ist ebenfalls offen. Zumindest der zweite
Punkt ist über den Umweg der Korrelation mit den Logiktests bestimmbar. Hohe
Korrelationen sprechen für eine zuverlässige Messung der Zellenwerte, keine Aussage ist
möglich bei geringen Korrelationen der neuen Verfahren mit den BIS-Aufgaben.
In Tabelle 8 sind die Korrelationen der verschiedenen Meßverfahren wiedergegeben. Sowohl
die Syllogismen als auch der räumlich relationale Test weisen mit der Kurzform der
Verarbeitungskapazität Korrelationen von substantieller Höhe auf. Diese Zusammenhänge
bestehen auch für die drei materialspezifischen Komponenten der BIS-K Skala. Die
Korrelationen zwischen den drei eingesetzten Leistungstests verringert sich nur unwesentlich,
wenn Drittvariablen kontrolliert werden. So bleiben die Zusammenhänge der Logiktests mit
der Kurzform zur Erfassung der Verarbeitungskapazität auch nach der Kontrolle des Alters
und der zuletzt besuchten Bildungsinstitution noch bei 0,56 (syllogistischer Test) bzw. 0,53
(relationaler Test). Die Höhe des Zusammenhangs zwischen den Testverfahren kann auch
nicht durch die Heterogenität der Gruppe erklärt werden. Im Vergleich zur
Normierungsgruppe liegt die durchschnittliche Streuung der hier untersuchten Stichprobe im
Intelligenztest mit 10,7 nur unwesentlich über der Normstandardabweichung von 10.
Tabelle 8: Interkorrelationen der eingesetzten Leistungstests
Syllogismen 1,2 räumliche figural verbal numerisch Verarbeitungskapazität
3,4
Relationen
Syllogismen ,73 5 ,55 ,56 ,53 ,50
,62
(553) (273) (277) (277) (277)
(277)
räumliche
,54 ,85 ,50 ,56 ,46
,63
Relationen
(575) (301) (301) (301)
(301)
figural ,56 ,51 ,45 6 ,57 ,58
,65
(578) (578) (578)
(578)
verbal ,62 ,55 ,56 ,77 7 ,53
,62
(578) (578)
(578)
numerisch ,50 ,47 ,57 ,52 ,47 6
,61
(578)
(578)
Verarbeitungskapazität
(578)
,65 ,63 ,64 ,61 ,61 ,83 7
1: Für alle Korrelationen gilt p
Logisches Denken
untereinander ist damit geringer als die Korrelationen mit dem externen Kriterium
Verarbeitungskapazität. Die recht geringe Korrelation verwundert insbesondere, da die
Denkvorgänge, die bei beiden Tests ablaufen sollen, gemäß der Modelltheorie im
wesentlichen auf die gleichen Ressourcen zurückgreifen sollen. Eine mögliche Erklärung
dieses niedrigen Zusammenhangs könnte darin bestehen, daß nicht immer die Denkprozesse
in Gang gesetzt wurden, die angezielt wurden. Die erwartungswiedrig geringe Schwierigkeit
der Dreimodellschlüsse des relationalen Tests könnte hierfür ein Indiz sein.
Tabelle 9 schlüsselt die Interkorrelationen der Tests in Itemgruppen gleicher Modellzahl auf.
Die Interkorrelationen der relationalen Itemgruppen liegen im Mittel über 0,60, während die
Interkorrelation der syllogistischen Itemgruppen bei nur 0,32 liegt. Die Korrelation der
syllogistischen zu den relationalen Itemgruppen liegen noch auf bzw. über diesem Wert. Eine
explorative Analyse, in die Ein- und Mehrmodellsyllogismen getrennt eingehen, scheint
aufgrund ihrer geringen Korrelation vernünftig zu sein.
Aus der Perspektive der Modelltheorie könnte der Unterschied zwischen den Ein- und
Mehrmodellsyllogismen insbesondere auf zwei Umstände zurückgeführt werden. Zunächst ist
es möglich, daß bei Einmodellsyllogismen die Arbeitsgedächtniskapazität als begrenzender
Faktor noch nicht ins Gewicht fällt. Limitierend auf die Leistung könnte hier insbesondere das
Verständnis der logischen Begriffe wirken. Diese Interpretation ist jedoch nicht sehr plausibel.
Andernorts (Kyllonen & Christal, 1990; Süß, Oberauer, Wittmann, Wilhelm & Schulze, 1996)
wurde bereits gezeigt, das Verarbeitungskapazität im großen und ganzen der
Arbeitsgedächtniskapazität entspricht. Nun weisen die Einmodellsyllogismen bereits alleine
eine Korrelation von 0,56 zur Verarbeitungskapazität auf. Eine Korrelation dieser Höhe ist
jedoch kaum zu erwarten, wenn die interindividuellen Unterschiede bei den
Einmodellsyllogismen durch subtile Interpretationsunterschiede der logischen Begriffe
zustande kommen. Daneben weisen die Mehrmodellsyllogismen, trotz vermutlich stärkerer
Arbeitsgedächtnisbeanspruchung, eine deutlich und signifikant niedrigere Korrelation zur
Verarbeitungskapazität auf als die Einmodellsyllogismen. Als zweites Gegenargument kann
ins Feld geführt werden, daß durch Unterschiede in der Interpretation der logischen Begriffe
sicher nicht alle Fehler erklärt werden können, die bei den Einmodellsyllogismen aufgetreten
sind (in der Instruktion wurde großer Wert darauf gelegt, daß alle logischen Begriffe adäquat
verstanden werden).
Die zweite Erklärung für den niedrigen Zusammenhang der Ein- und Mehrmodellsyllogismen
besteht darin, daß bei den Mehrmodellsyllogismen aktiv Gegenbeispiele konstruiert werden
müssen, um zur richtigen Schlußfolgerung zu gelangen, während dies für die
Einmodellsyllogismen nicht zutrifft. Anders formuliert kann auch behauptet werden, daß für
Einmodellsyllogismen Strategien zur korrekten Lösung führen, die nicht im engeren Sinne als
logisch bezeichnet werden können, während dies für die Mehrmodellsyllogismen nicht
zutrifft. Die Suche nach falsifizierenden Instanzen zu vorläufig konstruierten Modellen muß
demnach nur bei Mehrmodellitems stattfinden. Diese Aufgabe erschwert die
Mehrmodellitems so stark, daß ihre Schwierigkeit das Aufdecken interindividueller
Unterschiede erschwert. Dementsprechend fällt die interne Konsistenz der Mehrmodellitems
mit 0,48 sehr gering aus (die Einmodellsyllogismen weisen demgegenüber ein α von 0,77
auf). Sollte tatsächlich bei Einmodellsyllogismen das verbale Nachdenken (Polk & Newell,
1995) zur Lösung ausreichen, bei Mehrmodellsyllogismen jedoch die Suche nach
Gegenbeispielen ein kritischer Punkt sein, so kann erwartet werden, daß sich die beiden
Testteile in ihren Zusammenhängen mit externen Kriterien voneinander unterscheiden.
18
Logisches Denken
Tabelle 9: Korrelationen zwischen den beiden Logiktests
Syllog.
Einmod. 1,2
Syllog.
Mehrmod.
Relational 1
Mod.
Relational 2
Mod.
Relational 3
Mod.
Syllog.
Einmod.
,32
(553) 3 ,37
(273)
,38
(273)
,46
(273)
Syllog.
Mehrmod.
,34 ,32
(273)
,36
(273)
,32
(273)
Relational 1
Mod.
,39 ,29 ,60
(575)
,60
(575)
Relational 2
Mod.
,40 ,36 ,60 ,67
(575)
Relational 3
,45 ,32 ,61 ,68
Mod.
1: Für alle Korrelationen gilt p
20
Logisches Denken
Konstrukte gestatten. Damit werden überhaupt erst Möglichkeiten geschaffen, das Konstrukt
„Verarbeitungskapazität“ theoriegeleitet weiter zu differenzieren.
Die zentrale Forderung an die hier entwickelten Tests bestand darin, die Testkonstruktion auf
der Grundlage einer kognitionspsychologisch angemessenen Theorie zu betreiben. Der
wichtigste Vorteil einer kognitionspsychologischen Grundlage ist die Möglichkeit, die
kognitiven Prozesse und die beteiligten Ressourcen zu benennen und ihre Funktion zu
verdeutlichen. Daraus resultieren psychologisch gehaltvolle und prüfbare Annahmen über die
Schwierigkeit von Aufgaben sowie die Zusammenhänge zu externen Kriterien. Die
Modelltheorie des logischen Denkens ist aus theoretischen und empirischen Gründen den
konkurrierenden Theorien vorzuziehen. Die aus der Modelltheorie abgeleiteten
Schwierigkeitshypothesen besagen, daß unter sonst gleichen Bedingungen die Schwierigkeit
einer Aufgabe von der Anzahl zu konstruierender mentaler Modelle abhängt. Je mehr mentale
Modelle zur erfolgreichen Bearbeitung zu konstruieren sind, um so höher sollte die
Schwierigkeit sein. Dieser Schwierigkeitsanstieg ist auf die Belastung des
Arbeitsgedächtnisses zurückzuführen. Die Arbeitsgedächtniskapazität wirkt bei der
Bearbeitung deduktiver (und induktiver) Denkprobleme als begrenzender Faktor. Wenn zwei
Verfahren die gleiche kognitive Ressource belasten, dann sollten die Leistungen in beiden
Verfahren einen hohen Zusammenhang aufweisen. Daraus ergeben sich die Erwartungen
hinsichtlich des Zusammenhangs mit der Verarbeitungskapazität.
Im syllogistischen Test konnten die Unterschiede in den Itemschwierigkeiten durch die
Anzahl mentaler Modelle sehr gut erklärt werden. Kein Einmodellitem war schwerer als das
leichteste Mehrmodellitems. Die Anzahl mentaler Modelle erklärt 89% der Varianz der
Itemschwierigkeiten.
Im relationalen Test sollte die Anzahl mentaler Modelle ebenfalls eine entscheidende Größe
für die Itemschwierigkeiten sein. Dies ist jedoch nicht der Fall. Eine Erklärung dieses
Sachverhalts könnte sein, daß die Versuchspersonen bei der Aufgabenbearbeitung nicht alle
Modelle vollständig gebildet haben, sondern durch den Einsatz einer
komplexitätsreduzierenden Strategie die Items stark vereinfachen konnten. Insbesondere bei
Mehrmodellitems kann die Arbeitsgedächtnisbelastung drastisch reduziert werden, wenn eine
Rückwärtsstrategie eingesetzt wird. Dabei werden zunächst die in der Frage genannten
Objekte identifiziert. Daran anschließend werden, ohne die Unterbestimmtheit der räumlichen
Beschreibung zu berücksichtigen, so lange schrittweise benachbarte Objekte identifiziert, bis
die räumliche Relation der fraglichen Objekte erschlossen werden kann. Es muß daher davon
ausgegangen werden, daß der relationale Test nicht immer die Prozesse ausgelöst hat, die
angezielt wurden.
Die beiden anderen Annahmen hinsichtlich der Schwierigkeitsdeterminanten des relationalen
Tests erwiesen sich als korrekt. Je mehr Prämissen ein Item enthält, um so schwieriger ist es.
Wird innerhalb eines Items die Polung der Relation geändert, so erhöht dies ebenfalls die
Schwierigkeit.
Die psychometrische Betrachtung der Binnenstruktur der Tests zeigte, daß beide Verfahren
hinsichtlich ihrer internen Konsistenz (Cronbach’s α) akzeptable Werte aufwiesen. Beide
Verfahren waren jedoch nicht mit dem Raschmodell jedoch hinreichend mit dem
zweiparametrigen Birnbaummodell vereinbar. Jedoch lagen auch bei diesen Modellen noch
Abweichungen von einer perfekten Anpassung vor. Vermutlich sind die festgestellten
Abweichungen von den Modellannahmen darauf zurückzuführen, daß einerseits aufgrund der
relativ großen Stichprobe bereits kleine Unterschiede die Signifikanzschwellen überschritten
und daß andererseits die Anforderungen an erfolgreiches Aufgabenlösen recht vielschichtig
sind. Die Denkaktivitäten der Versuchspersonen umfassen neben dem Speichern des
Iteminhalts und der kurzfristigen Manipulation von Teilen der mentalen Repräsentation die
Logisches Denken
Konstruktion und Koordination von bis zu drei mentalen Modellen. Es ist also zu vermuten,
daß die wechselnden Anteile der Beanspruchung verschiedener Ressourcen mit den
Homogenitätsannahmen von einfachen probabilistischen Meßmodellen nicht völlig in
Einklang zu bringen sind. Zur Prüfung komplexerer Meßmodelle fehlt jedoch gegenwärtig
noch die theoretische Grundlage. Aus inhaltlichen Gründen sollte dennoch nicht darauf
verzichtet werden, das in Frage stehende Konstrukt möglichst breit zu operationalisieren. Eine
weitergehende Möglichkeit der probabilistischen Analyse könnte in der Prüfung von
Mischverteilungsmodellen bestehen (Rost, 1996). Es ist durchaus plausibel, von
verschiedenen Lösungsansätzen auszugehen (insbesondere für den syllogistischen Test). So
wurden verschiedentlich (Ford, 1995, Stenning & Oberlander, 1995) Personen, die eine
figural-bildhafte Strategie wählen, von Personen unterschieden, die eine verbale
Lösungsstrategie bevorzugen. Die hier vorgestellten Tests wurden jedoch nicht mit dem Ziel
entwickelt, entsprechende Untergruppen zu identifizieren, weswegen entsprechende
Berechnungen zum gegenwärtigen Zeitpunkt kaum fruchtbar sein können.
Die Zusammenhangserwartungen konnten für die beiden Gesamttests bestätigt werden. Da
beide Logiktests Korrelationen mit der Verarbeitungskapazität in einer Höhe von etwas über
.60 aufweisen, enthalten sie substantielle Varianzanteile von Intelligenztestleistungen. Bei
dem syllogistischen Test konnte jedoch post hoc ein differentieller Effekt festgestellt werden:
Nur für die Gruppe der überdurchschnittlich intelligenten Versuchspersonen bestand ein
Zusammenhang zwischen der Leistung bei den Mehrmodellsyllogismen und der Leistung bei
BIS-K. Es besteht daher Grund zu der Annahme, daß bei der Bearbeitung der
Mehrmodellsyllogismen vermutlich nur der intelligentere Teil der hier beteiligten Personen
sich mit der Suche und Konstruktion von Gegenbeispielen beschäftigt, während der weniger
intelligente Teil der Stichprobe vermutlich nur einfache Heurismen einsetzt, die nicht wie
beabsichtigt das Arbeitsgedächtnis belasten. Das bedeutet jedoch, daß ein Teil der Personen
keine im engeren Sinne logischen Denkprozesse anstellt. Der syllogistische Test scheint das in
Frage stehende Konstrukt also nur bei überdurchschnittlich intelligenten Personen zu erfassen.
Interessanterweise wurden empirische Untersuchungen zur Prüfung
kognitionspsychologischer Theorien in erster Linie mit studentischen Versuchspersonen
durchgeführt, Stichproben, die aller Wahrscheinlichkeit nach deutlich über dem Median der
hier untersuchten Stichprobe lagen. Somit ist zu befürchten, daß die gegenwärtigen
kognitionspsychologischen Theorien zum logischen Denken, die interindividuelle
Unterschiede in erster Linie auf die Arbeitsgedächtnisbeanspruchung zurückführen, nur das
Verhalten der vorrangig untersuchten überdurchschnittlich intelligenten Stichproben korrekt
beschreiben.
Neben der substantiellen Überlappung mit Intelligenztestleistungen wurde jedoch auch
angenommen, daß logische Denkleistungen von Ressourcen begrenzt werden, die nicht
identisch sind mit den begrenzenden Faktoren für andere komplexe Denkleistungen (wie
beispielsweise induktives Denken), die ebenfalls primär Verarbeitungskapazität erfordern.
Zwar wurde für beide Domänen angenommen, daß die Arbeitsgedächtniskapazität einen
entscheidenden Einfluß auf die Leistungen ausübt (für den Bereich der Intelligenz Kyllonen,
1994; Kyllonen & Christal, 1990; Oberauer; 1993; Süß, Oberauer, Wittmann, Wilhelm &
Schulze, 1996, für den Bereich des logischen Denkens beispielsweise Johnson-Laird & Byrne,
1991; Gilhooly, Logie, Wetherick & Wynn, 1993; Klauer, Oberauer, Roßnagel & Musch,
1996), dabei bleiben jedoch zwei wichtige Punkte unberücksichtigt. Erstens ist nicht
abschließend geklärt, ob Arbeitsgedächtniskapazität als eine homogene Ressource betrachtet
werden kann (Oberauer, Süß, Schulze, Wilhelm & Wittmann, 1996). Zweitens spielen
spezifische Wissens- und Strategiekomponenten bei logischen Aufgaben eine Rolle, deren
Einfluß auf interindividuelle Unterschiede nur schwer abgeschätzt werden kann.
21
Logisches Denken
Die beiden hier vorgestellten Verfahren sind demnach nur unter den gebotenen
Einschränkungen zur Erfassung des logischen Denkvermögens geeignet. Offen bleibt
insbesondere die Frage, inwieweit deduktives Denken ein eigenständiges Merkmal ist oder ob
die begriffliche Differenzierung komplexer Denkaktivitäten keinen hinreichenden
empirischen Gehalt aufweist.
7. Literatur
Bara, B.G., Bucciarelli, M. & Johnson-Laird, P.N. (1995). Development of syllogistic reasoning.
, , 157-193.
Bonatti, L. (1994). Propositional reasoning by model? , , 725-733.
Braine, M.D.S., Reiser, B.J. & Rumain, B. (1984). Some empirical justification for a theory of natural
propositional logic. In G.H. Bower (Ed.), (Vol. 18).
New York: Academic Press.
Braine, M.D.S. & Rumain, B. (1983). Logical reasoning. In J.H. Flavell & E.M. Markman (Eds.),
(4. Ausg.). New
York: Wiley.
Burt, C. (1919). The development of reasoning in children-I, 5,
68-77.
Byrne, R.M.J. & Johnson-Laird, P.N. (1989). Spatial reasoning. ,
, 564-575.
Carroll, J.B. (1993). . Cambridge, MA:
Cambridge University Press.
Cheng, P.W. & Holyoak, K.J. (1985). Pragmatic reasoning schemas. , , 391-
416.
Cheng, P.W. & Holyoak, K.J. (1989). On the natural selection of reasoning theories. , ,
285-314.
Clark, H.H. (1969). Linguistic Processes in deductive reasoning. , , 387-404.
Colberg, M., Nester, M.A. & Cormier, S.M. (1982). Inductive reasoning in psychometrics: A
philosophical corrective. , , 139-164.
Colberg, M., Nester, M.A. & Trattner, M.H. (1985). Convergence of the inductive and deductive
models in the measurement of reasoning abilities. , , 681-694.
Conrad, W., Eberle, G., Hornke, L., Kierdorf, B. & Nagel, B. (1976a).
. Weinheim: Beltz Test.
Conrad, W., Eberle, G., Hornke, L., Kierdorf, B. & Nagel, B. (1976b).
. Weinheim: Beltz Test.
Conrad, W., Büscher, P., Hornke, L., Jäger, R. Schweizer, H., Stünzner, W. & Wiencke, W. (1986a).
(3. überarbeitete und erweiterte Auflage). Weinheim:
Beltz Test.
Conrad, W., Büscher, P., Hornke, L., Jäger, R. Schweizer, H., Stünzner, W. & Wiencke, W. (1986b).
(3. überarbeitete und erweiterte Auflage). Weinheim:
Beltz Test.
DeSoto, L.B., London, M. & Handel, L.S. (1965). Social reasoning and spatial paralogic.
, , 513-521.
Ehrlich, K. & Johnson-Laird, P.N. (1982). Spatial description and referential continuity.
, , 296-306.
Ekstrom, R.B. & French, J.W. & Harman, H.H. (1976).
. Princeton, New Jersey: Educative Testing Service.
22
Logisches Denken
Evans, J.St.B. (1984). Heuristic and analytical processes in reasoning. ,
, 451-468.
Evans, J.St.B. (1989). . Hove, UK: Lawrence
Erlbaum Associates.
Evans, J.St.B. (1993). The cognitive Psychology of reasoning: An introduction.
, , 561-567.
Evans, J.St.B., Newstead, S.E. & Byrne, R.M.J. (1993).
. Hove, UK: Lawrence Erlbaum Associates.
Ford, M. (1985). Review of „mental models“. , , 897-903.
Ford, M. (1995). Two modes of mental representation and problem solution in syllogistic reasoning.
, , 1-71.
French, J.W., Ekstrom, R.B. & Price, L.A. (1963).
. Princeton, NJ: Educative Testing Service.
Gilhooly, K.J., Logie, R.H., Wetherick, N.E. & Wynn, V. (1993). Working memory and strategies in
syllogistic-reasoning tasks. , , 115-124.
Gilinsky, A.S. & Judd, B.B. (1993). Working memory and bias in reasoning across the life span.
, , 356-371.
Guilford, J.P. (1967). New York: McGraw-Hill.
Guilford, J.P., Christensen, P.R., Kettner, N.W., Green, R.F. & Hertzka, A.F. (1954). A factor analytic
study of Navy reasoning tests with the Air Force Aircrew Classification Battery.
, , 301-325.
Guyote, M.J. & Sternberg, R.J. (1981). A transitive-chain theory of syllogistic reasoning.
, , 461-525.
Hager, W. & Hasselhorn, M. (1995). Induktives Denken und die Aufgaben des Denktrainings für
Kinder I (Variablenvalidität: unabhängige Variablen). In W. Hager (Hrsg.),
. Göttingen: Hogrefe.
Hertzka, A.F., Guilford, J.P., Christensen, P.R. & Berger, R.M. (1954). A factor analytic study of
evaluative abilities. , , 581-597.
Hinnersmann, H. (1989). . Frankfurt a.M.: Lang.
Horn, W. (1962). Göttingen: Hogrefe.
Jäger, A.O. (1984). Intelligenzstrukturforschung: Konkurrierende Modelle, neue Entwicklungen,
Perspektiven. , , 21-35.
Jäger, A.O., Süß, H.-M & Beauducel, A. (1996). . BIS-Test, Form 4.
Göttingen: Hogrefe.
Johnson-Laird, P.N. (1983).
. Cambridge, MA: Cambridge University Press.
Johnson-Laird, P.N. (1993). . Hilsdale, NJ: Lawrence Erlbaum
Associates.
Johnson-Laird, P.N. (1994). Mental models and probabilistic thinking. , , 189-209.
Johnson-Laird, P.N. & Bara, B. (1984). Syllogistic inference. , , 1-61.
Johnson-Laird, P.N. & Byrne, R.M.J. (1989). Only reasoning. , ,
313-330.
Johnson-Laird, P.N. & Byrne, R.M.J. (1990). Meta-logical puzzles: Knights, knaves and Rips.
, 36, 69-84.
Johnson-Laird, P.N. & Byrne, R.M.J. (1991). . Hove, UK: Lawrence Erlbaum Associates.
Johnson-Laird, P.N. & Byrne, R.M.J. (1993a). Précis of Deduction. ,
, 323-333.
23
24
Logisches Denken
Johnson-Laird, P.N. & Byrne, R.M.J. (1993b). Mental models or formal rules.
, , 368-380.
Johnson-Laird, P.N., Byrne, R.M.J. & Schaecken, W. (1992). Propositional reasoning by model.
, , 418-439.
Johnson-Laird, P.N., Byrne, R.M.J. & Schaecken, W. (1994). Why models rather than rules give a
better account of propositional reasoning: A reply to Bonatti and to O´Brien, Braine, and Yang.
, , 734-739.
Johnson-Laird, P.N. & Oakhill, J. & Bull, D. (1986). Childrens syllogistic reasoning.
, , 35-58.
Johnson-Laird, P.N. & Steedman, M. (1978). The psychology of syllogisms. ,
, 64-99.
Johnson-Laird, P.N. & Tabossi, P. (1989). Reasoning by model: The case of multiple quantification.
, , 658-673.
Klauer, K.C. & Oberauer, K. (1995). Testing the mental model theory of propositional reasoning.
, , 671-687.
Klauer, K.C., Oberauer, K., Roßnagel, C. & Musch, J. (1996). Mentale Bilder und mentale Modelle.
, 204, 41-54.
Kratzmeier, H. (1976). Weinheim: Beltz.
Kyllonen, P.C. (1994). CAM: A theoretical framework for cognitive abilities measurement. In D.K.
Detterman (Ed.), Norwood,
NJ: Ablex Publishing Cooperation.
Kyllonen, P.C. & Christal, R.E. (1990). Reasoning ability is (little more than) working-memory
capacity?! , , 389-433.
Mani, K. & Johnson-Laird, P.N. (1982). The mental representation of spatial descriptions.
, , 181-187.
Marshalek, B., Lohman, D.F. & Snow, R.E. (1983): The complexity continuum in the radex and
hierarchical models of intelligence. , 7, 107-127.
Moosbrugger H. & Zistler R. (1993). Wie befreit man die Item-Trennschärfe von den Zwängen der
Item-Schwierigkeit? Das SPS-Verfahren. , , 22-43.
Nester, M.A. & Colberg, M. (1984). The effects of negation mode, syllogistic invalidity, and
linguistic medium on the psychometric properties of deductive reasoning tests.
, , 71-79.
Neubauer, G.P. (1995). Die Brauchbarkeit lösbarer Syllogismen als Testitems.
, , 164-176.
Oakhill, J.V. & Johnson-Laird, P.N. (1985). The effects of belief on the spontaneous production of
syllogistic conclusions. , , 553-569.
Oakhill, J.V. & Johnson-Laird, P.N. (1989). Believability and syllogistic reasoning. , ,
117-140.
Oaksford, M. & Chater, N. (1994). A rational analysis of the selection task as optimal data selection.
, , 608-631.
Oberauer, K. (1993). Die Koordination kognitiver Operationen - eine Studie über die Beziehung
zwischen Intelligenz und „working memory“. , , 57-84.
Oberauer, K., Süß, H.-M., Schulze, R., Wilhelm, O. & Wittmann, W.W. (1996).
Manuskript, zur Publikation eingereicht.
Oberauer, K. & Wilhelm, O. (1996). Richtungseffekte beim logischen Denken. In: Schorr, A. (Hrsg).
Lengerich: Pabst Science Publishers.
O´Brien, D.P., Braine, M.D.S. & Yang, (1994). Propositional reasoning by mental models? Simple to
refute inprinciple and in practice. , , 725-733.
Logisches Denken
Ormerod, T.C., Manktelow, K.I. & Jones, G.V. (1993). Reasoning with three types of conditional:
Biases and mental models. , , 653-677.
Osherson, D.N. (1974). , Volume 1. Hilsdale, NJ: Lawrence Erlbaum
Associates.
Osherson, D.N. (1975). Logic and models of logical thinking. In R.J. Flamagne (Ed.),
. Hilsdale, NJ: Lawrence Erlbaum Associates.
Osherson, D.N. (1976). , Volume 4. Hilsdale, NJ: Lawrence Erlbaum
Associates.
Polk, T.A. & Newell, A. (1995). Deduction as Verbal Reasoning. , , 533-
566.
Rips, L.J. (1983). Cognitive processes in propositional reasoning. , , 38-71.
Rips, L.J. (1989). The psychology of knights and knaves. , , 85-116.
Rips, L.J. (1990). Paralogical reasoning: Evans, Johnson-Laird, and Byrne on liar and truth-teller
puzzles. , , 291-314.
Rips, L.J. (1994). . Cambridge, MA:
MIT Press.
Rost, J. (1996).Bern: Hans Huber
Royce, J.R. (1973). The conceptual framework for a multi-factor theory of individuality. In J.R.
Royce (Ed.), London: Academic Press.
Schaecken, W. & Johnson-Laird, P.N. (1995). How people reason about temporal relations. In J.D.
Moore & J.F. Lehmann (Eds.),
. Hove, UK: Lawrence Erlbaum Associates.
Schaecken, W., Johnson-Laird, P.N. & d’Ydewalle, G. (1996). Mental models and temporal
reasoning. , 60, 205-234.
Shye, S. (1988). Inductive and deductive reasoning: A structural reanalysis of ability tests.
, , 308-311.
Stenning, K. & Oberlander, J. (1995). A cognitive theory of graphical and linguistic reasoning: Logic
and Implementation. , , 97-140.
Sternberg, R.J. (1980). Representation and process in linear syllogistic reasoning.
, , 119-159.
Sternberg, R.J. & Turner, M.E. (1981). Components of syllogistic reasoning. , ,
245-265.
Störing, G. (1908). Experimentelle Untersuchungen über einfache Schlussprozesse.
, , 1-27.
Süß, H.-M. (1996).
Göttingen: Hogrefe.
Süß, H.-M., Oberauer, K., Wittmann, W.W., Wilhelm, O. & Schulze, R. (1996).
Manuskript,
zur Publikation eingereicht.
Vandierendonck, A. & De Vooght, G. (1996).
Thinking & Reasoning, in press.
Weiß, R.H. (1987
Göttingen: Hogrefe.
Wilkins, M.C. (1928). The effect of changed material on ability to do formal syllogistic reasoning.
.
Woodworth, R.S. & Sells, S.B. (1935). An atmosphere effect in formal syllogistic reasoning.
, , 451-460.
25