Strategien im Gefangenen-Dilemma

Strategien im Gefangenen-Dilemma 

Volkswirtschaftliches Hauptseminar 

Angewandte Mikroökonomik 

Sommersemester 2001 

Friedrich-Alexander-Universität Erlangen-Nürnberg 

Institut für Wirtschaftswissenschaften 

Prof. Dr. Kähler 

Sebastian Dietze 

Trautenauer Str. 25 

91315 Höchstadt 

09193/7735 

7735@gmx.de

Gliederung 

1 Einführung in die Spieltheorie .......................................1 

1.1 Ziel der Seminararbeit....................................................................................... 1 

1.2 Definition der Spieltheorie................................................................................ 1 

1.3 Historische Entwicklung................................................................................... 2 

2 Das Gefangenen-Dilemma in der Theorie .....................4 

2.1 Das einfache Gefangenen-Dilemma ................................................................. 4 

2.2 Das wiederholte Gefangenen-Dilemma............................................................ 5 

2.2.1 Das zweirundige Gefangenen-Dilemma................................................... 6 

2.2.2 Das n-rundige Gefangenen-Dilemma ....................................................... 7 

2.2.3 Unbestimmt oft gespieltes Gefangenen-Dilemma.................................... 7 

2.2.4 Unendlich oft gespieltes Gefangenen-Dilemma ....................................... 9 

2.3 Superspiel-Strategien ........................................................................................ 9 

3 Axelrods Computerturniere .........................................11 

3.1 Axelrods erstes Turnier................................................................................... 11 

3.1.1 Teilnehmer und Regeln........................................................................... 11 

3.1.2 Turniersieger ........................................................................................... 12 

3.1.3 Gründe für den Triumph von Tit-for-Tat................................................ 12 

3.2 Axelrods zweites Turnier................................................................................ 13 

3.2.1 Teilnehmer und Regeln........................................................................... 13 

3.2.2 Turniersieger ........................................................................................... 13 

3.3 Die ökologische Analyse ................................................................................ 14 

3.3.1 Strategien als Population......................................................................... 14 

3.3.2 Abhängigkeit von der Umgebung........................................................... 15 

3.4 Tit-for-Tats Schwächen................................................................................... 18 

3.4.1 Unnötige Kooperation mit blinden Strategien ........................................ 18 

3.4.2 Mißverständnisse .................................................................................... 19 

3.4.3 Unerfüllbare Forderungen an Tit-for-Tat................................................ 20 

II

4 Wege aus dem Gefangenen-Dilemma ..........................21 

4.1 Ratschläge für die Spieler ............................................................................... 21 

4.2 Einfluß des Reformers .................................................................................... 22 

5 Bedeutung des Gefangenen-Dilemmas ........................25 

5.1 Stellungskrieg.................................................................................................. 25 

5.2 Das OPEC-Kartell........................................................................................... 26 

5.3 Biologie........................................................................................................... 26 

5.4 Fazit................................................................................................................. 27 

6 Literaturverzeichnis ......................................................28 

7 Anhang............................................................................30 

7.1 Grundbegriffe der Spieltheorie ....................................................................... 30 

7.1.1 Fachtermini ............................................................................................. 30 

7.1.2 Die Rationalitätshypothese ..................................................................... 32 

7.1.3 Grundlegende Spielsituation................................................................... 32 

7.1.4 Spielarten................................................................................................. 33 

7.1.5 Dominante Strategien.............................................................................. 33 

7.1.6 Das Nash-Gleichgewicht......................................................................... 33 

7.1.7 Pareto-Effizienz ...................................................................................... 35 

7.2 Strategien......................................................................................................... 35 

7.3 Axelrods erstes Computerturnier .................................................................... 40 

Version 1.08 vom 14.05.2002 

Auf www.joachim-dietze.de ist die aktuellste Version stets herunterladbar. 

Ebenfalls vom selben Autoren erschienen: „Der Börsenkrach vom Oktober 1987“. 

III

Tabellenverzeichnis 

Tabelle 1: Das Gefangenen-Dilemma.................................................................... 4 

Tabelle 2: Die zweite Runde im zweirundigen Gefangenen-Dilemma ................. 6 

Tabelle 3: Die erste Runde im zweirundigen Gefangenen-Dilemma .................... 6 

Tabelle 4: Mißverständnis bei Tit-for-tat............................................................. 19 

Tabelle 5: Eine allgemeine Spielmatrix............................................................... 32 

Tabelle 6: Spielmatrix mit dominanter Strategie ................................................. 33 

Tabelle 7: Ein eindeutiges Nash-Gleichgewicht.................................................. 34 

Abbildungsverzeichnis 

Abbildung 1: Ökologische Simulation mit Cooperate, Defect und Random ...... 16 

Abbildung 2: Ökologische Simulation mit Cooperate, Defect, Random und Titfor-tat............................................................................................................ 

16 

Abbildung 3: Ökologische Simulation mit 15 Strategien.................................... 17 

Abbildung 4: Axelrods erstes Turnier: Teilnehmer ............................................. 40 

Abbildung 5: Axelrods erstes Turnier: Endstand................................................. 41 

IV

1 Einführung in die Spieltheorie 

1.1 Ziel der Seminararbeit 

Diese Seminararbeit befaßt sich mit dem Gefangenen-Dilemma, dem 

berühmtesten Fall-Beispiel der Spieltheorie. Ich werde theoretische und 

computerexperimentelle Ergebnisse aufführen, um Strategien im Gefangenen- 

Dilemma zu analysieren. Bevor ich die Problematik des Gefangenen-Dilemmas 

erläutere, gehe ich zunächst kurz auf die geschichtliche Entwicklung der 

Spieltheorie ein, um den Leser einzuführen. 

Nachdem dann die Theorie des wiederholten Gefangenen-Dilemmas aufgeführt 

wird, bewerte ich im dritten Kapitel die Ergebnisse von Robert Axelrods 

Computer-Turnieren. Axelrod analysierte Strategien und erarbeitete so 

Verhaltensregeln zur Förderung der Kooperation. 

Durch reale Beispiele im Stellungskrieg, beim OPEC-Kartell und in der Biologie 

wird im fünften Kapitel die Bedeutung des Gefangenen-Dilemmas aufgezeigt. 

Ziel dieser Seminararbeit ist somit nicht nur, theoretische Lösungshilfen zu 

geben, sondern auch die Anwendbarkeit der Theorie und der Empirie auf reale 

Beispiele zu übertragen. 1 

1.2 Definition der Spieltheorie 

Die Spieltheorie, ein Teilgebiet der Mikroökonomie, befaßt sich mit der Analyse 

menschlichen Verhaltens in strategischen Situationen. Mehrere Spieler, die 

konfligierende Interessen haben und ihren Gewinn maximieren wollen, stehen 

vor verschiedenen Entscheidungsmöglichkeiten. Die typische Problematik liegt 

darin, daß der eigene Gewinn auch vom Verhalten der anderen Parteien abhängt. 

Die Spieltheorie, die für den Spieler die optimale Strategie finden soll, ist ein 

theoretisches Instrument zur Analyse solcher strategischer Entscheidungen. 

1 Die Grundbegriffe der Spieltheorie (die vorausgesetzt werden) sind im Anhang, Kapitel 7.1 aufgeführt 

1

1.3 Historische Entwicklung 

Im 18. Jahrhundert wurden die ersten entscheidungs- und spieltheoretischen 

Ansätze entwickelt. An den Analysen (zunächst wurden meist Verhaltenswege in 

Gesellschaftsspielen wie Schach und Kartenspielen bewertet) waren 

hauptsächlich Wissenschaftler aus der Ökonomie und der Mathematik beteiligt. 

Jedoch gilt erst das Jahr 1944, als der Mathematiker John von Neumann 

gemeinsam mit dem Ökonomen Oskar Morgenstern das fundamentale Werk 

„The Theory of Games and Economic Behaviour“ veröffentlichte, als das 

Geburtsjahr der Spieltheorie. In ihrem Werk wurden vor allem Zwei-Personen- 

Spiele und Nullsummenspiele dargestellt. Die Anwendung der Spieltheorie fand 

primär in den Wirtschaftswissenschaften statt. 

John von Neumann (*1903 †1957) Oskar Morgenstern (*1902 †1977) 

John Forbes Nash, ein US-amerikanischer Mathematiker, unterschied 1950 

erstmals zwischen kooperativen und nicht-kooperativen Spielen. Er bewies die 

Existenz eines Strategien-Gleichgewichts, das grundlegend für die nichtkooperativen 

Spiele wurde und seitdem Nash-Gleichgewicht genannt wird. 2 

Die Problematik des Gefangenen-Dilemmas (engl. Prisoner’s Dilemma) ist seit 

Jahrhunderten bekannt. Thomas Hobbes war der Ansicht, daß Kooperation in der 

Welt von Egoisten nur durch einen zentralen Herrschaftsstab möglich sei. 3 

2 Vgl. Nasar (1999), eine hervorragende Biographie Nashs (wurde mit Russell Crowe verfilmt. 2002 im Kino!) 

3 Vgl. Axelrod (2000) S. 3 

2

Eine wissenschaftliche Analyse des Gefangenen- 

Dilemmas erfolgte erst ab 1950. Im Jahr 1980 

erschien Robert Axelrods „The Evolution of 

Cooperation“, das als Hauptquelle dieser Arbeit 

dient. Seine empirische Analyse durch zwei 

Computer-Turniere gibt Erklärungen für scheinbar 

irrationale Kooperation zwischen egoistischen 

Spielern im wiederholten Gefangenen-Dilemma. 

Axelrod gibt Vorschläge zur Kooperationsförderung 

und nennt reale Beispiele aus Krieg und Biologie. 

Robert Axelrod 

Die praktische Anwendbarkeit der Spieltheorie dehnt sich heute vom 

Alltagsleben, der Ökonomie, der Mathematik, der Biologie und der Philosophie 

bis auf die Bereiche Politik- und Militärwissenschaft, Marketing, Soziologie und 

Psychologie aus. Die Spieltheorie stellt als ein Teilgebiet der Entscheidungstheorie 

einen der Hauptzweige der Mikroökonomie dar. 

1994 fand die Spieltheorie endgültig wissenschaftliche Anerkennung: John F. 

Nash und die beiden Wirtschaftswissenschaftler Reinhard Selten (Bonn) und 

John Charles Harsanyi (USA) wurden für ihre Forschung auf dem Gebiet der 

Spieltheorie mit dem Nobelpreis für Wirtschaftswissenschaften ausgezeichnet. 

Reinhard Selten (*1930) John C. Harsanyi (*1920 †2000) John F. Nash (*1928) 

3

2 Das Gefangenen-Dilemma in der Theorie 

2.1 Das einfache Gefangenen-Dilemma 

Das folgende Beispiel ist der Namensgeber des Gefangenen-Dilemmas: 

Zwei Personen haben gemeinsam ein Verbrechen begangen, wurden gefaßt, in 

getrennte Zellen gesperrt und dem Richter vorgeführt. In diesem nichtkooperativen 

Spiel hat jeder Gefangene (Spieler) nun die Wahl, zu gestehen 

(defektieren) oder nicht zu gestehen (kooperieren). 

Es gibt vier mögliche Spielausgänge: 

• Gefangener 1 gesteht, Gefangener 2 gesteht nicht 

Gefangener 2 wird wegen des Verbrechens und der Falschaussage für 20 

Jahre eingesperrt, Gefangener 1 wird freigelassen (Kronzeugenregelung) 

• Gefangener 1 gesteht nicht, Gefangener 2 gesteht 

Gefangener 1 wird für 20 Jahre eingesperrt, Gefangener 2 ist frei 

• Gestehen beide Gefangenen, so werden beide für zehn Jahre inhaftiert 

• Gesteht kein Gefangener, so kann man ihnen nicht viel nachweisen und 

beide werden wegen geringer Verbrechen für 3 Jahre festgehalten 

Jeder Gefangene ist nur daran interessiert, seine eigene Strafe zu minimieren. Die 

Strafe des anderen Gefangenen beeinflußt seine Entscheidung nicht. Da die 

Gefangenen möglichst kurz inhaftiert sein wollen, steht in der folgenden 

Spielmatrix eine hohe Punktzahl für eine geringe Haftstrafe. 

Gefangener 2 

Defektieren 

Kooperieren 

Gefangener 1 

Defektieren P=1, P=1 T=5, S=0 

Kooperieren S=0, T=5 R=3, R=3 

Tabelle 1: Das Gefangenen-Dilemma 

4

Die Buchstaben stehen für 

• Temptation – die Versuchung zu defektieren 

► 5 Punkte 

• Reward – die Belohnung für wechselseitige Kooperation ► 3 Punkte 

• Punishment – die Strafe für wechselseitige Defektion ► 1 Punkt 

• Sucker’s Payoff – die Auszahlung des gutgläubigen Opfers ► 0 Punkte 4 

Die Gefangenen wollen ihre Auszahlung maximieren und finden in der Strategie 

„Defektieren“ eine dominante Strategie. Beide erhalten nur einen Punkt, P als 

Strafe für wechselseitige Defektion. 

Definition: 

Ein Gefangenen-Dilemma liegt vor, falls 

1. Ein Gleichgewicht bei dominanter Strategie existiert 

2. Das Gleichgewicht nicht pareto-effizient ist 

3. T > R > P > S und 

T + S 

R > gilt 

2 

Hierin besteht das Gefangenen-Dilemma: Obwohl sich beide Spieler rational 

verhalten und ihre dominante Strategie spielen, landen sie in der schlechtesten 

gemeinsamen Situation. Trotz der dominanten Strategien und des einzigen Nash- 

Gleichgewichts bei beidseitiger Defektion, erzielen die beiden Spieler die einzige 

nicht pareto-effiziente Situation. 

Beim Gefangenen-Dilemma liegt somit ein Widerspruch zwischen der 

individuellen und der kollektiven Rationalität vor. 

2.2 Das wiederholte Gefangenen-Dilemma 

Beide Spieler werden mehrfach vor die Situation des Gefangenen-Dilemmas 

gestellt. Sie haben jeweils die Wahl zu kooperieren oder zu defektieren und 

dürfen ihre Entscheidung auch vom bisherigen Spielverlauf abhängig machen. 

4 Vgl. Axelrod (2000) S. 7f 

5

Während rationale Spieler im einfachen Gefangenen-Dilemma stets defektieren 

werden, kann Kooperation im wiederholten Gefangenen-Dilemma durchaus 

rational sein. Entscheidend ist, ob die genaue Anzahl der Spiele bekannt ist und 

ob über endlich oder unendlich viele Runden gespielt wird. 5 

2.2.1 Das zweirundige Gefangenen-Dilemma 

Die Auszahlung eines Spielers ist die Summe seiner Auszahlungen in beiden 

Spielen. Bei der Analyse des zweirundigen Gefangenen-Dilemmas betrachtet 

man zuerst die zweite Runde: 

Spieler 2 

Defektieren 

Kooperieren 

Spieler 1 

Defektieren 1, 1 5, 0 

Kooperieren 0, 5 3, 3 

Tabelle 2: Die zweite Runde im zweirundigen Gefangenen-Dilemma 

Unabhängig vom Ausgang der ersten Runde findet sich bei wechselseitiger 

Defektion ein Nash-Gleichgewicht, beide Spieler werden folglich in der zweiten 

Runde ihre dominante Strategie wählen und defektieren. 

Die zweite Runde beeinflußt das Spiel in der ersten Runde nicht. Die Auszahlung 

(1,1) aus der zweiten Runde wird zu der Auszahlung der ersten Runde addiert: 

Spieler 2 

Defektieren 

Kooperieren 

Spieler 1 

Defektieren 2, 2 6, 1 

Kooperieren 1, 6 4, 4 

Tabelle 3: Die erste Runde im zweirundigen Gefangenen-Dilemma 

5 Vgl. Schmidt (2001), http://www.vwl.uni-muenchen.de/ls_schmidt/index_de.htm, Kapitel 4 

6

Auch hier liegt bei „Defektieren/Defektieren“ ein eindeutiges Nash- 

Gleichgewicht vor. Somit werden beide Spieler beim zweifachen Gefangenen- 

Dilemma nie kooperieren. Das Dilemma bleibt bestehen: Die Spieler erhalten 2·P 

– zweimal punishment, die Strafe für beiderseitige Defektion. 

2.2.2 Das n-rundige Gefangenen-Dilemma 

Das n-fach wiederholte Gefangenen-Dilemma hat ein eindeutiges Nash- 

Gleichgewicht, nämlich das n-fache Defektieren. 

Der Beweis folgt aus der Rückwärtsinduktion. Das Argument beim zweirundigen 

Gefangenen-Dilemma wird (n-1)-fach angewandt. In der n-ten Runde verfügen 

beide Spieler unabhängig vom Verlauf in den ersten n-1 Runden über eine 

dominante Strategie: Defektion. Analog wird bis zur ersten Runde 

rückwärtsinduziert. Beide Spieler werden n-mal defektieren, weil der sogenannte 

„last period effect“ jegliche Kooperation verhindert. Beide Spieler erhalten n·P. 6 

2.2.3 Unbestimmt oft gespieltes Gefangenen-Dilemma 

Wenn das Gefangenen-Dilemma unbestimmt oft wiederholt wird, ist eine 

Rückwärtsinduktions-Analyse wegen der fehlenden letzten Periode unmöglich. 

Wir betrachten nun einen Spieler, der die Strategie Grim 7 anwendet, um zu 

zeigen, daß Kooperation nun rational sein kann. 8 

• Da die Anzahl der Stufenspiele zwar endlich aber unbekannt ist, wird die 

Auszahlung in der 2-ten Runde mit dem Faktor p und in der n-te-Runde 

mit 

n−1 

p multipliziert. 9 Die erste Runde soll sicher stattfinden. 

6 Vgl. Schmidt (2001), http://www.vwl.uni-muenchen.de/ls_schmidt/index_de.htm, Kapitel 4 S. 5 

7 Eine ausführliche Beschreibung aller genannten Strategien erfolgt im Anhang, Kapitel 7.2. 

Grim kooperiert, bis der Mitspieler defektiert. Auf eine einmalige Defektion antwortet Grim mit ewiger Defektion. 

8 vgl. http://kaldor.vwl.uni-hannover.de/wuv/lectures/scripts/sosem-2001/sp06.pdf 

9 Auf eine Runde folgt nicht mit Sicherheit eine weitere (Wahrscheinlichkeit) und die Zukunft ist nicht so bedeutend 

wie die Gegenwart (Abdiskontierung). p liegt zwischen 0 und 1. p entspricht einer Abwertung der späteren Runden 

7

• Falls der zweite Spieler stets kooperiert, ist seine Auszahlung: 10 

K 

2 3 

n 

= + p ⋅ + p ⋅ + p ⋅ + = ⋅∑ ∞ 3 

3 3 3 3 ... 3 p = 

= 1− 

p 

n 

0 

• Defektiert Spieler 2 in Runde N, erhält er einmal fünf Punkte und danach 

bestenfalls noch einen Punkt pro Runde, da Grim nun immer defektiert 

(Spieler 2 wird ab Runde N auch immer defektieren). Seine Auszahlung ist: 

D = 3 + p ⋅3 

+ p 

= 3⋅ 

N−2 

n N−1 

p p 5 

∑ 

n= 

0 

+ 

2 

⋅3 

+ ... + p 

⋅ 

+ 

∞ 

∑ 

n= 

N 

p 

n 

⋅5 

+ p 

⋅1+ 

p 

N−1 

N N+ 1 

⋅1+ 

... 

Nun berechnet man die Differenz aus K und D, um festzustellen, ob der Spieler 

durch die Defektion in der N-ten Runde profitiert. 

K − D = 3⋅ 

∞ 

∑ 

n= 

0 

p 

n 

− (3⋅ 

N−2 

∑ 

n= 

0 

p 

n 

+ 

p 

N−1 

⋅5 

+ 

∞ 

∑ 

n= 

N 

p 

n 

) 

= 

= 

N−1 

p (3 5) (3 1) 

p 

N−1 

⋅ 

− 

+ 

− 

⋅ 

∑ ∞ 

n= 

N 

p 

1 

⋅ ( −2 

+ 2⋅ 

( −1)) 

= p 

1− 

p 

n 

= 

p 

N−1 

N−1 

⋅ ( −2 

+ 2⋅ 

2 

⋅ ( − 4) 

1− 

p 

∑ ∞ 

n= 

1 

p 

n 

) 

Dieses Produkt ist für p = 0, 5 genau Null und für p > 0, 5 strikt größer als Null. 

Bezüglich Grim ist also ständige Kooperation bei p > 0, 5 erfolgreicher als jede 

andere Strategie. Spieler 2 erhält durch eine Defektion in der N-ten Runde zwar 

einen zusätzlichen Gewinn von 2 Punkten, vermindert seine Auszahlung in den 

folgenden Runden insgesamt aber deutlicher. Der langfristige Verlust in der 

Zukunft überwiegt die einmalige Temptation. 

Der genaue Wert p, für den K=D gilt, hängt von T, R, P und S ab. p ist jedoch 

stets kleiner als 1. 

10 Es wird die geometrische Reihe verwendet: 

∞ 

∑ 

p 

n 

= 

0 1 

1 

, und somit auch 

∞ 

∑n 

1 

n 1 

p = 

1 

−1 

8

2.2.4 Unendlich oft gespieltes Gefangenen-Dilemma 

Im theoretischen, unendlichen Gefangenen-Dilemma existiert der „last period 

effect“ ebenfalls nicht. Die Rückwärtsinduktion ist somit nicht anwendbar. 

Maximierungsstrategien 

Da die Auszahlungssumme im unendlichen Fall unendlich sein wird, ist eine 

einfache Maximierungsstrategie unsinnig. Deshalb versucht der Spieler nun 

• den Grenzwert der durchschnittlichen Auszahlungen 

( a i 

ist die Auszahlung im i-ten Spiel) 

a1 

+ a2 

+ ... + an 

lim 

n→∞ 

n 

• oder den Gegenwartswert der abdiskontierten Auszahlungen ∑ ∞ t 

δ 

n= 

1 

(δ ist der Diskontierungsfaktor) 

zu maximieren. 

Da Gewinne in der Zukunft weniger Bedeutung als in der Gegenwart haben, wird 

meist mit einem Diskontierungsfaktor gerechnet. 

Analog zum vorherigen Beweis (p wird durch δ ersetzt) kann man zeigen, daß 

sich Kooperation in allen Perioden einstellt, wenn der Diskontierungsfaktor hoch 

genug ist. Der einmalige Mehrgewinn durch die Defektion wiegt den Verlust in 

den folgenden Runden nicht auf. 11 

− 1 

⋅ a 

i 

2.3 Superspiel-Strategien 

Entscheidend für die Strategiewahl ist also, ob dem Spieler die genaue 

Rundenanzahl bekannt ist. In einem n-rundigen Gefangenen-Dilemma ist 

ständige Defektion die dominante Strategie, rationale Spieler kooperieren nie. 

Falls die Anzahl der Runden nicht genau feststeht oder unendlich ist und p bzw. 

δ groß genug sind, hängt das Verhalten des Spielers vom Verhalten des anderen 

Spielers ab. Die Aufgabenstellung, in Kapitel 2.2.3 und 2.2.4 eine „gute“ 

Strategie zu finden, kann die Theorie nicht lösen. 

11 Vgl. Schmidt (2001) Kapitel 4.3 

9

Aus dem Beweis, daß Kooperation beim unbestimmt oft gespielten Gefangenen- 

Dilemma rational sein kann, folgt ein Theorem: 

Ist p hinreichend groß, so existiert keine beste Strategie 

unabhängig von der Strategie des anderen Spielers. 

Beweis: Gegen Grim ist bei hohem p ständige Kooperation am erfolgreichsten, 

gegen Defect (permanente Defektion) jedoch ständige Defektion. 12 

Eine Strategie, die die Planung einer bestimmten Folge von Spielzügen in 

Abhängigkeit des anderen Spielers vorgibt, wird als Superspiel-Strategien 

bezeichnet. In Tests auf der Suche nach erfolgreichen Strategien werden die 

Superspiel-Strategien im Duell vor die Bedingungen des wiederholten 

Gefangenen-Dilemmas gestellt: 

• Es gibt keine Verpflichtung, getroffene Vereinbarungen zu halten 

• Es gibt keine Möglichkeit den Zug des Mitspielers vorherzusehen 

• Kein Spieler kann einen anderen beseitigen 

• Es besteht keine Möglichkeit die Auszahlung eines Mitspielers zu verändern 

• Keiner der Spieler kann das Spiel beenden oder verlassen 13 

12 Vgl. Axelrod (2000) S.14 

13 Vgl. Axelrod (2000) S.10f 

10

3 Axelrods Computerturniere 

Robert Axelrod, ein Politik-Professor aus Michigan, suchte eine Strategie, die im 

Vergleich zu anderen Strategien im Durchschnitt recht erfolgreich abschneidet. 

Er trug mit seinen Computer-Turnieren wesentlich zur Analyse des wiederholten 

Gefangenen-Dilemmas bei. 

3.1 Axelrods erstes Turnier 

3.1.1 Teilnehmer und Regeln 

Axelrod forderte Spieltheorie-Experten aus den Bereichen der Ökonomie, 

Psychologie, Soziologie, Politikwissenschaft und Mathematik auf, Superspiel- 

Strategien zu entwickeln. Die 14 teilnehmenden Wissenschaftler wußten, daß 

ihre Programme fünfmal (um Zufälle zu verringern) ein 200-faches Gefangenen- 

Dilemma gegen ihr eigenes, Random und alle anderen Programme spielen 

würden. Zielsetzung der Superspiel-Strategien war, im Durchschnitt eine 

möglichst hohe Auszahlung zu erreichen. Die Auszahlungen der einzelnen 

Duelle und ein etwaiger Sieg über den Mitspieler fanden keine Beachtung. Die 

Strategien konnten bei jedem Spielzug erneut über ihre Wahlmöglichkeiten 

nachdenken und ihre Entscheidung von den vergangenen Spielzügen des 

Mitspielers abhängig machen. 

Die Strategien erzielten in jedem Spielzug je nach ihrem Verhalten die bekannten 

Auszahlungen T=5, R=3, P=1 oder S=0 Punkte. 

Ein Programm konnte im Durchschnitt 0 bis 1000 (200-mal 0 bzw. 5) Punkte 

erreichen. Alle Voraussetzungen des n-fachen Gefangenen-Dilemmas waren 

gegeben. Da es mit der n-fachen Defektion eine dominante Strategie gab, war 

kaum mit kooperativen Strategien zu rechnen. 

11

3.1.2 Turniersieger 

Sieger mit 504,5 Punkten wurde die 

Strategie Tit-for-Tat, eingesandt von 

Anatol Rapoport, einem Psychologie- 

Professor aus Toronto. 14 Tit-for-Tat (wie 

du mir, so ich dir) kooperiert im ersten 

Zug und wiederholt dann stets den Zug 

des Mitspielers. Der Erfolg überraschte, 

da Tit-for-Tat freundlich ist und vorher 

bekannt war. 

Anatol Rapoport (*1911) 

3.1.3 Gründe für den Triumph von Tit-for-Tat 

Nach eingehender Untersuchung konnte Axelrod Eigenschaften feststellen, die 

den Erfolg von Tit-for-Tat begründen. 

Tit-for-Tat vereint die Eigenschaften Freundlichkeit und Nachsichtigkeit: 

• Freundlichkeit: Defektiere nicht als erster 

• Nachsichtigkeit: Defektiere, wenn der Gegner zuvor defektierte 

Tit-for-Tat erreichte gemeinsam mit anderen freundlichen (kooperierenden) 

Strategien eine sehr hohe Punktzahl und wurde von bösen (defektierenden) 

Strategien nur knapp besiegt. Böswillige Strategien unterliegen zwar nie im 

direkten Vergleich und sind vor Ausbeutung geschützt. Sie machen aber meist 

erheblich weniger Punkte als bei beidseitiger Kooperation. Die acht 

erstplazierten Strategien waren freundlich, alle anderen unfreundlich. 

Tit-for-Tat defektiert nur ein einziges Mal, gibt dem Mitspieler weiterhin die 

Möglichkeit zur Kooperation und minimiert so die Möglichkeit einer ständigen 

wechselseitigen Bestrafung. 

Viele Spieler versuchten Tit-for-Tat zu verbessern, scheiterten aber, da sie bereits 

durch seltene Defektionen zu oft P erhielten. Die Programmierer waren zu sehr 

14 Vgl. Kapitel 7.3 und Axelrod (2000) S. 25-30 und 173f 

12

auf ihren eigenen Vorteil bedacht und dachten zu pessimistisch von ihren 

Kontrahenten. Sie defektierten zu häufig und berücksichtigten dabei den höheren 

Gewinn durch Entgegenkommen und Kooperation nicht genügend. 

3.2 Axelrods zweites Turnier 

3.2.1 Teilnehmer und Regeln 

Axelrod veröffentlichte seine Analysen und schrieb ein zweites Computerturnier 

aus. Die 62 Teilnehmer wurde vor die selbe Problematik gestellt, außer daß 

Axelrod diesmal ein unbestimmt oft wiederholtes Gefangenen-Dilemma mit 

p=0,99654 wählte. 15 Die Teilnehmer konnten so mit ungefähr 200 Runden 

rechnen. Tatsächlich gingen die fünf Teilspiele nur über 63, 77, 151, 156 und 308 

Runden (Mittelwert 151). Die Rundenanzahl war für jedes Duell gleich, aber 

keinem Spieler vorher bekannt. 

3.2.2 Turniersieger 

Tit-for-Tat wurde nur von Anatol Rapoport eingesandt und gewann mit 434,73 

Punkten erneut. Tit-for-Tats Sieg war deutlich knapper ausgefallen als beim 

ersten Turnier: 52 Strategien lagen über 380 Punkten. 16 Viele Programmierer 

wollten ausnutzen, daß Axelrod die Freundlichkeit so positiv darstellte. Sie 

hofften auf naiv-kooperierende Strategie und wollten T erreichen. Da diese 

Überlegungen jedoch viele Spieler hatten, verloren die unfreundlichen Strategien 

erneut entscheidende Punkte durch wechselseitige Defektion. 

In beiden Turnieren lagen nur freundliche Strategien auf den vorderen Plätze: 

Beim ersten Computerturnier waren die ersten acht Strategien freundlich, beim 

zweiten Turnier 14 der ersten 15 Strategien. 

15 Vgl. Axelrod (2000) S. 38. Es ergibt sich eine durchschnittliche Rundenzahl von 289 und ein Median von 200 

16 Vgl. Axelrod (2000) S. 175-185 

13

3.3 Die ökologische Analyse 

3.3.1 Strategien als Population 

Um die Besonderheiten der einzelnen Strategien besser vergleichen zu können, 

ließ Robert Axelrod die Strategien in einer anderen Turnierform antreten. 

Axelrod benutzte einen evolutionsbiologischen Ansatz, um herauszufinden, wie 

man Kooperation in eine Population einführen und etablieren kann. 17 In der 

ersten Generation einer Population treten alle Strategien als Individuen mehrfach 

und gleich oft auf. Dann wird die Fitneß der Strategien, d.h. die Punktzahl gegen 

die anderen Strategien der Population, bestimmt und so die Zusammensetzung 

der nächsten Generation festgelegt. Eine Strategie, die eine überdurchschnittliche 

Auszahlung erreicht, vermehrt sich. Der prozentuale Anteil einer Strategie an der 

Population ist stets gleich dem prozentualen Anteil ihrer erreichten Punktzahl an 

der Gesamtauszahlungen. Nach einer gewissen Anzahl von Iterationen stellt sich 

ein Gleichgewicht der Anteile der Strategien an der Gesamtpopulation ein. 

Axelrod führt Definitionen und Sätze auf, die Strategien klassifizieren: 

Strategie B dringt in Strategie A ein, wenn sie gegen Strategie A 

einen höheren Punktwert erhält, als A mit sich selbst 

Eine Strategie heißt kollektiv stabil, wenn 

keine andere Strategie in sie eindringen kann 

Eine freundliche Strategie ist nur dann kollektiv stabil, wenn sie 

durch die erste Defektion des anderen Spielers provoziert wird 

Tit-for-Tat (und jede andere freundliche Strategie) kann nur dann kollektiv stabil 

sein, wenn p hinreichend groß ist. Sonst würde Defect in Tit-for-Tat eindringen 

können. Defect ist immer kollektiv stabil, da es gegen keine Strategie verliert. 

17 Vgl. Axelrod (2000) S. 43-63 

14

Eine Evolution der Kooperation ist in einer Welt von Defects somit höchstens 

dann möglich, wenn eine andere Strategie mehrfach auftreten kann. 

Beispielsweise genügt bei p=0,9 ein Anteil von fünf Prozent von Tit-for-Tat- 

Spielern um in das kollektiv stabile Defect einzudringen. Tit-for-Tat unterliegt 

Defect zwar knapp, macht gegen einen weiteren Tit-for-Tat-Spieler jedoch die 

Auszahlung R = 3 Punkte. Zwei Defect-Spieler erreichen lediglich P = 1 Punkt. 

Die freundlichen Tit-for-Tat-Spieler können sich nach jeder Runde ausbreiten 

und die böswilligen Defect-Spieler verdrängen. 

3.3.2 Abhängigkeit von der Umgebung 

Der Erfolg einer Strategie ist stark von der Umgebung abhängig. Beispielsweise 

ist Cooperate im direkten Vergleich mit Defect chancenlos. Cooperate wird in 

der ersten Generation im Durchschnitt 1,5 Punkte (50%·3=R + 50%·0=S), Defect 

hingegen 2,5 Punkte (50%·5=T + 50%·1=P) erhalten. Deshalb wird der Anteil 

der Cooperate-Strategien kontinuierlich abnehmen. Falls sich mehrere 

kooperative Strategien am Turnier beteiligen, wird Cooperate eine höhere 

Punktzahl als Defect erhalten. Um herauszufinden, ob eine Strategie allgemein 

gut abschneidet, muß man eine große Anzahl von Turnieren mit wechselndem 

Umfeld durchführen. Erfolgreiche Strategien würden häufiger ausgewählt, 

erfolglose Strategien aussortiert. Dieses Verfahren erinnert an natürliche 

Selektion, Evolution und ökologische Simulation. 

Eine Strategie heißt stabil in bezug auf eine Startverteilung von 

Strategien, wenn sie bei Erreichen eines Gleichgewichtszustandes 

nicht ausgestorben ist 

Die Wirtschaftswissenschaftler Mathieu und Delahaye haben einen "Iterated 

Prisoner's Dilemma Simulator" entwickelt, mit dem sich ökologische 

Simulationen mit Strategien in beliebiger Zusammensetzungen testen lassen. 18 

18 Vgl. http://www.cl-ki.uni-osnabrueck.de/~nntthele/ipd/ipd4.html. (auch Quelle von Abbildung 1-3). 

15

Abbildung 1: Ökologische Simulation mit Cooperate, Defect und Random 

Abbildung 1 zeigt eine Population mit 300 Individuen. Die Strategien Defect, 

Cooperate und Random sind in der ersten Generation jeweils 100-mal vertreten. 

Defect ist als einzige Strategie stabil in bezug auf diese Startaufstellung, sowohl 

Random als auch Cooperate sterben aus. Cooperate und Random verhalten sich 

unterschiedlich: Cooperate (schwarze Kurve) erzielt sowohl gegen Random als 

auch gegen Defect schlechte Resultate und stirbt schnell aus. Random (blaue 

Kurve) überlebt nur solange wie eine ausreichend große Anzahl von Cooperate- 

Individuen vorhanden ist. Im Duell mit Defect unterliegt Random schnell. 

Abbildung 2: Ökologische Simulation mit Cooperate, Defect, Random und Tit-for-Tat 

16

Generell gilt trotzdem nicht, daß Cooperate eine schlechte und Defect eine gute 

Strategie ist. Abbildung 2 und 3 zeigen die Ergebnisse umfangreicherer 

Simulationen, in denen Cooperate eine stabile Strategie ist, Defect aber nicht. In 

dem in Abbildung 2 dargestellten Experiment ist nur Tit-for-Tat zu Defect, 

Cooperate und Random hinzugekommen. Das Ergebnis weicht in dramatischer 

Weise ab: Zwar kann Defect zu Beginn seinen Anteil erhöhen, aber mit dem 

Aussterben von Random stirbt auch Defect aus. Cooperate, das gegen Defect und 

Random schlechte Resultate erzielt (im Schnitt S=0 bzw. (R=3 + S=0)/2=1.5 

Punkte), erweist sich als stabil. 

Abbildung 3: Ökologische Simulation mit 15 Strategien 

Bestätigt wird das Ergebnis durch Abbildung 3. Alle freundlichen Strategien sind 

stabil und alle unfreundlichen Strategien (inklusive Mistrust, das nur eine 

minimale Abänderung von Tit-for-Tat ist) sterben aus. Tit-for-Tat belegt nur 

einen guten Mittelplatz, da es gegen die blinden Strategien schwach abschneidet. 

Wie in Axelrods ausgeschriebenen Computer-Turnieren erweisen sich die 

freundlichen Strategien auch in dieser einfachen ökologischen Analyse als 

erfolgreichere Strategien. 

17

3.4 Tit-for-Tats Schwächen 

3.4.1 Unnötige Kooperation mit blinden Strategien 

Geringe Auszahlung 

Tit-for-Tat erzielt oftmals deutlich schlechtere Ergebnisse als möglich: 

• Tit-for-Tat gewinnt gegen die Strategie Cooperate immer nur 3 Punkte. 

Profitabler wäre es, stets zu defektieren (= 5 Punkte pro Runde) 

• Gegen Random erntet Tit-for-Tat genauso wenige Punkte wie Random, da 

Tit-for-Tat auf jede zufällige Kooperation von Random auch kooperiert 

Tit-for-Tat kann gegen keine Strategie im direkten Vergleich gewinnen. Es 

versagt gegen blinde (unsensitive) Strategien, weil es immer wieder Kooperation 

aufbauen möchte, von der blinden Strategie aber nicht belohnt wird. Gegen 

blinde Strategien wie Cooperate oder Random gibt es eine dominante Superspiel- 

Strategie: Defect. 

Gradual schlägt Tit-for-Tat 

Gradual ist eine Strategie, die in vielen Computer-Turnieren erheblich besser als 

Tit-for-Tat abschneidet. Gradual kooperiert beim ersten Zug und beantwortet das 

erste Defektieren des Gegners mit einer Defektion und anschließend zwei 

Kooperationen, schließlich das n-te Defektieren des Gegners mit n Defektionen 

und zwei Kooperationen. 

Die von Axelrod aufgestellte Forderung nach Einfachheit ist verletzt, denn 

Gradual benötigt Wissen über das gesamte Spiel seit Beginn. 

Gradual hat jedoch eine Eigenschaft, die Tit-for-Tat nicht hat, die aber dem 

Verhalten von Menschen näher kommt. Gradual ist sehr offensiv, es zwingt den 

Gegner zur Kooperation: Nichtkooperation zahlt sich für ihn immer weniger aus, 

denn sie wird mit einer immer größeren Anzahl von Defektionen beantwortet. 

18

Gleichzeitig ist Gradual sehr defensiv, möchte nicht ausgebeutet werden und 

wählt deshalb nach Ausbeutungsversuchen immer seltener die Kooperation. 

Bei einem Turnier mit Gradual, Tit-for-Tat und zehn Standardstrategien gewann 

Gradual deutlich. Graduals Erfolg ist aber nicht überraschend, da Tit-for-Tat 

gegen Per_kind, Per_nasty und Random schwache Ergebnisse erzielte. 19 

3.4.2 Mißverständnisse 

Axelrod schloß in seinen Computerturnieren Mißverständnisse zwischen den 

Spielern aus. In realen Problemsituationen ist es aber möglich, daß Kooperation 

beispielsweise in 5% aller Fälle als Defektion mißverstanden wird. 20 

Wenn beide Spieler Tit-for-Tat anwenden, führt ein Mißverständnis zu einer 

Kettenreaktion: 

Runde Spieler 1 Spieler 2 

1 Kooperation Kooperation 

2 Kooperation Kooperation 

 

 

 

 

(wird als Defektion mißverstanden!) 

3 Defektion Kooperation 

4 Kooperation Defektion 

5 Defektion Kooperation 

6 Kooperation Defektion 

Tabelle 4: Mißverständnis bei Tit-for-Tat 

Die beiden Tit-for-Tat-Spieler werden immer abwechselnd für die 

vorausgegangene Vergeltung erneut Vergeltung üben (Echo-Effekt). 

Tit-for-Tat bestraft selbst Spieler, die sich lange Zeit kooperativ gezeigt haben, 

sofort. Eine verbesserte Strategie muß wegen der möglichen Mißverständnisse 

19 Vgl. http://www.cl-ki.uni-osnabrueck.de/~nntthele/ipd/ipd3.html 

20 Vgl. Dixit/Nalebuff (1997) S. 105–112 

19

nachsichtiger sein: Scheint die Defektion nur eine Ausnahme (Mißverständnis 

oder auch Absicht) zu sein, sollte man den anderen Spieler nicht sofort bestrafen. 

Erst nach mehreren Defektionen in einem kurzen Zeitintervall sollte defektiert 

werden. 21 Geeignet ist Tit-for-two-Tats, das nur auf zwei aufeinanderfolgende 

Defektionen selbst defektiert Verluste ab. 

3.4.3 Unerfüllbare Forderungen an Tit-for-Tat 

Die Kapitel 3.4.1 und 3.4.2 stellen konträre Forderungen: 

• Um die unsinnige Kooperation mit blinden Strategien zu vermeiden, ist 

eine Strategie, die von sich aus defektiert und auf gegnerische Defektion 

mehrfach defektiert, nötig 

• Um einem Echo wegen eines Mißverständnisses zu entgehen, sollte die 

Strategie auf einmalige Defektionen nicht reagieren 

Tit-for-Tat geht einen Mittelweg und erzielt durchschnittliche Auszahlungen. 

Eine aggressivere Strategie erhält gegen blinde Strategien deutlich höhere 

Auszahlungen, wird aber wegen Mißverständnissen in ständiger Defektion 

Punkte einbüßen. Umgekehrt erhält eine freundlichere Strategie gegen blinde 

Strategien eine noch niedrigere Auszahlung, kann aber trotz der 

Mißverständnisse langfristig kooperieren. 

21 Vgl. Dixit/Nalebuff (1997) S. 112f 

20

4 Wege aus dem Gefangenen-Dilemma 

4.1 Ratschläge für die Spieler 

Aufgrund der umfangreichen Untersuchungen der Computer-Turniere und der 

guten Ergebnisse von Tit-for-Tat kann Axelrod den Spielern 

Verhaltensvorschläge für erfolgreiches Verhalten geben, um beim wiederholten 

Gefangenen-Dilemma eine hohe Auszahlung zu erhalten. 22 

Sei nicht neidisch! 

Es ist wichtig, sich nicht mit dem Gegenspieler zu vergleichen, sondern zu 

versuchen für sich das beste Ergebnis zu erzielen. Stellen Menschen fest, daß der 

andere eine größere Auszahlungsmenge hat, defektieren sie, um den Vorsprung 

einzuholen. Dies führt wiederum nur zur Defektion des anderen und es kommt zu 

einer Kette von Bestrafungen. Menschen denken oft in Nullsummenspielen. Das 

Gefangenen-Dilemma (und die meisten Konfliktsituationen in der Realität) ist 

jedoch ein Nicht-Nullsummenspiel. Beim wiederholten Gefangenen-Dilemma ist 

der Erfolg des anderen sogar eine Voraussetzung dafür, daß man selbst gut 

abschneidet. 

Defektiere nicht als erster! 

Langfristig sind freundliche Strategien stabiler und leistungsfähiger, nur in 

kurzfristigen Spielen ist die ständige Defektion die bessere Strategie. In beiden 

Computer-Turnieren waren die erfolgreichsten Strategien freundlich. Die 

ökologische Analyse zeigte, daß unfreundliche Strategien hauptsächlich durch 

blinde Strategien profitieren. Mit dem Aussterben der blinden Strategien ist die 

Grundlage für hohe Auszahlungen der unfreundlichen Strategien nach einigen 

Generationen zerstört. Unfreundliche Strategien erhalten gegen Strategien, die 

nicht nachsichtig sind sondern auf Defektion mit mehrfacher Defektion 

antworten, meist nur P. 

22 Vgl. Axelrod (2000) S. 99-111 

21

Erwidere sowohl Kooperation als auch Defektion! 

Reagiert eine Strategie auf Defektionen zu nachsichtig, so riskiert sie ausgebeutet 

zu werden. Beantwortet man eine Defektion mit mehr als einer eigenen 

Defektion, so kann hingegen das Superspiel eskalieren: Ständige gegenseitige 

Defektion könnte sich einstellen. Das optimale Ausmaß an Nachsicht muß der 

Umgebung angepaßt werden. Falls eine freundliche Strategie eine Defektion 

nicht mit Defektion beantworten würde, wäre sie zudem nicht kollektiv stabil. 

Sei nicht zu raffiniert! 

Wählt Spieler 1 eine komplizierte Strategie, könnte sein Verhalten auf Spieler 2 

wie eine Zufallsstrategie wirken. Da Spieler 1 scheinbar nicht auf ihn reagiert, 

geht der Anreiz zur Kooperation verloren. Sehr einfache Regeln wie Tit-for-Tat 

sind hingegen schnell erkannt und der Mitspieler kann dementsprechend handeln 

und kooperieren. Tit-for-Tat versucht weder zu täuschen noch zu betrügen. 

Raffiniertheit ist in Nullsummenspielen notwendig, um es dem Gegner möglichst 

schwer zu machen. Im Gefangenen-Dilemma verschlechtert sie aber durch 

Verwirrung die Chancen zur Kooperation. 

4.2 Einfluß des Reformers 

Nun werden Einflußnahmen des Reformers (z. B. des Staats), der die 

Kooperation unter Spielern fördern kann, erläutert. Somit wird nicht mehr der 

einzelne Spieler beraten, sondern versucht, Kooperation im Gefangenen- 

Dilemma durch äußere Veränderungen zu fördern. 23 

• Erweitere den Schatten der Zukunft 

Axelrod empfiehlt eine Erhöhung der Interaktion, da sich Kooperation desto eher 

einstellen kann, je öfter das Gefangenen-Dilemma wiederholt wird. 

Wenn man die Interaktion dauerhafter macht, also den Zeitraum des 

Aufeinandertreffens und somit p erhöht, steigen die Chancen zur Kooperation. 

23 

Kapitel 4.2 vgl. Axelrod (2000) S. 112-127 

22

Genauso kooperationsfördernd ist es, die Interaktionen häufiger stattfinden zu 

lassen. Dies kann erreicht werden, indem man die Anzahl der möglichen 

Mitspieler verringert. In Kleinstädten oder durch Ausschluß von oder 

Eintrittsbarrieren für konkurrierende Unternehmen trifft jeder Spieler öfter auf 

bekannte andere Spieler. Eine gute Konzentration von Interaktionen weniger 

Individuen entsteht durch Hierarchien. In einer Bürokratie schließen sich 

mehrere Personen ähnlicher Spezifikation zusammen. Diese Spieler treffen somit 

häufiger aufeinander. Bei Problemen zwischen den verschiedenen Zweigen 

agieren die Vorgesetzten miteinander. Dies ist sinnvoll, da wenige Vorgesetzte 

besser interagieren können als viele Mitglieder mehrerer Gruppen. 

Durch das Aufspalten eines Vertrages in viele Verhandlungsgegenstände wird 

Vertrauen eher aufgebaut werden können: Abrüstung zweier Großmächte ist 

höchstens in vielen Teilschritten realisierbar. 

• Änderung der Auszahlungen 

Die Hauptfunktion der Regierung ist die Ermöglichung von Auswegen aus dem 

Gefangenen-Dilemma durch Änderung von T, R, P und S. Durch eine Änderung 

der Auszahlungen ist eine freundliche Strategie bereits bei einem geringen p 

kollektiv stabil. Die Regierung zwingt die Bürger dazu, auch ohne privaten 

Anreiz soziales Verhalten auszuüben. Gesetze existieren, um Menschen zu 

veranlassen, Steuern zu zahlen, nicht zu stehlen und Verträge mit Fremden 

einzuhalten. Die beiden Gefangenen würden ebenfalls eher schweigen, wenn sie 

in einer organisierten Bande wären und bei Gestehen mit Bestrafung durch die 

eigene Bande rechnen müßten. 

• Belehrung der Spieler über kooperationsfördernde Werte, Fakten und 

Fertigkeiten, die kooperationsfördernd sind 

„Unterweise die Menschen, sich umeinander zu kümmern.” 

Die Menschen sollten sich mehr um das Wohlergehen ihrer Mitmenschen sorgen 

und sich zuerst jedem Menschen gegenüber kooperativ verhalten. Im Elternhaus, 

in Schulen und Kirchen wird den Kindern gelehrt, das Glück der Mitmenschen 

zu beachten. Dadurch, daß die Wohlfahrt anderer das eigene Wohlbefinden 

23

verbessern kann, wird Defektion unattraktiver. Menschen, die versuchen diesen 

Altruismus zu unterlaufen und kooperatives Verhalten nicht erwidern, sollte man 

mit Defektion begegnen. Dies führt zur Gegenseitigkeit als Grundlage der 

Kooperation. 

„Unterweise in Sachen Reziprozität” 

Die verbreitetste Moral in vielen Gesellschaften ist die Goldene Regel: 

“Behandele andere so, wie du behandelt werden möchtest.” Das Problem dieser 

Moral (= Strategie Cooperate) liegt in der ständigen Nachsicht, die einigen 

Mitmenschen entgegengebracht und von diesen ausgenutzt wird. Eine „Tit-for- 

Tat-Moral” ist besser, da sie zwar freundlich zu den Mitspielern ist, sich aber 

auch nicht ausnutzen läßt. Tit-for-Tat gewinnt in keinem direkten Duell und 

fördert Kooperation und verhält sich somit recht moralisch, wenn auch nicht 

nach der Goldenen Regel. Eine gegenseitige Unterweisung in Reziprozität 

(Wechselseitigkeit) ist notwendig um eventuell Abweichende zu erkennen und 

direkt zu bestrafen. 

“Verbessere die Erinnerungsfähigkeit” 

Eine gute Erinnerung an ehemalige Mitspieler und ihre Verhaltensweisen ist 

notwendig, damit die Spieler sofort wissen, ob sie freundlich oder aggressiv 

reagieren müssen. Kooperation kann nur aufrechterhalten werden, wenn man sich 

an die bisherigen Runden mit dem anderen Spieler erinnert. Sonst kann man auf 

früheres feindliches Verhalten nicht rechtzeitig reagieren. 

24

5 Bedeutung des Gefangenen-Dilemmas 

In diesem Kapitel wird aufgezeigt, daß Verhaltensweisen in unterschiedlichsten 

Bereichen durch das wiederholte Gefangenen-Dilemma nachvollziehbar werden. 

5.1 Stellungskrieg 

Aus der Sicht der Staaten war der erste Weltkrieg ein Nullsummenspiel. Die 

Soldaten in ruhigen Frontabschnitten im Stellungskrieg befanden sich hingegen 

im wiederholten Gefangenen-Dilemma. Sie trafen mehrfach auf die selben 

gegnerischen Soldaten, p war somit sehr groß. Ein Soldat hatte stets die Wahl zu 

kooperieren (vorsätzlich so schießen, daß Verletzungen vermieden werden) oder 

zu defektieren (gezielt schießen, um zu töten). 

Zwischen den verfeindeten Bataillonen konnte man eine Evolution der 

Kooperation feststellen. Ein kooperatives Interaktionssystem wurde durch 

gleichzeitige Ablenkungen (Mahlzeiten) oder schlechtes Wetter (Angriffe 

wurden fast unmöglich) eingeführt. Die Soldaten wurden so zur Kooperation 

gedrängt. Die Kooperationen wurden aufrechterhalten, da jedem Soldaten 

bekannt war, daß der Gegner zurückschlagen würde. Eine Dämpfungsfunktion 

verhinderte eskalierende Echos (Anstifter erkennt die Eskalation und verzichtet 

auf weitere Bestrafung). Die Soldaten spielten eine freundliche, nachsichtige 

Strategie. Unter den verfeindeten Soldaten bildeten sich Ethiken. Im Falle einer 

versehentlichen Defektion bedauerten die Soldaten den Tod eines Gegners. 

Moral verbesserte die Auszahlungen für kooperatives Verhalten. 

Die Führungsstäbe konnten das Verhalten der Soldaten nicht kontrollieren und 

verhindern. Gegen Kriegsende befahlen die Offiziere jedoch kontrollierbare 

Aggressionen wie kleine Stoßtrupps. Durch gezieltes Ausschalten der 

Dämpfungsfunktion wurde das Interaktionssystem außer Kontrolle gebracht. 

Ewige Defektion beendete die Evolution der Kooperation. 24 

24 Vgl. Axelrod (2000) S. 67-79 

25

5.2 Das OPEC-Kartell 

Das Standardbeispiel für ein iteriertes Gefangenen-Dilemma im Wirtschaftsleben 

ist das Kartell der Organisation der erdölexportierenden Länder OPEC. 

Die Spieler, also die Mitgliedsstaaten der OPEC, können in jeder Runde (jeden 

Monat) kooperieren (wenig Öl verkaufen) oder defektieren (viel Öl verkaufen). 

Für jedes Land ist es vorteilhaft viel Öl zu verkaufen, da es so seine Einnahmen 

erhöht. Dadurch, daß die Staaten mehr Öl anbieten, fällt jedoch der Preis. Wenn 

alle Staaten kooperieren, würde jeder Staat dank des hohen Preises R erhalten. 

Ziel des Kartells ist es, jeden Staat zur Kooperation zu bringen, damit niemand 

auf T spekuliert und so allen Staaten schadet. 

Nach dem Zusammenschluß der OPEC-Staaten stieg der Rohölpreis pro Barrel 

von 1973 bis 1980 von 3 auf 30 US Dollar. Als dann das Kartell 

zusammenzubrechen schien, fiel der Preis 1986 auf 10 US Dollar pro Barrel. In 

den ersten Spielrunden kooperierten alle Staaten, dann fingen einige Staaten an 

zu defektieren. Die Lage eskalierte, alle Staaten verkauften viel Rohöl. 

Das Gefangenen-Dilemma tritt nur in Oligopolen auf. In Polypolen können die 

Unternehmen den Preis nicht verändern und beeinflussen somit durch ihre 

Strategie die empfohlenen Verhaltensweisen für andere Unternehmen nicht. 

Am Beispiel des OPEC-Kartells sieht man auch, daß Kooperation unter den 

Spielern für Unbeteiligte schlecht sein kann. Die Allgemeinheit präferiert 

niedrige Rohölpreise, ihr wäre es also lieber, wenn die Staaten ständig 

defektieren würden. Kartellamte sollen Kooperation und Absprachen verbieten. 25 

5.3 Biologie 

In biologischen System läßt sich Kooperation durch die Verwandtschaftstheorie 

erklären. Nahe Verwandtschaft zwischen Lebewesen ermöglicht Altruismus, also 

den Verzicht auf eigenen Vorteil für das Überleben der eigenen Art. 

25 Vgl. Dixit/Nalebuff (1997) S. 89-91 

26

Kooperation tritt jedoch auch auf, wenn keine Verwandtschaft vorliegt. Axelrod 

nennt für die Reziprozitätstheorie Symbiosen zwischen Pilzen und Algen, 

Ameisen und Ameisen-Akazien, Feigen und Feigenbäumen als Beispiele für 

wechselseitige Kooperation im wiederholten Gefangenen-Dilemma. 

Unkalkulierbare biologische Faktoren wie durchschnittliche Lebensdauer, 

relative Mobilität und Gesundheit der Individuen führen dazu, daß die Anzahl 

der gespielten Runden unbekannt ist. Defektion ist bei hohem p nicht mehr die 

dominante Strategie und Kooperation kann sich einstellen. Problematisch ist, daß 

sich beispielsweise Bakterien nicht an das Verhalten anderer Bakterien erinnern 

können. Deshalb ist es wichtig, mit möglichst wenigen anderen Spielern in 

Kontakt zu treten. 26 

5.4 Fazit 

Mit den erörterten Eigenschaften des wiederholten Gefangenen-Dilemmas ist es 

gelungen, Kooperation zwischen Egoisten in vielen Fällen als eine rationale 

Verhaltensweise herauszustellen. Egoismus muß also nicht für Feindseligkeit und 

Defektion stehen. Falls die Zukunft eine ausreichende Bedeutung hat, können die 

Spieler die pareto-ineffiziente Situation der wechselseitigen Defektion im 

einfachen Gefangenen-Dilemma verlassen und sich langfristig durch ständige 

Kooperation belohnen. 

Die Vorteile und Stärken von Tit-for-Tat und ähnlichen freundlichen und 

nachsichtigen Strategien habe ich in Theorie, Computerexperimenten und 

Wirklichkeit eindeutig nachweisen können. 

26 Vgl. Axelrod (2000) S. 80-95 

27

6 Literaturverzeichnis 

Hauptquellen 

Axelrod, Robert 

Die Evolution der Kooperation; 5. Auflage, R. Oldenbourg Verlag, München 2000 

Dixit, Avinash K. und Nalebuff, Barry J. 

Spieltheorie für Einsteiger – Strategisches Know-how für Gewinner; 1.Auflage, 

Schäffer-Poeschel Verlag, Stuttgart 1997 

Feess-Dörr, Eberhard 

Mikroökonomie, Kapitel 2: Einige entscheidungstheoretische Grundlagen der 

Mikroökonomie; Metropolis-Verlag, Marburg 1997 

Güth, Werner 

Spieltheorie und ökonomische (Bei)Spiele; 2. Auflage, Springer-Verlag, Berlin 

1999 

Manteuffel, Karl und Stumpe, Dieter 

Mathematik für Ingenieure, Naturwissenschaftler, Ökonomen, Landwirte: 

Spieltheorie; 3. Auflage, BSB Teubner Verlagsgesellschaft, Leipzig 1990 

Nasar, Sylvia 

Auf den fremden Meeren des Denkens. Das Leben des genialen Mathematikers 

John Nash; Piper Verlag, München 1999 

Poundstone, William 

Prisoner’s Dilemma; 1. Auflage, Doubleday-Verlag, New York 1992 

von Neumann, John und Morgenstern, Oskar 

Spieltheorie und wirtschaftliches Verhalten; 2. Auflage, Physica-Verlag, 

Würzburg 1967 

28

Internet-Quellen 

David Levine 

Fachhochschule Fulda 

Economic and Game Theory 

http://levine.sscnet.ucla.edu/ 

Info zu Axelrods Computerturnier 

http://www.fh-fulda.de/~fd9006/OekoSimSpiele/Egoisten.html 

Foto von und Text über Anatol Rapoport 

http://collections.ic.gc.ca/heirloom_series/volume7/countries/russia11.html 

Humboldt-Uni. Berlin 

Universität Hannover 

Universität Koblenz 

Universität Köln 

Universität Mannheim 

Universität München 

Uni. Saarbrücken 

Universität Osnabrück 

Universität Ulm 

University of Michigan 

Spieltheorie-Skript von Prof. Werner Güth 

http://www.wiwi.hu-berlin.de/institute/wt3/Lehre/ 

ss01_spieltheorie/ss01_spieltheorie.html (besonders: Kapitel 6 Seite 388 - 394) 

Spieltheorie-Skript von Thomas Riechmann 

http://kaldor.vwl.uni-hannover.de/wuv/lectures/scripts/sosem-2001/spieltheorie.html 

http://kaldor.vwl.uni-hannover.de/wuv/lectures/scripts/sosem-2001/sp06.pdf 

Text zu Axelrods Buch von Jens Woch 

http://wwwpriv.uni-koblenz.de:81/~woch/abstracts/axelrod-ek-91.html 

Außenpolitik-Seminararbeiten (Stellungskrieg) 

http://www.uni-koeln.de/wisofak/powi/jaeger/arbeiten/seminar/ss2000/jacobs/index.html 

Spieltheorie-Skript von Oliver Kirchkamp 

http://www.sfb504.uni-mannheim.de/~oliver/spiel/spieltheorie_1.pdf 

Spieltheorie-Skript von Prof. Klaus M. Schmidt 

http://www.vwl.uni-muenchen.de/ls_schmidt/index_de.htm 

Reinhard Selten: Informationen und Foto 

http://www.uni-saarland.de/z-einr/ub/News/aus-04/sel.html 

Ausführliche Texte zur Spieltheorie und Axelrod 

http://www.cl-ki.uni-osnabrueck.de/~nntthele/ipd/index.html 

Entscheidungstheorie – Kooperation unter Egoisten 

http://www.informatik.uniulm.de/ki/Edu/Vorlesungen/VerteilteKI/WS9596/std2ent.html 

Homepage von Robert Axelrod 

http://www.spp.umich.edu/people/axelrod-r.htm 

Universität Zürich Evolution der Kooperation und k. I. 

http://www.ifi.unizh.ch/groups/ailab/teaching/seminar_newai99/pfister.pdf 

Thomas Fent 

Geschichte der Spieltheorie 

http://e119ws1.tuwien.ac.at/OR/Fent/Game/deutsch.html 

29

7 Anhang 

7.1 Grundbegriffe der Spieltheorie 

7.1.1 Fachtermini 

In der folgenden Übersicht wird die Bedeutung der wichtigsten Begriffe der 

Spieltheorie kurz umschrieben. 

Begriff 

Spiel 

Spieler 

(auch Agent, Partei, Aktor) 

Strategie 

(auch Handlungsalternative) 

Gewinnmatrix 

(auch Spiel-, Auszahlungs-, 

Ereignis-, Payoff-, 

Nutzenmatrix) 

Situation 

(auch Lösung) 

Bedeutung 

Unter einem Spiel versteht man eine Anzahl von Regeln, die 

die zugelassenen Handlungen der an einem Wettbewerb 

(Konflikt) beteiligten Parteien beschreiben. Diese Spielregeln 

müssen präzise festlegen, welche Züge jeder Spieler in allen 

möglichen Situationen ausführen kann, wann das Spiel 

beendet ist, und wer dann welchen Betrag gewonnen hat 

Die teilnehmenden Interessenparteien (z.B. Firmen, 

Gefangene, Staaten) sind die Akteure des Spiels. Sie haben 

stets die Wahl zwischen verschiedenen Aktionsmöglichkeiten 

(Strategien) 

Eine Strategie ist ein eindeutiger Verhaltensplan des Spielers 

für jede Entscheidungssituation 

Die Strategien und die daraus folgenden Gewinne der Spieler 

werden in einer Matrix aufgeführt. Der Gewinn von Spieler 1 

steht vor, der Gewinn von Spieler 2 nach dem Komma 

Jedes Ergebnis, das sich durch die Wahlmöglichkeiten der 

Spieler ergeben kann, wird als Situation bezeichnet 

30

Begriff 

Gemischte / reine 

Strategie 

Nullsummenspiel 

/ Nicht- 


Simultanes / 

sequentielles 

Spiel 

Nichtkooperatives 

/ 

kooperatives 

Spiel 

Einfaches / 

wiederholtes 

Spiel (auch iteriertes 

Spiel oder Superspiel) 

Perfekte / 

imperfekte 

Information 

Bedeutung 

Wenn die Spieler reine Strategien spielen müssen, müssen sie 

sich stets auf einen Weg festlegen. Bei gemischten Strategien 

können sie hingegen beispielsweise zu 50% Weg A und zu 

50% Weg B einschlagen (Münzwurf trifft die Entscheidung) 

In einem Nullsummenspiel ist die Auszahlungssumme aller 

Spieler stets gleich null. In Nicht-Nullsummenspielen kann es 

insgesamt auch Verluste oder Gewinne geben 

Falls sich alle Spieler gleichzeitig entscheiden müssen, 

spricht man von einem simultanen Spiel. In einem 

sequentiellen Spiel agieren die Spieler nacheinander 

In einem nichtkooperativen Spiel kann es durchaus freiwillige 

Kooperation geben. Es existiert aber kein übergeordnetes 

Rechtssystem, das die Spieler auf getroffene Vereinbarungen 

festlegen würde. Bei kooperativen Spielen können bindende 

Vereinbarungen getroffen werden, und die Spieler dürfen von 

ihrem Gewinn Seitenzahlungen an andere Spieler leisten 

In einem einfachen Spiel wird das Spiel nur eine Runde (auch 

Periode, Stufe) gespielt. Unter einem wiederholten Spiel 

versteht man das mehrfache Spielen desselben Spiels. Jede 

Runde wird als Stufenspiel bezeichnet 

Falls die Spieler zu jedem Zeitpunkt vollständig über den 

bisherigen Spielverlauf und die Auszahlungen informiert sind, 

spricht man von einem Spiel mit perfekter Information. Wenn 

es im Spiel auch nicht kalkulierbare Ereignisse geben kann, 

handelt es sich um ein Spiel mit imperfekter Information 

31

7.1.2 Die Rationalitätshypothese 

Die Spieltheorie stellt an die Spieler die Forderung, sich stets rational zu 

verhalten. Nach dem Menschenbild der Ökonomie trifft der Homo oeconomicus 

keine gefühlsmäßigen oder habituellen Entscheidungen, sondern wählt die 

Alternative, die ihm den höchsten Nutzen bringt. Er verhält sich ungeachtet des 

Erfolgs oder Mißerfolgs der anderen Spieler strikt rational. Handeln aus 

altruistischen Motiven ist ausgeschlossen. 

7.1.3 Grundlegende Spielsituation 

In der Spieltheorie werden Konfliktsituationen zwischen mehreren Parteien 

betrachtet. Jede Partei kann zwischen verschiedenen Strategien wählen. 

Generell sind Anzahl der Spieler, der Strategien und der zu spielenden Runden 

beliebig. Um die Analysierbarkeit zu vereinfachen, werden jedoch meist und 

auch in dieser Arbeit Spiele mit zwei Spielern und wenigen Strategien betrachtet. 

Die Spielsituation jeder Runde wird in einer Gewinnmatrix veranschaulicht: 

Spieler 2 

Strategie A Strategie B Strategie C 

Strategie A 6, 9 4, 7 6, 1 

Spieler 1 

Strategie B 8, 4 8, 5 4, 9 

Strategie C 11, 7 5, 3 5, 7 

Tabelle 5: Eine allgemeine Spielmatrix 

Jeder Spieler wählt eine Präferenzordnung der Ergebnisse, er ordnet also jeder 

Situation einen Zahlenwert zu. Würden beide Spieler Strategie B wählen, erhielte 

Spieler 1 acht, Spieler 2 fünf Gewinneinheiten (= Nutzenpunkte). 

32

7.1.4 Spielarten 

In dieser Arbeit werden stets nicht-kooperative, simultane Nicht- 

Nullsummenspiele mit perfekter Information betrachtet: 

• Die Spieler dürfen zwar kooperieren, können aber keine bindenden 

Vereinbarungen treffen – nicht-kooperatives Spiel 

• Die Spieler müssen ihre Entscheidungen stets simultan treffen 

• Die Auszahlungssumme muß nicht immer gleich Null sein – Nicht- 


• Die Spieler wissen stets alles über vergangene Spiele, Wahlmöglichkeiten 

und Auszahlungen des Gegner – perfekte Information 

7.1.5 Dominante Strategien 

Definition: 

Eine dominante Strategie ist eine Strategie, die in jedem Fall 

mindestens genauso gut ist, wie jede andere Strategie 

Ein Spieler wird eine dominante Strategie unabhängig von der Wahl der anderen 

Spieler spielen, da ihm diese stets den höchsten Gewinn einbringt. 

Im folgenden Spiel wählt Spieler 2 mit Strategie A eine dominante Strategie: 

Spieler 2 

Strategie A 

Strategie B 

Spieler 1 

Strategie A 1, 10 15, 3 

Strategie B 6, 12 8, 4 

Tabelle 6: Spielmatrix mit dominanter Strategie 

7.1.6 Das Nash-Gleichgewicht 

Falls keine dominanten Strategien vorliegen, lassen sich durch das Nash- 

Gleichgewicht (engl. Nash-Equilibrium) Strategien finden, die den erwarteten 

33

Gewinn jedes Spielers maximieren. Da die Strategien wechselseitig beste 

Antworten darstellen und sich deshalb kein Spieler durch das Abweichen von 

seiner Gleichgewichtsstrategie verbessern kann, werden alle Spieler dieses 

Konzept anwenden. Das Nash-Gleichgewicht stellt für den einzelnen Spieler 

jedoch meist keine optimale Lösung dar. 

Definition: 

Eine Situation, in der sich kein Spieler durch eine andere Strategie 

besser stellen kann, sofern die anderen Spieler bei ihrem Verhalten 

bleiben, bezeichnet man als Nash-Gleichgewicht 

Im folgenden Spiel existiert ein eindeutiges Nash-Gleichgewicht: 

Spieler 2 

Strategie A Strategie B Strategie C 

Strategie A 10, 10 0, 2 2, 4 

Spieler 1 

Strategie B 3, 3 6, 6 7, 5 

Strategie C 25, 0 4, 7 0, 4 

Tabelle 7: Ein eindeutiges Nash-Gleichgewicht 

Jeder Spieler muß voraussehen, wie sein Mitspieler handeln wird, um die beste 

Antwort auf diese Strategie spielen zu können. Folglich wird ein Strategiepaar 

gespielt, in dem beide Strategien die beste Antwort auf die jeweils andere 

darstellen. Ein solches Nash-Gleichgewicht besteht in diesem Beispiel, wenn 

beide Spieler Strategie B spielen. Kein Spieler hat einen Anreiz, von seiner 

Gleichgewichts-Strategie abzuweichen, da dies unweigerlich mit Verlust 

verbunden wäre. Bei allen anderen Strategiekombinationen hat mindestens ein 

Spieler die Motivation, seine Strategie zu wechseln. 

Spiele aus dem Wirtschaftsbereich haben in reinen Strategien meist entweder 

kein Nash-Gleichgewicht oder mehrere. Die Spieler müssen nun eine gemischte 

34

Strategie wählen. Jeder Strategie wird also eine bestimmte 

Ausspielwahrscheinlichkeit zugeordnet. Man kann beweisen, daß sich durch 

gemischte Strategien stets ein eindeutiges Nash-Gleichgewicht finden läßt. 

7.1.7 Pareto-Effizienz 

Definition: 

Eine Situation heißt pareto-effizient, wenn kein Spieler 

besser gestellt werden könnte, ohne daß mindestens 

ein anderer Spieler eine Verschlechterung erleidet 

Die Pareto-Effizienz ist ein Kriterium dafür, ob ein Spielausgang wünschenswert 

ist. Betrachtet man eine Situation, die nicht pareto-effizient ist, so wäre eine 

andere Situation, die mindestens einen Spieler besser stellt, möglich. Dieser 

Spieler könnte einen Bruchteil seines zusätzlichen Nutzenzuwachses an alle 

Spieler verteilen. Somit wären alle Spieler besser gestellt. 

7.2 Strategien 

Die folgende Liste führt einige einfache Standardstrategien und Strategien, die 

bei Axelrods Turnieren eingesetzt wurden, auf. Die Standardstrategien werden 

auch benutzt, um neue Strategien zu testen. 27 

Unter einer blinden Strategie versteht man eine Strategie, die Verhalten nicht 

vom anderen Spieler abhängig macht, also einem blinden Schema folgt. 

Strategien, deren Verhalten vom Verhalten des anderen Spielers abhängen, 

bezeichnet man als sensitive Strategien. 

Es wird auf die Bezeichnungen und Auszahlungen von Tabelle 1 Bezug 

genommen: T=Temptation, 5 Punkte; R=Reward, 3 Punkte; P=Punishment, 1 

Punkt; S=Sucker’s Payoff, 0 Punkte. 

27 Vgl. http://www.informatik.uni-ulm.de/ki/Edu/Vorlesungen/VerteilteKI/WS9596/std2ent.html, 

http://www.cl-ki.uni-osnabrueck.de/~nntthele/ipd/ipd2.html, und Axelrod (2000) Teil II 

35

Blinde Strategien 

Name, System 

Defect 

unfreundlich, blind 

defektiere bei jedem 

Zug 

Cooperate 

freundlich, blind 

kooperiere bei jedem 

Zug 

Per_kind 

(= Per_ccd) 


spiele periodisch 

„2mal kooperieren – 

defektieren“ 

Per_nasty 

(= Per_ddc) 


spiele periodisch 

„2mal defektieren – 

kooperieren“ 

Random* 


ermittle Zufallszahl 

0

Sensitive Strategien 

Name, System 

Spite 

(= Grim = Friedman*) 

freundlich 

kooperiere im ersten 

Zug, dann kooperiere, 

solange der Gegner 

noch nicht defektiert 

hat, danach defektiere 

immer 

Tit-for-Tat* 

freundlich 


Zug; in jedem weiteren 

Zug spiele den Zug, 

den der Gegner beim 

letzten Mal benutzt hat 

Tat-for-Tit 

(= Mistrust) 

unfreundlich 

defektiere im 1. Zug; 

spiele dann Tit-for-Tat 

Tit-for-two-Tats 

freundlich 

defektiere nur auf 

zweifache Defektion 

Strategie 

Dies ist die erste Strategie, die das Verhalten des Gegners 

berücksichtigt. Spite ist freundlich, es bietet Kooperation 

an, ändert aber sein Verhalten, sobald der Gegner einmal 

versucht hat, unkooperativ zu sein. Spite läßt sich als 

Cooperate mit Abwehrmechanismus beschreiben, der vor 

Ausbeutung schützt. Spite versucht nicht, Gegner zur 

Kooperation zu bewegen, die gelegentlich T erhalten 

wollen. Es gibt Spite-Varianten, die ihr Verhalten erst 

nach zwei oder mehreren "Betrugsversuchen" ändern. 

Diese Strategie ist kooperationswillig, wehrt sich aber 

auch gegen Ausbeutungsversuche. Gleichzeitig ist sie 

nicht nachtragend, sondern beantwortet erneute 

Kooperationsbereitschaft mit Kooperation. Tit-for-Tat 

kann nicht gewinnen, da es niemals unmotiviert 

defektiert, also nie versucht T zu erhalten. Andererseits 

kann es aber auch nicht mit mehr als 5 Punkten Abstand 

verlieren, weil es sich nur einmal ausbeuten läßt. 

Tat-for-Tit läßt sich überhaupt nicht ausbeuten, da die 

Strategie am Anfang defektiert. Daher ist Tat-for-Tit auf 

die Initiative des Gegners angewiesen, damit es zur 

Kooperation kommt. Ansonsten gelten die gleichen 

Bemerkungen wie bei Tit-for-Tat. 

Tit-for-two-Tats ist nachsichtiger als Tit-for-Tat und hätte 

Axelrods erstes Turnier gewonnen, wenn es jemand 

eingereicht hätte. Tit-for-two-Tats kann jedoch auch 

leicht ausgebeutet werden, z. B. von Per_kind. 

37

Name, System 

Two-tits-for-Tat 

freundlich 

defektiere zweimal auf 

Defektion 

Soft-majo 

freundlich 

spiele den 

meistbenutzten Zug des 

Gegners, bei 

Gleichheit kooperiere 

Downing* 

unfreundlich 

kooperiere mit 

kooperativen Spielern, 

defektiere im 

Zweifelsfall 

Gradual 

freundlich 

Bestraft die erste Defektion 

mit einer Defektion, die 

zweite Defektion mit zwei 

Defektionen, etc. 

Prober 

unfreundlich 

spiele die ersten drei Züge 

„kooperieren – 2mal 

defektieren“; defektiere 

immer, wenn der Gegner im 

2.+3. Zug kooperiert hat, 

sonst spiele Tit-for-Tat 

Strategie 

Two-tits-for-Tat ist nicht so nachsichtig wie Tit-for-Tat, 

sondern bestraft den anderen Spieler nach jeder 

Defektionen mit zwei Defektionen. 

Soft-majo (soft majority, knappe Mehrheit) versucht 

ständiger Ausbeutung dadurch zu entgehen, daß sie bei 

überwiegender Defektion ebenfalls defektiert. Das hat 

den Vorteil, daß sie gegen „bedingt“ kooperationswillige 

Gegner weiterhin kooperiert, aber den Nachteil, relativ 

leicht überlistet zu werden, z.B. durch Per_nasty. 

Downings Programm berechnet die Wahrscheinlichkeit 

für Kooperation bei seinem Mitspieler, nachdem er selbst 

kooperiert oder defektiert hat. Nach jedem Zug wird die 

bedingte Wahrscheinlichkeit neu berechnet. Bei gleicher 

oder geringerer Wahrscheinlichkeit der Kooperation wird 

defektiert, ansonsten kooperiert. 

Gradual kooperiert beim ersten Zug und beantwortet das 

erste Defektieren des Gegners mit einem Defektieren und 

anschließend zwei Kooperationen, schließlich das n-te 

Defektieren des Gegners mit n Defektionen und zwei 

Kooperationen. 

Hier soll die gegnerische Strategie zunächst getestet 

werden: Wenn sie sich ausbeuten läßt, fährt Prober fort, 

zu defektieren. Das führt zu einer aggressiven 

Grundhaltung, die allerdings bei „schlaueren“ Gegnern 

zugunsten einer kooperativen Haltung (Tit-for-Tat) 

aufgegeben wird, da sonst nur P in Aussicht stünde. 

38

Name, System 

Pavlov 

freundlich 


Zug; dann nur, wenn 

beide Spieler 

denselben Zug gemacht 

haben 

Graaskamp* 

unfreundlich 

ähnlich wie Tit-for-Tat, 

versucht gegnerische 

Strategie zu erkennen 

Joss* 

unfreundlich 

Tit-for-Tat mit 

zufälliger Defektion 

Tideman und 

Chieruzzi* 

freundlich 

Bestraft die erste 

Defektion mit einer 

Defektion, die zweite 

Defektion mit zwei 

Defektionen, etc. 

Strategie 

Pavlov verfolgt einen ähnlichen Grundgedanken wie Titfor-Tat, 

stellt jedoch strengere Anforderungen an die 

eigene Kooperationswilligkeit: Nur nach einer 

erfolgreichen Kooperation wird weiter kooperiert, d.h. 

die Strategie reagiert auf Ausbeutungsversuche mit 

Nichtkooperation und macht dann von sich aus keinen 

Versuch, eine Kooperation wieder zu etablieren. 

Das Programm von Graaskamp spielt 50-mal Tit-for-Tat, 

defektiert, spielt fünfmal Tit-for-Tat und analysiert dann 

die Ergebnisse. Es versucht, eine der anderen Strategien 

zu erkennen und so die Auszahlung durch eingestreute 

Defektionen zu erhöhen. 

Joss’ Programm verhält sich ähnlich wie Tit-for-Tat, 

jedoch defektiert es mit einer zehnprozentigen 

Wahrscheinlichkeit, auch wenn der andere kooperiert hat. 

Tideman und Chieruzzis Programm bestraft die erste 

Defektion mit einer Defektion, die zweite Defektion mit 

zwei Defektionen, es ähnelt also Gradual. Es gibt aber 

nicht auf, unter bestimmten Umständen wird dem Gegner 

eine neue Chance gegeben. Nach zweimaliger 

Kooperation spielt es wie am Anfang. Zusätzlich 

überprüft ein implementierter Test statistisch, ob es sich 

bei dem Gegner um Random handelt. 

Mit * markierte Strategien nahmen am ersten Axelrod-Turnier teil 

39

7.3 Axelrods erstes Computerturnier 

Auf den folgenden Seiten sind die Tabellen 2 und 3 aus Robert Axelrods „Die 

Evolution der Kooperation“, Anhang A aufgeführt. 

Sie zeigen Teilnehmer und Ergebnisse des ersten Computerturniers. 

Abbildung 4: Axelrods erstes Turnier: Teilnehmer 28 

28 Vgl. Axelrod (2000) Seite 173 

40

Abbildung 5: Axelrods erstes Turnier: Endstand 29 

29 Vgl. Axelrod (2000) Seite 174 

41

Strategien im Gefangenen-Dilemma

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?