Dylemat Więźnia
Dylemat Więźnia
Dylemat Więźnia
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>Dylemat</strong> <strong>Więźnia</strong><br />
Beata Stępień<br />
Nina Kosz<br />
Piotr Sztela<br />
Karol Kornatka
<strong>Dylemat</strong> więźnia - definicja<br />
<strong>Dylemat</strong>em <strong>Więźnia</strong> nazywany jest jeden z klasycznych<br />
problemów teorii gier o sumie niezerowej. Jest on<br />
interesującą częścią klasy sytuacji, gdzie dwie strony<br />
mogą wybierać pomiędzy kooperatywnym i<br />
niekooperatywnym zachowaniem.<br />
W grze tej można osiągnąć wynik zysk-zysk oraz<br />
strata-strata. <strong>Dylemat</strong> więźnia nie ma zastosowania do<br />
sytuacji typu targowanie się, gdzie zysk jednej strony<br />
oznacza stratę drugiej; opisuje on raczej sytuację, w której<br />
gracze tworzą zespół i pracują razem.
Historia Gry<br />
Twórcami gry są Melvin Drasher i Merrill Flood z<br />
RAND Corporation w 1950 roku.<br />
Formalizacją gry zajął się Albert W. Tucker – do<br />
schematu gry dodał historyjkę<br />
(skąd gra otrzymała swoją<br />
Niespotykaną acz<br />
stosowną nazwę)
Klasyczna forma brzmi następująco:<br />
Dwóch podejrzanych zostało zatrzymanych przez policję.<br />
Policja, nie mając wystarczających dowodów do<br />
postawienia zarzutów, rozdziela więźniów i przedstawia<br />
każdemu z nich tę samą ofertę: jeśli będzie zeznawać<br />
przeciwko drugiemu, a drugi będzie milczeć, to zeznający<br />
wyjdzie na wolność, a milczący dostanie dziesięcioletni<br />
wyrok. Jeśli obaj będą milczeć, obaj odsiedzą 6 miesięcy<br />
za inne przewinienia. Jeśli obaj będą zeznawać, obaj<br />
dostaną pięcioletnie wyroki. Każdy z nich musi podjąć<br />
decyzję niezależnie i żaden nie dowie się czy drugi milczy<br />
czy zeznaje, aż do momentu wydania wyroku.<br />
Jak powinni postąpić?
Możliwe wyniki gry<br />
Więzień A milczy Obaj skazani na 6 miesięcy<br />
Więzień A zeznaje<br />
Więzień B milczy Więzień B zeznaje<br />
Więzień A: wolny<br />
Więzień B: 10 lat<br />
Więzień A: 10 lat<br />
Więzień B: wolny<br />
Obaj skazani na 5 lat<br />
A B<br />
A (0,0) (-2,1)<br />
B (1,-2) (-1,-1)<br />
Celem każdego gracza jest maksymalizacja swoich zysków,<br />
czyli uzyskanie jak najkrótszego wyroku.
W ogólnej postaci, dylemat<br />
przedstawia się jako macierz:<br />
Współpracuj Oszukuj<br />
Współpracuj R, R S, T<br />
Oszukuj T, S P, P<br />
T to inaczej pokusa zdrady, R – nagroda za<br />
współpracę, P – kara za zdradę, a S – wypłata<br />
oszukanego.<br />
Aby gra spełniała warunki dylematu, muszą być<br />
spełnione następujące nierówności:<br />
T > R > P > S<br />
Te warunki zapewniają, że oszukiwanie jest w każdej<br />
sytuacji bardziej opłacalne niż współpraca i<br />
jednocześnie że obaj tracą gdy obaj oszukują.
Iterowany <strong>Dylemat</strong> <strong>Więźnia</strong><br />
W iterowanym dylemacie więźnia, ci sami gracze grają wielokrotnie ze<br />
sobą, wybierając strategie w kolejnych rundach na podstawie<br />
wcześniejszych rund.<br />
Robert Aumann pokazał w 1959 roku, że w nieskończonym ciągu takich<br />
rozgrywek, współpraca może być stanem równowagi.<br />
W przypadku gdy wiadomo, ile dokładnie będzie rozgrywek, optymalną<br />
jest strategia Zawsze Oszukuj.<br />
Wynika to z następującego rozumowania: w ostatniej rundzie można<br />
równie dobrze oszukać, ponieważ przeciwnik nie będzie miał już okazji<br />
ukarać za to zagranie. Dlatego obaj gracze w ostatniej rundzie oszukają.<br />
Zatem w przedostatniej rundzie również opłaca się oszukać, ponieważ<br />
w ostatniej rundzie przeciwnik i tak oszuka itd.<br />
Zatem aby pojawiła się współpraca, liczba rund musi być losowa, albo<br />
przynajmniej nieznana graczom.
<strong>Dylemat</strong> więźnia w badaniach<br />
komputerowych<br />
W 1984 roku Rober Axeldor zaprosił akademików z całego świata do<br />
uczestnictwa w turnieju dla programów komputerowych, grających w<br />
iterowany dylemat więźnia. Przysyłane programy różniły się pod<br />
względem złożoności, startowego zachowania, reakcji na działanie<br />
przeciwnika itp. Wyniki pokazały, że przy wielokrotnych<br />
rozgrywkach, egoistyczne strategie dawały średnio bardzo małe<br />
wygrane w porównaniu z bardziej altruistycznymi.<br />
Axelrod pokazał w ten sposób możliwość ewolucyjnego wykształcenia<br />
się zachowań altruistycznych z nastawionych na własny zysk, wyłącznie<br />
za pomocą selekcji naturalnej.
Strategie dla iterowanego dylematu<br />
więźnia<br />
Najlepszą strategią w powyższym<br />
turnieju okazała się strategia „WET ZA<br />
WET” – Polega ona na współpracy w<br />
pierwszej rundzie a w każdej następnej<br />
tego co przeciwnik robił w poprzedniej.<br />
W niektórych sytuacjach lepszą<br />
okazywała się strategia „WET ZA WET Z<br />
WYBACZENIEM” polegająca na tym iż za<br />
każdym razem gdy przeciwnik oszukiwał<br />
gracz wybaczał z małym<br />
prawdopodobieństwem (do 5%) i z<br />
następną rundą znów miała miejsce<br />
współpraca. Pozwalało to przerwać<br />
nieskończony często ciąg wet za wet.
Wnioski Badań<br />
Axelrod zdefiniował następujące cechy występujące w dylemacie więźnia:<br />
Przyjazność – nie oszukujemy dopóki przeciwnik nas nie oszuka<br />
Mściwość – reagowanie na zdradę przeciwnika<br />
Skłonność do przebaczania – wracanie do współpracy<br />
Brak zazdrości – nie staranie się o uzyskanie lepszego wyniku niż ma<br />
przeciwnik<br />
Badania dały wynik, mówiący że aby wyjść najlepiej należy być przyjaznym<br />
i wybaczać.
W jednorazowym dylemacie więźnia oszustwo jest zawsze najlepszym<br />
wyborem – niezależnie od przeciwnika.<br />
W iterowanym dylemacie - optymalna strategia zależy od tego jak grają<br />
przeciwnicy i jak reagują na współpracę i zdradę. Przykładowo, gdyby<br />
wszyscy gracze grali strategią Zawsze Oszukuj, to jeden gracz grający<br />
strategią Wet Za Wet uzyskałby nieco gorszy wynik niż reszta. Gdyby<br />
wszyscy gracze grali strategią Zawsze Współpracuj, znacznie lepszy<br />
wynik uzyskałby jeden gracz grający strategią Zawsze Oszukuj.
Przykłady ze świata rzeczywistego<br />
Doping<br />
<strong>Dylemat</strong> dotyczy wszystkich<br />
szkodliwych dla zdrowia zabiegów<br />
poprawiających szanse<br />
zwycięstwa. Przykładami może<br />
być doping bądź gwałtowne<br />
tracenie wagi tak aby trafić do<br />
niższej kategorii<br />
wagowej. Zawodnik który tego nie<br />
robi (współpracuje) może stracić<br />
szanse na zwycięstwo. W<br />
momencie gdy wszyscy stosują<br />
doping zawody tracą sens.
Zawody kolarskie<br />
Częstą sytuacją jest gdy dwóch zawodników wyprzedza peleton,<br />
zmieniając się na męczącej przedniej pozycji. Jeśli żaden z<br />
zawodników nie będzie się starał jechać jako pierwszy, peleton<br />
szybko ich dogoni. Jeśli tylko jeden z nich będzie to robił, istnieje<br />
duża szansa że zawodnik który jechał za nim i dzięki temu mniej się<br />
męczył, wyprzedzi go tuż przed metą.
Informatyka<br />
Udostępnianie programów na publicznej<br />
licencji jest odpowiednikiem współpracy.<br />
Każda firma która udostępnia takie<br />
oprogramowanie, ułatwia prace innym<br />
firmom, które mogą z niego korzystać przy<br />
tworzeniu własnych produktów. Każde<br />
ulepszenie takiego oprogramowania musi<br />
zostać również udostępnione na publicznej<br />
licencji, co wymusza współpracę pomiędzy<br />
firmami.
Ochrona Środowiska<br />
Dbanie o czystość wód, powietrza, utylizacja odpadów - są<br />
działaniami odpowiadającymi współpracy, które wymagają wysiłku.<br />
Znacznie łatwiej jest nie podejmować tej współpracy a korzystać z<br />
wysiłku innych - to postawa oszusta. Kiedy jednak wszyscy będą<br />
oszukiwać i zaśmiecać środowisko, życie w nim stanie się uciążliwe.
SYSTEM PODATKOWY<br />
Każdy obywatel płacący<br />
należne podatki przyczynia się<br />
do finansowania potrzeb<br />
publicznych. Oszuści którzy<br />
starają się unikać płacenia<br />
podatków, czerpiąc z tego<br />
doraźne korzyści finansowe,<br />
najczęściej korzystają na równi<br />
z innymi z infrastruktury,<br />
edukacji, opieki zdrowotnej,<br />
finansowanych z podatków<br />
płaconych przez<br />
współpracujących.
Dziękujemy za uwagę