19.05.2013 Views

Dylemat Więźnia

Dylemat Więźnia

Dylemat Więźnia

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Dylemat</strong> <strong>Więźnia</strong><br />

Beata Stępień<br />

Nina Kosz<br />

Piotr Sztela<br />

Karol Kornatka


<strong>Dylemat</strong> więźnia - definicja<br />

<strong>Dylemat</strong>em <strong>Więźnia</strong> nazywany jest jeden z klasycznych<br />

problemów teorii gier o sumie niezerowej. Jest on<br />

interesującą częścią klasy sytuacji, gdzie dwie strony<br />

mogą wybierać pomiędzy kooperatywnym i<br />

niekooperatywnym zachowaniem.<br />

W grze tej można osiągnąć wynik zysk-zysk oraz<br />

strata-strata. <strong>Dylemat</strong> więźnia nie ma zastosowania do<br />

sytuacji typu targowanie się, gdzie zysk jednej strony<br />

oznacza stratę drugiej; opisuje on raczej sytuację, w której<br />

gracze tworzą zespół i pracują razem.


Historia Gry<br />

Twórcami gry są Melvin Drasher i Merrill Flood z<br />

RAND Corporation w 1950 roku.<br />

Formalizacją gry zajął się Albert W. Tucker – do<br />

schematu gry dodał historyjkę<br />

(skąd gra otrzymała swoją<br />

Niespotykaną acz<br />

stosowną nazwę)


Klasyczna forma brzmi następująco:<br />

Dwóch podejrzanych zostało zatrzymanych przez policję.<br />

Policja, nie mając wystarczających dowodów do<br />

postawienia zarzutów, rozdziela więźniów i przedstawia<br />

każdemu z nich tę samą ofertę: jeśli będzie zeznawać<br />

przeciwko drugiemu, a drugi będzie milczeć, to zeznający<br />

wyjdzie na wolność, a milczący dostanie dziesięcioletni<br />

wyrok. Jeśli obaj będą milczeć, obaj odsiedzą 6 miesięcy<br />

za inne przewinienia. Jeśli obaj będą zeznawać, obaj<br />

dostaną pięcioletnie wyroki. Każdy z nich musi podjąć<br />

decyzję niezależnie i żaden nie dowie się czy drugi milczy<br />

czy zeznaje, aż do momentu wydania wyroku.<br />

Jak powinni postąpić?


Możliwe wyniki gry<br />

Więzień A milczy Obaj skazani na 6 miesięcy<br />

Więzień A zeznaje<br />

Więzień B milczy Więzień B zeznaje<br />

Więzień A: wolny<br />

Więzień B: 10 lat<br />

Więzień A: 10 lat<br />

Więzień B: wolny<br />

Obaj skazani na 5 lat<br />

A B<br />

A (0,0) (-2,1)<br />

B (1,-2) (-1,-1)<br />

Celem każdego gracza jest maksymalizacja swoich zysków,<br />

czyli uzyskanie jak najkrótszego wyroku.


W ogólnej postaci, dylemat<br />

przedstawia się jako macierz:<br />

Współpracuj Oszukuj<br />

Współpracuj R, R S, T<br />

Oszukuj T, S P, P<br />

T to inaczej pokusa zdrady, R – nagroda za<br />

współpracę, P – kara za zdradę, a S – wypłata<br />

oszukanego.<br />

Aby gra spełniała warunki dylematu, muszą być<br />

spełnione następujące nierówności:<br />

T > R > P > S<br />

Te warunki zapewniają, że oszukiwanie jest w każdej<br />

sytuacji bardziej opłacalne niż współpraca i<br />

jednocześnie że obaj tracą gdy obaj oszukują.


Iterowany <strong>Dylemat</strong> <strong>Więźnia</strong><br />

W iterowanym dylemacie więźnia, ci sami gracze grają wielokrotnie ze<br />

sobą, wybierając strategie w kolejnych rundach na podstawie<br />

wcześniejszych rund.<br />

Robert Aumann pokazał w 1959 roku, że w nieskończonym ciągu takich<br />

rozgrywek, współpraca może być stanem równowagi.<br />

W przypadku gdy wiadomo, ile dokładnie będzie rozgrywek, optymalną<br />

jest strategia Zawsze Oszukuj.<br />

Wynika to z następującego rozumowania: w ostatniej rundzie można<br />

równie dobrze oszukać, ponieważ przeciwnik nie będzie miał już okazji<br />

ukarać za to zagranie. Dlatego obaj gracze w ostatniej rundzie oszukają.<br />

Zatem w przedostatniej rundzie również opłaca się oszukać, ponieważ<br />

w ostatniej rundzie przeciwnik i tak oszuka itd.<br />

Zatem aby pojawiła się współpraca, liczba rund musi być losowa, albo<br />

przynajmniej nieznana graczom.


<strong>Dylemat</strong> więźnia w badaniach<br />

komputerowych<br />

W 1984 roku Rober Axeldor zaprosił akademików z całego świata do<br />

uczestnictwa w turnieju dla programów komputerowych, grających w<br />

iterowany dylemat więźnia. Przysyłane programy różniły się pod<br />

względem złożoności, startowego zachowania, reakcji na działanie<br />

przeciwnika itp. Wyniki pokazały, że przy wielokrotnych<br />

rozgrywkach, egoistyczne strategie dawały średnio bardzo małe<br />

wygrane w porównaniu z bardziej altruistycznymi.<br />

Axelrod pokazał w ten sposób możliwość ewolucyjnego wykształcenia<br />

się zachowań altruistycznych z nastawionych na własny zysk, wyłącznie<br />

za pomocą selekcji naturalnej.


Strategie dla iterowanego dylematu<br />

więźnia<br />

Najlepszą strategią w powyższym<br />

turnieju okazała się strategia „WET ZA<br />

WET” – Polega ona na współpracy w<br />

pierwszej rundzie a w każdej następnej<br />

tego co przeciwnik robił w poprzedniej.<br />

W niektórych sytuacjach lepszą<br />

okazywała się strategia „WET ZA WET Z<br />

WYBACZENIEM” polegająca na tym iż za<br />

każdym razem gdy przeciwnik oszukiwał<br />

gracz wybaczał z małym<br />

prawdopodobieństwem (do 5%) i z<br />

następną rundą znów miała miejsce<br />

współpraca. Pozwalało to przerwać<br />

nieskończony często ciąg wet za wet.


Wnioski Badań<br />

Axelrod zdefiniował następujące cechy występujące w dylemacie więźnia:<br />

Przyjazność – nie oszukujemy dopóki przeciwnik nas nie oszuka<br />

Mściwość – reagowanie na zdradę przeciwnika<br />

Skłonność do przebaczania – wracanie do współpracy<br />

Brak zazdrości – nie staranie się o uzyskanie lepszego wyniku niż ma<br />

przeciwnik<br />

Badania dały wynik, mówiący że aby wyjść najlepiej należy być przyjaznym<br />

i wybaczać.


W jednorazowym dylemacie więźnia oszustwo jest zawsze najlepszym<br />

wyborem – niezależnie od przeciwnika.<br />

W iterowanym dylemacie - optymalna strategia zależy od tego jak grają<br />

przeciwnicy i jak reagują na współpracę i zdradę. Przykładowo, gdyby<br />

wszyscy gracze grali strategią Zawsze Oszukuj, to jeden gracz grający<br />

strategią Wet Za Wet uzyskałby nieco gorszy wynik niż reszta. Gdyby<br />

wszyscy gracze grali strategią Zawsze Współpracuj, znacznie lepszy<br />

wynik uzyskałby jeden gracz grający strategią Zawsze Oszukuj.


Przykłady ze świata rzeczywistego<br />

Doping<br />

<strong>Dylemat</strong> dotyczy wszystkich<br />

szkodliwych dla zdrowia zabiegów<br />

poprawiających szanse<br />

zwycięstwa. Przykładami może<br />

być doping bądź gwałtowne<br />

tracenie wagi tak aby trafić do<br />

niższej kategorii<br />

wagowej. Zawodnik który tego nie<br />

robi (współpracuje) może stracić<br />

szanse na zwycięstwo. W<br />

momencie gdy wszyscy stosują<br />

doping zawody tracą sens.


Zawody kolarskie<br />

Częstą sytuacją jest gdy dwóch zawodników wyprzedza peleton,<br />

zmieniając się na męczącej przedniej pozycji. Jeśli żaden z<br />

zawodników nie będzie się starał jechać jako pierwszy, peleton<br />

szybko ich dogoni. Jeśli tylko jeden z nich będzie to robił, istnieje<br />

duża szansa że zawodnik który jechał za nim i dzięki temu mniej się<br />

męczył, wyprzedzi go tuż przed metą.


Informatyka<br />

Udostępnianie programów na publicznej<br />

licencji jest odpowiednikiem współpracy.<br />

Każda firma która udostępnia takie<br />

oprogramowanie, ułatwia prace innym<br />

firmom, które mogą z niego korzystać przy<br />

tworzeniu własnych produktów. Każde<br />

ulepszenie takiego oprogramowania musi<br />

zostać również udostępnione na publicznej<br />

licencji, co wymusza współpracę pomiędzy<br />

firmami.


Ochrona Środowiska<br />

Dbanie o czystość wód, powietrza, utylizacja odpadów - są<br />

działaniami odpowiadającymi współpracy, które wymagają wysiłku.<br />

Znacznie łatwiej jest nie podejmować tej współpracy a korzystać z<br />

wysiłku innych - to postawa oszusta. Kiedy jednak wszyscy będą<br />

oszukiwać i zaśmiecać środowisko, życie w nim stanie się uciążliwe.


SYSTEM PODATKOWY<br />

Każdy obywatel płacący<br />

należne podatki przyczynia się<br />

do finansowania potrzeb<br />

publicznych. Oszuści którzy<br />

starają się unikać płacenia<br />

podatków, czerpiąc z tego<br />

doraźne korzyści finansowe,<br />

najczęściej korzystają na równi<br />

z innymi z infrastruktury,<br />

edukacji, opieki zdrowotnej,<br />

finansowanych z podatków<br />

płaconych przez<br />

współpracujących.


Dziękujemy za uwagę

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!