Informacja praktyczna. Linki oznaczone kolorem zielonym prowadzą do istniejących artykułów - w przeciwieństwie do oznaczonych jasnym odcieniem szarości, które prowadzą do tych jeszcze niedostępnych.

Dylemat społeczny to sytuacja, w której jednostka czerpie korzyści poprzez swe egoistyczne działanie wobec innych do czasu, gdy pozostali nie zaczną również postępować egoistycznie, wtedy to cała grupa traci. Elektrosprzęgła.

Jako klasyczny przykład dylematu społecznego podaje się tzw. dylemat wspólnego pastwiska. Polega on na tym, iż każdy z hodowców bydła posiadał własne pastwiska tylko na swój użytek, ale każdy miał jednocześnie dostęp do wspólnego pastwiska. Gdy jeden z hodowców nadmiernie korzystał ze wspólnej łąki, zyskiwał na tym, gdy jednak reszta grupy zaczęła czynić podobnie pastwisko ulegało szybkiej degradacji przez co wszyscy tracili, gdyż wkrótce każdy musiał się przenieść na swoje ziemie.

Tego typu badaniami zajmował się m.in. psycholog społeczny Kevin Brechner.

Gra oparta jest starym problemie teorii gier, tzw. dylemacie więźnia. Ty i Twój wspólnik zostaliście złapani na przestępstwie. Od waszych zeznań zależy ile lat spędzicie w więzieniu. Problem w tym, że nie możecie ustalić wspólnej wersji zeznań. Możecie współpracować z organami władzy (sypać) lub nie (siedzieć cicho).
- Jeżeli oboje będziecie sypać - oboje dostaniecie po 20 lat,
- Jeżeli oboje będziecie siedzieć cicho - oboje dostaniecie po 10 lat,
- Jeżeli jeden z Was będzie sypał, a drugi siedział cicho - sypiący dostanie 5 lat, a siedzący cicho 25.
Jaki jest najlepszy wybór dla Ciebie? Sypiesz czy siedzisz cicho?

Twój wybór ->
wybór wspólnika \

Sypię

Siedzę cicho

Sypie

20 , 20

25 , 5

Siedzi cicho

5 , 25

10 , 10

zaznacz swój wybór
i kliknij

Dylemat więźnia

Z Wikipedii, wolnej encyklopedii.

Jump to: navigation, search

Dylemat więźnia to jeden z najważniejszych problemów teorii gier:

Dwóch zamieszanych w duże przestępstwo przestępców złapano za małe przewinienie. Policja wie, że oni są winni, lecz nie ma dowodów. Jeśli:

będą współpracować ze sobą, odsiedzą niewielką karę za małe przewinienie (określenie współpraca dotyczy współpracy między przestępcami, sprzęgła elektromagnetyczne zębate nie współpracy z policją i oznacza, że obaj nie będą zeznawać),

jeden zerwie współpracę i będzie zeznawał, a drugi nie, pierwszy zostanie uwolniony, drugi natomiast pójdzie siedzieć za poważne przestępstwo,

obaj będą zeznawać, obaj pójdą siedzieć, przy czym wyrok będzie z tego względu nieco złagodzony.

Problem jest następujący: niezależnie od postępowania drugiego, opłaca się zeznawać. Jeśli natomiast żadna ze stron by nie zeznawała, wynik byłby o wiele lepszy dla obu graczy.

Zatem wybór podyktowany interesem osobistym nie zawsze jest najlepszy dla danej osoby.

Wiele sytuacji w życiu ma własności podobne do dylematu więźnia.

Jednym z popularnych rozwiązań jest dobrowolne przyjęcie na siebie kary w przypadku jeśli zerwie się współpracę, drugi natomiast będzie współpracował. Tak działają różne systemy honorowe, w tym świat przestępczy. Jeśli obie strony uczestniczą w tego typu systemie honorowym i są świadome tego u przeciwnika, mogą zaryzykować współpracę, na czym obie zyskają. Zobacz: obietnica.

Inne rozwiązanie to iterowany dylemat więźnia - wielokrotne rozgrywanie między dwoma graczami dylematu więźnia. Zysk z zerwania współpracy jest o wiele niższy od straty spowodowanej brakiem współpracy w następnych turach.

Spotyka się też dylemat więźnia w wersji wieloosobowej.

Zobacz też: przegląd zagadnień z zakresu matematyki, gra w cykora, optimum Pareta

Źródło: “http://pl.wikipedia.org/wiki/Dylemat_wi%C4%99%C5%BAnia”

Kategorie: Teoria gier | Paradoksy

Iterowany dylemat więźnia

Z Wikipedii, wolnej encyklopedii.

Jump to: navigation, search

Iterowany dylemat więźnia to gra polegająca na wielokrotnym rozgrywaniu dylematu więźnia między tymi samymi graczami.

W przeciwieństwie do jednorazowego dylematu więźnia, tutaj opłaca się współpracować - zysk jednej tury jest niewielki w porównaniu do strat we wszystkich kolejnych.

Iterowany dylemat więźnia działa najlepiej jeśli nie wiadomo, która tura jest ostatnia. Gdyby było wiadomo, że tur jest 100, setna tura zredukowałaby się do zwykłego dylematu więźnia, a więc nikt by nie współpracował. Skoro wiadomo, że w setnej turze nikt nie współpracuje, 99-ta tura redukuje się do dylematu więźnia itd.

Bardzo prostą i efektywną strategią w tej grze jest wet za wet.

Zobacz też: przegląd zagadnień z zakresu matematyki

Źródło: “http://pl.wikipedia.org/wiki/Iterowany_dylemat_wi%C4%99%C5%BAnia”

Styczeń 2004

Gry społeczne

Wstęp

W publikacjach na temat zarządzania wiedzą wiele miejsca poświęca się tzw. “communities of practice”, czyli społecznościom w działaniu. Są to nieformalne, samoorganizujące się grupy ludzi, którzy zajmują się podobną działalnością i posiadają uzupełniającą się wiedzę. Istnienie takich społeczności zasadza się na współpracy. Jak jednak do niej dochodzi? Co skłania ludzi do współdziałania, jakie warunki muszą zostać spełnione? Czy zawsze opłaca się współpracować? Na te i podobne pytania można próbować udzielić odpowiedzi wykorzystując teorię gier. Wszyscy mieliśmy okazję zetknąć się z nią oglądając święcący niedawno triumfy film “Piękny umysł”, którego głównym bohaterem jest John Nash - współtwórca tej teorii. Próbując odkryć zasady rządzące ruchami w stadzie ptaków czy zachowaniami podejrzanych, on oraz inni badacze skonstruowali teorię wykorzystywaną obecnie przez socjologów i ekonomistów do wyjaśniania zachowań w grupach ludzi oraz zwierząt.

Podstawy teorii gier

Czym jest gra? Myślę, że każdy z nas wie to intuicyjnie. Po krótkim zastanowieniu potrafilibyśmy podzielić gry na takie, które wymagają pewnych umiejętności (np. sporty), albo polegające na szczęściu, albo strategiczne - tzn. takie, które polegają na specyficznej interakcji pomiędzy graczami. Oczywiście wiele gier ma cechy mieszane - wymagają podejmowania decyzji strategicznych, posiadania określonych umiejętności fizycznych, często nie bez znaczenia jest też łut szczęścia. Jednak teoria gier koncentruje się na grach strategicznych. Wszyscy gramy w takie gry niemal bez przerwy, wchodząc w różne interakcje z innymi ludźmi. Co cechuje takie gry? Oczywiście istnieją gracze; mają oni do wyboru strategie, czyli określone zachowania. Każde zachowanie przynosi im określoną korzyść (lub jej odwrotność - stratę). Najważniejszym założeniem jest, że gracze zachowują się racjonalnie, tzn. wybierają te zachowania, które ich zdaniem przyniosą im maksymalne korzyści.

Klasycznym przykładem gry jest tak zwany “dylemat więźnia”. Wyobraźmy sobie sytuację, w której policja złapała dwie osoby podejrzane o popełnienie przestępstwa. Obydwie są przesłuchiwane oddzielnie, w taki sposób, żeby wydobyć, który jest zamieszany w przestępstwo. Jeżeli żaden się nie przyzna - zostaną uwolnieni. Jeżeli jeden z nich oskarży drugiego - zostanie zwolniony i otrzyma nagrodę, natomiast drugi pójdzie do więzienia. Jeżeli obydwaj się oskarżą, otrzymają wyroki, jednak nieco krótsze. Taką grę można przedstawić w postaci tabeli (tzw. macierzy wypłat) pokazującej możliwe strategie i ich konsekwencje. Pierwsza liczba oznacza wyrok dla więźnia pierwszego, druga dla drugiego. Liczba ujemna oznacza nagrodę.

Zastanówmy się jak mogłoby wyglądać nasze myślenie gdybyśmy byli jednym z tych więźniów? Jeżeli ten drugi nas oskarży, także powinniśmy go oskarżyć - wtedy nasza kara będzie mniejsza. Jeżeli nas nie oskarży - także powinniśmy go oskarżyć, bo wtedy wyjdziemy i otrzymamy nagrodę. Ten drugi oczywiście pomyśli tak samo (jest racjonalnym graczem) a więc obydwaj skończymy w więzieniu. Do takiego też wniosku doszedł John Nash - podobne kombinacje strategii nazywa się punktami równowagi Nasha. Charakteryzują się tym, że żadnemu z graczy nie opłaca się zmienić strategii, chyba, że zrobi to inny. Ciekawe jest to, że gdybyśmy poszli na współpracę byłoby lepiej. “Dylemat więźnia” w niemal niezmienionej postaci można zastosować do analizy np. niedawnego wyścigu zbrojeń. Pozostawiam Czytelnikom znalezienie odpowiedzi na pytanie, dlaczego do niego w ogóle doszło :

Teoria gier pozwala analizować różnego rodzaju gry: dwuosobowe, wieloosobowe, jednokrotne i powtarzające się. Znajduje szerokie zastosowanie, między innymi w biologii (szczególnie - socjobiologii), socjologii, naukach politycznych (gdzie pozwala np. analizować systemy wyborcze) oraz ekonomii - tu służy do analizy wyborów konsumentów oraz ich zachowań na rynku. Takim rynkiem może być umowny rynek wiedzy, na którym grają osoby współtworzące społeczności w działaniu.

Wypłata w grze w społeczność

Jakie są motywy przyłączenia i uczestnictwa w społeczności? Innymi słowy: co zyskujemy, jaka jest nasza wypłata w tej grze? Socjologowie wskazują na kilka możliwych motywów takiego działania. Podstawowym może być chęć czerpania z zasobów społeczności - w tym przypadku korzystanie z wiedzy posiadanej przez innych członków zespołu. Jednak reguły społeczne wymagają także wkładu w społeczność. Może on być motywowany oczekiwaniem odpłaty w przyszłości. Tzn. ponosimy chwilowy wydatek (stratę?), żeby w następnej grze zyskać wykorzystując czyjeś poczucie “długu”. Występowanie takich motywów wśród zwierząt badano już w 1971 roku - patrz [4]. Innym motywem może być budowanie własnej reputacji - zyskujemy w ten sposób we własnych oczach oraz w oczach innych, co także może przełożyć się na przyszłe korzyści. W sytuacjach społecznych pojawiają się również zachowania altruistyczne, to jest takie, które nie mają na celu żadnej osobistej korzyści. Być może jednak jest to tylko pozór. Badania socjobiologów pokazują, że występujące w społeczności zachowania altruistyczne mogą przynosić korzyść społeczności jako całości, a więc za tym pośrednictwem również poszczególnym osobnikom. Z drugiej strony eksperyment wykonany na uniwersytecie Emory [2], polegający na badaniu aktywności mózgów uczestniczek przy grze w “dylemat więźnia” wskazał, że współpraca i poświęcenie powodują pobudzenie obszarów w mózgu odpowiadających za “nagradzanie” - być może jesteśmy genetycznie i fizjologicznie predysponowani do współpracy?

Mamy wobec tego wiele możliwości zysku w grze w społeczność, macierz wypłat jest pełna. Jaką jednak strategię przyjąć? Czy zawsze współpracować?

Strategie w grze w społeczność

Zdrowy rozsądek i obserwacja własnego życia pozwala domyślać się, jaką strategią najczęściej się posługujemy. Przecież każdy uczestniczy w całym szeregu społeczności a więc podejmujemy współpracę. Zrywamy ją natomiast, kiedy się “sparzymy”. Klasyczne już badania przeprowadzone przez Axelrod’a i Hamiltona w 1981 roku potwierdziły i pozwoliły uściślić tą strategię. Poproszono grupę osób o rozegranie dużej liczby (200) partii “dylematu więźnia” a następnie przeanalizowano ich postępowanie. Okazało się, że strategię wykorzystywaną najczęściej można opisać przy pomocy kilku prostych reguł:

Za pierwszym razem zawsze podejmuj współpracę,

Rezygnuj ze współpracy, jeżeli w poprzedniej grze partner zrezygnował,

“przebacz”, jeżeli partner podejmie współpracę, a “ukarałeś” go już raz rezygnując,

Ta strategia jest opłacalna, jeżeli prawdopodobieństwo gry z tą samą osobą przekracza 2/3.

Taką strategię nazwano “wet za wet” (tit for tat). Taka strategia jest przejrzysta - pozwala przewidywać zachowanie partnera. Inne strategie także często wykorzystywane to strategia “prostodusznego testera” (wet za wet z niespodziewaną zdradą od czasu do czasu), “testera skruszonego” (jeżeli sam zdradził to dopuszcza jedną zdradę bez kary), lub odpłacanie dopiero pod drugiej zdradzie - o innych można poczytać więcej np. w [1].

Mimo, że strategia “wet za wet” sprawdza się bardzo często, wyjątkiem są tutaj sytuacje, w których wszyscy inni stosują nieprzyjazne strategie.

Takie zachowanie można przyjąć, jeżeli będziemy grali wielokrotnie a więc zakładamy pewną pamięć o wynikach przeszłej naszej współpracy z danymi osobami. Odzwierciedleniem tej pamięci i jej konsekwencji jest pojęcie zaufania między kooperującymi. Zaufanie buduje się między innymi na historii wcześniejszych zachowań i kontaktów. Zaufanie to odzwierciedlenie stabilności strategii partnera (potocznie rozumiane pozytywnie - jako stabilność strategii współpracy). Co jednak zrobić, kiedy jesteśmy nowymi uczestnikami gry rynkowej, czy też mamy przystąpić do jakiejś społeczności? Tutaj z pomocą przychodzą między innymi systemy informatyczne - pozwalając przejrzeć historię zachowania partnerów na rynku (a więc ocenić ich strategię) - jeżeli jest to rynek elektroniczny, lub posłużyć się jakimś rodzajem rankingu. Czytelników pragnących więcej szczegółów na temat teorii gier odsyłam do literatury w Internecie - po polsku [1], a także na stronę poświęconą teorii gier i jej zastosowaniom po angielsku [3].

Dylemat więźnia

Dylemat więźnia to prosta gra, doskonale ilustrująca wiele aspektów zachowania jednostek i grup, niezależnie, czy mówimy o czarodziejach, narodach czy przedsiębiorstwach. Gra ta stanowi symulację konfliktu między egoistycznym pragnieniem każdego gracza, by wybrać strategię “zwycięzca bierze wszystko”, typową dla mentalności Ślizgonów, a koniecznością współpracy i kompromisu dla wspólnego dobra.

Łatwo można wymyślić realistyczny scenariusz tej gry. Wyobraźmy sobie dwóch uczniów Hogwartu przyłapanych z ukradzioną różdżką. Różdżka jest poplamiona krwią jednorożca, dlatego Dumbledore podejrzewa, że ci dwaj popełnili znacznie poważniejsze przestępstwo, ale brakuje mu dowodów. Zebrane dowody pozwalają na ukaranie obu za posiadanie skradzionej różdżki - 50 punktów kary dla każdego domu - ale Dumbledore chce wyjaśnić sprawę krwi, ponieważ za zabicie jednorożca grozi kara 800 punktów.

Dumbledore zamyka uczniów w oddzielnych pokojach i nie pozwala im na kontaktowanie się ze sobą, a następnie składa każdemu propozycję: jeśli obciąży drugiego zabiciem jednorożca, jego dom nie zostanie ukarany za kradzież różdżki, a dom drugiego otrzyma karę w wysokości 1000 punktów. Jeżeli obaj złożą zeznania, oba domy stracą po 800 punktów. Jeśli obaj będą milczeć, oba domy stracą po 50 punktów za kradzież różdżki. Uczniowie muszą założyć, że Dumbledore złożył każdemu z nich taką samą propozycję. Co powinni zrobić?

Wyobraźmy sobie, że wskutek szczególnie skomplikowanego biegu zdarzeń tymi uczniami są Harry Potter i kumpel Malfoya, Vincent Crabbe. Z punktu widzenia Crabbe’a sytuacja wygląda następująco. Harry może z nim współpracować (zachować milczenie) lub zdradzić (złożyć zeznania). Przyjmijmy, że Harry milczy. Jeśli Crabbe również zachowa milczenie, oba domy stracą po 50 punktów. Jeżeli natomiast Crabbe złoży zeznania, to jego dom nic nie straci, a Gryffindor otrzyma karę w wysokości 1000 punktów. Czyli Crabbe powinien zeznawać. Załóżmy teraz, że Harry zeznaje. Jeśli Crabbe zachowa milczenie, Slytherin straci 1000 punktów. Jeśli natomiast Crabbe będzie zeznawał, oba domy stracą po 800 punktów. Zatem i w tym przypadku racjonalne rozumowanie prowadzi do wniosku, że Crabbe powinien zdradzić. Ponieważ możliwe zyski i straty są takie same dla obu graczy, Harry powinien dojść do takiego samego wniosku. Logiczna analiza skłania obu do zdrady, co kończy się stratą 800 punktów, choć mogli pozbawić swe domy tylko 50, gdyby potrafili znaleźć sposób na nawiązanie współpracy i zachowanie milczenia.

Dylemat więźnia fascynuje matematyków, socjologów i biologów, ponieważ ładnie ilustruje często spotykany problem: jak indywidualna ambicja prowadzi do wspólnego nieszczęścia. W rozważanym przypadku na wynik wpływają liczne czynniki: gdyby obaj podejrzani należeli do tego samego domu, mieliby zapewne do siebie większe zaufanie; gdyby wiedzieli, że nigdy się nie spotkają, nie mieliby powodu współpracować i tak dalej. W rzeczywistości ponowne spotkanie graczy jest jednak bardzo prawdopodobne, a w powtarzanej grze w dylemat więźnia pojawiają się nowe strategie.

Jednym z najbardziej znanych badaczy zajmujących się tym problemem jest Robert Axelrod z Uniwersytetu Michigan, który w 1980 roku zorganizował światowy turniej programów komputerowych, grających w dylemat więźnia. Zwycięzcą został program “Wet za wet”. Jak nazwa wskazuje, program ten zaczyna od współpracy w pierwszej rundzie, a w każdej następnej robi to, na co przeciwnik zdecydował się w poprzedniej. Ta strategia jest “miła”, ponieważ gracz zaczyna od zasygnalizowania gotowości do współpracy, a równocześnie jest dość prosta. Bardzo złożone strategie mogą okazać się nieczytelne dla przeciwnika, który wówczas traci chęć do współpracy. Wielką zaletą strategii wet za wet jest jej prostota, a stwierdzenie, iż okazała się najlepsza, stanowi optymistyczny sygnał dla tych, którzy obawiają się, że ludzka natura opiera się na chciwości i egoizmie, typowym dla Malfoyów. W kontekście społecznym sukces strategii wet za wet może oznaczać, że największe szanse na powodzenie ma oportunistyczny poszukiwacz współpracy, nie zaś bezwzględny manipulant. Współpraca społeczna może być wynikiem działania zasady “dawaj, to też dostaniesz”. Szlachetni ludzie, tacy jak Gryfoni, nie zawsze kiepsko na tym wychodzą.

W rzeczywistości jednak szlachetni ludzie często ponoszą klęskę. By doszło do spontanicznego nawiązania współpracy, powinni zostać spełnione pewne warunki: gracze muszą się wielokrotnie spotykać, muszą się rozpoznawać, muszą pamiętać wynik poprzednich gier. Należy jednak wziąć pod uwagę jeszcze inne czynniki, takie jak prawdopodobieństwo spotkania między graczami, błędy, gdy próby nawiązania współpracy są interpretowane jako zdrada, oraz przekazywane genetycznie z pokolenia na pokolenie sposoby zachowania. Analizując takie czynniki - występują one często w realnych sytuacjach - Robert (obecnie lord) May z Uniwerystetu w Oksfordzie doszedł do wniosku, że przełomowa praca Axelroda jest bardzo wyidealizowana i na ogół nie odpowiada rzeczywistości.

Martin Nowak, obecnie zatrudniony w Instytucie Studiów Zaawansowanych w Princeton, i Karl Sigmund z Uniwersytetu Wiedeńskiego zbadali, czy strategia wet za wet radzi sobie z takimi komplikacjami. Okazuje się, że gdy uwzględnimy możliwość błędów, spowodowanych zwykłymi ludzkimi pomyłkami, strategia wet za wet nie jest już najlepsza, ponieważ nie przewiduje przebaczenia: kiedy gracze zaczną zdradzać, będą tak postępować stale. Uwzględniając tę niepewność, gracze mogą opracować lepszą strategię. W tym celu należy dopuścić, by decyzja w kolejnej grze miała nieco losowy charakter, co umożliwia “przebaczenie” i testowanie zachowania drugiego gracza. W strategii “pobłażliwy wet za wet” taki element losowy pozwala na przerwanie wzajemnego cyklu zdrad. Inna, bardziej udana strategia to “Pawłow”. Można ją podsumować maksymą: “jeśli coś nie jest zepsute, to lepiej nie naprawiaj (a jeśli przegrywasz, zmień strategię)”. Niepewność nie wyklucza jednak nawiązania współpracy, dlatego optymistyczny aspekt pracy Axelroda pozostaje ważny.

Inną modyfikację dylematu więźnia wprowadzili Nowak i May, którzy badali, co dzieje się w przypadku gry dwuwymiarowej, gdy gracze zajmują kwadraty szachownicy. Okazuje się, że gracze współpracujący i zdrajcy mogą wówczas współistnieć, ale nie jako pojedyncze jednostki, lecz grupy. Wynika stąd, że w rzeczywistym świecie populacje gospodarzy i pasożytów lub ofiar i drapieżców mogą współistnieć jako zwarte społeczności, mimo niestabilności ich oddziaływań.

Ten rezultat wyjaśnia, dlaczego zamknięta społeczność Hogwartu jest bardziej stabilna, gdy uczniowie są podzieleni na cztery domy, a nie śpią wszyscy razem w jednym ogromnym internacie. Z matematycznych modeli wynika, że gdy gracze współpracujący, tacy jak Gryfoni, spotykają innych skorych do współpracy, ich społeczność jest stabilna. Zdrajcy, tacy jak Ślizgoni, nie mogą zdominować całej społeczności (choć zyskują w każdym pojedynczym spotkaniu z graczem współpracującym), ponieważ tracą we wzajemnych kontaktach; natomiast społeczność współpracujących nie tylko ma się doskonale, ale nawet zdobywa nowych członków, “nawracając” zdrajców.

Taki model jest wciąż bardzo wyidealizowany. W rzeczywistym społeczeństwie, w przeciwieństwie do systemu graczy związanych z polami szachownicy, ludzie często oddziałują z osobami, z którymi nigdy więcej się nie spotkają, a mimo to współpracują, składają się na charytatywne cele, włączają się do ruchów politycznych i zachowują się zgodnie z przyjętymi normami. Biorąc pod uwagę liczne jednorazowe oddziaływania, powinniśmy zapytać, dlaczego społeczeństwo się nie rozpada. Doświadczenia dowodzą, że przyczyną są kary.

Ernst Ferh z Uniwersytetu w Zurychu i Simon Gächter z Uniwersytetu w St Gallen wymyślili finansową grę, w której uczestnicy - obcy sobie - muszą zdecydować, czy zainwestować własne środki we wspólne przedsięwzięcie, czy odmówić, a następnie wykorzystać społeczną postawę pozostałych. Gra ta stanowi próbę zbadania odwiecznego problemu “tragedii wspólnego dobra”. Gracze mają się złożyć na wspólny fundusz, który następnie zostaje podwojony i rozdzielony równo między wszystkich graczy, niezależnie od tego, ile każdy zainwestował. Grupa jako całość zyskuje najwięcej, gdy wszyscy gracze inwestują maksymalną przyjętą sumę, ale pierwszy zdrajca, który odmówi udziału w składce, osobiście zyskuje najwięcej. Gra w dobro publiczne jest uważana za bardzo adekwatny model wielu ludzkich problemów - na przykład naszej niezdolności do rozwiązania problemów ekologicznych i klimatycznych. W świecie Hogwartu gra w dobro publiczne stanowi model wyścigu, którego celem jest zakup dla danego domu wszystkich wyścigowych mioteł.

W szwajcarskim eksperymencie brało udział 240 graczy, których dzielono na zmieniające się ciągle grupy, tak by dowolni dwaj gracze spotykali się tylko raz; dzięki temu nikt nie mógł zdobyć reputacji skąpca lub człowieka szczodrego. Gdy nie wprowadzono kar finansowych dla tych, którzy nie inwestowali własnych środków dla wspólnego dobra, a tylko korzystali ze szczodrości innych, współpraca załamywała się całkowicie po sześciu rundach, ponieważ w celu ukarania egoistów inni gracze sami przestawali współpracować. Społeczeństwo się rozpadło. “Nasze doświadczenia dowodzą, że jeśli członkowie grupy mogą karać tylko wycofaniem się ze współpracy, to bardzo szybko wszyscy przestają współpracować” - komentuje Fehr.

Kiedy jednak wprowadzono kary dla egoistów, wspólne dobro zatryumfowało: w tym przypadku ponad 90% graczy zwiększyło własne wkłady. “Kiedy można jawnie karać graczy nie współpracujących, współpraca staje się typowym zachowaniem nawet wówczas, gdy gra trwa tylko jedną turę - mówi Fehr. - Jest istotne, by kara była jawna i dotykała tylko egoistę, a nie polegała wyłącznie na wycofaniu się z dalszej współpracy”.

Najbardziej skuteczna okazała się strategia “altruistycznego karania”, w której osoby wymierzające karę same ponoszą pewne niewielkie koszty. Badacze stwierdzili, że mimo ponoszonej straty strategia ta dawała graczom satysfakcję psychiczną, nie zaś materialną, gdyż stwarzała okazję rozładowania złości z powodu pasożytnictwa innych. Zatem motywem współpracy nie jest tylko prosta zbieżność interesów; altruistyczna kara stanowi jeden ze składników “kleju”, utrzymującego społeczeństwo w całości.

Argus Filch, woźny z Hogwartu, z tęsknotą opowiadał o tym, jak kiedyś miał prawo wieszać winnych uczniów za nadgarstki na kilka dni; zachował nawet na wszelki wypadek kolekcję łańcuchów i kajdan. Jego zapał do zadawania bólu nie wydaje się szczególnie altruistyczny, gdyż nie ponosił żadnych kosztów, przeciwnie, najwyraźniej sprawiało mu to przyjemność. W czasach Harry’ego złe zachowanie poszczególnych uczniów karano, odejmując punkty całemu domowi; kara była równie nieuchronna jak nagroda za istotne osiągnięcia. To prowadzi do altruistycznego karania, ponieważ członkowie domu odnoszą się niechętnie i krytycznie do kolegów, których złe zachowanie spowodowało stratę punktów, co prowadzi do pogorszenia ogólnego nastroju w domu. Hermiona Granger usiłowała namówić Rona i Harry’ego, by nie włóczyli się nocą po szkole, przypominając im, że wystawiają na ryzyko punkty całego domu. Gdy kolejna nocna wyprawa zakończyła się wpadką i stratą 150 punktów, Harry, który przedtem był bardzo lubiany, spadł na dno społecznej hierarchii - teraz niemal wszyscy odnosili się do niego z niechęcią. “Kiedy dochodzi do złamania norm grupowych, uczniowie szydzą z winowajców. Karanie przez rówieśników za łamanie norm jest niemal zawsze altruistyczne” - twierdzi Fehr.

Innym przykładem altruistycznego karania jednostki przez grupę jest przypadek wykluczenia doskonałego gracza z zespołu quidditcha z powodu złamania zasad obowiązujących w drużynie. Szlaban, jeszcze jedna z kar stosowanych w Hogwarcie, również wydaje się nieco altruistyczna, gdyż nauczyciel musi marnować swój czas, nadzorując aresztowanego. Kiedy Harry musiał za karę pomóc Hagridowi przeszukać Zakazany Las w nocy, gajowy Hogwartu również narażał się na niebezpieczeństwo. “Przełożeni często nie lubią karać. Karanie innych jest zwykle niewygodne. Nasze emocje pomagają przełamać bezwład i niechęć do karania - dlatego karanie należy często uważać za altruistyczne - tłumaczy Fehr. - Tak więc nawet kary wymierzane przez przełożonych, którzy formalnie mają prawo karania (na przykład policjanci, nauczyciele, szefowie instytucji), należy uznać za altruistyczne”. J. K. Rowling nieświadomie wykazała, , że utopijne społeczeństwo, w którym wszyscy współpracują bez zagrożenia karą, jest niemożliwym do zrealizowania marzeniem.

[1] [2] [3] [4

Andrzej Balicki

Teoria gier w naukach politycznych

Teoria gier jest próbą zastosowania narzędzi matematycznych do wyjaśniania szeroko rozumianych decyzji politycznych. Klasyczne teorie operują takimi pojęciami jak: państwo, ustrój, racja stanu, legitymizacja itp. Teoria gier próbuje zaś stworzyć pewne formalne (wyrażone w języku matematyki) ramy do opisu zachowań podmiotów, które - niezależnie od tego czy są to państwa, wyborcy czy partie polityczne - są traktowane jako “gracze”. Celem artykułu jest szkicowe przedstawienie teorii gier, przeanalizowanie jej podstawowych zalet i wad. Zaprezentuję kilka ciekawych przykładów zastosowania teorii gier i sytuacji, w których teoria ta zawodzi. O tym, jak wszechstronna wydaje się niektórym ta teoria może świadczyć analiza Biblii przy użyciu narzędzi teorii gier dokonana przez Stevena Bramsa.1
Pierwsza pojawiająca się wątpliwość dotyczy tego, czy rzeczywiście jest możliwe stworzenie jakiegoś matematycznego modelu podejmowania decyzji przez człowieka, i jaki w ogóle może być zasięg modeli matematycznych w opisywaniu rzeczywistości “pozamatematycznej”.Richard Dawkins w swojej klasycznej już książce “Samolubny gen” zaproponował aby na ewolucję gatunków spojrzeć z perspektywy pojedynczych genów, które to są “graczami”. Dobór naturalny jest zaś wynikiem gry, w której biorą udział gracze (geny) postępujący według różnych strategii.2 Obecnie przyjmuje się, że wszystkie wcześniejsze metody opisu ewolucji można sprowadzić do teorii gier.Skoro zatem teoria gier “zadziałała” w opisie ewolucji to może przyda się także do analizy rzeczywistości społecznej.
Elementem każdej gry jest wzajemna zależność graczy, polegająca na tym, że wynik gry (wypłata) dla poszczególnego gracza zależy od tego co on zrobi i co zrobią jego rywale. Każdy z graczy stara się osiągnąć jak najlepszy wynik (wypłatę) i wie, że inni starają się osiągnąć wynik najlepszy dla nich. Istotne jest także to, że każdy z graczy wie, który wynik jest najlepszy dla każdego z rywali. Mamy zatem do czynienia z całkowicie przejrzystą sytuacją.3
Po raz pierwszy teoria gier została zastosowana w naukach społecznych do analizy problemu ekonomicznego. Prekursorski model to dziewiętnastowieczny model duopolu Cournota. Rozwiązanie gry wyznaczało wielkość produkcji.4 Jeśli chodzi o sferę polityczną, to najłatwiej teorię gier zastosować do problemów z elementem ekonomicznym - np. płacenie podatków. Załóżmy, że żyjemy w dwuosobowym państwie, w którym każdy z dwóch podatników (Kowalski i Iksiński) ma do wyboru dwie opcje: płacić podatki albo nie płacić.
Sytuację można zobrazować tabelą - Kowalski ma do wyboru jeden z wierszy, Iksiński - jedną z kolumn. Wynikiem gry jest jedno z czterech pól tabeli, jest ono wypadkową decyzji dwóch graczy. W każdym polu pierwsza liczba odnosi się do gracza wybierającego wiersze (Kowalskiego), druga do wybierającego kolumny (Iksińskiego). Liczby oznaczają preferencje graczy : 4 jest lepsza od 3, 3 od 2 itd. Widać zatem, że Kowalskiemu najbardziej odpowiadałoby pole lewe-dolne (najlepszy wynik: 4), czyli sytuacja w której nie płaci podatków, zaś drugi z graczy płaci. Jednocześnie taka sytuacja byłaby najgorsza dla Iksińskiego (wynik: 1). sprzęgła elektromagnetyczne

Iksiński

Kowalski

Płacić

Nie płacić

Płacić

3, 3

1, 4

Nie płacić

4, 1

2, 2


Teoria gier zakłada, że każdy z graczy ma tę samą tabelę przed oczyma (wie o preferencjach rywala) i podejmuje decyzje starając się najlepiej przewidzieć ruch przeciwnika. Gracze wykonują ruch jednocześnie. Postawmy się w sytuacji Kowalskiego. Jeśli Iksiński zapłaciłby (lewa kolumna) to najlepiej dla Kowalskiego byłoby nie płacić (wybór dolnego wiersza). Jeśli zaś Iksiński by nie płacił (prawa kolumna) to Kowalski także powinien nie płacić (dolny wiersz). Niezależnie zatem od decyzji rywala Kowalski powinien nie płacić. Założyliśmy jednak, że każdy z graczy widzi tę tabelę, zatem także Iksińki. Analogicznie rozumując dojdzie on także do wniosku, że niezależnie od postępowania rywala nie powinien płacić. Gdyby każdy z graczy-podatników postępował racjonalnie wybór padłby na prawy-dolny kwadrat, a co za tym idzie, nikt nie płaciłby podatków.
Dylemat polega zatem na tym, że gracze muszą kierować się egoistyczną strategią, pomimo iż znany im jest wynik wyboru lewego-górnego kwadratu, tzn. wynik, który byłby korzystniejszy dla obydwu graczy. Według norweskiego politologa Jona Elstera zachowania polityczne to takie zachowania, które mają na celu rozwiązanie tego dylematu i doprowadzenie do wyboru opcji 3,3. Tylko dzięki współpracy gracze są w stanie osiągnąć najlepszy wynik.
Idealnym rozwiązaniem byłoby wprowadzenie do gry kogoś, kto wymusiłby współpracę graczy. Thomas Hobbes w Lewiatanie proponował Suwerena, który karałby za społecznie niepożądane zachowania. Jednak takie rozwiązanie nie mieści się w regułach gry, a poza tym jest to możliwe jedynie teoretycznie. Jeżeli spojrzymy na stosunki międzynarodowe to w praktyce nie ma żadnego podmiotu, który byłby w stanie zmusić państwa do współpracy.
Rozwiązanie pojawia się gdy gra jest powtarzalna. Robert Axelrod zorganizował swego czasu “zawody” mające na celu stworzenie najlepszej strategii gry w dylemat więźnia. Polem gry stał się komputer, zaś strategie zostały zapisane w sformalizowany sposób. Wygrała strategia “oko za oko” (Tit-for-tat). Po ogłoszeniu wyników Axelrod ogłosił drugą rundę - sytuacja była o tyle prostsza, że znany był dotychczasowy zwycięzca. Jednak ponownie “oko za oko” okazało się najlepszą strategią. Jej zasady są bardzo proste: w pierwszym ruchu współpracuj, w każdym kolejnym powtarzaj ostatni ruch przeciwnika.5 Strategia ta nawet bez matematycznej analizy wydaje się optymalna z punktu widzenia zdrowego rozsądku, który nakazuje nam ona rozpoczynać “grę” przyjaźnie, na przyjazny ruch odpowiadać tym samym, i wybaczać - nawet po długiej serii nieprzyjaznych zagrywek wystarczy jeden gest współpracy.
Zwycięstwo strategii “oko za oko” wydaje się zadowalającym wyjaśnieniem dlaczego ludzie pomimo wszystko współpracują ze sobą. Jednakże jeśli analizujemy wersję dylematu więźnia bez powtórzeń - a taka sytuacja często zdarza się w rzeczywistym świecie - to przewidywanie ludzkich zachowań okazuje się nietrafione. W takiej sytuacji każdy racjonalnie myślący gracz powinien nie współpracować. Tymczasem - w sytuacji eksperymentalnej - aż 30 procent ludzi współpracuje, czyli postępuje niezgodnie z własnym interesem.6 Dzieje się tak pomimo tego, że w czasie eksperymentu zasady gry zostały im dokładnie wytłumaczone. Pojawia się pytanie czym jest racjonalność i czy ludzie postępują racjonalnie, czy nie. W naukach politycznych mamy do czynienia z dwojakim rozumieniem “racjonalności”. Pierwsze kładzie nacisk na racjonalny sposób zachowania, który byłby zgodny z przytoczonymi powyżej zasadami. Racjonalne myślenie definiowane jest w opozycji do myślenia motywowanego w inny sposób (np. poprzez emocje, poczucie obowiązku). Stosując terminologię teorii gier racjonalnymi nazwalibyśmy takie postępowanie, które jest zgodne ze strategią gwarantującą najlepszy możliwy wynik dla gracza. Natomiast drugie obecne w naukach politycznych podejście do racjonalności jest właściwie tautologiczne. Zgodnie z nim wszystko co ludzie robią jest rezultatem realizowania ich własnych korzyści, zaś racjonalnym postępowaniem jest działanie na rzecz tych właśnie korzyści własnych. Interesujące jest to, że te dwa podejścia do pojmowania racjonalności rozwijały się równolegle.7 Obecnie nadal brak konsensu odnośnie tego, co dokładnie rozumiemy mówiąc o racjonalności.
Niezależnie jednak od tego czym jest racjonalność, wyraźnie widać, że w wielu sytuacjach podejmowane przez ludzi decyzje są odmienne od tego, co nakazywałaby teoria gier. Jednym z wyjaśnień może być fakt, iż często dokonujemy oceny postępowania stosując jako kryterium nie subiektywną użyteczność osiągniętego celu, a zasady, zgodnie z którymi cel został osiągnięty. Mogą to być jakieś ogólne zasady - jak np. Kantowskie imperatywy mówiące, że powinniśmy postępować zgodnie z regułą, co do której chcemy by stała się ona powszechna i, że powinniśmy traktować człowieka zawsze jako cel, a nigdy środek naszych działań. Regułami tymi mogą być także pewne zasady proceduralne - zarówno formalne, jak i nieformalne. Seria eksperymentów wykonanych w latach siedemdziesiątych przez Thibaulta i Walkera pokazała znaczenie tego, czy zasady proceduralne są postrzegane jako uczciwe. Eksperymenty były symulacją procesów sądowych w państwach prawa stanowionego i common law. Jedna z najważniejszych różnic pomiędzy nimi to stopień partycypacji uczestników w procesie podejmowania decyzji. W procesie common law ława przysięgłych ma poczucie rzeczywistego wpływu na decyzję sądu. Ciekawym jest, że symulowany proces common law był wszędzie postrzegany jako bardziej sprawiedliwy - zarówno w państwach common law, jak i prawa stanowionego. Autorzy eksperymentów podają wiele uzupełniających się wyjaśnień - ludzie czują, że procedura jest uczciwa gdy wierzą, że mają wpływ na decyzję, gdy proces podejmowania decyzji jest neutralny i - co ciekawe - gdy pozwala na kontakty interpersonalne. Ważne jest także poczucie, że podejmujący decyzję są umotywowani do uczciwego postępowania. Pomimo tego, że sprawiedliwy wyrok jest sam w sobie ważny, eksperymenty pokazują, że dużo łatwiej zaakceptować niesprawiedliwy wyrok gdy procedura postrzegana jest jako uczciwa.8
Inne ciekawe wnioski wnoszą wyniki eksperymentów przeprowadzonych w latach osiemdziesiątych, mających na celu zbadanie zachowania ludzi w grupie. Orbell, van de Kragt i Dawes zastosowali zasady dylematu więźnia do prostej gry - każdy z graczy mógł wpłacić otrzymane wcześniej 5$ do “banku”, z którego, jeśli odpowiednio wielu członków grupy zrobiło tak samo, była wypłacana nagroda 10$. Jako że była ona wypłacana wszystkim, każdemu graczowi zależało na tym aby jak najwięcej pozostałych wpłaciło, a on sam nie - wtedy otrzymywał łącznie 15$. Każdy podejmował decyzje w warunkach pełnej anonimowości. Eksperyment przeprowadzono w wielu wersjach.9 Jedną z zasadniczych różnic między nimi było zezwolenie lub jego brak na rozmowę w grupie, w czasie której uczestnicy mogli przekonywać się wzajemnie. Wersja bez możliwości dyskusji dała 30-45 procent wpłacających uczestników, zaś wersja z dyskusją - aż 75-85 procent. Wyniki są zadziwiające - znaczą one, że aż 85 procent uczestników eksperymentu postępowało niezgodnie z własnym interesem w imię interesu grupy. Autorzy eksperymentów wskazują - jako wyjaśnienie - m. in. na zobowiązujący charakter własnych obietnic i przewidywania wywiedzione z obietnic innych. Wpływ dyskusji uczestników był tak duży, ponieważ zbliżyła ona w istotny sposób warunki eksperymentu do realnego życia. Wielu ludzi stosuje w życiu strategię polegającą na dotrzymywaniu obietnic, chociażby ze względu na swój własny interes. Poza tym możliwość porozmawiania z innymi uczestnikami tworzy stosunek interpersonalny - dużo trudniej oszukać kogoś, kto był choćby przez chwile partnerem w dyskusji niż anonimowego uczestnika eksperymentu.
Przytoczony tutaj dylemat więźnia jest podstawowym problemem dla teorii gier, jednocześnie stanowi niejako punkt wyjścia. Wśród jego założeń znajdujemy m. in. całkowitą przejrzystość sytuacji dla wszystkich graczy. W rzeczywistości nigdy do końca nie możemy być pewni jakie są preferencje poszczególnych graczy. Teoria gier, starając dostosować swe narzędzia do rzeczywistych sytuacji, rozwija analizę gier z niekompletną informacją.10 Do ciekawych wniosków prowadzi analiza działania sondaży opinii publicznej przy założeniu, że tylko niektórzy z wyborców mają wiedzę o rzeczywistym usytuowaniu kandydatów na scenie politycznej, reszta wyborców zaś ma wiedzę jedynie o własnych przekonaniach politycznych. Okazuje się, że po odpowiednio długiej sekwencji sondaży (tym dłuższej im jest mniej “poinformowanych” wyborców) nie poinformowani wyborcy zagłosują na kandydatów odpowiadających ich przekonaniom opierając się na wiedzy z sondaży.11 Teoria gier może zatem mieć konkretne przełożenie na praktykę - analiza wspomnianej gry jest poważnym argumentem przeciwko zakazom sondaży na krótko przed wyborami, gdyż - jak dowodzi Ordeshook - właśnie takie sondaże pomagają w odpowiednim przełożeniu preferencji wyborców na rzeczywiście oddane głosy.
Do zasług teorii gier należy zaliczyć m. in. stworzenie przestrzennych modeli usytuowania partii na scenie politycznej12 i przewidzenie tzw. strategicznego głosowania w sytuacji gdy mamy do czynienia z progami przy wyborach parlamentarnych. Dzięki specyficznej ordynacji wyborczej w Niemczech, porównanie liczby oddanych głosów na kandydata z liczbą głosów na jego partię (w tym samym okręgu) pozwala na określenie skali strategicznego głosowania. Można powiedzieć, że oczywiste jest, że wprowadzenie progu zmieni proporcje oddanych głosów, jednak niemiecka ordynacja wyborcza pozwala na dokładne zmierzenie tych proporcji w jednym głosowaniu.13 Tego typu modele byłyby niemożliwe, gdyby ograniczyć się tylko do klasycznych narzędzi obecnych w naukach politycznych. Znaleźć możemy także wiele przykładów zastosowania modeli tego typu do analizy stosunków międzynarodowych. 14
Przytoczone tu przykłady miały pokazać kilka istotnych cech teorii gier i jej umiejscowienia w naukach politycznych. Z jednej strony nietrudno zauważyć, że wiele problemów wymyka się analizie korzystającej z klasycznych narzędzi i pojęć. Teoria gier przynosi zupełnie nową perspektywę. Pozwala ona na bardzo “eleganckie” wyjaśnienie zagadnień należących dziś do historii polityki.15 Z drugiej jednak strony w wielu sytuacjach założenie o pierwszorzędnej roli własnego interesu jako motywie postępowania jest błędne. Wyraźnie pokazuje to np. seria eksperymentów symulujących procesy sądowe. Teoria gier z pewnością jest w stanie pokazać, jakie postępowania, jaka strategia powinna być zastosowana w celu osiągnięcia określonego celu. Może ona powiedzieć, jakich metod powinno się użyć aby wynik działania był najkorzystniejszy. Jednakże nie może ona wyjaśnić dlaczego zachowania podmiotów politycznych nie zawsze są zgodne z realizacją ich własnego interesu. To oczywiście nie znaczy, że myślenie w kategoriach własnego interesu jest mało istotne. James Madison w Federaliście nr 10 analizował zachowania frakcji politycznych działających głównie w celu realizacji własnego interesu.16 To podejście stało się podstawą konstrukcji stworzonych przez Konstytucję Amerykańską. I chociaż niektórzy wskazują na konieczność jej zmiany (np. Alvin Toffler) to bezspornie funkcjonowanie demokracji w Stanach Zjednoczonych zawdzięczamy w dużej mierze właśnie Konstytucji i obecnym sprzęgła w niej założeniom Madisona. Podsumowując - chociaż ujmowanie podmiotów politycznych jako “graczy” nie wyjaśnia wielu zagadnień, szczególnie motywacji decyzji, to trudno dziś sobie wyobrazić analizę zachowań politycznych bez tej swoistej perspektywy jaką daje teoria gier.

Artykuł powstał w wyniku udziału w seminarium prof. Karola Sołtana (University of Maryland) w ramach International Summer School in Political Science and International Relations 1998.

PRZYPISY

1 Steven Brams, Biblical Games: A Strategic Analysis of Stories in the Old Testament, Cambridge, MIT Press, 1980.

2 R. Dawkins, Samolubny gen, Prószyński i S-ka, Warszawa 1996

3 Dokładny opis elementów i reguł gry - patrz: P. C. Ordeshook, A Political Theory Primer, Routledge, New York 1992, ss. 11-14.

4 Por. M. Malawski, A. Wieczorek, H. Sosnowska,Konkurencja i kooperacja. Teoria gier w ekonomii i naukach społecznych, PWN, Warszawa 1997, ss. 68-70.

5 Por. R. Axelrod, The Evolution of Cooperation, Basic Books, New York, 1984, szczegółowy opis matematyczny powtarzalnego dylematu więźnia - patrz: J. D. Morrow, Game Theory for Political Scientists, Princeton University Press, New Jersey 1994, ss. 262-268.

6 Por. R. M. Dawes, A. van de Kragt, J. M. Orbell, Cooperation for the Benefit of Us- Not me, or My Conscience, w: J. J. Mansbridge, Beyond Self-Interest, The University of Chicago Press, Chicago 1990, s. 103.

7 Por. J. J. Mansbridge, wyd. cyt., ss. 10-11

8 Por. T. R. Tyler, Justice, Self-Interest, and the Legitimacy of Legal and Political Authority, w: J. J. Mansbridge, wyd. cyt.,ss. 172-176.

9 Dokładny opis eksperymentów - patrz: J. J. Mansbridge, wyd. cyt., ss.101-110.

10 Przykłady gier z niekompletną informacją - patrz: P. C. Ordeshook, wyd. cyt., ss. 209-214.

11 Por. tamże, ss. 203-208

12 Przykładowa przestrzenna analiza rządu CDU-FDP w 1987r: M. Laver, K. A.Shepsle, Making and Breaking Governments, Cambridge University Press, New York 1996, ss. 125-139.

13 Analiza strategicznego głosowania na przykładzie Niemiec: G. W. Cox, Making Votes Count, Cambridge University Press, New York 1997, ss. 81-83.

14 Ciekawe ujęcia problemów w języku teorii gier- zaangażowanie ONZ w Bośni : M. J. Hinich, M. C. Munger, Analytical Politics, Cambridge University Press, New York 1997, ss. 38-41; analiza działania OPEC w latach siedemdziesiątych: A. K. Dixit, B. J. Nalebuff, Thinking Strategically, W. W. Norton & Company, New York 1993, ss.89-91 i 98-102.

15 Przykłady z historii Ameryki w ujęciu teorii gier: W. H. Riker: The Art of Political Manipulation, Yale University Press, New Haven 1986.

16 Por.: James Madison, Alexander Hamilton and John Jay, The Federalist Papers, Penguin, New York 1987

Tags: , , , , , , ,

Leave a Reply