Podręcznik
Strona: | SEZAM - System Edukacyjnych Zasobów Akademickich i Multimedialnych |
Kurs: | 4. Elementy teorii gier |
Książka: | Podręcznik |
Wydrukowane przez użytkownika: | Gość |
Data: | wtorek, 8 kwietnia 2025, 13:24 |
Opis
Wersja podręcznika: 1.0
Data publikacji: 01.01.2022 r.
Wykłady
W1…WN, odpowiadające w sumie ok. 10-12 godz. standardowego wykładu
1. Elementy teorii gier
- Wprowadzenie
Jednak zastanówmy się nad tym, jak można zdefiniować grę w sensie teorii gier. Otóż sytuacja w której mamy do czynienia z taką grą, w której uczestniczy (gra) wielu, co najmniej dwóch, graczy, z których każdy ma do wyboru pewną liczbę możliwych strategii, które określają w jaki sposób rozegra daną grę.
Gracz jest to niekoniecznie człowiek, można traktować go jako firmę, państwo, grupę społeczną, w końcu program komputerowy.
Istotne jest to, że strategie, a szerzej decyzje, podejmowane przez każdego z graczy wpływają na wynik gry.
Istnieje wiele definicji teorii gier, przytoczę jedną z nich, za dr. Adamem Woźniakiem, z książki "Decyzje w warunkach współzawodnictwa":
Gracz w sytuacji gry może:
- współzawodniczyć z innymi graczami (np. o wspólne zasoby);
- współpracować z innymi (np. aby wspólnie wykonać pewne zadanie);
- tworzyć bądź dołączać do koalicji aby:
- wykonywać wspólne działania i osiągać dzięki temu większe zyski (w porównaniu z innymi koalicjami),
- konkurować z innymi graczami lub koalicjami.
Te zagadnienia będą rozwijane w kolejnych rozdziałach.
1.1. Niekooperatywna teoria gier - wprowadzenie
Aby wprowadzić w tematykę niekooperatywnej teorii gier, podać podstawowe definicje i pojęcia posłużę się przykładową grą śmieciową.
Obydwoje gracze mają do dyspozycji dwie możliwe decyzje: podpisać umowę o wywóz śmieci lub wysypywać je na tyłach swojej działki. Zapiszmy to formalnie:

i
są zbiorami decyzji odpowiednio Pana Wiersza i Pani Kolumny.
są poszczególnymi decyzjami.
i
są konkretnymi podjętymi decyzjami.
Wynik gry można opisać za pomocą funkcji rezultatów . Argumentem tej funkcji są decyzje graczy, zaś wynikiem są jej rezultaty dla graczy. W wypadku naszej gry:
. Zbiorem rezultatów dla Pana Wiersza jest
, zaś zbiorem rezultatów dla Pani Kolumny jest
. Te zbiory nie muszą być sobie równe, jednak w przypadku naszej gry są sobie równe:
Do prezentacji wypłat można wykorzystać tzw. macierz wypłat. Jest to wygodna forma, ale możliwa do wykorzystania dla mniejszych gier.
Macierz wypłat zwyczajowo zapisuje się w taki sposób, że decyzje pierwszego gracza (w tym wypadku Pana Wiersza) zapisujemy w kolejnych wierszach macierzy, natomiast decyzje drugiego gracza (w tym wypadku Pani Kolumny) zapisujemy w kolejnych kolumnach macierzy. W każdej komórce macierzy zapisujemy wartości dla pierwszego gracza, a następnie (po przecinku) dla drugiego gracza.
Taka macierz uzupełniona opisowymi bądź symbolicznymi zbiorami wyników tworzy tzw. osnowę gry.
Aby z osnowy uzyskać grę, należy uzupełnić ją o indywidualne preferencje graczy odnośnie rezultatów.
nie śmierdzi za darmo



Gra uzupełniona o preferencje odnośnie rezultatów może być analizowana. Rezultaty gry można także przedstawić za pomocą liczb, tzw. indykatorów preferencji lub inaczej funkcji wartościujących.
Taka funkcja wartościująca dla każdego gracza ma postać - jej argumentem jest rezultat gry, zaś wynikiem liczba rzeczywista.
Na podstawie powyższego przykładu można zauważyć, że funkcje wartościujące mogą być różne, co więcej preferencje graczy odnośnie rezultatów gry także mogą się różnić.

Preferencje Pani Kolumny (wynikające z poprzedniego przykładu):

Ostatecznie można zapisać macierz gry z funkcjami wartościującymi:
![]() |
![]() |
![]() |
---|---|---|
![]() |
-2000, -2000 | -2500,0 |
![]() |
0,-3000 | -500, -2500 |
Wyobraźmy sobie Pana Wiersza i Panią Kolumnę, którym zależy na tym aby się spotkać, ale są zbyt nieśmiali żeby się umówić. Obydwoje wiedzą też, że lubią chodzić do dwóch klubów: ,Atabaska’ i ,Bajlando’, ale nie wiedzą do którego aktualnie pójdzie druga osoba. Kiedy spotkają się w jednym z klubów, obydwoje będą bardzo zadowoleni (wypłata dla obydwojga +10). W ,Atabasce’ będzie relacja z meczu (wypłata dla P. Wiersza +3 jeśli tam będzie), natomiast w ,Bajlando’ na pewno będą przyjaciółki P. Kolumny (wypłata dla P. Kolumny +4 jeśli tam będzie, dla P. Wiersza -2 jeśli tam będzie).
1.2. Niekooperatywna teoria gier - gry o sumie zerowej
W tym rozdziale zajmiemy się gramai o sumie zerowej. Jak można zdefiniować taką grę? Otóż dla gier dwuosobowych można posłużyć się następującą defnicją:
Dla gier wieloosobowych, definicja jest następująca:
Przykładowe gry o sumie zerowej to gra w rzut monetą, gra w "papier-kamień-nożyce".
![]() |
![]() |
![]() |
![]() |
---|---|---|---|
![]() |
0,0 | -1,1 | 1,-1 |
![]() |
1,-1 | 0,0 | -1,1 |
![]() |
-1,1 | 1,-1 | 0,0 |
Postać ogólna dwuosobowej gry o sumie zerowej przedstawia się następująco:
![]() |
![]() |
![]() |
---|---|---|
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Taka postać wynika wprost z defnicji - wygrana Pana Wiersza (


Dlatego też, dla tych gier (dwuosobowych) wygodnie jest opisywać jest w podstaci skróconej, w której przedstawiamy jedynie wypłaty Pana Wiersza (pierwszego z graczy):
![]() |
![]() |
![]() |
---|---|---|
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Problem "rozwiązywania" gier o sumie zerowej rozwiązał John von Neumann w 1928 r. Sformułował on algorytm podejmowania decyzji tzw. strategię minimaks, która maksymalizuje zyski gracza i minimalizuje straty przeciwnika. Algorytm ten został stworzony dla gier dwuosobowych o sumie zerowej i kompletnej informacji.
W grach dwuosobowych można wyznaczyć także maksimin (analizując grę z punktu widzenia przeciwnika Pana Wiersza).
![]() |
![]() |
![]() |
min. wiersza | |
---|---|---|---|---|
![]() |
1 | 4 | 1 | maksimin |
![]() |
0 | 2 | 0 | |
maks. kolumny | 1 | 4 | ||
minimaks |
Aby obliczyć wartość minimaks, można posłużyć się macierzą wypłat. Obliczamy wartość maksymalną w każdej kolumnie, a następnie wybieramy najmniejszą z tych wartości (w przykładzie jest to wartość 1, odpowiadająca decyzji ). Analogicznie, obliczemy wartość minimalną w każdym wierszu i wybieramy największą z tych wartości (w przykładzie jest to wartość 1, odpowiadająca decyzji
).
- mniejsza lub równa każdej wartości w jego wierszu
- większa lub równa każdej wartości w jego kolumnie



Wykres 3D obrazujący ideę punktu siodłowego. Oś X to wybory Pana Wiersza, oś Y Pani Kolumny.
Punkt siodłowy nie zawsze istnieje. Taka sytuacja zachodzi wówczas, gdy wartości minimaks i maksimin się różnią.
Istnieje także możliwość, że jest wiele takich punktów.
![]() |
![]() |
![]() |
![]() |
min. wiersza | |
---|---|---|---|---|---|
![]() |
6 | 0 | -1 | -1 | |
![]() |
3 | 1 | 1 | 1 | maksimin |
![]() |
4 | 1 | 1 | 1 | maksimin |
maks. kolumny | 6 | 1 | 1 | ||
minimaks | minimaks |
Zdefiniujmy pojęcie strategii czystej.
Przykładem strategii czystej dla Pana Wiersza jest , zaś dla Pani Kolumny strategią czystą to
. W przypadku istnienia dokładnie jednego punktu siodłowego, obydwoje graczy posiada strategie czyste, które odpowiadają punktowi siodłowemu. Stosując strategię czystą, gracz powoduje maksymalizację swoich zysków (minimalizację strat).
Jednak, gdy nie istnieje dokładnie jeden punkt siodłowy, gracze mogą stosować strategię mieszaną.
Jak jednak wyznaczyć taki rozkład prawdopodobieństwa? Zastanówmy się najpierw jaki wynik przyniosłoby stosowanie przez Panią Kolumnę decyzji w oparciu o rzut monetą - czyli wybieranie decyzji z prawdopodobieństwem 1/2 i
z prawdopodobieństwem 1/2.
Wówczas, wybór przez Pan Wiersza powodowałby oczekiwaną wypłatę dla niego równą:
.
Zaś wybór dawałby Panu Wierszowi wypłatę równą
.
Z tych prostych kalkulacji wynika, że Pan Wiersz, wiedząc że Pani Kolumna stosuje strategię mieszaną: z prawd. = 1/2, i
z prawd. = 1/2, zawsze wybierze
.






Sprawdźmy wypłaty dla Pana Wiersza dla


W analogiczny sposób można wyznaczyć strategię mieszaną dla Pana Wiersza, zakładając, że wybiera decyzję z prawdopodobieństwem
i
z prawdopodobieństwem
. Wówczas:
- jeśli Pani Kolumna zagra
otrzyma oczekiwaną wypłatę:
- jeśli Pani Kolumna zagra
otrzyma oczekiwaną wypłatę:
Pani Kolumna nie wykorzysta znajomości strategii Pana Wiersza gdy: .
Na koniec kilka wniosków i twierdzeń.
Każda gra

Podczas gdy znalezienie strategii mieszanej dla gry jest proste, to znalezienie jej dla gier
jest bardziej skomplikowane. Jednak literatura podaje na to kilka sposobów:
- redukcja gry poprzez wykreślanie rozwiązań zdominowanych (por. rozdział 7.3)
- rozwiązanie algebraiczne układu równań (por. Straffin P. "Teoria Gier, 2001, rozdział 3)
- rozwiązanie zadania metodą graficzną (por. Straffin P. "Teoria Gier, 2001, rozdział 3)
- Rozwiązanie zadania programowania liniowego (por. Raghavan, T. E. S. "Zero-sum two-person games." Handbook of game theory with economic applications 2 (1994): 735-768)
1.3. Niekooperacyjna teoria gier - gry przeciwko naturze
W tym przykładzie rozważana jest sytuacja jamajskich rybaków, którzy mają do wybory trzy strategie:
- [W] rozstawić kosze do połowu ryb na łowiskach wewnętrznych
- [Z] rozstawić kosze do połowu ryb na łowiskach zewnętrznych
- [P] rozstawić kosze do połowu ryb pośrednio: na łowiskach wewnętrznych i zewnętrznych
Natomiast Natura na dwie strategie:
- [A] prądy wodne są aktywne
- [N] prądy wodne są nieaktywne
W trakcie wielu lat połowów, rybacy oszacowali wartości wypłat dla tak zdefiniowanej gry:
A
N
W
17,3
11,5
Z
-4,4
20,6
P
5,2
17,0
W jaki sposób rybacy powinni podjąć decyzję odnośnie strategii? Przeanalizujmy cztery kryteria znane z literatury:
- kryterium wartości oczekiwanej (Laplace'a)
- kryterium maksyminowe (Waldegrave'a)
- kryterium Savage'a (L.J. Savage)
- kryterium Hurwicza (L. Hurwicz)
Kryterium Laplace'a zakłada, że obliczamy wartość oczekiwaną dla każdej decyzji gracza, przy założonym rozkładzie decyzji Natury. Jeśli nie mamy żadnych wiadomości / obserwacji na temat strategii Natury, należy założyć rozkład proporcjonalny.
A | N | Wartość oczekiwana | |
---|---|---|---|
W | 17,3 | 11,5 | 14,4 := 0,5 * 17,3 + 0,5 * 11,5 |
Z | -4,4 | 20,6 | 8,1 := 0,5 * (-4,4) + 0,5 * 20,6 |
P | 5,2 | 17,0 | 11,1 := 0,5 * 5,2 + 0,5 * 17 |
Największa wartość oczekiwana (14,4) jest przy decyzji rybaka W (rozstaw kosze na łowiskach Wewnętrznych). Zmiana rozkładu prawdopodobieństwa na inny, wynikający przykładowo z obserwacji Natury, może jednak zmienić decyzję rybaków.
Kryterium maksyminowe zakłada, że ostrożny rybak będzie podejmował decyzję kierując się zasadą najlepszego rezultatu gwarantowanego. Innymi słowy, rybak stosujący kryterium maksyminowe podejmie decyzję, która przy najgorszej (dla niego) decyzji Natury, da najlepszy rezultat.
A | N | Wartość oczekiwana | |
---|---|---|---|
W | 17,3 | 11,5 | 11,5 := min(17,3; 11,5) |
Z | -4,4 | 20,6 | -4,4 := min(-4,4; 20,6) |
P | 5,2 | 17,0 | 5,2 := min(5,2; 17,0) |
Kryterium Savage'a opiera się na minimalizacji żalu. Rybak po realizacji decyzji może pomyśleć: "Zdecydowałem się rozstawić kosze na obydwu łowiskach: wewnętrznych i zewnętrznych (decyzja P), liczyłem, że prądy będą nieaktywne (decyzja Natury N) i zarobię 17. Natomiast okazało się, że prądy były aktywne (Natura wybrała decyzję A) i zarobiłem tylko 5,2!". Metoda Savage'a polega na zbudowaniu macierzy strat i zminimalizowaniu maksymalnej straty jakiej rybak może doświadczyć. Budowanie macierzy strat polega na tym, że każda komórka tej macierzy otrzymuje wartość będącą różnicą pomiędzy maksymalną wartością z kolumny z macierzy wypłat a wartością z komórki z macierzy wypłat.
A | N | strata | |
---|---|---|---|
W | 0 | 9,1 | max(0; 9,1) := 9,1 |
Z | 21,7 | 0 | max(21,7;0) := 21,7 |
P | 12,1 | 3,6 | max(12,1;3,6) := 12,1 |
Kryteria Savage'a i Waldegrave'a są krytykowane za zbytnią ostrożność. Kryterium zaporponowane przez Leonida Hurwicza łączy najgorszą i najlepszą opcję, wprowadzając tzw. wskaźnik optymizmu-pesymizmu, lub wskaźnik ostrożności .
Przykładowo, dla współczynnika ostrożności , czyli dla bardzo ostrożnego rybaka wybór będzie polegał na rozstawieniu koszy na łowiskach wewnętrznych.
1.4. Niekooperacyjna teoria gier - gry o sumie niezerowej
Najbardziej znaną i najbardziej zbadaną grą o sumie zerowej jest gra w dylemat więźnia.
Dwóch podejrzanych zostało zatrzymanych przez policję. Policja, nie mając wystarczających dowodów do postawienia zarzutów, rozdziela więźniów i przedstawia każdemu z nich tę samą ofertę: jeśli będzie zeznawać przeciwko drugiemu, a drugi będzie milczeć, to zeznający wyjdzie na wolność, a milczący dostanie dziesięcioletni wyrok. Jeśli obaj będą milczeć, obaj odsiedzą 6 miesięcy za inne przewinienia. Jeśli obaj będą zeznawać, obaj dostaną pięcioletnie wyroki. Każdy z nich musi podjąć decyzję niezależnie i żaden nie dowie się, czy drugi milczy czy zeznaje, aż do momentu wydania wyroku. Jak powinni postąpić? (za Wikipedia: https://pl.wikipedia.org/wiki/Dylemat_więźnia).
Dla gry w dylemat więźnia, macierz wypłat przedstawia się następująco:
K milczy
K zeznaje
W milczy
-0,5; -0,5
-10; 0
W zeznaje
0;-10
-5; -5
Zastanówmy się, która decyzja dla Pani Kolumny i dla Pana Wiersza będzie najlepsza, najbardziej korzystna. Pierwszym pojęciem, które wprowadzimy będzie dominacja strategii.
Kolejnym pojęciem będzie strategia dominująca:
Na podstawie powyższych definicji, możemy zaproponować jeden ze sposobów wyznaczania rozwiązań gier o sumie niezerowej. Polega on na wyznaczeniu strategii zdominowanych dla każdego z graczy i rozgrywanie gry za ich pomocą. Niestety, takie strategie rzadko występują w rzeczywistych grach.
Kolejną definicją jest optymalność wyniku gry w sensie Pareto.
Warto przedstawić także definicję nieoptymalności wyniku gry w sensie Pareto.
Z powyższych definicji możemy zdefiniować kryterium Pareto: tylko wynik optymalny w sensie Pareto może być akceptowalny jako rozwiązanie gry. Kryterium Pareto stanowi podstawową zasadę racjonalności grupowej.
Sprawdźmy, czy rozwiązania gry w dylemat więźnia są optymalne w sensie Pareto. Naszkicujmy wszystkie rozwiązania tej gry w dwuwymiarowej przestrzeni wypłat:
Wyniki gry, które są oznaczone czerwonym kolorem (), są optymalne w sensie Pareto. Dalej, spełniają kryterium racjonalności grupowej. Spełnienie tego kryterium przez rozwiązanie gry powoduje, że gracz nie może zyskać więcej, bez spowodowania straty dla drugiego gracza.
Poznaliśmy pojęcie strategii dominującej i możliwość (rzadką) na poszukiwanie rozwiązania gry. Poznaliśmy kryterium Pareto, które wskazuje racjonalne grupowo rozwiązania. Jednak poszukiwanie "dobrych" rozwiązań gry może zostać przeprowadzone przy użyciu tzw. koncepcji rozwiązania (ang. solution concept). Tworzy pewne założenia co do rozwiązania gry i formalnie tłumaczy ono jak zostanie rozegrana gra. Większość koncepcji rozwiązania jest oparta o koncepcje równowagowe.
Najbardziej znana koncepcja rozwiązania została zaproponowana przez Johna Nasha w 1951 r. Zakłada ona, że w grze znajdującej się w równowadze żaden z graczy nie ma zachęt jednostronnie odstępować o strategii równowagii. Równowaga Nasha (w strategiach czystych) jest to taki profil strategii czystych , że dla każdego
i dla każdej strategii czystej
gracza i-tego spełnia:
Nash udowonił, że każda skończona gra ma przynajmniej jeden punkt równowagi Nasha (niekoniecznie w strategiach czystych). Jednak w tym podręczniku nie będziemy zajmować się strategiami mieszanymi.
Przeanalizujmy teraz grę w dylemat więźnia i pokażmy jedną z metod wyznaczania punktów równowagowych Nasha.
![]() |
K milczy | K zeznaje | |
---|---|---|---|
W milczy | -0,5; -0,5 | ![]() |
-10; 0 |
![]() |
![]() |
||
W zeznaje | 0;-10 | ![]() |
-5; -5 |
Rozpocznijmy naszą analizę do punktu






