1. Elementy teorii gier

1.3. Niekooperacyjna teoria gier - gry przeciwko naturze

Gra przeciwko naturze to taka gra, w której jednego z graczy nazywamy Naturą. Zakłada się, że pozostali gracze nie wiedzą nic o macierzy wypłat Natury, strategiach jakie Natura wybierze, ani o rozkładach prawdopodobieństwa wyboru poszczególnych strategii Natury.
Dobry przykład do analizy gier przeciwko naturze został opracowany przez Williama Davenporta na podstawie analizy antropologicznej jamajskich rybaków (W. Davenport "Jamaican fishing: A game theory analysis", 1960). 

W tym przykładzie rozważana jest sytuacja jamajskich rybaków, którzy mają do wybory trzy strategie:
  • [W] rozstawić kosze do połowu ryb na łowiskach wewnętrznych
  • [Z] rozstawić kosze do połowu ryb na łowiskach zewnętrznych
  • [P] rozstawić kosze do połowu ryb pośrednio: na łowiskach wewnętrznych i zewnętrznych

Natomiast Natura na dwie strategie:

  • [A] prądy wodne są aktywne
  • [N] prądy wodne są nieaktywne

W trakcie wielu lat połowów, rybacy oszacowali wartości wypłat dla tak zdefiniowanej gry:


Macierz wypłat dla rybaków
A N
W 17,3 11,5
Z -4,4 20,6
P 5,2 17,0

W jaki sposób rybacy powinni podjąć decyzję odnośnie strategii? Przeanalizujmy cztery kryteria znane z literatury:

  • kryterium wartości oczekiwanej (Laplace'a)
  • kryterium maksyminowe (Waldegrave'a)
  • kryterium Savage'a (L.J. Savage)
  • kryterium Hurwicza (L. Hurwicz)

Kryterium Laplace'a zakłada, że obliczamy wartość oczekiwaną dla każdej decyzji gracza, przy założonym rozkładzie decyzji Natury. Jeśli nie mamy żadnych wiadomości / obserwacji na temat strategii Natury, należy założyć rozkład proporcjonalny.

Kryterium Laplace'a (zakładany rozkład 50/50)
A N Wartość oczekiwana
W 17,3 11,5 14,4 := 0,5 * 17,3 + 0,5 * 11,5
Z -4,4 20,6 8,1 := 0,5 * (-4,4) + 0,5 * 20,6
P 5,2 17,0 11,1 := 0,5 * 5,2 + 0,5 * 17

Największa wartość oczekiwana (14,4) jest przy decyzji rybaka W (rozstaw kosze na łowiskach Wewnętrznych). Zmiana rozkładu prawdopodobieństwa na inny, wynikający przykładowo z obserwacji Natury, może jednak zmienić decyzję rybaków.

Oblicz wartość kryterium Laplace'a i wynikające z tego decyzję dla rybaków dla rozkładu prawdopodobieństwa 10/90.

Kryterium maksyminowe zakłada, że ostrożny rybak będzie podejmował decyzję kierując się zasadą najlepszego rezultatu gwarantowanego. Innymi słowy, rybak stosujący kryterium maksyminowe podejmie decyzję, która przy najgorszej (dla niego) decyzji Natury, da najlepszy rezultat.

Kryterium maksyminowe 
A N Wartość oczekiwana
W 17,3 11,5 11,5  := min(17,3; 11,5)
Z -4,4 20,6 -4,4 := min(-4,4; 20,6)
P 5,2 17,0 5,2 := min(5,2; 17,0)
Najlepszy rezultat gwarantowany, zakładając najgorszą decyzję (dla rybaka) Natury, to 11,5. Rybak powinien podjąć decyzję o rozstawieniu koszy do połowu ryb na łowiskach wewnętrznych.

Kryterium Savage'a opiera się na minimalizacji żalu.  Rybak po realizacji decyzji może pomyśleć: "Zdecydowałem się  rozstawić kosze na obydwu łowiskach: wewnętrznych i zewnętrznych (decyzja P), liczyłem, że prądy będą nieaktywne (decyzja Natury N) i zarobię 17. Natomiast okazało się, że prądy były aktywne (Natura wybrała decyzję A) i zarobiłem tylko 5,2!". Metoda Savage'a polega na zbudowaniu macierzy strat i zminimalizowaniu maksymalnej straty jakiej rybak może doświadczyć. Budowanie macierzy strat polega na tym, że każda komórka tej macierzy otrzymuje wartość będącą różnicą pomiędzy maksymalną wartością z kolumny z macierzy wypłat a wartością z komórki z macierzy wypłat.


Kryterium Savage'a -- macierz strat 
A N strata
W 0 9,1 max(0; 9,1) := 9,1
Z 21,7 0 max(21,7;0) := 21,7
P 12,1 3,6 max(12,1;3,6) := 12,1


Kryteria Savage'a i Waldegrave'a są krytykowane za zbytnią ostrożność. Kryterium zaporponowane przez Leonida Hurwicza łączy najgorszą i najlepszą opcję, wprowadzając tzw. wskaźnik optymizmu-pesymizmu, lub wskaźnik ostrożności  \theta \in [0;1] .

Przykładowo, dla współczynnika ostrożności  \theta = 0,95 , czyli dla bardzo ostrożnego rybaka wybór będzie polegał na rozstawieniu koszy na łowiskach wewnętrznych.

Kryterium Hurwicza \theta =0,95
A N kryterium Hurwicza
W 17,3 11,5 11,79 := 0,95 * min(17,3;11,5) + 0,05*max(17,3;11,5)
Z -4,4 20,6 -3,15 := 0,95 * min(-4,4;20,6) + 0,05*max(-4,4;20,6)
P 5,2 17,0 5,79 := 0,95 * min(5,2;17) + 0,05*max(5,2;17)

Zadanie: wyznacz decyzję dla rybaka "ryzykanta", którego wskaźnik ostrożności wynosi  \theta = 0,05