Podręcznik
Wersja podręcznika: 1.0
Data publikacji: 01.01.2022 r.
Wykłady
W1…WN, odpowiadające w sumie ok. 10-12 godz. standardowego wykładu
1. Elementy teorii gier
1.3. Niekooperacyjna teoria gier - gry przeciwko naturze
W tym przykładzie rozważana jest sytuacja jamajskich rybaków, którzy mają do wybory trzy strategie:
- [W] rozstawić kosze do połowu ryb na łowiskach wewnętrznych
- [Z] rozstawić kosze do połowu ryb na łowiskach zewnętrznych
- [P] rozstawić kosze do połowu ryb pośrednio: na łowiskach wewnętrznych i zewnętrznych
Natomiast Natura na dwie strategie:
- [A] prądy wodne są aktywne
- [N] prądy wodne są nieaktywne
W trakcie wielu lat połowów, rybacy oszacowali wartości wypłat dla tak zdefiniowanej gry:
A
N
W
17,3
11,5
Z
-4,4
20,6
P
5,2
17,0
W jaki sposób rybacy powinni podjąć decyzję odnośnie strategii? Przeanalizujmy cztery kryteria znane z literatury:
- kryterium wartości oczekiwanej (Laplace'a)
- kryterium maksyminowe (Waldegrave'a)
- kryterium Savage'a (L.J. Savage)
- kryterium Hurwicza (L. Hurwicz)
Kryterium Laplace'a zakłada, że obliczamy wartość oczekiwaną dla każdej decyzji gracza, przy założonym rozkładzie decyzji Natury. Jeśli nie mamy żadnych wiadomości / obserwacji na temat strategii Natury, należy założyć rozkład proporcjonalny.
A | N | Wartość oczekiwana | |
---|---|---|---|
W | 17,3 | 11,5 | 14,4 := 0,5 * 17,3 + 0,5 * 11,5 |
Z | -4,4 | 20,6 | 8,1 := 0,5 * (-4,4) + 0,5 * 20,6 |
P | 5,2 | 17,0 | 11,1 := 0,5 * 5,2 + 0,5 * 17 |
Największa wartość oczekiwana (14,4) jest przy decyzji rybaka W (rozstaw kosze na łowiskach Wewnętrznych). Zmiana rozkładu prawdopodobieństwa na inny, wynikający przykładowo z obserwacji Natury, może jednak zmienić decyzję rybaków.
Kryterium maksyminowe zakłada, że ostrożny rybak będzie podejmował decyzję kierując się zasadą najlepszego rezultatu gwarantowanego. Innymi słowy, rybak stosujący kryterium maksyminowe podejmie decyzję, która przy najgorszej (dla niego) decyzji Natury, da najlepszy rezultat.
A | N | Wartość oczekiwana | |
---|---|---|---|
W | 17,3 | 11,5 | 11,5 := min(17,3; 11,5) |
Z | -4,4 | 20,6 | -4,4 := min(-4,4; 20,6) |
P | 5,2 | 17,0 | 5,2 := min(5,2; 17,0) |
Kryterium Savage'a opiera się na minimalizacji żalu. Rybak po realizacji decyzji może pomyśleć: "Zdecydowałem się rozstawić kosze na obydwu łowiskach: wewnętrznych i zewnętrznych (decyzja P), liczyłem, że prądy będą nieaktywne (decyzja Natury N) i zarobię 17. Natomiast okazało się, że prądy były aktywne (Natura wybrała decyzję A) i zarobiłem tylko 5,2!". Metoda Savage'a polega na zbudowaniu macierzy strat i zminimalizowaniu maksymalnej straty jakiej rybak może doświadczyć. Budowanie macierzy strat polega na tym, że każda komórka tej macierzy otrzymuje wartość będącą różnicą pomiędzy maksymalną wartością z kolumny z macierzy wypłat a wartością z komórki z macierzy wypłat.
A | N | strata | |
---|---|---|---|
W | 0 | 9,1 | max(0; 9,1) := 9,1 |
Z | 21,7 | 0 | max(21,7;0) := 21,7 |
P | 12,1 | 3,6 | max(12,1;3,6) := 12,1 |
Kryteria Savage'a i Waldegrave'a są krytykowane za zbytnią ostrożność. Kryterium zaporponowane przez Leonida Hurwicza łączy najgorszą i najlepszą opcję, wprowadzając tzw. wskaźnik optymizmu-pesymizmu, lub wskaźnik ostrożności .
Przykładowo, dla współczynnika ostrożności , czyli dla bardzo ostrożnego rybaka wybór będzie polegał na rozstawieniu koszy na łowiskach wewnętrznych.