Podręcznik
1. Elementy teorii gier
1.1. Niekooperatywna teoria gier - wprowadzenie
Aby wprowadzić w tematykę niekooperatywnej teorii gier, podać podstawowe definicje i pojęcia posłużę się przykładową grą śmieciową.
Obydwoje gracze mają do dyspozycji dwie możliwe decyzje: podpisać umowę o wywóz śmieci lub wysypywać je na tyłach swojej działki. Zapiszmy to formalnie:
\( D^W = \{ \textrm{wywożenie śmieci} (d^W), \textrm{składowanie śmieci na tyłach działki} (g^W) \} \ni c^W \)
\( D^K = \{ \textrm{wywożenie śmieci} (d^K), \textrm{składowanie śmieci na tyłach działki} (g^K) \} \ni c^K \)\( D^W\) i \(D^K\) są zbiorami decyzji odpowiednio Pana Wiersza i Pani Kolumny. \(d^W, g^W, d^K, g^K\) są poszczególnymi decyzjami. \( c^W\) i \(c^K\) są konkretnymi podjętymi decyzjami.
Wynik gry można opisać za pomocą funkcji rezultatów \(q_X\). Argumentem tej funkcji są decyzje graczy, zaś wynikiem są jej rezultaty dla graczy. W wypadku naszej gry: \( q_X(c^W,c^K)=(x^W,x^K) \). Zbiorem rezultatów dla Pana Wiersza jest \( X^W\), zaś zbiorem rezultatów dla Pani Kolumny jest \(X^K\). Te zbiory nie muszą być sobie równe, jednak w przypadku naszej gry są sobie równe:
\(X^W = X^K = \{ \textrm{nie śmierdzi za darmo, nie śmierdzi i kosztuje, śmierdzi za darmo, śmierdzi i kosztuje} \} \)
Do prezentacji wypłat można wykorzystać tzw. macierz wypłat. Jest to wygodna forma, ale możliwa do wykorzystania dla mniejszych gier.
| \( q_X \) | \( d^K \) | \( g^K \) |
|---|---|---|
| \( d^W \) |
nie śmierdzi i kosztuje, nie śmierdzi i kosztuje | śmierdzi i kosztuje, nie śmierdzi za darmo |
| \( g^W \) | nie śmierdzi za darmo, śmierdzi i kosztuje | śmierdzi za darmo, śmierdzi za darmo |
Macierz wypłat zwyczajowo zapisuje się w taki sposób, że decyzje pierwszego gracza (w tym wypadku Pana Wiersza) zapisujemy w kolejnych wierszach macierzy, natomiast decyzje drugiego gracza (w tym wypadku Pani Kolumny) zapisujemy w kolejnych kolumnach macierzy. W każdej komórce macierzy zapisujemy wartości dla pierwszego gracza, a następnie (po przecinku) dla drugiego gracza.
Taka macierz uzupełniona opisowymi bądź symbolicznymi zbiorami wyników tworzy tzw. osnowę gry.
Aby z osnowy uzyskać grę, należy uzupełnić ją o indywidualne preferencje graczy odnośnie rezultatów.
nie śmierdzi za darmo \( \succ \) nie śmierdzi i kosztuje \( \succ \) śmierdzi za darmo \( \succ \) śmierdzi i kosztuje
Gra uzupełniona o preferencje odnośnie rezultatów może być analizowana. Rezultaty gry można także przedstawić za pomocą liczb, tzw. indykatorów preferencji lub inaczej funkcji wartościujących.
Taka funkcja wartościująca dla każdego gracza ma postać \( w_O: X \mapsto \mathbb{R} \) - jej argumentem jest rezultat gry, zaś wynikiem liczba rzeczywista.
- \( w^W_O( \textrm{nie śmierdzi za darmo}, \cdot) = 0 \)
- \( w^W_O( \textrm{nie śmierdzi i kosztuje}, \cdot) = -2000 \)
- \( w^W_O( \textrm{śmierdzi za darmo}, \cdot) = -500 \)
- \( w^W_O( \textrm{śmierdzi i kosztuje}, \cdot) = -2500 \)
i dla Pani Kolumny:
- \( w^K_O( \textrm{nie śmierdzi za darmo }, \cdot) = 0 \)
- \( w^K_O( \textrm{nie śmierdzi i kosztuje}, \cdot) = -2000 \)
- \( w^K_O( \textrm{śmierdzi za darmo}, \cdot) = -2500 \)
- \( w^K_O( \textrm{śmierdzi i kosztuje}, \cdot) = -3000 \)
Na podstawie powyższego przykładu można zauważyć, że funkcje wartościujące mogą być różne, co więcej preferencje graczy odnośnie rezultatów gry także mogą się różnić.
Preferencje Pani Kolumny (wynikające z poprzedniego przykładu): \( \textrm{nie śmierdzi za darmo} \succ \textrm{nie śmierdzi i kosztuje} \succ \textrm{śmierdzi za darmo} \succ \textrm{śmierdzi i kosztuje} \).
Ostatecznie można zapisać macierz gry z funkcjami wartościującymi:
| \( q_X \) | \( d^K \) | \( g^K \) |
|---|---|---|
| \( d^W \) |
-2000, -2000 | -2500,0 |
| \( g^W \) | 0,-3000 | -500, -2500 |
Wyobraźmy sobie Pana Wiersza i Panią Kolumnę, którym zależy na tym aby się spotkać, ale są zbyt nieśmiali żeby się umówić. Obydwoje wiedzą też, że lubią chodzić do dwóch klubów: ,Atabaska’ i ,Bajlando’, ale nie wiedzą do którego aktualnie pójdzie druga osoba. Kiedy spotkają się w jednym z klubów, obydwoje będą bardzo zadowoleni (wypłata dla obydwojga +10). W ,Atabasce’ będzie relacja z meczu (wypłata dla P. Wiersza +3 jeśli tam będzie), natomiast w ,Bajlando’ na pewno będą przyjaciółki P. Kolumny (wypłata dla P. Kolumny +4 jeśli tam będzie, dla P. Wiersza -2 jeśli tam będzie).