1. Elementy teorii gier

1.1. Niekooperatywna teoria gier - wprowadzenie

Aby wprowadzić w tematykę niekooperatywnej teorii gier, podać podstawowe definicje i pojęcia posłużę się przykładową grą śmieciową.


Załóżmy, że istnieje dwoje graczy: Pan Wiersz i Pani Kolumna. Obydwoje są właścicielami sąsiadujących ze sobą działek letniskowych. Obydwoje nie posiadają podpisanej umowy o wywóz śmieci, koszt podpisania takiej umowy to 2000 PLN/rok. Obecnie, mają możliwość składowania śmieci na tyłach swoich działek. Jednak, miejsce składowania śmieci na jednej działce, znajduje się bezpośrednio domku sąsiada. W takiej sytuacji Pan Wiersz, decydując się wyrzucać swoje śmieci na tyłach swojej działki, powoduje brzydki zapach u Pani Kolumny. Podobnie Pani Kolumna, wyrzucając śmieci na tyłach swojej działki, powoduje, że u Pana Wiersza śmierdzi.

Obydwoje gracze mają do dyspozycji dwie możliwe decyzje: podpisać umowę o wywóz śmieci lub wysypywać je na tyłach swojej działki. Zapiszmy to formalnie:

 D^W = \{ \textrm{wywożenie śmieci} (d^W), \textrm{składowanie śmieci na tyłach działki} (g^W) \} \ni c^W

 D^K = \{ \textrm{wywożenie śmieci} (d^K), \textrm{składowanie śmieci na tyłach działki} (g^K) \} \ni c^K

 D^W i D^K są zbiorami decyzji odpowiednio Pana Wiersza i Pani Kolumny. d^W, g^W, d^K, g^K są poszczególnymi decyzjami.  c^W i c^K są konkretnymi podjętymi decyzjami.

Wynik gry można opisać za pomocą funkcji rezultatów q_X. Argumentem tej funkcji są decyzje graczy, zaś wynikiem są jej rezultaty dla graczy. W wypadku naszej gry:  q_X(c^W,c^K)=(x^W,x^K) . Zbiorem rezultatów dla Pana Wiersza jest  X^W, zaś zbiorem rezultatów dla Pani Kolumny jest X^K. Te zbiory nie muszą być sobie równe, jednak w przypadku naszej gry są sobie równe:
X^W = X^K = \{ \textrm{nie śmierdzi za darmo, nie śmierdzi i kosztuje, śmierdzi za darmo, śmierdzi i kosztuje} \}

Do prezentacji wypłat można wykorzystać tzw. macierz wypłat. Jest to wygodna forma, ale możliwa do wykorzystania dla mniejszych gier.

 q_X  d^K  g^K
 d^W
nie śmierdzi i kosztuje, nie śmierdzi i kosztuje śmierdzi i kosztuje, nie śmierdzi za darmo
 g^W nie śmierdzi za darmo, śmierdzi i kosztuje śmierdzi za darmo, śmierdzi za darmo
Macierz wypłat dla gry śmieciowej

Macierz wypłat zwyczajowo zapisuje się w taki sposób, że decyzje pierwszego gracza (w tym wypadku Pana Wiersza) zapisujemy w kolejnych wierszach macierzy, natomiast decyzje drugiego gracza (w tym wypadku Pani Kolumny) zapisujemy w kolejnych kolumnach macierzy. W każdej komórce macierzy zapisujemy wartości dla pierwszego gracza, a następnie (po przecinku) dla drugiego gracza. 

Taka macierz uzupełniona opisowymi bądź symbolicznymi zbiorami wyników tworzy tzw. osnowę gry.

Aby z osnowy uzyskać grę, należy uzupełnić ją o indywidualne preferencje graczy odnośnie rezultatów. 

Przykładowe preferencje dla Pani Kolumny: 
nie śmierdzi za darmo  \succ nie śmierdzi i kosztuje  \succ śmierdzi za darmo  \succ śmierdzi i kosztuje

Gra uzupełniona o preferencje odnośnie rezultatów może być analizowana. Rezultaty gry można także przedstawić za pomocą liczb, tzw. indykatorów preferencji lub inaczej funkcji wartościujących.

Taka funkcja wartościująca dla każdego gracza ma postać  w_O: X \mapsto \mathbb{R} - jej argumentem jest rezultat gry, zaś wynikiem liczba rzeczywista.

Przykładowe funkcje wartościujące dla Pana Wiersza:
  •  w^W_O( \textrm{nie śmierdzi za darmo}, \cdot) = 0 
  •  w^W_O( \textrm{nie śmierdzi i kosztuje}, \cdot) = -2000 
  •  w^W_O( \textrm{śmierdzi za darmo}, \cdot) = -500
  •  w^W_O( \textrm{śmierdzi i kosztuje}, \cdot) = -2500 

i dla Pani Kolumny:

  •  w^K_O( \textrm{nie śmierdzi za darmo }, \cdot) = 0 
  •  w^K_O( \textrm{nie śmierdzi i kosztuje}, \cdot) = -2000 
  •  w^K_O( \textrm{śmierdzi za darmo}, \cdot) = -2500
  •  w^K_O( \textrm{śmierdzi i kosztuje}, \cdot) = -3000 

Na podstawie powyższego przykładu można zauważyć, że funkcje wartościujące mogą być różne, co więcej preferencje graczy odnośnie rezultatów gry także mogą się różnić.

Preferencje Pana Wiersza (wynikające z poprzedniego przykładu):  \textrm{nie śmierdzi za darmo} \succ \textrm{śmierdzi za darmo} \succ \textrm{nie śmierdzi i kosztuje} \succ \textrm{śmierdzi i kosztuje} .
Preferencje Pani Kolumny (wynikające z poprzedniego przykładu):  \textrm{nie śmierdzi za darmo} \succ \textrm{nie śmierdzi i kosztuje} \succ \textrm{śmierdzi za darmo} \succ \textrm{śmierdzi i kosztuje} .

Ostatecznie można zapisać macierz gry z funkcjami wartościującymi:

 q_X  d^K  g^K
 d^W
-2000, -2000 -2500,0
 g^W 0,-3000 -500, -2500
Macierz wypłat z funkcjami wartościującymi dla gry śmieciowej

Dla gry opisanej poniżej zapisz: graczy, zbiory ich decyzji, zbiory rezultatów, osnowę gry, macierz gry oraz macierz gry z funkcjami wartościującymi.
Wyobraźmy sobie Pana Wiersza i Panią Kolumnę, którym zależy na tym aby się spotkać, ale są zbyt nieśmiali żeby się umówić. Obydwoje wiedzą też, że lubią chodzić do dwóch klubów: ,Atabaska’ i ,Bajlando’, ale nie wiedzą do którego aktualnie pójdzie druga osoba. Kiedy spotkają się w jednym z klubów, obydwoje będą bardzo zadowoleni (wypłata dla obydwojga +10). W ,Atabasce’ będzie relacja z meczu (wypłata dla P. Wiersza +3 jeśli tam będzie), natomiast w ,Bajlando’ na pewno będą przyjaciółki P. Kolumny (wypłata dla P. Kolumny +4 jeśli tam będzie,  dla P. Wiersza -2 jeśli tam będzie).