1. Programowanie dynamiczne

1.2. Przykładowe zadanie

Rozwiążemy problem inwestycyjny, definiując poszczególne elementy PD.  

Załóżmy, że inwestor dysponuje budżetem 10 mln zł. Ma do wyboru 8 różnych możliwości, każda z nich charakteryzuje się różną stopą zwrotu, podaną w tabeli. Aby ograniczyć ryzyko nadmiernej koncentracji kapitału inwestor nie chce wydać więcej niż 4 mln zł na pojedynczą opcję. Przyjmuje się, że można zainwestować tylko wielokrotności 1 mln zł. Pozostała, niezainwestowana gotówka daje zwrot w wysokości 5 tys. zł za każdy milion.
wartości zwrotu dla każdej opcji inwestycyjnej, przy danym poziomie inwestycji

Dla powyższego zadania, które jest odmianą problemu plecakowego definiujemy:

  • etapy t: opcje inwestycyjne,
  • stany x_t: zainwestowana gotówka przed rozważeniem opcji t,
  • sterowanie u_t: ile zainwestować gotówki w opcję t,
  • funkcja przejścia:  x_{t+1}=x_t+u_t,
  • wartość końcowa w tym zadaniu nie jest zerowa, określa ją zwrot z pozostałej, niezainwestowanej gotówki:  V_T(x_T)=(10-x_T)\cdot 0.5,
  • funkcja Bellmana odnosi się w tym przypadku tylko do zysku z decyzji:  V_t(x_t)=\max_{u_t}\{f(u_t)+V_{t+1}(x_t+u_t)\}.

Problem ten można przedstawić w postaci grafu PD, tak jak na poniższej ilustracji, gdzie zaznaczono też optymalne rozwiązanie.

Zadanie w postaci grafu PD

Klasyczne zadanie odpowiednie do rozwiązywania metodą PD to tzw. problem połowu ryb.
Połów (catching fishes). Określ wielkość połowu ryb w każdym roku w przeciągu 10 lat, wiedząc, że obecnie (rok 1) w jeziorze jest 10000 ryb, a ich tempo rocznego przyrostu wynosi 20% (ilości ryb w jeziorze na początku każdego roku). Ryby są sprzedawane w cenie 5$ za sztukę.
Niech (\x\) oznacza liczbę złowionych ryb. Koszt połowu dany jest funkcją:
 0.4x + 100, gdy x \leq 5000;
0.3x + 5000, gdy 5000\leq x \leq 10000;
 0.2x + 10000, gdy x > 10000;
Przyszłe zyski podlegają dyskontu zgodnie ze współczynnikiem 0.8/rok.
Rozwiązane można znaleźć w Miranda, Mario J., and Paul L. Fackler. Applied Computational Economics and Finance, MIT Press, 2002.