Podręcznik: Restrykcja - dekompozycja Bendersa

3. Techniki restrykcyjne i relaksacyjne

3.2. Restrykcja - dekompozycja Bendersa

W tym rozdziale pokażemy możliwości wykorzystania dekomponowalnej struktury zadania lokalizacji, stosując zamiast relaksacji techniki restrykcji. Restrykcja to technika polegająca na dodatkowym ograniczaniu zbioru dopuszczalnego problemu optymalizacji. W omawianej we wcześniejszych rozdziałach metodzie podziału i oszacowań restrykcja była wykorzystywana do wydzielania części obszaru dopuszczalnego poprzez narzucenie ograniczeń typu nierównościowego na zmienne. W metodzie opracowanej przez Bendersa w 1962r. restrykcja polega na narzuceniu konkretnych wartości wybranym zmiennym całkowitoliczbowym, podczas gdy pozostałe zmienne są optymalizowane. Metoda Bendersa ma zatem zastosowanie do rozwiązywania tylko pewnych klas problemów optymalizacji, dla których w możliwy jest rozdział zmiennych, w szczególności prowadzący do wyodrębnienia zadania programowania liniowego oraz zadania programowania dyskretnego, które jest łatwiejsze do rozwiązywania od pierwotnego problemu dyskretno-ciągłego.

Przypomnijmy, ze w zadaniu lokalizacji rozważanym w poprzednim podrozdziale poświęconym relaksacji Lagrange'a problem pierwotny polega na określeniu, w których miastach otworzyć magazyny (zmienna binarna \(y_j\)) oraz w jakich proporcjach zaspokoić zapotrzebowanie klientów w miastach \(i\) zaopatrywanych przez magazyny \(j\) (zmienna ciągła z zakresu \(0\leq x_{ij}\leq 1\)). Dla uproszczenia, analizujemy łatwieszą wersję problemu, w którym pomijamy ograniczone pojemności magazynów.

Sformułowanie matematyczne problemu pierwotnego P:

\( P=\min \sum_{ij} c_{ij}x_{ij} +\sum_i f_iy_i\)
p.o.:
(1) \(\sum_i x_{ij}= 1\;\;\;\forall j\in \mathrm{cities}\)
(2) \(x_{ij}\leq y_i\;\;\;\forall i,j\in \mathrm{cities}\)
(3) \(x_{ij}\geq 0,\;\; y_i\in\{0,1\}\;\;\;\forall i,j\in \mathrm{cities}. \)

Zdefiniujmy teraz problem operujący tylko na zmiennych ciągłych \(0\leq x_{ij}\leq 1\), w którym \(y_j\) jest traktowane jako parametr - zostało poddane restrykcji. Przyjmując, że wartości wektora \(y_j\) są ustalone, restrykcja \(PX(y)\) zadania (P) jest podproblemem sparametryzowanym przez y. W takiej sytuacji \(PX(y)\) jest zadaniem liniowym względem zmiennej x o następującej postaci:

\(PX(y)= \min \sum_{ij} c_{ij}x_{ij}\)
p.o.:
(4) \(\sum_i x_{ij}= 1\;\;\;\forall j\in \mathrm{cities},\;\;\; \perp \lambda_j\)
(5) \(x_{ij}\leq y_i\;\;\;\forall i,j\in \mathrm{cities}, \;\;\;\perp v_{ij}\)
(6) \(x_{ij}\geq 0,\;\; \;\;\forall i,j\in \mathrm{cities}. \)

W powyższym sformułowaniu oznaczyliśmy też zmienne dualne do ograniczeń (4) i (5), które będą wykorzystane w dalszej analizie metody Bendersa. Przypomnijmy, że sformułowanie dualne można rozważać tylko dla problemów ze zmiennymi ciągłymi - a taki właśnie jest problem \(PX(y)\). Zauważmy przy okazji, że problem \(PX(y)\) może być zdekomponowany na \(j\) niezależnych podproblemów optymalizacji, podobnie niezależnie można określać odpowiednie zmienne dualne . Podproblem \(PX^j(y)\):

\(PX^j(y)= \min \sum_{i} c_{ij}x_{ij}\)
p.o.:
(7) \(\sum_i x_{ij}= 1,,\;\;\; \perp \lambda_j\)
(8) \(x_{ij}\leq y_i\;\;\;\forall i\in \mathrm{cities},\;\;\;\perp v_{ij}\)
(9) \(x_{ij}\geq 0,\;\; \;\;\forall i\in \mathrm{cities}. \)

W metodzie dekompozycji Bendersa kolejnym elementem schematu postępowania jest sformułowanie dualne zadania \(PX(y)\) określane jako problem D1. Skorzystamy z możliwości dekompozycji zadania \(PX(y)\) na podproblemy i dla ułatwienia rozważań sformułujemy podproblem \(D1^j(y)\):

\(D1^j(y)= \max \lambda_j+\sum_{i} y_iv_{ij}\)
p.o.:
(10) \( \lambda_j+v_{ij} \leq c_{ij},,\;\;\; \forall i\in \mathrm{cities}\)
(11) \(\lambda_j \mathrm{nieogr.},\;\;\; v_{ij}\geq 0\).

Zmienna dualna \(\lambda_j\) w zadaniu \(D1^j(y)\) jest nieograniczonego znaku, przy czym musi być zawsze niezerowa, tj. musi być zmienną bazową (każde miasto musi być zaopatrzone). Ze względu na maksymalizację, oraz ograniczenie (10) \(\lambda_j\) będzie przybierać najniższą z wartości \(c_{ij}\), dla których \(y_{i}=0\). Natomiast w pozostałych przypadkach, z tego względu że w bazie nie może być dodatkowych zmiennych \(v_{ij}\) (lub zmiennych dopełniających) szczególna postać tego zadania pozwala wyznaczyć rozwiązania zmiennych dualnych jako:

\(\lambda_j = c_{kj},\;\; v_{ij} = ((c_{1j}-c_{kj})^+, (c_{2j}-c_{kj})^+,\ldots, (c_{nj}-c_{kj})^+)\).

Stąd:

\(\hat{r}^j = \max_{k\in \mathrm{cities}} [c_{kj}+ \sum_{i \in \mathrm{cities}}y_i(c_{ij}-c_{kj})^+]\).

Najważniejszą cechą zadania dualnego w metodzie Bendersa jest to, że jego zbiór rozwiązań dopuszczalnych nie zależy od wyboru \(y\). Dzieje się tak, ponieważ ustalony \(y\) jest pomijany w funkcji celu zadania pierwotnego, a jak pamiętamy, w ograniczeniach zadania dualnego wykorzystywane są jedynie współczynniki funkcji celu zadania prymalnego. Niezależność zbioru dopuszczalnego \(D1(y)\) od wektora \(y\) pozwala na rozważanie wyłącznie punktów wierzchołkowych tego zbioru, gdyż to w jednym z nich znajduje się optimum, którego wartość zależy od \(y\). To pozwala przekształcić problem P do równoważnego zadania D2. W rozważanym tu problemie lokalizacji jest on następującej postaci. Problem \(D2\):

\(D2= \max \sum_i f_iy_i +\sum_{j} r_j\)
p.o.:
(12) \( r_j\leq -c_{kj}+\sum_{i \in \mathrm{cities}}y_i(c_{kj}-c_{ij})^+,\;\;\; \forall k,j\in \mathrm{cities}\)

(13) \(\sum_i y_i\geq 1,\)

(13) \(r_j \in R\;\;\; y_{j}\in\{0,1\}\\).

Bezpośrednie rozwiązywanie zadania D2 jest na ogół niepraktyczne, gdyż wymaga wyznaczenia wszystkich punktów wierzchołkowych zbioru dualnego, co może być szczególnie kłopotliwe w przypadku dużej liczby wierzchołków. Dlatego Benders opracował iteracyjną procedurę, która pozwala na wyznaczenie optymalnego wierzchołka zbioru dualnego zazwyczaj w niewielkiej liczbie iteracji.

Formalna konstrukcja algorytmu Bendersa:

Krok 0. Wyznacz wartość wektora zmiennych dualnych \(v^0\) jako dowolne rozwiązanie dopuszczalne problemu dualnego \(D1(y)\) - uwaga, nie musi to być punkt wierzchołkowy zbioru dopuszczalnego. Jeżeli rozwiązanie dopuszczalne nie istnieje, to STOP. W p. p. przyjmij \(k = 1\) i idź do kroku 1.
Krok 1. Rozwiąż zadanie zrelaksowane \(P^k\), tzn. zadanie D2, w którym występuje jedynie \(k\) ograniczeń. W wyniku rozwiązaniu zrelaksowanego zadania uzyskujemy optymalną wartość wektora \(y = \hat{y}^k\), i wartość funkcji celu będącą wartością oszacowania górnego \(\tilde{z}^k\).
Krok 2. Rozwiąż zadanie restrykcyjne \(D1(y)\) podstawiając \(y = \hat{y}^k\). W wyniku rozwiązania restrykcji zadania uzyskujemy optymalną wartość wektora zmiennych dualnych \(\hat{v}^k\). Na jego podstawie oraz wartości \(\hat{y}^k\) można obliczyć oszacowanie dolne \(\underline{z}^k\) w \(k\)-tej iteracji.
Krok 3. Jeżeli \(\tilde{z}^k- \underline{z}^k < \epsilon\) to \(\hat{y}^k\) jest rozwiązaniem optymalnym problemu (P), idź do kroku 4 w celu wyznaczeniu optymalnej wartości x. W p.p. podstaw \(k = k + 1\) i idź do kroku 1.
Krok 4. Rozwiąż problem \(PX(y)\) przyjmując \(y = \hat{y}^k\). STOP.

Iteracyjny algorytm Bendersa znajduje rozwiązanie w co najwyżej \(K\) iteracjach, gdzie \(K\) to liczba punktów wierzchołkowych zadania dualnego Bendersa.
Uwaga. Dekompozycja Bendersa może być szczególnie efektywna w przypadku, gdy struktura macierzy ograniczeń jest blokowo-diagonalna z wstęgą pionową, jak pokazano na poniższym rysunku.

Innym przykładem możliwości zastosowania metody dekompozycji Bendersa jest sytuacja, gdy funkcje powiązane ze zmienną \(y\) mają szczególną strukturę, np. wynikającą z przepływu w sieciach.