3. Zdolności generalizacyjne sieci neuronowych

3.9. Zadania i problemy

1. Zaprojektować sieć MLP modelującą krzywą magnesowania pierwotnego żelaza.


2. Zespół trzech klasyfikatorów został wytrenowany na tych samych danych uczących do rozpoznania 2 klas danych. W wyniku testowania zespołu na pięciu wektorach  \mathbf{x}  uzyskano następujące wskazania klas klasyfikatorów dla poszczególnych danych   \mathbf{x}_i :

Klasyfikator 1: 1(  \mathbf{x}_1 ), 2(  \mathbf{x}_2 ), 2(  \mathbf{x}_3 ), 1(  \mathbf{x}_4 ), 2(  \mathbf{x}_5 )

Klasyfikator 2: 2(  \mathbf{x}_1 ), 1(  \mathbf{x}_2 ), 2(  \mathbf{x}_3 ), 2(  \mathbf{x}_4 ), 2(  \mathbf{x}_5 )

Klasyfikator 3: 1(  \mathbf{x}_1 ), 2(  \mathbf{x}_2 ), 1(  \mathbf{x}_3 ), 1(  \mathbf{x}_4 ), 2(  \mathbf{x}_5 )

Podać ostateczne przypisania wektorów   \mathbf{x}_i  (i = 1, 2, 3, 4, 5) do klas stosując zasadę głosowania większościowego (majority voting).


3. Zaproponować wzory na współczynniki wagowe zespołu 3 klasyfikatorów neuronowych 2-klasowych działających na zasadzie większości ważonej. Przyjąć, że współczynniki te są zależne od znanej z góry dokładności klasyfikacji poszczególnych klasyfikatorów na  p  danych uczących.


4. Sieć neuronowa o 6 wagach  w_1 = 10; w_2=5; w_3=2; w_4=1; w_5=0,5; w_6=0,1 została wytrenowana przy użyciu algorytmu uczącego 2-go rzędu dla którego macierz hesjanu określona jest wzorem

 \mathbf{H}=\left[\begin{array}{rrrrrr}
1 & 0,1 & -0,2 & 0,4 & 0,1 & 0,1 \\
0,1 & 2 & 0,5 & -0,3 & -0,4 & 0,2 \\
-0,2 & 0,5 & 5 & 0,2 & 1,5 & -0,8 \\
0,4 & -0,3 & 0,2 & 4 & 1,5 & -1,2 \\
0,1 & -0,4 & 1,5 & 1,5 & 10 & 3,2 \\
0,1 & 0,2 & -0,8 & -1,2 & 3,2 & 8
\end{array}\right]

Wyznaczyć wartości współczynnika ważności  S_i metodą OBD i OBS (przy obliczeniach macierzowych można wykorzystać program Matlab). Porównać wyniki obu metod i numery wag, podlegające obcięciu.


5. Wyjaśnić pojęcia: przeuczenie sieci, technika "cross validation" oraz leave-one-out.


6. Korzystając z programu MLP.m (patrz opis programu w wykładzie 2) sprawdzić zdolność generalizacji dwu sieci neuronowych MLP o jednym wejściu, jednym wyjściu i dwu różnych liczbach neuronów ukrytych ( K=10  oraz  K=150 ) realizujących aproksymację funkcji sinusoidalnej w jednym okresie przy wykorzystaniu 10 par danych uczących  x, d  odpowiadających temu okresowi. Dane testujące wygenerować w tym samym okresie poprzez przesunięcie zmiennej  x  w stosunku do danych uczących. Narysować wykresy funkcji aproksymowanej przez obie sieci na tle wartości zadanych.