3. Sieci neuronowe głębokie

3.11. Zadania i problemy

1.Obraz wejściowy poddany operacjom max i average poolingu ma postać

\( \left[\left.\begin{array}{cccccc} 1 & 12 & 5 & 7 & 23 & 17 \\ 4 & 5 & 0 & 9 & 11 & 10 \\ 24 & 17 & 2 & 21 & 22 & 12 \\ 1 & 5 & 7 & 16 & 8 & 8 \\ 15 & 23 & 6 & 4 & 4 & 14 \\ 14 & 3 & 11 & 6 & 2 & 0 \end{array} \right]\,\right. \)

Wyznaczyć obrazy wyjściowe po zastosowaniu tych operacji z maską \( 2 \times 2 \). Przyjąć 2 wartości kroku \( stride=1 \) i \( stride=2 \).


2. Wyznaczyć 3 obrazy wyjściowe po operacji konwolucji i ReLU na 2 obrazach wejściowych

\( \begin{aligned} \text { Obr1}=[ & 1 \; 0 \; 3 \\ & 4 \;1\;6 \\ & 0\; 1 \; 1] \end{aligned} \)

\( \begin{aligned} \text { Obr1}=[ & 5 \; 6 \; 1 \\ & 1 \;2\;0 \\ & 4\; 3 \; 1] \end{aligned} \)

przy zastosowaniu 3 par filtrów )każda para generuje jeden obraz wyjściowy)

\( F11=[ 1 \;0; -1\; 1] \), \( F12=[1 \; 4; 0 \; -1] \)

\( F21=[ 2 \; 1; 3\; -1] \), \(F22=[-1 \; 1; 0 \; 2] \)

\( F31=[1 \; -1; -1\; 2]\), \(F32=[4\; 1; 6\; -1] \)

Przyjąć \( stride = 1\).


3. Określić minimalną wartość parametru zero padding w obu wymiarach, aby obraz wejściowy o wymiarach \( 100\times 80 \) poddany operacji pooling z maską \(4 \times 4\) i krokiem \( stride=2 \) dał obraz wynikowy o wymiarach \(50 \times 40\). Wykorzystać wzór 

\( O=(W−F+2P)/S+1 \)


4. Wyznaczyć wartość funkcji kross-entropijnej dla sieci CNN o 3 neuronach wyjściowych, jeśli dla pary uczącej \( (x,d) \) należącej do klasy pierwszej \( d=1 \) suma wagowa neuronów wyjściowych była równa \( u1=1.5 \); \(u2=0.9\); \(u3=1.2 \).