3. Sieci neuronowe głębokie

3.11. Zadania i problemy

1.Obraz wejściowy poddany operacjom max i average poolingu ma postać

 \left[\left.\begin{array}{cccccc}
1 & 12 & 5 & 7 & 23 & 17 \\
4 & 5 & 0 & 9 & 11 & 10 \\
24 & 17 & 2 & 21 & 22 & 12 \\
1 & 5 & 7 & 16 & 8 & 8 \\
15 & 23 & 6 & 4 & 4 & 14 \\
14 & 3 & 11 & 6 & 2 & 0
\end{array} \right]\,\right.

Wyznaczyć obrazy wyjściowe po zastosowaniu tych operacji z maską  2 \times 2 . Przyjąć 2 wartości kroku  stride=1 i  stride=2 .


2. Wyznaczyć 3 obrazy wyjściowe po operacji konwolucji i ReLU na 2 obrazach wejściowych

 \begin{aligned}
 \text { Obr1}=[ & 1 \; 0 \; 3 \\
& 4 \;1\;6 \\
& 0\; 1 \; 1]
\end{aligned}

 \begin{aligned}

 \text { Obr1}=[ & 5 \; 6 \; 1 \\

& 1 \;2\;0 \\

& 4\; 3 \; 1]

\end{aligned}

przy zastosowaniu 3 par filtrów )każda para generuje jeden obraz wyjściowy)

 F11=[ 1 \;0; -1\; 1] ,  F12=[1 \; 4; 0 \; -1]

 F21=[ 2 \; 1; 3\; -1] , F22=[-1 \; 1; 0 \; 2]

 F31=[1 \; -1; -1\; 2], F32=[4\; 1; 6\; -1]

Przyjąć  stride = 1.


3. Określić minimalną wartość parametru zero padding w obu wymiarach, aby obraz wejściowy o wymiarach  100\times 80 poddany operacji pooling z maską 4 \times 4 i krokiem  stride=2 dał obraz wynikowy o wymiarach 50 \times 40. Wykorzystać wzór 

 O=(W−F+2P)/S+1


4. Wyznaczyć wartość funkcji kross-entropijnej dla sieci CNN o 3 neuronach wyjściowych, jeśli dla pary uczącej  (x,d) należącej do klasy pierwszej  d=1 suma wagowa neuronów wyjściowych była równa   u1=1.5 ; u2=0.9; u3=1.2 .