3. Sieci neuronowe głębokie

3.12. Słownik

Słownik opanowanych pojęć

Wykład 6

Sieci głębokie – sieci wielowarstwowe, w których kolejne warstwy połączone lokalnie są odpowiedzialne za generację i selekcję cech diagnostycznych procesu. Cechy te są podawane następnie na stopień końcowy realizujący funkcję klasyfikatora bądź regresora.

Sieć CNN – sieć neuronowa konwolucyjna (ang. Convolutional Neural Network) stanowiąca sztandarową postać sieci głębokich.

Autoenkoder – sieć jednokierunkowa wielowarstwowa stanowiąca uogólnienie sieci MLP, stosowana do automatycznej generacji cech diagnostycznych procesu.

Stride – krok przesunięcia maski filtrującej obraz.

Pooling – metoda redukcji wymiaru poprzez łączenie sąsiednich pikseli w postaci wartości średniej lub maksymalnej.

ReLU – dwu-odcinkowo liniowa funkcja aktywacji, przyjmująca jako wyjście wartość argumentu wejściowego, jeśli jest on dodatni lub zero w przeciwnym wypadku.

Zero padding – uzupełnianie obrazu zerami (wierszy i kolumn) dla zwiększenia wymiaru obrazu wejściowego.

Mini batch – mały podzbiór danych wybranych losowo ze zbioru uczącego używany w procesie uczenia sieci głębokiej.

Sofplus – modyfikacja funkcji ReLU zapewniając ciągłość pochodnej.

Softmax – metoda uczenia sieci CNN w zadaniu klasyfikacji.

Struktura sieci w pełni połączona – fragment końcowy struktury sieciowej rozwiązania głębokiego, w którym neurony w sąsiednich warstwach są w pełni połączone wagowo.

Funkcja kross-entropijna – specjalna definicja funkcji celu stosowana w uczeniu sieci głębokich wykorzystująca prawdopodobieństwo przynależności do określonej klasy.

SGDM – stochastyczny algorytm największego spadku z momentem rozpędowym.

ADAM – algorytm uczenia sieci głębokich (ang. ADAptive Momenet estimation) stosujący adaptacyjnie dobierany współczynnik uczenia uzależniony od momentu statystycznego gradientu pierwszego i drugiego rzędu.

Transfer learning – metoda uczenia wstępnie nauczonej sieci głębokiej poprzez adaptację ograniczonej struktury sieci (zwykle klasyfikatora końcowego) na właściwych danych.

ALEXNET – pierwsza sieć CNN wstępnie wytrenowana do użytku publicznego wykorzystywana poprzez transfer learning.

UNET – sieć głęboka CNN stworzona specjalnie do segmentacji obrazów biomedycznych.

YOLO – sieć CNN (ang. You Only Look Once) wykorzystywana do klasyfikacji i regresji.

RCNN – sieć głęboka stworzona specjalnie do segmentacji obrazów (ang. Region based CNN).

Dywergencja Kullbacka-Leiblera – miara odległości między zbiorami w przestrzeni stochastycznej.

Autoencoder wariacyjny – rozwiązanie sieci głębokiej umożliwiające generację obrazów podobnych do oryginału (ang. Variational Autoencoder) .

GAN – sieć stworzona do koncepcji przeciwstawienia sobie dwu sieci neuronowych, z których jedna reprezentuje dane rzeczywiste, a druga dane generowane sztucznie, udając dane rzeczywiste (ang. Generative Adversarial Network).

BIGAN – modyfikacja sieci GAN o polepszonym działaniu.