2. Sieć perceptronu wielowarstwowego MLP

2.1. Wprowadzenie

Metody uczenia sieci jednokierunkowej, wielowarstwowej o neuronach typu sigmoidalnego są proste i łatwe w implementacji praktycznej, zwykle z nauczycielem, a podstawą uczenia jest zbiór stowarzyszonych par uczących (xd) , w których x jest wektorem wejściowym, a d odpowiadającym mu, zadanym wektorem wyjściowym sieci. Sieć nazywana jest heteroasocjacyjną, jeśli wektory x oraz d są różne. W przypadku gdy x=d , sieć nosi nazwę autoasocjacyjnej. Funkcja aktywacji neuronu stosowana w sieciach MLP jest typu sigmoidalnego. W wykładzie tym przedstawione zostaną podstawowe zależności odnoszące się do sieci wielowarstwowych sigmoidalnych. Omówione zostaną najważniejsze aspekty metod gradientowych uczenia tych sieci, w tym algorytm propagacji wstecznej generacji, metody poszukiwania kierunku minimalizacji oraz współczynnika uczenia.