Podręcznik

1. Modele neuronów

1.6. Model neuronu Hebba

Donald O. Hebb, badając działanie komórek nerwowych [24] zauważył, że powiązanie wagowe dwóch komórek jest wzmacniane, jeśli obie komórki są jednocześnie pobudzone (stają się aktywne). Jeśli \( j \)-ta komórka o sygnale wyjściowym \( y_j \) powiązana jest z \( i \)-tą o sygnale wyjściowym \( y_i\) przez wagę \( w_{ij} \), wówczas na stan powiązań tych komórek wpływają wartości ich sygnałów \( y_j \) oraz \( y_i \).

D. Hebb zaproponował regułę matematyczną, w której uwzględniony został wynik tej obserwacji. Zgodnie z regułą Hebba, zmiana wagi \( w_{ij}\) neuronu odbywa się proporcjonalnie do iloczynu jego sygnału wejściowego oraz wyjściowego [46]

\( w_{ij} (k+1) = w_{ij} (k) + \eta y_i y_j \)

(1.18)

przy współczynniku \(\eta\) reprezentującym wartość stałej uczenia. Reguła Hebba może być stosowana do różnego typu struktur sieci neuronowych i różnych funkcji aktywacji zastosowanych w modelu neuronu.

Rys. 1.7 Ogólny model neuronu Hebba

Ogólny model neuronu Hebba, przedstawiony na rys. 1.7, odpowiada standardowej postaci modelu. Waga \( w_{ij} \) włączona jest między sygnałem wejściowym \( y_j \) a węzłem sumacyjnym \( i \)-tego neuronu o sygnale wyjściowym \( y_i \).

Uczenie neuronu z zastosowaniem reguły Hebba może się odbywać w trybie bez nauczyciela lub z nauczycielem. W pierwszym przypadku w regule Hebba używa się aktualnej wartości \( y_i \) sygnału wyjściowego neuronu (wzór (1.18)). W uczeniu z nauczycielem wartość sygnału wyjściowego \( y_i \) zastępuje się wartością zadaną \( d_i \) dla tego neuronu. Regułę Hebba można wówczas zapisać w postaci

\( w_{ij} (k+1) = w_{ij} (k) + \eta d_i y_j \)

(1.19)

Reguła Hebba charakteryzuje się tym, że w jej wyniku wagi mogą przybierać wartości dowolnie duże i nie podlegają stabilizacji, gdyż w każdym cyklu uczącym następuje proces sumowania aktualnych przyrostów wartości wag.

Jedną z metod poprawy stabilności procesu uczenia według reguły Hebba jest przyjęcie przy aktualizacji wag nie ostatniej wartości \( w_{ij} \) ale wartości zmniejszonej o tak zwany współczynnik zapominania \( \gamma \) Wówczas regułę Hebba można zapisać w postaci

\( w_{ij} (k+1) = (1-\gamma) w_{ij} (k) + \eta y_i y_j \)

(1.20)

Współczynnik zapominania \(\gamma\) zawiera się zwykle w przedziale (0, 1) i stanowi najczęściej niewielki procent stałej uczenia \(\eta\). Przyjęcie dużej wartości \(\gamma\) powoduje, że neuron zapomina większość tego, co zdołał nauczyć się w przeszłości. Uczenie Hebba zaliczane jest do uczenia typu korelacyjnego, gdyż w swojej istocie uwzględnia korelacje zachodzące między sygnałami neuronów sieci.

Stabilizacja reguły Hebba przez wprowadzenie współczynnika zapominania zawodzi w przypadku neuronu liniowego. Dla neuronu liniowego Hebba jego sygnał wyjściowy opisany jest zależnością linową \(y_i=\mathbf{w}_i^T \mathbf{x}=\mathbf{x}^T \mathbf{w}_i\), w której \( \mathbf{w}_i\) jest wektorem wagowym neuronu \(i\)-tego a \( \mathbf{x}\) wektorem sygnałów wejściowych tego neuronu. Zostało udowodnione, że w takim przypadku wartości wag \( \mathbf{x}\) procesie uczenia nigdy nie stabilizują się, a proces uczenia się nie kończy. Stabilizacja wag (połączona z jednoczesną normalizacją) jest możliwa przez wprowadzenie modyfikacji reguły Hebba. Zgodnie z modyfikacją zaproponowana przez E. Oję [46] aktualizacja wag \( w_{ij} \) wektora \( \mathbf{w}_i\) przebiega według wzoru

\( w_{ij} (k+1) = w_{ij} (k) + \eta ( x_j - w_{ij} y_i ) \)

(1.21)

Reguła ta przypomina propagację wsteczną, gdyż sygnał \(x_j\) jest modyfikowany przez sygnał wsteczny, pochodzący od sygnału wyjściowego \(y_i\) neuronu. Przy jednym neuronie reguła Oji jest regułą lokalną, gdyż w procesie modyfikacji sygnału \(x_j\) bierze udział tylko waga, którą aktualnie adaptujemy.