5. Inne struktury sieci

5.5. Uczenie transferowe

W tym podrozdziale omówimy uczenie transferowe (ang. transfer learning), które nie stanowi nowej architektury sieci, ale jest niezwykle skuteczną sztuczką pozwalającą na uzyskanie dobrych wyników przy małej liczbie danych uczących. Jest to podejście szczególnie skuteczne i łatwe w przetwarzaniu obrazów. Przykład takiego podejścia został przedstawiony na rysunku 30.

Ilustracja uczenia transferowego - wykorzystanie pre-trenowanej sieci z nową warstwą wyjściową
Rysunek 30: Uczenie transferowe

W uczeniu transferowym wykorzystujemy sieć, która była uczona na dużym zbiorze danych do podobnego zadania. Przykładowo chcemy wykrywać źle zakręcone butelki na linii produkcyjnej, a korzystamy z sieci trenowanej do klasyfikacji zdjęć do wielu kategorii. Postępujemy w następujący sposób:

  1. ściągamy gotową sieć uczoną na dużym zbiorze danych,

  2. pozbywamy się ostatniej warstwy,

  3. uczymy tylko nową ostatnią warstwę

  4. lub kilka warstw (jeśli mamy trochę więcej danych).