Podręcznik

1. Zespoły klasyfikatorów

1.2. Warunki właściwego działania zespołu

Uwzględnienie w zespole wielu rozwiązań na raz i ich integracja w jeden końcowy wynik ma sens tylko wtedy, gdy poszczególne rozwiązania są niezależne od siebie a ich wskaźniki jakości są do siebie zbliżone. Łączenie ich ze sobą stwarza wówczas szansę skompensowania pewnych błędów i poprawy dokładności klasyfikatora bądź regresora. Należy jednak podkreślić, że poszczególne rozwiązania nie mogą znacząco różnić się co do jakości, gdyż to najsłabsze może pogorszyć działanie całego zespołu [36].

Niezależność działania pojedynczych rozwiązań można uzyskać na wiele sposobów. Jednym z nich jest zastosowanie rozwiązania bazującego na innej zasadzie działania poszczególnych elementów zespołu. Na przykład zastosowanie klasyfikatora MLP, RBF, SVM daje dobrą przesłankę niezależności, gdyż każdy z nich opiera swój werdykt na innej zasadzie: MLP jest aproksymatorem globalnym, RBF lokalnym, natomiast SVM stosuje odmienne podejście do uczenia. W ramach każdego rozwiązania można również stosować struktury układu zróżnicowane pod względem złożoności (np. liczby neuronów ukrytych).

Innym rozwiązaniem problemu niezależności jest zastosowanie w uczeniu każdego członka zespołu różniących się zbiorów uczących. Takie podejście powoduje, że parametry poszczególnych układów dobrane w procesie uczenia będą inne, a więc ich działanie w trybie odtworzeniowym również odmienne. Problemem może być ograniczony zasób danych przeznaczonych do uczenia. Można go złagodzić przez zastosowanie procedury losowania danych, w której każdy układ stosuje określony procent całego zbioru danych zmieniany każdorazowo w procesie uczenia (np. procedura zwana bagging).

Innym rozwiązaniem jest stosowanie zróżnicowanego sposobu generacji cech diagnostycznych stanowiących informację wejściową dla każdego indywidualnego członka zespołu [22,49,60]. Cechy te generowane są na podstawie tych samych danych pomiarowych. W takiej sytuacji każde z indywidualnych rozwiązań systemu ma dostęp do pełnej informacji pomiarowej, ale inaczej przetworzonej.