Podręcznik
8. Redukcja atrybutów
8.1. Wprowadzenie
Redukcja atrybutów (argumentów) jest algorytmem stosowanym w dwóch odrębnych dziedzinach wiedzy, a mianowicie w zagadnieniach związanych z klasyfikacją danych – maszynowe uczenie, eksploracja danych itd. [2.23], [2.24] oraz w zagadnieniach związanych z optymalizacją i syntezą logiczną układów cyfrowych (por. rozdz. 2.6). W obu przypadkach jest to problem polegający na redukowaniu nadmiarowych specyfikacji w tablicach danych (tablicach prawdy układów logicznych) za pośrednictwem usuwania zbędnych atrybutów (argumentów). Uzyskiwane w wyniku takiego procesu tablice są wykorzystywane do generowania uogólnionych reguł decyzyjnych albo do kolejnych etapów optymalizacji logicznej (w przypadku układów cyfrowych). Oczywiście dane wejściowe algorytmów redukcji są w obu przypadkach zasadniczo różne. Dla tablic danych mamy do czynienia z wielowartościowymi atrybutami warunkowymi i wielowartościowymi atrybutami decyzyjnymi. Dla tablic prawdy wartości argumentów i wartości funkcji są binarne. Jednocześnie całkowicie inaczej są interpretowane tzw. wartości nieokreślone. W tablicy danych wartość nieokreślona atrybutu warunkowego oznacza, że wartość tego atrybutu nie została ustalona [2.18], a w przypadku tablic funkcji logicznych nieokreśloność argumentu wektora wejściowego oznacza występowanie w specyfikacji wektorów o wszystkich możliwych wartościach danego argumentu.
W rezultacie stosowane w praktyce algorytmy redukcji argumentów oraz atrybutów znacznie się różnią, a jak pokazują przeprowadzone eksperymenty – stosowane w syntezie logicznej metody i algorytmy redukcji argumentów okazują się skuteczniejsze niż analogiczne algorytmy redukcji atrybutów stosowane w analizie danych.
W układach logicznych i ich realizacjach sprzętowych istotnym zagadnieniem jest obliczenie minimalnych zbiorów argumentów o najmniejszej liczności. W przypadku redukcji atrybutów ważniejsze jest obliczenie wszystkich minimalnych zbiorów atrybutów. Taka potrzeba może się zdarzyć, gdy wyliczony zbiór atrybutów mniejszy pod względem liczności niż inny może być trudny do realizacji lub bardziej kosztowny. Na przykład, gdy rozważamy obliczenia redukcji atrybutów dla potrzeb diagnozy medycznej dany parametr może wyrażać skomplikowane lub kosztowne badanie, lub wyrażać badanie, które ma negatywny wpływ na zdrowie pacjenta, lub badanie, które nie jest możliwe do przeprowadzenia. Natomiast inne rozwiązanie – o większej liczności – może być łatwiejsze do realizacji w praktyce. Dlatego opracowanie odpowiednich do zastosowań, skutecznych i szybkich algorytmów redukcji atrybutów jest szczególnie istotne w systemach eksploracji danych.