7. Analiza i eksploracja danych

7.3. Relacja zgodności i relacja nierozróżnialności

W podrozdziale przedstawiamy notację relacji nierozróżnialności, która jest podstawowym pojęciem w dziedzinie eksploracji danych. Podobne pojęcie nazywane relacją zgodności (tolerancji) jest stosowane w dziedzinie układów logicznych. Jest używane głównie do celów dekompozycji układów kombinacyjnych [2.17],  oraz logiki sekwencyjnej [2.22]. Na bazie tej relacji skonstruowano pojęcie
r-podziału, które znajduje zastosowanie w syntezie logiki wielowartościowej, a tym samym może być zastosowane do reprezentacji zarówno systemów informacyjnych jak i systemów decyzyjnych.

Niech A=( U,A\cup D),  będzie systemem decyzyjnym, wtedy z każdym podzbiorem B\subseteq A kojarzymy relację równoważności IND_{A}(B):

 

IND_{A}( B) =\left\{( u_{p} ,u_{q}) \in U^{2} :\forall a_{i} \in B,\rho ( u_{p} ,a_{i}) =\rho ( u_{q} ,a_{i})\right\}

 

IND_{A}( B) nazywamy B-relacją nierozróżnialności [2.24].

 

Jednakże, dla systemu decyzyjnego przedstawionego w tablicy 2.30, symbol „*” dla obiektu może wyrażać wartość 0 lub 1. W rezultacie, obiekt przedstawia wiele wierszy tablicy. Stąd, klasyfikacja z użyciem relacji nierozróżnialności nie znajduje zastosowania. Aby rozwiązać ten problem wprowadzamy relację zgodności.

Wartości atrybutów ai, tj. rpi = r(up,ai) oraz rqi = r(uq,ai) nazywamy zgodnymi (rpi ~ rqi) wtedy i tylko wtedy, gdy rpi = rqi lub rpi = * lub rqi = *, gdzie „* oznacza przypadek, dla którego wartość atrybutu jest „do not care”. Z drugiej strony, jeżeli rpi oraz rqi są zdefiniowane i są różne mówimy, że rpi jest nie zgodne z rqi i tę relację oznaczamy przez rp  rqi.

Na podstawie tej definicji mówimy o relacji zgodności COMA(B) określonej dla każdego zbioru Í A:

 

COMA(B) = {(<i>u</i></span></span></span></span></span></span><span class="Teksttreci66ptOdstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><sub><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">p</span></span></span></sub></span></span></span><span class="Teksttreci66ptOdstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">,</span></span></span></span></span></span><span class="Teksttreci6Odstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><i><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">u</span></span></span></i></span></span></span><span class="Teksttreci66ptOdstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><sub><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">q</span></span></span></sub></span></span></span><span class="Teksttreci6Bezkursywy" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="font-style:italic"><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">)</span></span></span></span></span></span> <span class="PogrubienieTeksttreci6SimSun95ptBezkursywyOdstpy2pt" style="background:white"><span style="font-family:SimSun"><span style="letter-spacing:2.5pt"><span style="font-weight:bold"><span style="font-style:italic"><span lang="EN-US" style="font-size:9.5pt"><span style="line-height:150%"><span style="font-family:Symbol">Î</span></span></span></span></span></span></span></span><span class="Teksttreci6Odstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><i><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif"> U</span></span></span></i></span></span></span><span class="Teksttreci6Odstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><i> </i></span></span></span><span class="PogrubienieTeksttreci6SimSun95ptBezkursywyOdstpy2pt" style="background:white"><span style="font-family:SimSun"><span style="letter-spacing:2.5pt"><span style="font-weight:bold"><span style="font-style:italic"><sup><span style="font-size:9.5pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">2</span></span></span></sup></span></span></span></span></span><span class="Teksttreci6Bezkursywy" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="font-style:italic"><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">: </span></span></span></span></span></span><span class="Teksttreci6Bezkursywy" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="font-style:italic"><span lang="EN-US" style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:Symbol">"</span></span></span></span></span></span><span class="Teksttreci6Odstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><i><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif"> a<sub>i</sub></span></span></span></i></span></span></span><span class="Teksttreci695pt" style="font-family:"Times New Roman",serif"><span style="letter-spacing:0pt"><span style="font-weight:normal"><span style="font-style:normal"><span style="text-decoration:none"><span style="font-variant:normal !important"><span lang="EN-US" style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:Symbol"> Î</span></span></span></span></span></span></span></span></span> <span class="Teksttreci6Odstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><i><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">B</span></span></span></i></span></span></span><span class="Teksttreci6Odstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">,</span></span></span></span></span></span><span class="Teksttreci695pt" style="font-family:"Times New Roman",serif"><span style="letter-spacing:0pt"><span style="font-weight:normal"><span style="font-style:normal"><span style="text-decoration:none"><span style="font-variant:normal !important"><i> </i></span></span></span></span></span></span><span class="Teksttreci695pt" style="font-family:"Times New Roman",serif"><span style="letter-spacing:0pt"><span style="font-weight:normal"><span style="font-style:normal"><span style="text-decoration:none"><span style="font-variant:normal !important"><span lang="EN-US" style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:Symbol">r</span></span></span></span></span></span></span></span></span><span class="Teksttreci6Odstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">(<i>u</i></span></span></span></span></span></span><span class="Teksttreci66ptOdstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><sub><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">p</span></span></span></sub></span></span></span><span class="Teksttreci66ptOdstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">,</span></span></span></span></span></span><span class="Teksttreci6Odstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><i><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">a<sub>i</sub></span></span></span></i></span></span></span><span class="Teksttreci6Odstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">)<i> </i></span></span></span></span></span></span><span class="Teksttreci95ptKursywa" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:0pt"><span style="font-weight:normal"><span style="font-style:italic"><span style="text-decoration:none"><span style="font-variant:normal !important"><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">~</span></span></span></span></span></span></span></span></span></span><span class="Teksttreci695pt" style="font-family:"Times New Roman",serif"><span style="letter-spacing:0pt"><span style="font-weight:normal"><span style="font-style:normal"><span style="text-decoration:none"><span style="font-variant:normal !important"><i> </i></span></span></span></span></span></span><span class="Teksttreci695pt" style="font-family:"Times New Roman",serif"><span style="letter-spacing:0pt"><span style="font-weight:normal"><span style="font-style:normal"><span style="text-decoration:none"><span style="font-variant:normal !important"><span lang="EN-US" style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:Symbol">r</span></span></span></span></span></span></span></span></span><span class="Teksttreci6Odstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">(<i>u</i></span></span></span></span></span></span><span class="Teksttreci66ptOdstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><sub><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">q</span></span></span></sub></span></span></span><span class="Teksttreci66ptOdstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">,</span></span></span></span></span></span><span class="Teksttreci6Odstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><i><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">a<sub>i</sub></span></span></span></i></span></span></span><span class="Teksttreci6Odstpy1pt" style="background:white"><span style="font-family:"Times New Roman",serif"><span style="letter-spacing:1.5pt"><span style="font-size:12.0pt"><span style="line-height:150%"><span style="font-family:"Calibri",sans-serif">)},

 

gdzie o obiektach p oraz q, które spełniają relację COMA(B) mówimy, że są zgodne w zbiorze B. Obiekty zgodne w zbiorze B = A nazywamy po prostu zgodnymi.

Relacja zgodności, nazywana również relacją tolerancji, jest zwrotna i symetryczna, a stąd generuje klasy zgodności na zbiorze obiektów U. Relacja zgodności pozwala na klasyfikowanie obiektów, ale klasy obiektów nie tworzą podziałów na zbiorze U, jak to jest w przypadku relacji nierozróżnialności. COMA(B) klasyfikuje obiekty grupując je w klasy zgodności, tj. U|COMA(B) gdzieÍ A.

Stąd, dowolny zbiór obiektów U reprezentujący system informacyjny lub system decyzyjny może zostać przypisany wielokrotnie i do różnych klas dla danego podzbioru atrybutów A. Taką rodzinę klas nazywamy r-podziałem i oznaczamy przez P(B), gdzie B jest wybranym podzbiorem zbioru A = {a<sub>1 </sub>,..., a<sub>m</sub>}.

r-podział na zbiorze U może być postrzegany jako zbiór nierozłącznych podzbiorów U, których suma jest równa U. Wszystkie symbole i operacje dla algebry podziałów [2.22], mogą zostać bezpośrednio zastosowane do algebry r-podziałów. W szczególności relacja mniejszy lub równy dla dwóch r-podziałów P1 oraz P2 (P1 £ P2) zachodzi wtedy i tylko wtedy, gdy dla każdej klasy z r-podziału P1, oznaczanej w skrócie przez Ki(P1) istnieje Kj(P2) taka, że Ki(P1) Í Kj(P2).

r-podział na jednoelementowym zbiorze B = {a<sub>i</sub>} oznaczamy przez P(ai) lub po prostu \prod\nolimits _{a_{i}}.

r-podział indukowany przez zbiór B jest iloczynem r-podziałów indukowanych przez pojedyncze atrybuty ai Î B.