Przekazywanie informacji multimedialnych
2. Kompresja i porządkowanie danych
2.17. Cechy teksturowe Tamury
Tamura zaproponował zestaw 6 cech teksturowych, korespondujących z percepcją człowieka: skrośność (oarsness) , kontrast (contrast) , kierunkowość (directionality), liniowość(line-likeness), regularność (regularity) i zgrubność(roughness). Przeprowadzone przez samych autorów koncepcji testy wykazały szczególną użyteczność 3 pierwszych miar.
Rys. 3.3 Przykłady właściwości teksturowych według wybranych cech Tamury. a) duża skrośność b) mała skrośność c) duży kontrast d) mały kontrast e) ukierunkowana f) nieukierunkowana. Obrazki zaczerpnięte z literatury.
Cenną zaletą cech teksturowych Tamury jest ich znacząca korelacja z percepcją człowieka. Aspekt tej korelacji był jednym z głównych założeń autorów. Można tam znaleźć także interesujące i rzadko spotykane opisy testów z użytkownikami, oceniającymi korelację miar obliczeniowych z ich subiektywnym wrażeniem. Przykładowe obrazy, pokazujące tekstury o skrajnych wartościach wykorzystanych cech, przedstawiona są na rysunku 3.3. Cechy te definiujemy następująco:
1. Skrośność - daje informacje o wielkości ziarna w teksturze. Im wartości skrośności jest większa, tym większe mamy ziarno. Idea wyznaczania skrośności w mierze Tamury polega na użyciu operatorów o różnym rozmiarze. Dokładnie procedura jej wyznaczania wygląda następująco:
- dla każdego punktu \((n_0, n_1)\) wyznacz średnią wartość w jego sąsiedztwie. Wielkość tego sąsiedztwa to potęgi dwójki, czyli np. \(1\times 1, 2\times 2, 4\times 4, \dots, 32\times 32\):
| \( A_k(n_0, n_1)=\frac{1}{2^{2k}}\sum^{2^{k}}_{i=1}\sum^{2^{k}}_{j=1}X(n_0-2^{k-1}+i,n_1-2^{k-1}+j)\) |
(3.8) |
- dla każdego punktu \((n_0, n_1)\) wyznacz różnice pomiędzy nie nachodzącymi na siebie obszarami po przeciwległych stronach punktu w kierunku poziomym i pionowym:
| \(E_k^h(n_0, n_1)=|A_k(n_0+2^{k-1},n_1)-A_k(n_0-2^{k-1}, n_1)|\) |
(3.9) |
oraz:
| \( E_k^v(n_0, n_1)=|A_k(n_0,n_1+2^{k-1})-A_k(n_0,n_1-2^{k-1})|\) |
(3.10) |
- w każdym punkcie \((n_0, n_1)\) wybierz rozmiar sąsiedztwa, który prowadzi do największej wartości różnicy:
| \( S(n_0, n_1)=\arg\max_{k=1\dots 5}\max_{d=h,v}E_k^d(n_0,n_1)\) |
(3.11) |
- weź średnią z \(2^S\) jako miarę skrośności dla obrazu:
| \(F_{crs}=\frac{1}{N_{0}N{1}}\sum_{n_0=1}^{N_0}\sum_{n_1=1}^{N_1}2^{S(n_0,n_1)}\) |
(3.12) |
2. Kontrast - w szerszym sensie kontrast stanowi o jakości obrazu. Można wyróżnić 4 czynniki, które mają wpływ na kontrast obrazu w skali szarości:
- dynamika zakresu poziomów jasności,
- polaryzacja rozłożenia czerni i bieli na histogramie poziomów szarości,
- ostrość krawędzi,
- okres powtarzalności wzorców tekstury.
Kontrast obrazu jest wyznaczany jako:
| \(F_{con}=\dfrac{\sigma}{\alpha_4^z}\) |
(3.13) |
gdzie \(\alpha_4=\frac{\mu_4}{\sigma_4}\),\(\mu_4=\frac{1}{N_{0}N{1}}\sum_{n_0=1}^{N_0}\sum_{n_1=1}^{N_1}(X(n_0,n_1)-\mu)^4\) jest czwartym momentem średniej \(\mu\), \(\sigma^2\) jest wariancją poziomów szarości obrazu, a \(z\) zostało eksperymentalnie dobrane jako \(\frac{1}{4}\).
3. Kierunkowość - kierunkowość jest cechą mówiącą o występowaniu w teksturze kierunku. Nie chodzi tu jednak o to, jaki ten kierunek jest, a jedynie o określenie czy on występuje, tak więc dwie tekstury różniące się jedynie orientacją będą posiadały identyczną kierunkowość.
Do wyznaczenia kierunkowości wyznaczane jest różnicowe przybliżenie pochodnej poziomej \(\triangle_H\) i pionowej \(\triangle_V\) poprzez splot obrazu \(X(n_0, n_1)\) z maskami, odpowiednio (filtr Prewitta):
i wtedy dla każdego punktu \((n_0, n_1)\) wyznaczana jest zależność:
| \( \theta=\frac{\pi}{2} + \tan^{-1}{\frac{\triangle_V(n_0, n_1)}{\triangle_H(n_0, n_1)}}\) |
(3.14) |
Z tych wartości jest następnie wyznaczany 16--przedziałowy histogram \(H_D\), stanowiący opis kierunkowości.
Aby przedstawione powyżej cechy wykorzystać w indeksowaniu obrazów, trzeba je odpowiednio dostosować. W swojej pierwotnej formie każda z cech Tamury daje skalarny wynik dla całego obrazu. W zastosowaniu do indeksowania wskazana byłaby reprezentacja bardziej szczegółowa, w skrajnym przypadku dająca wartość cechy dla każdego piksela w obrazie. Takie podejście pozwala na stworzenie histogramu cechy i jego łatwe porównywanie z histogramami w bazie referencyjnej. W przypadku skrośności, aby otrzymać wartość cechy dla każdego piksela, wykonywane są kroki a) do c) algorytmu, dając w efekcie miarę skrośności dla każdego piksela. Kontrast jest wyznaczany w sąsiedztwie \(15\times 15\) dla każdego piksela. Kierunkowość dla każdego piksela wyznaczana jest w ten sposób, że zamiast filtru Prewitta zastosowany jest filtr Sobela, natomiast kierunkowość\(\theta\) wyznaczana jest dla każdego piksela, określając kierunkowość w jego sąsiedztwie. W przypadku kierunkowości warto też zwrócić uwagę na fakt, że dla tej miary autorzy pracy Tamury nie opisują dostatecznie jasno sposobu wyznaczenia globalnej miary kierunkowości -- te same problemy mieli zresztą autorzy Deselaers,Faloutsos, którzy w obu przypadkach wspominali o konieczności adaptacji algorytmu wyznaczania skośności.
Mając trzy wartości dla każdego piksela: skośność, kontrast i kierunkowość, można wyznaczyć trójwymiarowy histogram.
Rysunek 3.4 przedstawia przykładowe rysunki obrazujące, odpowiednio, obraz oryginalny (a), skrośność (b), kontrast (c) i kierunkowość (d), oraz wszystkie te trzy wielkości, przedstawione na obrazie barwnym jako składowe RGB (e).
Rys. 3.4 Obraz cech Tamury dla przykładowego obrazu: a) obraz oryginalny, b) obraz skrośności, c) obraz kontrastu, d) obraz kierunkowości, e) obraz skrośności, kontrastu i kierunkowości jako kolorowy obraz RGB