7. Kodowanie obrazu nieruchomego i sekwencji wideo

7.2. Kwantyzacja skalarna i wektorowa obrazu

Kwantowanie pikseli obrazu rządzi się podobnymi prawami, co kwantowanie próbek sygnału audio. Można stosować kwantyzatory równomierne o różnej liczbie poziomów kwantyzacji, można optymalizować poziomy w celu zmniejszenia energii błędu kwantyzacji.  Obowiązuje zasada „6 decybeli na bit”: dodanie jednego bitu kwantyzatorowi powoduje czterokrotne zmniejszenie energii błędu kwantyzacji (czyli zmniejszenie o 6 dB). 
Do oceny jakości skwantowanego obrazu nie stosuje się jednak globalnej ani segmentowej wartości SNR, jak w sygnałach akustycznych. Wartości pikseli bliskie zera opisują ciemne fragmenty obrazu, a bliskie wartości maksymalnej – jasne. Błąd kwantyzacji pikseli jest tak samo dokuczliwy w ciemnych i jasnych elementach obrazu, więc wartości pikseli obrazu nie powinny wpływać na ocenę jego jakości. Dobrym wskaźnikiem jakości byłaby energia błędu, zależy ona jednak od skali wartości pikseli (najczęściej są one wyskalowane od 0 do 1, albo od 0 do 255). Aby uniezależnić się od skali, wprowadzono normalizację mocy błędu kwantyzacji z wykorzystaniem mocy  piksela o największej możliwej jasności (np. 1 lub 2552). Najczęściej podaje się Peak Signal to Noise Ratio (PSNR):

PSNR=\frac{x_{max}^2}{E(x_i-x_i^\ast)^2} (39)

gdzie E(x_i-x_i^\ast)^2\cong\frac{1}{M}\sum_{i=1}^{M}{(x_i-x_i^\ast)^2} – średnia moc błędu kwantyzacji. PSNR najczęściej podaje się w decybelach. 
W kwantowaniu obrazu nie znajduje zastosowania kwantyzator pseudologarytmiczny ani adaptacyjny. Ich celem było wyrównanie SNR dla sygnałów cichych i głośnych. W kwantyzacji obrazu odpowiednikiem cichego sygnału audio byłby ciemny obraz o znikomym kontraście – a więc bezużyteczny. Sensowne jest za to optymalizowanie poziomów kwantyzacji w celu zmniejszenia błędu kwantyzacji. Do obliczania poziomów kwantyzacji stosuje się algorytm Lloyda, o którym była mowa w p.4. Wyniki kwantowania skalarnego obrazu w odcieniach szarości pokazano w tabeli 3. Liczba poziomów kwantyzacji wynosi L=2^b, gdzie b – liczba bitów na piksel. Zauważmy, że zasada „6 dB na bit” jest spełniona jedynie w pewnym zakresie zmian b. Wyprowadziliśmy tę zasadę zakładając równomierny rozkład prawdopodobieństwa kwantowanych wartości, co nie jest spełnione dla pikseli obrazu. Ponadto metoda Lloyda nie gwarantuje otrzymania optymalnych poziomów kwantyzacji.

Tabela 3 Kwantowanie skalarne pikseli obrazu

Liczba poziomów kwantyz.

b   bitów na piksel

PSNR [dB]

 oryginał *    (L=256)

 8

 -

 L=2

 1

 17.3

 L=4

 2

 18.3

 L=8

 3

 24.7

 L=16

 4

 30.5

 L=32

 5

 32.5

*Otwórz hyperlink aby zobaczyć obraz

 

Sąsiadujące ze sobą piksele są silnie skorelowane, często należą do rozległego obiektu o tym samym kolorze. Jeżeli blisko siebie leżące piksele połączymy w wektory, to można się spodziewać poprawy jakości przy stosowaniu kwantyzacji wektorowej. W tabeli 4 porównano wyniki kwantyzacji obrazu z rozdzielczością b=1 bit/piksel przy stosowaniu kwantyzacji skalarnej (L=2 odcienie szarości) i wektorowej. Utworzono 4-wymiarowe wektory z pikseli leżących w kwadracie 2x2 piksele, a następnie 9-wymiarowe wektory leżące w kwadracie 3x3 piksele. Liczba wektorów w słowniku wynosi L=2bN (wzór 33). Kwantyzacja wektorowa dała tu wyjątkowo dobre wyniki, zwłaszcza dla 9-wymiarowych wektorów. Porównując obrazy, pamiętajmy, że w każdym wypadku przeznaczamy 1 bit na zakodowanie 1 piksela. 

Tabela 4 Kwantowanie wektorowe obrazu,  b=1 bit/piksel

Wymiar wektora

Liczba wektorów w słowniku

PSNR [dB]

 N=1 (skalarne) *

 L=2 poziomy kwantyzacji

 17.3

 N=4 (kwadraty 2 x 2)

 L=16

 26

 N=9 (kwadraty 3 x 3)

 L=512

 31

*Otwórz hiperlink aby zobaczyć obraz