5. Metody kompresji sygnałów

5.3. Kodowanie transformacyjne

Kodowanie transformacyjne jest rodzajem kodowania blokowego i z założenia stanowi proces dwustopniowy. Niech X oznacza wektor próbek sygnału: X=(X1, X2, ...,XN)t. Zasada kodowania transformacyjnego polega na poddaniu wektora X odpowiedniej transformacji liniowej T, w wyniku której powstanie nowy wektor Y, zwykle o tym samym rozmiarze zwany wektorem współczynników transformaty (próbek transformaty): Y = TX. Standardowo współczynniki transformaty są kwantowane w sposób niezależny, czyli skalarnie. Istotne własności wektora Y, ze względu na kompresję sygnału, to:

  • Występowanie efektu „wymieszania informacji” zawartych w próbkach wejściowych - każda próbka transformaty zawiera część informacji zawartej we wszystkich próbkach bloku wejściowego.
  • Zmniejszona korelacja wzajemna współczynników w porównaniu z korelacją oryginalnych próbek sygnału: możliwość zastosowania alokacji bitów i jak się później okaże kwantyzacji wektorowej z kodem składanym: PCVQ.
  • Występowanie efektu „upakowania”, tzn. koncentracja energii w obrębie ograniczonej liczby próbek transformaty K<N (możliwość eliminacji próbek zerowych i mniej znaczących).

 

Pełny schemat funkcjonalny układu kodowania transformacyjnego z kwantyzacja skalarną przedstawiono na rys.5.3: (symbole Qk  oznaczają kwantyzatory skalarne o różnej liczbie poziomów kwantyzacji, T- kwadratową macierz K´K realizująca transformację liniową).

Rys. 5.3 Kodowanie transformacyjne z kwantyzacją skalarną

Jak widać, operacja kwantyzacji jest dokonywana oddzielnie dla każdego współczynnika (próbki) transformaty:

 

  Yk = Q (Yk) (5.12)

 

Odtworzoną postać Xoryginalnego wektora X otrzymuje się dokonując odwrotnego przekształcenia skwantowanej postaci Y’:

 

  X’ =T-1 ( Y’) (5.13)

 

Najbardziej wygodną miarą błędu kodowania, którą można zastosować w tym systemie, jest uśredniona statystycznie wartość błędu średniokwadratowego:

 

  D_{TC} =E\left[ ||X-X^{\prime } ||^{2}\right] =\sum\nolimits ^{K}_{i=1} E\left[ |X_{i} -X^{\prime }_{i} |^{2}\right] (5.14)

 

Stopień koncentracji energii w dziedzinie transformaty opisywany jest za pomocą tzw. współczynnika efektywności upakowania energii: EPE (Energy Packing Efficiency). Definiuje się go jako stosunek energii zawartej w K pierwszych współczynnikach do energii całkowitej (N współczynników):

 

  \mathrm{EPE}\left(K\right)=\frac{\sum_{k=0}^{K-1}E\left[Y_k^2\right]}{\sum_{k=0}^{N-1}E\left[Y_k^2\right]} (515.)

 

Do transformat dotychczas najbardziej popularnych w dziedzinie kompresji sygnału oprócz KLT należą Dyskretna Transformata Fouriera i Dyskretna Transformata Kosinusowa.

W podsumowaniu rozważań dotyczących kodowania transformacyjnego warto podkreślić, iż:

  • Badania o charakterze subiektywnym wykazały, że zarówno ucho jak i oko ludzkie charakteryzują się różnymi wrażliwościami na amplitudy poszczególnych współczynników transformat (SNR dla poszczególnych współczynników jest parametrem ważniejszym niż wartość globalnego SNR);
  • Operację transformaty opisuje zależność: Y=TX,  gdzie  X=(X1, X2, X3,...,XK)t  jest wektorem transformowanym zaś T  operatorem liniowym;
  • Każdy współczynnik transformaty jest zależny od wszystkich składowych wektora transformowanego;
  • Współczynniki transformaty są mniej skorelowane i wymagają mniej kompresji dodatkowej;
  • Współczynniki transformaty są bardziej upakowane, niektóre można zaniedbać;

 

Uwaga: Transformata odwrotna może spotęgować błąd kwantyzacji, aby tego uniknąć należy ograniczyć się do transformat ortogonalnych. Przy transformacji ortogonalnej odległość między dwoma punktami pozostaje niezmienna.