Podręcznik: Elastyczny koder wielu skal

1. Semantyczne modele informacji

1.6. Elastyczny koder wielu skal

Selektywna kompresja informacji rządzi się innymi prawami. Warto zauważyć, że:

modelowane obrazy zachowują cechę samopodobieństwa w zmieniającej się skali (po rozciągnięciu obrazu do większej dziedziny i przeskalowaniu zachowane zostają właściwości statystyczne oryginału), a więc:
- kluczową rolę odgrywają przekształcenia (transformacje) danych ze skalowaniem rozdzielczości, zachowujące informację o położeniu i treści częstotliwościowej współczynników poszczególnych skal;
- szczególnie ważnym elementem wynikającym z rozkładu zależności danych w przestrzeni ze skalowaniem rozdzielczości jest kodowanie pozycji współczynników transformaty i ich znaczeń (względem ustalonej wartości progowej).

Efektywny koder obrazów powinien zapewnić następujące cechy reprezentowanej informacji:

hierarchiczność korelującą z semantycznym znaczeniem kolejnych przybliżeń źródła informacji (progresja treści) zapewniająca progresję optymalną w sensie R(D) (tj. od maksymalnego przyrostu informacji na bit transmitowanych danych do minimalnego);
selektywność rozkładu informacji w poszczególnych obszarach wielu skal dziedziny z możliwością rekonstrukcji informacji zarówno w pełnej, niezakłóconej wersji (nawet w sensie odwracalnej kompresji danych), jak też odpowiednio wybranej, przybliżonej (w możliwie szerokim zakresie) na poziomie pojedynczych pikseli, obiektowym lub semantycznym;
elastyczność pozwalającą na realizację porządku kodowania i dekodowania informacji zależnie od wymagań użytkownika (interaktywność procesu kompresji/dekompresji).

Trwają poszukiwania optymalnych przekształceń obrazów w wielu skalach. Klasyczne falkowe przekształcenie obrazów zakłada separowane jądro transformacji (sekwencja przekształceń 1W po wierszach i kolumnach), co nie pozwala dobrze opisać obiektów w obrazach (występuje uwypuklenie informacji w kierunku pionowym i poziomym kosztem innych kierunków). Aproksymacja nieliniowa gładkiej krzywej jest często lepsza w przypadku wykorzystania transformacji wielorozdzielczych z jądrem 2W (curvelets), filtrów kierunkowych (contourlets), przekształceń geometrycznych po podziale obrazu na bloki o różnej wielkości, co daje lokalny opis informacji w różnej skali (beamlets, wedgelets, bandlets i inne). Zastosowanie oszczędniejszej, bardziej upakowanej i uporządkowanej reprezentacji danych w dziedzinie tych przekształceń pozwala również zwiększyć selektywność rozwiązań uwzględniających znaczenie rozkładów symboli na poszczególnych poziomach tak uzyskanej hierarchii informacji obrazowej. Wykorzystywane są tutaj podstawy teoretyczne kształtowania baz - atomów czas-częstotliwość dostarczane przez analizę harmoniczną i funkcjonalną. Uzyskane już rezultaty poprawy efektywności w stosunku do JPEG2000 są obiecujące i sugerują kierunek doskonalenia metod kompresji sygnałów w ramach planowanego przez komitet JPEG nowego standardu kompresji - AIC (advanced image coding).