Doskonalenie odbioru informacji multimedialnych
1. Semantyczne modele informacji
1.3. Mechanizmy selekcji informacji
Podstawową metodą usuwania przede wszystkim semantycznej nadmiarowości danych, kosztem nieodwracalnej numerycznie postaci danych rekonstruowanych w procesie kompresji jest kwantyzacja. Równie uniwersalnym rozwiązaniem jest porządkowanie danych (nierosnąco) według ilości przenoszonych przez nie informacji i kontrolowanie zakresu kodowania ciągu źródłowego, zależnie od wymagań zastosowania. Przykładowo, przy zmniejszeniu kanału przesyłowego przekazana zostaje jedynie najważniejsza, najefektywniej kodowana część informacji, a w razie możliwości czy dodatkowych żądań odbiorcy -- pozostała. Zależnie od zastosowań, selekcja informacji może przebiegać w schematach zdecydowanie bardziej specyficznych, przy zastosowaniu określonych wymagań semantycznych czy użytkowych właściwych danemu przekazowi informacji. Przykładowo, wstępna detekcja określonych obiektów w obrazie może zróżnicować sposób kodowania wybranych fragmentów obrazu -- obszary zawierające istotne elementy przekazu kodowane są w sposób numerycznie odwracalny, podczas gdy pozostałe -- jedynie w zakresie koniecznego tła.
W kompresji selektywnej poszukiwana jest efektywna reprezentacja semantycznie definiowanej informacji wyrażonej wstępnie danymi w postaci źródłowej, zaś indeksowanie to tworzenie indeksu (indeksów) obiektów (kolekcji obiektów) danego typu, czyli spisu (zestawu) tych obiektów ze względu na określone ich właściwości (cechy, czyli wartości ustalonego argumentu indeksu - zobacz \cite{Skarbek04}) mające znaczenie dla użytkownika. Przy wyborze argumentu indeksu (tj. określonych właściwości indeksowanych obiektów) istotna jest rozróżnialność obiektów, a więc wydobycie wyjątkowej treści każdego z obiektów z ogólnego, mało znaczącego tła. Kluczową rolę odgrywa tu dotarcie do realnej informacji związanej z każdym obiektem (w naszym przypadku obrazem), tj. istoty przekazywanej treści. Semantyczne określenie informacji odgrywa tutaj decydującą rolę.
W indeksie występują identyfikatory obiektów wskazujące (pośrednio lub bezpośrednio) ich fizyczną lokalizację. Korzystające z indeksów wyszukiwarki dostarczają na żądanie odbiorcy obiekty o określonych cechach sięgając niekiedy do ich skompresowanej reprezentacji, dekodując i prezentując np. obraz.
Nowe standardy kompresji, np. JPEG2000 przewidują efektywne łączenie kompresji z indeksowaniem, wyznaczanie cech w dziedzinie przekształconych w kompresji danych, co często daje lepszą selektywność wyszukiwania pozwalając porównywać optymalizowane reprezentacje informacji z uwzględnieniem ich znaczenia.
Praca nad standardem kompresji obrazów JPEG2000 jest przykładem szerszego spojrzenia na zagadnienia kompresji selektywnej w ostatnich latach, bogatszego o uwzględnienie wymagań odbiorcy i subiektywnego znaczenia przesyłanych mu danych. Możliwa jest ingerencja w procedury przetwarzania danych oraz organizacji strumienia wyjściowego, a przez to wykorzystanie wiedzy wynikłej z doświadczenia użytkownika, tradycji, kultury itd. Opracowano zagadnienia interakcyjnej transmisji, rekonstrukcji obrazów z ingerencją odbiorcy w jakość i ilość otrzymywanych danych, które stają się realną informacją weryfikowaną przez odbiorcę (jego cele). Wprowadzono elementy zabezpieczania danych, ochrony własności intelektualnych, ukrywania informacji przed postronnymi odbiorcami. W ostatnich miesiącach trwają intensywne prace nad indeksowaniem obrazów w ramach nowego standardu JPSearch, tworzonego przez członków komitetów JPEG i MPEG jako zintegrowane uzupełnienie standardów JPEG.
Realizacja takich założeń nie jest prosta i na obecnym etapie, niedoskonała. Przeprowadziliśmy szereg testów porównawczych kodera JPEG2000 z realizacją starszego standardu JPEG. Ocena uzyskanych rezultatów nie jest jednoznaczna - zobacz przykład z rys. 1.2.
Rys. 1.2 Porównanie efektywności selektywnej kompresji obrazów według standardów JPEG i JPEG2000: a) obraz testowy Lenna odtworzony po kompresji w stopniu 50:1 (JPEG daje wartość PSNR równą 28,18 dB, a dla JPEG2000 PSNR=30,5 dB); b) obraz testowy Frog zrekonstruowany po kompresji w stopniu 30:1 (JPEG daje PSNR=24,8 dB, a JPEG2000 - PSNR=25,46 dB). W ocenie subiektywnej trudno wskazać wersję Frog o lepszej jakości.
O ile w przypadku obrazu testowego Lenna wyraźnie lepsza jakość rekonstrukcji kompensuje kilkukrotnie większą złożoność obliczeniową kodera JPEG2000, to jednak w przypadku obrazu Frog trudno wskazać lepszą wersję w ocenie subiektywnej. Główną zaletą JPEG2000 nie jest więc jego efektywność, ale większa możliwość dostosowania do semantycznej warstwy przekazywanej informacji.
Zastosowania medyczne wymagają jeszcze szerszego spojrzenia na zagadnienie kompresji. Nie bez przyczyny nie ma dotąd powszechnej zgody środowisk lekarskich na stosowanie kompresji stratnej w obrazowaniu medycznym. Obawy budzi wiarygodność diagnostyczna rekonstruowanych obrazów oraz sposób ustalenia optymalnych parametrów procesu kompresji. Nie przekonuje wiele prac dowodzących nawet poprawy jakości obrazów po kompresji, nie ma jasnych reguł prawnych \cite{Brownrigg}. Sformułowanie obiektywnych kryteriów optymalizacji algorytmu kompresji tych obrazów jest nadal sprawą otwartą, choć jest przedmiotem licznych badań od wielu lat.