1. Standardy multimedialne

Wysiłki wielu badaczy, teoretyków i praktyków, próbujących sprostać bieżącym wyzwaniom współczesności koncentrowały się wokół tworzonych i doskonalonych standardów multimedialnych. Prace standaryzacyjne gwarantowały możliwość przełożenia najnowszych osiągnięć badaczy na rozwiązania praktyczne, stanowiące globalne ramy najnowszych technologii rynkowych. Otwarty i twórczy charakter takiej pracy służył nierzadko narodzinom nowych technologii przekładanych prawie  natychmiast na usługi użyteczne w niemal nieograniczonej skali.

Do najistotniejszych zagadnień poruszonych w tym wykładzie należy charakterystyka standardów multimedialnych rodzin JPEG i MPEG, ze szczególnym zwróceniem uwagi na proces ich doskonalenia, zakres zastosowań oraz stosowne rozwiązania algorytmiczne. Warto zwrócić uwagę przede wszystkim na algorytmy kompresji JPEG, JPEG2000 oraz MPEG-2 i H.264, specyficzne ich dostosowanie do charakterystyki odbiorcy informacji, wręcz nieograniczonego zakresu definiowania danych źródłowych oraz wymagań współczesnych systemów przekazu informacji wielostrumieniowej. Ważne jest ponadto zrozumienia zasad indeksowania oraz ocena skuteczności procesu wyszukiwania danych po zawartości.


Najstarszymi (1980 rok) i szeroko stosowanymi obecnie standardami kompresji obrazów cyfrowych są międzynarodowe standardy kodowania cyfrowych faksów, odpisów (\emph{facsimile}) Grupy 3 i Grupy 4 opracowane przez grupę konsultacyjną CCITT (Consultative Committee of the International Telephone and Telegraph). Standardy te dotyczą jedynie binarnych obrazów zawierających teksty i dokumenty. Wzrost liczby zastosowań wielopoziomowych obrazów cyfrowych w szerokiej gamie zastosowań nieuchronnie prowadzi do opracowywania nowych standardów kompresji. Udogodnienia związane z wprowadzeniem tych standardów dotyczą nie tylko łatwiejszej wymiany obrazów pomiędzy różnymi systemami i aplikacjami, lecz także pozwalają na znaczące ograniczenie kosztu budowy wyspecjalizowanych urządzeń cyfrowych niezbędnych w wielu systemach kompresji obrazów w czasie rzeczywistym. W ostatnich latach prace nad nowymi standardami kompresji obrazów prowadzone były w trzech zasadniczych kierunkach:

  • obrazy binarne
  • obrazy ruchome (sekwencje wizyjne, wideo)

W 1988 roku został uformowany komitet znany jako JBIG (Joint Bilevel Imaging Group) pod auspicjami ISO-IEC/JTC1/SC2/WG8 i CCITT SG VIII NIC, w celu opracowania standardu kompresji i dekompresji obrazów binarnych. Grupa skoncentrowała swoje wysiłki na poszukiwaniu efektywniejszego algorytmu od opracowanych wcześniej przez CCITT, w zastosowaniu do klasycznych aplikacji (n.p. ośmiu binarnych obrazów odniesienia zaproponowanych przez CCITT), a także rozszerzenia ich stosowalności do nowych aplikacji.  Chodziło głównie o opracowanie algorytmów progresywnych i adaptacyjnych.

Należy też wspomnieć o opracowanej przez naukowców z IBM w 1988 roku binarnej wersji kodera arytmetycznego o nazwie Q-koder i zastosowaniu go do kompresji obrazów binarnych w następujących opracowaniach:

  • technika ABIC (Arithmetic Binary Image Compression)
  • CCITT Group 3 i 4 - kodowanie długości sekwencji do kompresji obrazów binarnych
  • JBIG/JBIG2 (Joint Bilevel Imaging Group) - kodowanie arytmetyczne do kompresji danych binarnych

Komitet znany powszechnie pod nazwą JPEG (Joint Photographic Experts Group), działający jako ISO-IEC/JTC1/SC2/WG10 przy bliskiej nieformalnej współpracy  z CCITT SG VIII NIC, uformowany został pod koniec 1986 roku w celu opracowania międzynarodowego standardu dla pojedynczych, wielopoziomowych, monochromatycznych i kolorowych obrazów. Zadaniem zespołu było zdefiniowanie standardu dla tak różnych zastosowań jak foto- i telegazeta, grafika komputerowa, skład komputerowy, mała poligrafia, kolorowe faksy, systemy medyczne i wiele innych. Pomimo tego, iż w tej dziedzinie nie istniały wcześniejsze standardy, członkowie JPEG byli silnie przekonani, że wymagania zdecydowanej większości tych zastosowań winny być uwzględnione w standardzie. Ostateczna propozycja standardu, która została opublikowana w 1992/1993 r. jako standard międzynarodowy ISO/IEC zawiera trzy główne składniki: 1) system podstawowy, który zawiera prosty i efektywny algorytm, adekwatny w stosunku do większości zastosowań kompresji obrazów, 2) zbiór rozszerzeń systemu zawierający przede wszystkim algorytm progresywnego kodowania rozszerzający pole zastosowań, 3) niezależna bezstratna metoda kodowania dla zastosowań wymagających tego typu kompresji. Bardziej dokładne omówienie tego standardu, ze względu na przewidywane przez twórców jego zastosowanie także w systemach obrazowania medycznego, zostanie przedstawione w następnej części tego podrozdziału.

Rozwój nowych metod i technik multimedialnych w dużym stopniu odbywa się przy okazji prac nad nowymi standardami. Tak było z kompresją obrazów doskonaloną w ramach standardów JPEG, http://www.jpeg.org, normalizacyjna (grupa robocza ISO/IEC SC 29/WG 1 - Joint Picture Expert Group) oraz kompresją sekwencji wizyjnych i dźwięku, czy też opisem multimediów w rodzinie standardów MPEG, http://www.mpeg.org, (MPEG - normalizacyjna grupa robocza ISO/IEC SC 29/WG 11 - Moving Picture Expert Group). Nie tylko sankcjonowano standardem uznane powszechnie rozwiązania istotnych technik multimedialnych, ale ogłaszano konkursy na nowe algorytmy, metody, opracowania, by rozwiązać bieżące i przyszłe problemy świata multimediów w określonych uwarunkowaniach (np. kolejne części JPEG2000, czy rozwój technik promowanych przez MPEG), indeksowania treści multimedialnej z wykorzystaniem doskonalszych deskryptorów (MPEG-7), stworzyć zintegrowaną platformę multimedialną (MPEG-21), itd. Wręcz aranżowano nowe prace badawcze w dużych zespołach, by sprostać wyzwaniom dynamicznego rozwoju technologicznego według perspektyw umiejętnie zarysowanych w kolejnych wezwaniach (call) grup normalizacyjnych. Standardy multimedialne mają więc charakter silnie innowacyjny. 

Normy JPEG i MPEG mają charakter ogólny (generyczny). Wynika to ze specyfiki  multimediów, które mają charakter powszechny, uniwersalny, o szerokim spektrum zastosowań w różnorodnych produktach komercyjnych, przemysłowych, teleinformatycznych, elektronicznych. Takie podejście wymaga definiowania profili aplikacyjnych i poziomów zgodności, a niekiedy zestawów narzędziowych  dostosowujących ogólne ramy standardu do wiodących, konkretnych zastosowań.