1. Semantyczne modele informacji

1.1. Semantyczna teoria informacji

W niektórych przypadkach semantyka obrazów odgrywa na tyle znaczącą rolę w interpretacji (użytkowaniu, odczytaniu zawartej informacji) przekazywanych danych, że powinna stanowić ważny element w procesie optymalizacji algorytmów kompresji jako ''uzupełnienie'' statystycznej teorii informacji. Ważnym obszarem zastosowań jest tutaj obrazowanie medyczne.

Dwa zasadnicze cele teorii Shannona to: a) obliczanie ilości informacji dostarczanej przez źródła możliwie wiernie opisujące przesyłane dane, b) opracowanie efektywnych kodów bazujących na właściwych modelach statystycznych źródeł informacji. Oba te elementy wymagają ustalenia znaczeń pojedynczej danej, kontekstu jej wystąpienia, charakteru reprezentowanej informacji.

Należy tutaj odwołać się do podstaw ogólnej teorii informacji, w której występuje pojęcie semantycznej teorii informacji. Początki tej teorii stanowią prace Bar-Hillela i Carnapa również z lat 50 zeszłego wieku, a istotą jest określanie dodatkowo znaczenia poszczególnych symboli alfabetu źródła informacji. Wykorzystanie ontologicznych i aksjologicznych aspektów rozumienia informacji jest trudne do przełożenia na formalny i algorytmiczny opis modeli źródeł informacji, jednak wykorzystanie elementów tych teorii wydaje się konieczne w takich zastosowaniach jak np. analiza, rekonstrukcja i indeksowanie treści obrazów medycznych w sposób wiarygodny diagnostycznie.

Algorytmiczne wykorzystanie zasad semantycznej teorii informacji może być nieco łatwiejsze poprzez skorzystanie z tych metod matematycznych, które ułatwią semantyczną selekcję w algorytmach rozpoznawania. Chodzi tu o wykorzystanie analizy funkcjonalnej, które pozwala w większym stopniu uwolnić się od nierealistycznych założeń statystycznych dobierając bazy przekształceń przybliżających efektywnie lokalne, chwilowe właściwości sygnału. Ułatwia to także dostosowanie metody analizy do semantyki źródła informacji poprzez większe uporządkowanie informacji (zhierarchizowanie jej opisu) i dokładniejszy jej opis (czasową charakterystykę wielu skal ułatwiającą rozdzielenie sygnału od szumu) w nowej dziedzinie przekształcenia.

W latach 50 zeszłego stulecia powstała ''moskiewska szkoła teorii informacji'' z jej najznakomitszym przedstawicielem A.N. Kołmogorowem. Obok probabilistycznych sposobów modelowania źródeł informacji wykorzystano tam także teorię przybliżania (aproksymacji) źródeł z wykorzystaniem metod analizy funkcjonalnej. Stochastyczny proces opisujący źródło informacji zastąpiony jest przez klasę funkcji (sygnałów) f określonych w dziedzinie T. Dowolna funkcja jest aproksymowana i dyskretyzowana przez koder za pomocą sieci aproksymacji. Sieć aproksymacji według koncepcji Kołmogorowa jest zbiorem funkcji możliwie zupełnym i mało-licznym (kontrolowanym przez inne pojęcie entropii), aproksymującym istotne cechy sygnałów (funkcji) źródłowych. Kryteria doboru i optymalizacji postaci sieci formułowane jako minimalizacja błędu przybliżenia definiują proces reprezentacji (modelowania) danych z dopuszczeniem strat. 

Na poziomie ogólności proponowanym przez teorię Kołmogorowa bardzo niewiele można powiedzieć o strukturze optymalnej dla danego problemu sieci aproksymacji. Chociaż alternatywna teoria opisu informacji nie prowadzi to dokładnych oszacowań relacji złożoności modelu źródła do ilości reprezentowanej informacji, to jest istotna ze względu na sugestię funkcjonalnego modelowania źródeł. Chodzi o wyznaczenie efektywnych baz przekształceń sygnałów/obrazów w celu bardziej zwartego (oszczędnego) opisu informacji.

Wykorzystanie doświadczeń semantycznej teorii informacji, dodatkowo coraz doskonalszej wiedzy medycznej na temat zasad percepcji psychowizualnej danych obrazowych i obiektywizacji metod ich interpretacji pozwala konstruować doskonalsze sposoby selekcji i porządkowania analizowanej informacji na podstawie optymalizowanych metod opisu danych (duża rola analizy funkcjonalnej, przede wszystkim analizy harmonicznej, czyli analizy funkcji z wykorzystaniem transformacji o bazie wielu skal dobieranej w przestrzeni czas-częstotliwość).