Doskonalenie odbioru informacji multimedialnych
2. Komputerowa obróbka danych
2.14. Rozumienie i interpretacja przekazu
Definicja procesu rozumienia danych nie jest prosta, bo odwołując się do zróżnicowanych ludzkich intuicji trudno jest precyzyjnie określić jej ramy w przełożeniu na formalne opisy, algorytmy, komputerowe metody analityczne. Ogólnie rozumieć przekaz informacji to ''łapać, o co chodzi'', pojmować sens, zdawać sobie sprawę z wymowy obserwowanej treści. Rozumienie to wyłowienie z obrazów informacji niezbędnej do ich użytkowania, czyli interpretacji odczytanego przekazu, a często też podjęcia na jego podstawie wiążących decyzji.
J. Hawkins określił rozumienie sytuacji jako zdawania sobie sprawy z życiowo istotnych skutków danej sytuacji. Z kolei R. Penrose zwraca szczególną uwagę na rolę świadomości w procesie rozumienia danej sytuacji.
Istotne jest podkreślenie konieczności semantycznego rozumienia informacji. Informacja służy odbiorcy w realizacji określonego celu, a przekaz danych dokonuje się zawsze w kontekście określonej treści. Treści danych przypisana jest funkcja semantyczna, która odzwierciedla w dużych stopniu ich użyteczność dla odbiorcy. Precyzyjnie określając semantykę rozpoznanych elementów, obiektów czy cech w przypadkach niejasnych - z informacją ukrytą i komunikując ją odbiorcy, dostarczamy informacji użytecznych w określonym zastosowaniu. Dobrem przykładem jest rozumienie informacji obrazowej.
Komputerowe rozumienie obrazów wspiera proces właściwej interpretacji semantycznej reprezentacji obrazów, tj. określonych (ustalonych, rozpoznanych) obiektów/regionów/cech -- komponentów o przypisanej funkcji semantycznej. Interpretacja wyjaśnia ''co rzeczywiście dzieje się'' w obrazie, jaka jest wymowa informacji obrazowej na wyższym, określonym przez zastosowanie, poziomie abstrakcji. Prowadzi to do formułowania decyzji dotyczących dalszych działań, czyli robienia użytku z wyekstrahowanej, rozpoznanej, zrozumianej i właściwie ocenionej informacji z ustaloną semantyką.
Rozumienie obrazów to określenie znaczenia/wymowy pełnej informacji przekazywanej w obrazie (znaczenia całej sceny). Wykorzystywana jest tutaj wiedza dziedzinowa z zakresu relacji pomiędzy obiektami i ich cechami, okoliczności (kontekstu) ich występowania, dostrzegalne zarówno w samym obrazie, jak też wynikające z innych uwarunkowań procesu obrazowania.
Kluczowym warunkiem skutecznej interpretacji obrazów jest trafne rozpoznanie -- odczytanie pełnej informacji poprzez \textbf{zrozumienie całego przekazu treści obrazowej}, w tym niekiedy nawet najdrobniejszych, słabo dostrzegalnych jego szczegółów. Przy skutecznym opracowaniu narzędzi wspomagania na plan pierwszy wysuwa się problem integracji cech wizualnych oraz obliczeniowych, opisujących regiony zainteresowań w kontekście wiarygodnych znaczeń rozpoznanych obiektów, struktur, drobnych detali, kompozycji treści przez synergii tych znaczeń do postaci odczytywanej informacji.
\textbf{Komputerowe rozumienie obrazów} jest rodzajem sprzęgu pomiędzy komputerem a człowiekiem, -- rodzajem dostrojenia stosowanego modelu formalnego do fachowego, ale także psychofizycznego potencjału użytkownika, -- symbolem dopasowania specjalisty do wyrafinowanego narzędzia i odwrotnie. Udane rozumienie obrazów stwarza możliwość wykorzystania całego potencjału dostępnej wiedzy i zdolności, wspierając kreatywność i umiejętność trafnego wnioskowania. Sukces zależy tutaj od obu stron, przy czym zazwyczaj decydujący wpływ ma postawa człowieka.
Tradycyjne pytanie stawiane w metodologii metod analizy obrazów: ''jak policzyć to, co widać?'', w przypadku współczesnych wymagań komputerowego wspomagania coraz częściej przyjmuje formę odwrotną: \textbf{''jak rozumieć i pokazać to, co da się policzyć?''}, czyli jak zrozumieć to, co pojawia się w warstwie numerycznego opisu danych. A często pojawiają się tam rzeczy na tyle istotne, że wpływają w znaczącym stopniu na informacyjny przekaz obrazu. Nowych metod należy poszukiwać na styku postrzegania i interpretacji, objętych regułami reprezentowania informacji i rozumienia reprezentacji.
Automatyczna interpretacja obrazów dotyczy wyjaśnienia przyczyn obserwowanych czy ekstrahowanych treści, nawiązuje więc do szerszej wiedzy doświadczalnej, specyfiki zastosowań, czy ogólnej wiedzy typowego użytkownika.