Podręcznik
7. Kodowanie obrazu nieruchomego i sekwencji wideo
7.1. Reprezentacje obrazu nieruchomego i ruchomego
Obraz jest przetwarzany na szereg pikseli, podobnie jak dźwięk na szereg próbek. To próbkowanie obrazu jest możliwe dzięki ograniczonej rozdzielczości ludzkiego oka. Jesteśmy w stanie rozróżnić kilkadziesiąt punktów w jednym stopniu kątowym naszego pola widzenia, jeśli liczba szczegółów jest większa, postrzegamy je jako jednolitą plamę. Nasza wrażliwość na zmianę jasności jest większa niż wrażliwość na zmianę koloru. Piksele reprezentujące kolor (chrominancję) mogą zatem występować w większej odległości niż piksele reprezentujące jasność (luminancję). Aby z tego skorzystać, trzeba wpierw oddzielić luminancje od chrominancji. Załóżmy, że obraz został zapisany w postaci trzech zbiorów pikseli dla 3 podstawowych kolorów: R,G,B. Jasność poszczególnych pikseli niech będzie zapisana w postaci liczb całkowitych od 0 do 255. Taka 8-bitowa reprezentacja jest wystarczająca dla przeważającej części obrazów. Wówczas możemy zastosować odwracalne przekształcenie liniowe 3 kolorów na wartość luminancji (Y’) i dwóch składowych chrominancji (Cb, Cr) – wzór (38). Jest wiele podobnych przekształceń, zainteresowanym polecam książki [17], [18].
(38) |
Piksele chrominancji występują w zapisanym cyfrowo obrazie rzadziej niż piksele luminancji. Na rys. 47 pokazano dwie metody podpróbkowania chrominancji: schemat 4,2,2 (na 4 piksele luminancji przypadają 2 pary pikseli chrominancji) i schemat 4,2,0 (na 4 piksele luminancji mamy 2 pary pikseli chrominancji lub brak pikseli chrominancji).
4,2,2 |
4,2,0 |
Rysunek 47 Podpróbkowanie chrominancji (wszystkie piksele reprezentują luminancję, czarne ponadto chrominancję)
Obraz ruchomy może zostać zapisany jako ciąg obrazów nieruchomych (tzw. ramek). Jest to możliwe dzięki ograniczonej rozdzielczości czasowej naszego oka: Widząc kilkadziesiąt ramek na sekundę wydaje si e nam, że oglądamy płynny, ciągły ruch.