4. Graniczne parametry transmisyjne

W p.2.1 zostały sformułowane kryteria jakości transmisji cyfrowej. Pożądane byłoby wąskie pasmo zmodulowanego sygnału, a jednocześnie duża szybkość modulacji (liczba symboli transmitowanych w ciągu sekundy). Niestety są to wymagania sprzeczne: symbole o krótkim czasie trwania mają szersze pasmo (rys.8, Moduł 1). Pożądana byłaby duża przepływność binarna (liczba bitów na sekundę) i niska stopa błędów. Tu też jest sprzeczność - ze wzoru 45 dla kodu bipolarnego wynika, że krótki czas przeznaczony na transmisję bitu (T)  prowadzi do wzrostu prawdopodobieństwa błędnego odbioru. Cenna byłaby duża efektywność widmowa, ale jest ona osiągalna tylko przy wysokim stosunku mocy sygnału do szumu w kanale (rys.46). Poza tym, dążymy do jak największej odporności na szumy w kanale, czyli jak najwyższej jakości odtworzonej po stronie odbiorczej mowy czy muzyki (maksimum SNR0) przy danym stosunku mocy sygnału do szumu na wyjściu kanału (SNR). 
Rozpatrzmy dokładniej wymienione problemy, zaczynając od szybkości modulacji (liczba symboli na sekundę). 
Niech nadawane symbole mają postać krótkich impulsów (rys.49).  Przesyłana informacja jest zakodowana w ich amplitudach: x_0,\ x_1,x_2\ldots  Jest to tzw. PAM (pulse amplitude modulation). Impulsy są nadawane co T sekund (w praktyce będą to mikro- lub nanosekundy). Stosując odpowiedni filtr, można tym impulsom nadać dowolny kształt, pod warunkiem nieprzekraczania czasu trwania równego T. 

Rysunek 49 Sygnał nadawany (PAM)

Kanał transmisyjny jest dolnopasmowy o paśmie B [Hz]. Modelem kanału jest filtr idealny o charakterystyce częstotliwościowej podanej na rys.50. 

 

Rysunek 50 Charakterystyka częstotliwościowa kanału

Odpowiedź impulsowa kanału jest odwrotną transformatą Fouriera charakterystyki częstotliwościowej (patrz zad.4, p.8.1, Moduł1). 

 

Rysunek 51 Odpowiedź impulsowa kanału

Na rys.52 pokazano odpowiedź kanału na 3 impulsy z rys.49 (zachowano ten sam kolor impulsu i odpowiedzi kanału).  Oczywiście na wyjściu kanału obserwujemy sumę tych sygnałów i w ogólnym przypadku nie można odczytać amplitud x_0,\ x_1,x_2\ldots  Jest to tzw. interferencja międzysymbolowa (ISI – Intersymbol Interference). 

 

Rysunek 52 Odpowiedź kanału na sygnał PAM

Interferencję międzysymbolową można zneutralizować, jeśli wykorzysta się regularne przejścia przez zero odpowiedzi impulsowej kanału (rys.51). Nadając kolejne impulsy w momentach  0,\frac{1}{2B},\frac{2}{2B},\frac{3}{2B}\ldots , umożliwiamy idealną  demultipleksację, gdyż w każdym z tych momentów nie zeruje się reakcja kanału tylko na jeden impuls (rys.53). 

 

Rysunek 53 Odpowiedź kanału na sygnał PAM gdy T=1/(2B)

Nadając impulsy co 1/(2B) sekund, transmitujemy 2B symboli na sekundę. W ten sposób otrzymujemy Twierdzenie Nyquista o szybkości modulacji:  W kanale o paśmie B [Hz] można przesyłać do  2B impulsów (symboli) na sekundę bez interferencji międzysymbolowej. 
W twierdzeniu Nyquista nie mówi się nic o szumie w kanale i błędach w transmisji. Gdy nie ma szumu w kanale, wówczas można transmitować (oczywiście w teorii, nie w praktyce) impulsy o nieskończonej liczbie różnych amplitud. Wówczas nawet jeden impuls może przenieść nieskończoną ilość informacji. 
Szum w kanale istnieje zawsze, w związku z tym rozpatrzmy problem jego wpływu na stopę błędów w transmisji.  Weźmy dla przykładu wzór na stopę błędów w kodzie bipolarnym (45): P_e=\frac{1}{2}erfc{(}\sqrt{\frac{ST}{\eta}}\ ). Czy można otrzymać stopę błędów dowolnie bliską zeru? Teoretycznie jest to możliwe, gdy \frac{ST}{\eta}\rightarrow\infty, a więc nieograniczonej mocy nadajnika lub nieskończenie długim symbolu, a więc szybkości transmisji dążącej do zera. W swoich pracach opublikowanych w połowie XX w. Claude Shannon wykazał, że można jednak uczynić stopę błędów dowolnie bliską zeru, jeśli rozpoznawać będziemy całą przesłaną wiadomość a nie pojedyncze symbole. Ideę Shannona realizuje się w praktyce, tworząc kody zabezpieczające przed błędami, wymagające opóźnionej decyzji [2]. 
Jakie warunki muszą być spełnione, aby udało się zredukowanie stopy błędów do wartości bliskiej zeru? 
Załóżmy że nadajemy pewną wiadomość składającą się z dużej liczby (k) impulsów: s_1,s_2,\ldots,s_k.  Potrzebny nam będzie nadajnik o mocy S=E(s_i^2). Kanał ma pasmo B i charakterystykę częstotliwościową jak na rys.50. 
Aby zneutralizować interferencje międzysymbolowe, impulsy nadajemy co 1/(2B), czyli przesyłamy 2B impulsów na sekundę. Na wyjściu kanału obserwujemy sygnał użyteczny s(t) jak na rys.53 i szum n(t) o mocy N=\eta B. Ich suma to sygnał v(t)=s(t)+n(t), który podajemy na wejście odbiornika. Pasmo tego sygnału wynosi B, więc można przeprowadzić jego pomiar, pobierając 2B próbek na sekundę (twierdzenie o próbkowaniu). Jednocześnie mamy 2B impulsów na sekundę, więc wystarczy jedna próbka na nadany impuls. Cała wiadomość zawiera zatem k próbek, a jej transmisja trwa k/(2B) sekund. 
Tak więc wiadomość możemy przedstawić w postaci k-wymiarowego wektora \overset{-}s=s_1,s_2,\ldots,s_k, a szum w postaci wektora  \overset{-}n=n_1,n_2,\ldots,n_k. Sygnał odebrany z szumem to wektor \overset{-}v=\overset{-}s+\overset{-}n
Typowa wiadomość wykorzystuje całą moc nadajnika, czyli  S\approx \frac{1}{k}\sum\nolimits ^{k}_{i=1} (s_{i} )^{2} =\frac{1}{k}|| \overset{-}{s}|| ^{2}. Stąd kwadrat normy wektora \overset{-}{s} można oszacować jako || \overset{-}{s}|| ^{2}\approx kS. Tak więc wektory wiadomości leżą w odległości zbliżonej do \sqrt{kS} od początku układu współrzędnych.
Moc szumu można oszacować jako  N\approx\frac{1}{k}\sum_{i=1}^{k}{(n_i)^2}=\frac{1}{k}||\overset{-}{n}||^{2}. Oszacowanie jest tym dokładniejsze, im większe k. Stąd  || \overset{-}{n}||^{2}=\sum_{i=1}^{k}(n_i)^2≈kN.  Wektory szumu leżą przy powierzchni kuli o promieniu \sqrt{kN}. Rysunek 54 to rysunek poglądowy przedstawiający wektory wiadomości, szumu i sygnału odebranego. 

Rysunek 54 Wektory wiadomości, szumu i sygnału odebranego oraz ich normy

Istotne znaczenie ma norma wektora szumu w przestrzeni wysokowymiarowej. Zmienna losowa  ||\overset{-}n||^2=\sum^k _{i=1}(n_i)^2 ma rozkład chi kwadrat o k stopniach swobody, gdyż próbki szumu to nieskorelowane zmienne o rozkładzie gaussowskim [2]. Na rys.55 pokazano rozkłady znormalizowanej zmiennej  \frac{1}{k}||\overset {-}n||^2 dla różnych wartości k. Wariancja szumu wynisi 1. Norma wielowymiarowych wektorów szumu dąży do wartości stałej. 

Rysunek 55 Gęstość prawdopodobieństwa zmiennej  \frac{1}{k}\sum_{i=1}^{k}n_i^2

Ta obserwacja ma znaczenie kluczowe. Wskazuje ona, że nadając pewną wiadomość  \overset{-} s, odbierzemy wektor leżący przy powierzchni kuli o promieniu \sqrt{kN} i środku w punkcie  \overset{-} s – rys.56.

Rysunek 56 Wynik pomiaru wiadomości leży na powierzchni otaczającej ją kuli

W odbiorze stosujemy zasadę minimum odległości. Jeśli zatem transmitowane wiadomości będą leżały dostatecznie daleko od siebie, to otaczające je kule szumu nie zetkną się. Każdy wynik pomiaru leżący na powierzchni kuli wskaże nam środek kuli jako najbliższą wiadomość i będzie to decyzja nieobciążona błędem. Tak więc możliwa jest bezbłędna transmisja wiadomości pod warunkiem że będą długie (duża wartość k).
Pozostaje problem, ile takich niezachodzących na siebie kul szumu można rozmieścić. Jesteśmy ograniczeni mocą nadajnika.  Sygnał odebrany v(t)=s(t)+n(t) ma moc średnią S+N, a więc wektory sygnałów odebranych \overset {-} v=\overset {-} s+\overset {-} n leżą w odległości około \sqrt{kS+kN} od początku układu współrzędnych. Wewnątrz kuli o promieniu  R=\sqrt{kS+kN} musimy rozmieścić kule szumu o promieniu r=\sqrt{kN}. Ile takich kul można rozmieścić? Tyle, ile wynosi ich stosunek objętości, a więc  [\frac{R}{r}]^k=[\frac{S+N}{N}]^{k/2}=[1+\frac SN]^{k/2}. Tyle różnych wiadomości można odebrać bezbłędnie. Oznacza to bezbłędne przesłanie {log}_2{\ }[1+\frac{S}{N}]^{k/2}=\frac k2log2 [1+\frac SN] bitów.
Transmisja całej wiadomości trwa \frac{k}{2B} sekund, a więc w ciągu sekundy wysyłamy (bez interferencji międzysymbolowych) C=\frac{2B}{k}\ \ \frac{k}{2}{log}_2{\left[1+\frac{S}{N}\right]=B\ }{log}_2{\left[1+\frac{S}{N}\right]} bitów. W sposób uproszczony pokazaliśmy uzasadnienie bardzo ważnego twierdzenia w telekomunikacji:
Tw. Shannona o przepustowości kanału
W kanale o szerokości pasma B, przy stosunku mocy sygnału do szumu na wyjściu kanału równym \frac{S}{N}=\frac{S}{\eta B} można przesyłać z dowolnie niską stopą błędów 

C=B\ log_2[1+\frac SN]=B\ log_2[1+\frac {S}{ηB}]\ \ bit/s (52)

Tę największą szybkość transmisji nazywa się przepustowością kanału (channel capacity). Im większy stosunek mocy sygnału do mocy szumu, tym większa przepustowość. Kanał bez szumu ma przepustowość nieskończoną, gdyż jesteśmy w stanie bezbłędnie rozpoznać nieskończoną liczbę różnych sygnałów.

Gdy  \frac{S}{N}\rightarrow\infty  to  C\rightarrow\infty (53)

Ciekawszym problemem jest wpływ pasma na przepustowość kanału. Pasmo B występuje we wzorze (52) dwukrotnie. Zmniejszając pasmo do zera, zmniejszamy szum na wyjściu kanału (N=\eta B), ale maleje również liczba transmitowanych symboli (twierdzenie Nyquista). Stosując regułę de l’Hospitala można obliczyć granicę (pozostawiam to czytelnikowi jako ćwiczenie): 

Gdy  B\rightarrow0  to  C\rightarrow0 (54)

Tak więc zmniejszanie pasma nie jest korzystne z punktu widzenia szybkości transmisji.  Z drugiej strony, poszerzenie pasma zapewnia większą przepustowość kanału mimo większej mocy szumu:

Gdy  B\rightarrow\infty\   to  C=B\ log_2[1+\frac S{ηB}]=\frac Sηlog_2(1+\frac S{ηB})^\frac{ηB}{S}=\frac Sηlog_2\ e

gdyż \lim \limits _{x\rightarrow\infty} (1+\frac{1}{x})^x=e

(55)

Pomimo że noc szumu dąży do nieskończoności (N=\eta B\rightarrow\infty) , kanał jest zdolny do bezbłędnej transmisji z maksymalną przepływnością określoną wzorem (55). 
Porównajmy wąskopasmową (pasmo B1 Hz) i szerokopasmową (pasmo B2 Hz) transmisję w kanale, charakteryzującym się gęstością mocy szumu W/Hz  - rys.57. Mamy do dyspozycji nadajnik o mocy S watów i dwie możliwości:  

  1. Transmisja wąskopasmowa: wykorzystujemy wąskie pasmo B1 Hz aby otrzymać wysoki stosunek mocy sygnału do szumu  SNR=\frac S{ηB_1}
  2. Transmisja szerokopasmowa: wykorzystujemy szersze pasmo B2 >> B1 Hz

 

Rysunek 57 Wykorzystanie kanału w transmisji wąskopasmowej (po lewej) i szerokopasmowej (po prawej)

Rysunek 57 sugeruje, że bardziej odporna na szum jest transmisja wąskopasmowa, gdyż gęstość mocy sygnału jest większa niż gęstość mocy szumu. Z kolei w transmisji szerokopasmowej gęstość mocy sygnału znajduje się poniżej gęstości mocy szumu. Wynika to z faktu, że oba prostokąty na rys.57 mają to samo pole równe mocy sygnału S. 
Wrażenie to jest jednak fałszywe – większą szybkość transmisji otrzymujemy w przypadku szerokopasmowym. Proszę się o tym przekonać przeglądając rozwiązane zadanie 11,.p.5.1

Ważnym parametrem transmisyjnym jest efektywność widmowa. Mówi ona o tym, ile bitów na sekundę  można przesłać w kanale o szerokości pasma 1 Hz. Przypomnijmy sobie oznaczenia:

  • Rb – szybkość transmisji [bit/s],   
  • Rb/B – efektywność widmowa [bit/s/Hz]
  • Eb– energia zużyta na transmisję 1 bitu [J=Ws]

Załóżmy, że osiągnęliśmy graniczną szybkość transmisji równą przepustowości kanału:
R_b=C=B\ {log}_2{\left[1+\frac{S}{N}\right]}=B\ {log}_2{\left[1+\frac{E_bR_b}{\eta B}\right]}. Przekształcając wzór Shannona (52) wykorzystaliśmy fakt, .ze moc sygnału S jest to energia na sekundę, czyli energia na bit (Eb) razy liczba bitów na sekundę (Rb). Przekształcając dalej, otrzymuje się: \frac{R_b}{B}={log}_2{\left[1+\frac{E_bR_b}{\eta B}\right]}  a w końcu 

 \frac{E_b}{\eta}=\frac{B}{R_b}\left[2^\frac{R_b}{B}-1\right] (56)

Wzór (56) określa najmniejszą wartość SNR (wyrażoną jako stosunek energii na bit i gęstości mocy szumu) jaka jest niezbędna do zapewnienia bezbłędnej transmisji z efektywnością widmową Rb/B. Jest to granica Shannona przedstawiona na Rys. 46. Gdy pasmo kanału rośnie do nieskończoności, wówczas efektywność widmowa maleje do zera.  Graniczna wartość SNR wynosi w tej sytuacji ln(2), czyli około -1.6 dB: 

Gdy   B→∞    to   \frac {E_b}{η} → ln(2)    (57)

Przy niższych wartościach SNR nie może być mowy o bezbłędnej transmisji. 

Z twierdzeniem Shannona o przepustowości kanału wiąże się graniczna odporność na zakłócenia. Przypominamy że chodzi o zależność  wartości SNR na wyjściu odbiornika od wartości SNR na wyjściu kanału: SNR0=f(SNR). Pożądana byłaby jak najwyższa jakość sygnału na wyjściu odbiornika (np. mowy czy muzyki) przy niskiej jakości sygnału na jego wejściu: {SNR}_0\gg SNR. Niestety, istnieje graniczna wartość odporności na zakłócenia, która wyraża się wzorem:

 SNR_0\le\left[1+\frac{f_M}{B}SNR\right]^\frac{B}{f_M}-1    (58)

Parametrem jest tu współczynnik poszerzenia pasma B/fM czyli pasmo sygnału zmodulowanego przez pasmo sygnału modulującego (np. sygnału mowy). We wzorze (58) stosunek mocy sygnału do szumu w kanale jest zdefiniowany następująco: \ SNR=\frac{S}{N}=\frac{S}{\eta\ f_M}. Jako moc szumu w kanale przyjęto moc szumu przypadającą na pasmo sygnału przed modulacją. 
Rodzinę funkcji opisaną wzorem (58) pokazano na rys.58. Wąskopasmowe modulacje nieposzerzające pasma (B=fM) mają niską odporność na szum w kanale (SNR0=SNR). Im szersze pasmo, tym większa odporność. Nie wzrasta ona jednak do nieskończoności, nawet przy nieograniczonym paśmie istnieje krzywa graniczna – rys.58.  Ograniczenie SNR sygnału wyjściowego (np. muzyki transmitowanej bezprzewodowo) odnosi się do każdej transmisji – nawet analogowej. Potwierdza to analiza porównawcza modulacji AM i FM. Szerokopasmowa modulacja FM jest bardziej odporna na szumy w kanale. 

Rysunek 58 Graniczna odporność na zakłócenia

Wzór (58) można wyprowadzić z twierdzenia Shannona o przepustowości kanału. 
Graniczna szybkość transmisji w kanale:

C=B\ {log}_2{(}1+\frac{S}{\eta B})=B\ {log}_2{(}1+\frac{f_M}{B}\frac{S}{\eta f_M})=B\ {log}_2{(}1+\frac{f_M}{B}SNR)  

Szybkość transmisji na wyjściu odbiornika: C_0=f_M{log}_2{(}1+SNR_0).
Liczba bitów na wyjściu odbiornika nie może być większa niż na jego wejściu, gdyż odbiornik nie jest źródłem informacji, on tylko przetwarza otrzymaną informację: C_0\le C. Przepisując tę nierówność otrzymujemy kolejno:

{log}_2{(}1+SNR_0)\le\frac{B}{f_M}{log}_2{(}1+\frac{f_M}{B}SNR) 

{log}_2{(}1+SNR_0)\le{log}_2{(}1+\frac{f_M}{B}SNR)^\frac{B}{f_M} 

1+SNR_0\le(1+\frac{f_M}{B}SNR)^\frac{B}{f_M} 

SNR_0\le(1+\frac{f_M}{B}SNR)^\frac{B}{f_M}-1 

 

Ostatnia postać jest identyczna ze wzorem (58).