05.04.2013 Views

SERWIS ELEKTRONIKI

SERWIS ELEKTRONIKI

SERWIS ELEKTRONIKI

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Telewizja HDTV – cz.3-ost.<br />

Andrzej Brzozowski<br />

Kodowanie fonii w standardach MPEG<br />

Istnieje kilka odmian standardu MPEG opisuj¹cych metodê<br />

kodowania sygna³u fonii. Nale¿¹ do nich:<br />

• MPEG-1 (nazywany tak¿e Layer III lub MP3),<br />

• MPEG-2 AAC (Advanced Audio Coding)<br />

• MPEG-4 HE- AAC (High Efficiency Advanced Audio Codding<br />

oznaczany tak¿e jako AAC+)<br />

• MPEG-Surround.<br />

Kompresja fonii w standardach MPEG oparta jest na w³asnoœciach<br />

psychoakustycznych ucha ludzkiego i polega na eliminacji<br />

czêœci sygna³u fonii nieistotnych z punktu widzenia<br />

akustyki. Eliminacja ta nazywana jest tak¿e maskowaniem.<br />

Maskowanie czêstotliwoœci<br />

Cz³owiek teoretycznie s³yszy dŸwiêki z zakresu 20Hz-<br />

20kHz. W rzeczywistoœci jednak wiêkszoœæ ludzi nie s³yszy<br />

dŸwiêków powy¿ej 16-17kHz, choæ wyczuwa je. Ucho najlepiej<br />

reaguje na pasmo 2-4kHz (mowa mieœci siê w zakresie<br />

tzw. pasma telefonicznego 0.5-2kHz). Pozosta³e dŸwiêki, aby<br />

by³y s³yszalne, musz¹ byæ odpowiednio wzmocnione. Na rysunku<br />

11 przedstawiono charakterystykê czu³oœci ucha ludzkiego<br />

na czêstotliwoœci foniczne.<br />

Poziom [dB]<br />

100<br />

80<br />

60<br />

40<br />

20<br />

0<br />

0.02 0.05 0.1 0.2 0.5 1 2 5 10 20<br />

Czêstotliwoœæ<br />

[kHz]<br />

Rys.11. Charakterystyka czu³oœci ucha ludzkiego.<br />

Cz³owiek s³yszy wszystkie dŸwiêki, które wystêpuj¹ powy¿ej<br />

poziomu reprezentowanego przez krzyw¹ z rysunku 11.<br />

Czêstotliwoœci¹ odniesienia dla tej krzywej jest czêstotliwoœæ<br />

2kHz. Wszystkie dŸwiêki o poziomach poni¿ej krzywej czu-<br />

³oœci nie musz¹ byæ transmitowane. Z w³asnoœci psychoakustycznych<br />

ucha ludzkiego wynikaj¹ nastêpuj¹ce wnioski, które<br />

zosta³y wykorzystane w kompresji fonii MPEG:<br />

• niskie tony skutecznie maskuj¹ (czyli zag³uszaj¹) tony<br />

wysokie,<br />

• wysokie tony nie maskuj¹ tak dobrze tonów niskich,<br />

• im wiêksza jest energia dŸwiêku maskuj¹cego, tym szersze<br />

pasmo mo¿e on zamaskowaæ,<br />

• im bardziej oddalone od siebie s¹ czêstotliwoœci dŸwiêków,<br />

tym s³absze jest maskowanie.<br />

Telewizja HDTV<br />

Rozdzielczoœæ ucha ludzkiego mo¿e byæ wyra¿ona jako<br />

krytyczne pasma czêstotliwoœci, które s¹ równe ok. 100Hz dla<br />

ni¿szych czêstotliwoœci akustycznych i wiêksze ni¿ 4kHz dla<br />

wy¿szych czêstotliwoœci.<br />

Maskowanie chwilowe<br />

Nastêpnym efektem psychoakustycznym wykorzystywanym<br />

w kompresji sygna³u fonii jest maskowanie chwilowe<br />

dŸwiêku. Zjawisko to polega na tym, ¿e ka¿dy g³oœny ton powoduje<br />

nasycenie receptorów ucha œrodkowego a zdolnoœæ do<br />

s³yszenia innych dŸwiêków powraca po pewnym czasie (czasie<br />

opóŸnienia). Im d³u¿ej trwa dŸwiêk maskuj¹cy, tym d³u¿szy<br />

jest czas, po którym s³yszalne s¹ inne dŸwiêki.<br />

Koder i dekoder MPEG<br />

Bior¹c pod uwagê te cechy ludzkiego s³uchu, stworzono<br />

tzw. kodowanie podzakresowe, którego podstawowym za³o-<br />

¿eniem jest odrzucanie wszystkich zbêdnych informacji o nies³yszalnych<br />

(maskowanych) czêstotliwoœciach. Poniewa¿ czêstotliwoœci<br />

tych jest du¿o, kompresja jest bardzo efektywna,<br />

ale jest to kompresja stratna, to znaczy, ¿e nie mo¿na odtworzyæ<br />

czêstotliwoœci maskowanych-czyli odrzuconych lecz ucho<br />

ludzkie i tak tego nie rozró¿nia.<br />

Proces kompresji dŸwiêku poprzedzony jest cyfryzacj¹ sygna³ów<br />

fonii kana³ów Lewego L i Prawego P. Cyfryzacja polega<br />

na próbkowaniu oddzielnie sygna³ów kana³ów L i P metod¹<br />

PCM (Pulse Code Modulation). Próbki sygna³ów fonii<br />

podawane s¹ nastêpnie do kodera MPEG sygna³u fonii. Na<br />

rysunku 12 przedstawiono schemat blokowy kodera MPEG i<br />

dekodera MPEG sygna³u fonii.<br />

Koder MPEG<br />

Wejœcie<br />

sygna³u<br />

fonii (PCM) Podzia³ sygna³u<br />

na 32 podzakresy<br />

czêstotliwoœci<br />

Dekoder MPEG<br />

Zakodowany<br />

strumieñ<br />

danych Rozpakowanie<br />

danych<br />

Wybór bitów<br />

do maskowania<br />

Kwantyzacja<br />

Kodowanie<br />

Analiza próbek<br />

w oparciu o model<br />

psychoakustyczny<br />

Rekonstrukcja<br />

próbek<br />

Wyjœciowy<br />

strumieñ<br />

Formowanie danych<br />

strumienia danych<br />

Wyjœiowy<br />

sygna³<br />

Transformacja audio<br />

z dziedziny czasu PCM<br />

do dziedziny<br />

czêstotliwoœci<br />

Rys.12. Schemat blokowy kodera MPEG i dekodera<br />

MPEG fonii.<br />

Ogólny algorytm kodowania jest nastêpuj¹cy: sygna³ akustyczny<br />

jest dzielony na 32 równe podzakresy za pomoc¹ odpowiedniego<br />

zestawu filtrów. Sygna³ w ka¿dym z podzakresów<br />

jest analizowany i na podstawie w³aœciwoœci ucha ludzkiego<br />

wybiera siê te sk³adowe, które s¹ maskowane przez inne<br />

sk³adowe-jeœli dwa dŸwiêki maj¹ zbli¿one czêstotliwoœci i jeden<br />

z nich ma znacznie wiêksz¹ energiê od drugiego to ucho<br />

nie jest w stanie wykryæ obecnoœci s³abszego dŸwiêku. S³abszy<br />

dŸwiêk jest wiêc maskowany (usuwany).<br />

<strong>SERWIS</strong> <strong>ELEKTRONIKI</strong> 7/2007 29

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!