12.07.2015 Views

Trendy vo vede a výskume informačných a komunikačných technológií

Trendy vo vede a výskume informačných a komunikačných technológií

Trendy vo vede a výskume informačných a komunikačných technológií

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Automatické rozpoznávanie reči 29„rovnako“ vyslovenom slove. Z tohto hľadiska rozpoznávanie nie je možné vykonávať lenobyčajným porovnaním nahraných vzoriek signálu. Preto sa digitálny signál ešteparametrizuje, čím sa z krátkej postupnosti vzoriek (cca 30ms) získa pozorovanie zloženéz niekoľkých parametrov – vektor príznakov, ktorý reprezentuje krátky časový úsekaudiosignálu.2 PA R A M E T R I Z Á C I A S I G N Á L URečový audiosignál parametrizujeme, teda získavame postupnosť čísel, ktorécharakterizujú požadované vlastnosti. Extrakcia príznakov je proces, počas ktorého savstupný audiosignál transformuje na postupnosť pozorovaní, za účelom získania určitýchvybraných rysov audiosignálu. Pri rozpoznávaní reči sa napr. obvykle vypočítavaenergetické spektrum signálu v krátkych časových oknách 10 – 40 ms, kedy sa audiosignálpovažuje za stacionárny [1]. Extrahované príznaky sú najčastejšie spektrálne alebokepstrálne koeficienty (resp. LPC koeficienty), ktoré skoncentrujú informáciu rečovéhosignálu do postupnosti vektorov dĺžky 5 – 40 prvkov [2]. Typ príznakov závisí od úlohyrozpoznávania.Obr. 2 Digitálny rečový signál (22kHz / 16bit / mono)V oblasti rozpoznávania reči sa za štandardné parametre považujú Melove frekvenčné -kepstrálne koeficienty (MFCC – Mel Frequency Cepstral Coefficients). Digitálnyaudiosignál (obr. 2) sa prevedie do spektrálnej oblasti (obr. 3). Ďalšími úpravami spektra sazískajú Melove koeficienty. Pre účel rozpoznávania reči stačí na jedno pozorovanie

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!