21.12.2012 Aufrufe

Klassifikation von Mustern

Klassifikation von Mustern

Klassifikation von Mustern

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

3.6. MERKMALE FÜR DIE SPRACHERKENNUNG (VA.1.2.2, 06.02.2004) 217<br />

wobei m (mc)<br />

k<br />

der zeitliche Mittelwert des k–ten Cepstrum Koeffizienten und c (mc,n)<br />

τ,k<br />

der resultie-<br />

rende normierte Wert ist.<br />

Ein anderer Vorschlag zur Normierung besteht aus den Schritten der Unterdrückung aller<br />

durch den Maskierungseffekt verdeckten Spektralkomponenten, der Lautstärkenormierung jeder<br />

Spektralkomponente mit der Lautstärke an der Hörschwelle sowie der Abbildung in die<br />

mel–Skala mit (3.6.23). Der Maskierungseffekt besagt, dass alle Geräusche unhörbar werden,<br />

wenn andere lautere zeitlich und spektral benachbart sind. Der ungefähre Verlauf der Maskierung<br />

geht aus Bild 3.6.4a hervor. Zu jeder Spektralkomponente fν des Sprachsignals wird diese<br />

Maskierung, vertikal verschoben je nach aktueller Lautstärke, angenommen und ihr Verlauf<br />

über der Signalfrequenz fs mit ψν(fs) bezeichnet. Für das aktuelle Sprachsignal zur (diskreten)<br />

Zeit τ ist die resultierende Maskierung dann definiert mit<br />

ψτ(fs) = max<br />

ν {ψν(fs)} . (3.6.35)<br />

Alle Anteile des Sprachsignals unterhalb der Maskierung ψτ (fs) werden eliminiert. Der Verlauf<br />

der Hörschwelle ist in Bild 3.6.4b angegeben. Ist Lhs(fs) die Lautstärke an der Hörschwelle und<br />

Ls(fs) die Lautstärke des Sprachsignals, so ist die normierte Lautstärke<br />

Lsn(fs) = Ls(fs) − Lhs(fs) . (3.6.36)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!