21.12.2012 Aufrufe

Klassifikation von Mustern

Klassifikation von Mustern

Klassifikation von Mustern

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

3.6. MERKMALE FÜR DIE SPRACHERKENNUNG (VA.1.2.2, 06.02.2004) 209<br />

3.6 Merkmale für die Spracherkennung (VA.1.2.2, 06.02.2004)<br />

3.6.1 Kurzzeittransformationen<br />

Da ein Sprachsignal eine zeitlich veränderliche Struktur hat, ist es nicht sinnvoll, z. B. ein<br />

ganzes Wort oder gar einen ganzen Satz nach FOURIER zu transformieren bzw. daraus irgendwelche<br />

Merkmale zu extrahieren. Statt dessen zerlegt man das Muster in kurze (Zeit)–<br />

Fenster (“windows”, “frames”) <strong>von</strong> ca. 10ms Dauer, wie es schon für die gefensterte FOURIER-<br />

Transformation in Abschnitt 3.2.3 getan wurde. Generell sollte ein Fenster<br />

• klein genug sein, um eine gute zeitliche Auflösung zu liefern,<br />

• und groß genug sein, um eine gute Frequenzauflösung zu liefern.<br />

Da beides wegen Satz 2.2, S. 67 oder Satz 2.3, S. 67 nicht beliebig genau möglich ist, muss<br />

ein Kompromiss geschlossen werden, indem man z. B. geeignete Kurzzeittransformationen<br />

wie die Kurzzeit–FOURIER-Transformation (bzw. die gefensterte FOURIER-Transformation, s.<br />

Abschnitt 3.2.3) oder andere <strong>von</strong> Zeit und Frequenz abhängige Darstellungen wie die WIGNER–<br />

VILLE Transformation definiert. Auch die bereits in Abschnitt 3.3 eingeführte Wavelet Transformation<br />

kommt in Frage.<br />

Definition 3.14 Die Kurzzeit–FOURIER-Transformation ist (s. auch (3.2.47), S. 176)<br />

<br />

KFT(τ, ω) = f(t)w(t − τ)exp[−2πi ωt] dt . (3.6.1)<br />

Dabei ist w(t) eine in der Regel reelle Fensterfunktion. Beispiele für diskrete Fensterfunktionen<br />

wν wurden in (2.5.43) gegeben.<br />

Die WIGNER–VILLE Transformation ist<br />

<br />

WVT(τ, ω) = f τ + t<br />

<br />

f<br />

2<br />

∗<br />

<br />

τ − t<br />

<br />

exp[−2πi ωt] dt . (3.6.2)<br />

2<br />

Im Prinzip wird mit (3.6.1) ein Muster in einzelne Zeitfenster zerlegt und je Fenster ein<br />

Merkmalsvektor berechnet. Diese Rechnung wird für eine Folge <strong>von</strong> Zeitfenstern, die das Muster<br />

überdecken, wiederholt. Es wird noch erwähnt, dass man bei Bildern ganz analog vorgeht,<br />

wenn man ein Bild in kleinere Blöcke <strong>von</strong> Bildpunkten zerlegt und je Block einen Merkmalsvektor<br />

berechnet.<br />

3.6.2 Lineare Vorhersage<br />

Die Methode der linearen Vorhersage beruht auf dem Ansatz, einen Schätzwert ˆ fn des n–ten<br />

Wertes einer Folge [fj] <strong>von</strong> Abtastwerten mit einer linearen Schätzgleichung zu berechnen. In<br />

die Schätzgleichung <strong>von</strong> der Form<br />

ˆfn = −<br />

m<br />

µ=1<br />

aµ fn−µ<br />

(3.6.3)<br />

gehen m Werte fn−1, . . . , fn−m ein sowie die noch zu bestimmenden Vorhersagekoeffizienten<br />

(oder Prädiktorkoeffizienten) aµ. Ist [fj] eine Folge <strong>von</strong> Abtastwerten f(j∆t) einer Zeitfunktion<br />

f(t), so kann man fn als den gerade beobachteten Wert auffassen und fn−µ, µ = 1, . . . , m

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!