Deutsche Gesellschaft für Audiologie - Universität Oldenburg
Deutsche Gesellschaft für Audiologie - Universität Oldenburg
Deutsche Gesellschaft für Audiologie - Universität Oldenburg
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
als Beispiel, wie das Amplituden-Histogramm mittels Perzentilen modelliert wird, und der<br />
Abstand zwischen den Perzentilen Aufschluss über die Modulationstiefe gibt.<br />
m es<br />
N u<br />
Fra<br />
of<br />
ber<br />
m<br />
200<br />
180<br />
160<br />
140<br />
120<br />
100<br />
80<br />
60<br />
40<br />
20<br />
Envelope Histogram and Percentiles over 30 s of Clean Speech<br />
10 % 50 % 90 %<br />
Breite<br />
0<br />
20 30 40 50<br />
Envelope Level [dB]<br />
60 70 80<br />
Fig. 3: Amplitudenhistogramm und Perzentile eines Sprachsignals.Das Merkmal 'Breite' ist<br />
definiert als Differenz zwischen der 90 % und der 10 % Perzentile.<br />
Das spektrale Profil wird auf eine rudimentäre Weise durch zwei Merkmale modelliert, den<br />
spektralen Schwerpunkt und die zeitlichen Schwankungen des spektralen Schwerpunktes<br />
(Fig. 4). Diese beiden Merkmale wurden bereits im Klassifizierer von Phonak (1999) verwendet.<br />
Amplitude [dB]<br />
80<br />
70<br />
60<br />
50<br />
40<br />
30<br />
Schwankungen<br />
des spektralen<br />
Schwerpunkts<br />
spektraler Schwerpunkt<br />
1000 2000 3000 4000 5000 6000 7000 8000<br />
Frequenz [Hz]<br />
Fig. 4: Zur Beschreibung des spektralen Profils werden der spektrale Schwerpunkt und dessen<br />
zeitliche Schwankungen berechnet.<br />
Für die Beschreibung der Harmonizität wird normalerweise der Pitch eines Klanges benutzt<br />
(Fig. 5). In unserem Ansatz wird die Harmonizität durch zwei Merkmale charakterisiert: die<br />
Tonalität und die Pitch-Varianz. Die Tonalität ist definiert durch das Verhältnis der harmonischen<br />
zu den unharmonischen Anteilen im Zeitsignal.<br />
[Hz]<br />
requency<br />
F<br />
500<br />
400<br />
300<br />
200<br />
100<br />
0<br />
Pitch Frequency of Clean Speech<br />
5 10 15 20 25<br />
Time [s]<br />
Fig. 5: Typischer zeitlicher Pitch-Verlauf eines Sprachsignals. Das Merkmal Tonalität ist das<br />
Verhältnis von harmonischen zu unharmonischen (hier durch 0 Hz angezeigten) Anteilen.<br />
Um Amplituden-Onsets zu modellieren, wird das Auftreten hoher und schneller Amplitudenanstiege<br />
im Bark-Spektrum analysiert. Fig. 6 zeigt ein typisches Onsetmuster <strong>für</strong> Popmusik.<br />
162