13.12.2012 Aufrufe

DAGA 2010 - Deutsche Gesellschaft für Akustik eV

DAGA 2010 - Deutsche Gesellschaft für Akustik eV

DAGA 2010 - Deutsche Gesellschaft für Akustik eV

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Programm <strong>DAGA</strong> <strong>2010</strong> 249<br />

die oftmals nicht zu einer relevanten Reduktion der Sprachverständlichkeit<br />

im Nahbereich führen. Es bietet sich dann die Verwendung eines<br />

Schallmaskierungssystems an. Das neu entwickelte Maskierungssystem<br />

SISOMask diagnostiziert aufkommenden Sprachschall und spielt<br />

nur dann maskierende Geräusche aus, wenn diese tatsächlich benötigt<br />

werden. Dadurch kann das Ansteigen des Grundgeräuschpegels bei<br />

geringem oder hohem Sprachaufkommen reduziert werden. SISOMask<br />

verfügt über eine intelligente Spracherkennungsroutine, um Fremdgeräusche<br />

zu filtern, sowie Analysealgorithmen und Regelsysteme zur Beurteilung<br />

von Schwellwerten. Es wurde <strong>für</strong> die Kombination mit halboder<br />

raumhohen Stellwänden konzipiert und kann auch zur Unterstützung<br />

der Dämmungseigenschaften von Wänden beitragen. SISOMask<br />

basiert auf einer durchgängigen Software-Lösung, deren Anwendung<br />

und Funktionen darlegt werden. Messergebnisse an Probanden, sowie<br />

objektive Parameter bzgl. der Sprachverständlichkeit werden erläutert.<br />

Do. 15:15 Gauß B 501 Sprachverarbeitung<br />

Parametric Diphthong Formant Trajectory Representations for Forensic<br />

Speaker Recognition<br />

E. Enzinger<br />

Austrian Academy of Sciences, Acoustics Research Institute<br />

Three different parametric diphthong formant trajectory representations<br />

are evaluated for the use in forensic speaker identification. Polynomial<br />

curves, discrete cosine transform and B-splines are fittedtotracksofthe<br />

first three formants of diphthongs from 30 Viennese German speakers.<br />

Instantaneous measurements are taken at two presumed phonetic targets<br />

(emulating dual-target) as well as 9 measurements at 10% steps<br />

throughout the duration of the segments. Comparisons are performed in<br />

a likelihood ratio framework, using a multi-variate kernel density formula<br />

(MVKD). The MVKD relates speaker similarity to all measurements.<br />

The evaluation applies cross-validation by using the remaining speakers<br />

as background data when comparing two particular speakers. Resulting<br />

error rates are computed for all conditions and displayed in DET plots.<br />

Do. 15:40 Gauß B 501 Sprachverarbeitung<br />

Vergleich von Merkmalsextraktionsverfahren <strong>für</strong> die automatische<br />

Sprecherverifikation bei Nichtübereinstimmung des Stimmaufwands<br />

in Trainings- und Testdaten<br />

C. Harwardt<br />

Fraunhofer FKIE<br />

Die automatische Sprecherverifikation auf Audiodaten mit weitestgehenden<br />

Übereinstimmungen der Signaleigenschaften in Trainings- und Testmaterial<br />

liefert <strong>für</strong> viele Szenarien und Signalqualitäten bereits sehr gute<br />

Ergebnisse. Stimmen die Signaleigenschaften jedoch nicht überein,

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!