13.12.2012 Aufrufe

DAGA 2010 - Deutsche Gesellschaft für Akustik eV

DAGA 2010 - Deutsche Gesellschaft für Akustik eV

DAGA 2010 - Deutsche Gesellschaft für Akustik eV

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Programm <strong>DAGA</strong> <strong>2010</strong> 71<br />

Anfrage nur aus einer Melodie besteht, während in der Musikkollektion<br />

Gesamtkompositionen enthalten sind. In diesem Beitrag präsentieren<br />

wir erste Ergebnisse unserer Analysen, mit denen wir das Ziel verfolgen,<br />

klassische Musicmatching-Methoden so anzupassen oder zu erweitern,<br />

dass diese auch im Fall von Harmonie- oder Polyphonieunterschieden<br />

zu zufriedenstellenden Ergebnissen führen. Insbesondere berücksichtigen<br />

wir dabei als Anfrage dominante Themen und Motive, wie sie typischerweise<br />

am Anfang von Notenbänden vermerkt werden, um einzelne<br />

Stücke in kompakter Weise zu beschreiben oder zu kennzeichnen.<br />

Di. 15:20 Grashof C 24 Music Processing I<br />

Vergleich von Matching-Techniken <strong>für</strong> die Detektion gesprochener<br />

Phrasen<br />

D. von Zeddelmann a ,F.Kurth a und M. Mueller b<br />

a Fraunhofer FKIE; b Saarland University and MPI Informatik<br />

In diesem Beitrag wird die Aufgabe betrachtet Suchanfragen, gegeben<br />

als kurze Phrasen gesprochener Sprache in akustischen Sprachaufnahmen<br />

zu erkennen. Hierzu werden an Stelle klassischer MFCC-<br />

Signalmerkmale (Mel Frequency Cepstral Coefficients) eine Variante der<br />

sogenannten HFCC-Merkmale (Human Factors Cepstral Coefficients)<br />

verwendet, bei der die zu Subbändern zusammengefassten Spektralkoeffizienten<br />

zusätzlich zur MFCC-Konstruktion eine perzeptuell motivierte<br />

Bandbreite besitzen. Die Tauglichkeit zur Phrasendetektion wird<br />

darauf aufbauend durch eine zusätzliche Bildung von Kurzzeitstatistiken<br />

erreicht. Die eigentliche Detektion wird mittels eines unüberwachten<br />

Matchingansatzes auf zeitlichen Merkmalsfolgen durchgeführt, wobei<br />

der Matchingansatz ursprünglich im Gebiet des Music Information<br />

Retrievals vorgeschlagen wurde. Die vorgestellte Arbeit verfolgt vor diesem<br />

Hintergrund das Ziel, zwei verschiedene Matchingstrategien, das<br />

Diagonal Matching und das Subsequence-DTW (Dynamic Time Warping)<br />

auf ihre Tauglichkeit zur Phrasendetektion zu analysieren und deren<br />

Leistungsfähigkeiten miteinander zu vergleichen. Seitens des DTWs<br />

werden dabei verschiedene Parametrisierungen des Basisalgorithmus<br />

untersucht. Die Evaluation erfolgt anhand des Kiel-Korpus gesprochener<br />

Sprache.<br />

Di. 15:45 Grashof C 24 Music Processing I<br />

Notenschrift-Audio Synchronisation komplexer Orchesterwerke<br />

mittels Klavierauszug<br />

V. Thomas, C. Fremerey, S. Ewert und M. Clausen<br />

Bonn University, Computer Science III<br />

Welcher Takt einer Partitur ist gerade auf einer Einspielung des Musikstücks<br />

zu hören? Diese und ähnliche Fragen sind Gegenstand der<br />

Notenschrift-Audio Synchronisation. Derartige Synchronisationsresultate<br />

erleichtern die Navigation und Suche innerhalb von Musikstücken.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!