Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Automatische Erkennung von Cover-Versionen und Plagiaten in ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Feature Extraktion 60<br />
3.6.1.3 Trajektorien<br />
Um nun tatsächlich Melodie <strong>und</strong> Bass aus der errechneten Überlagerung gespielter Töne<br />
zu extrahieren, werden die zu e<strong>in</strong>em Zeitpunkt jeweils dom<strong>in</strong>antesten <strong>und</strong> stabilsten<br />
Gr<strong>und</strong>ton-Trajektorien herangezogen. Derartige Trajektorien erzeugt e<strong>in</strong> Multi-Agent-<br />
System aus den vorliegenden Daten. Jeder e<strong>in</strong>zelne Agent generiert dabei genau e<strong>in</strong>e<br />
Trajektorie durch Verb<strong>in</strong>den mehrerer zeitlich benachbarter hervorstechender Peaks.<br />
Dabei werden alle Frames nache<strong>in</strong>ander laut folgendem Schema abgearbeitet.<br />
1. E<strong>in</strong> Peak-Detektor erkennt hervorstechende Peaks, die über e<strong>in</strong>em festgelegten<br />
Schwellwert relativ zum Maximalwert liegen. Die aktiven Agenten bestimmen<br />
durch Interaktion, welchem e<strong>in</strong> solcher Peak am nähesten liegt <strong>und</strong> somit am<br />
besten zuzuordnen ist. Erheben mehr als e<strong>in</strong> Agent Anspruch auf e<strong>in</strong>en Peak,<br />
so wird er dem verlässlichsten zugerechnet. Beansprucht ke<strong>in</strong>er der Agenten den<br />
Peak, so wird e<strong>in</strong> neuer erzeugt um ihn zu verfolgen.<br />
2. Jeder Agent hat e<strong>in</strong>en Penalty-Wert, der erhöht wird, sobald <strong>in</strong> e<strong>in</strong>em Frame ke<strong>in</strong><br />
Peak gef<strong>und</strong>en wird um se<strong>in</strong>e Trajektorie fortzusetzen. F<strong>in</strong>det der Agent <strong>in</strong> e<strong>in</strong>em<br />
der darauf folgenden Frames wieder e<strong>in</strong>en passenden Peak, so wird die Penalty<br />
auf 0 zurückgesetzt. Erreicht dieser Wert jedoch e<strong>in</strong>e bestimmte Grenze, dann<br />
term<strong>in</strong>iert der Agent <strong>und</strong> die Trajektorie endet.<br />
3. Jeder Agent bestimmt se<strong>in</strong>e eigene Verlässlichkeit. Dieser Wert ermittelt sich<br />
daraus, wie stark sich die Energien der verfolgten Peaks jeweils <strong>von</strong> jenen ih-<br />
rer Nachbarfrequenzen abheben. Die Verlässlichkeit e<strong>in</strong>er Trajektorie geme<strong>in</strong>sam<br />
mit ihrer Gesamtenergie gibt schließlich den Ausschlag dafür, welche als Melodie-<br />
bzw. Bass-Stimme zu e<strong>in</strong>em bestimmten Zeitpunkt ausgewählt wird.<br />
Beim schrittweisen Durchlaufen aller Frames bietet es sich an, am Ende des Musikstücks<br />
zu beg<strong>in</strong>nen <strong>und</strong> nach vorne h<strong>in</strong> weiterzuarbeiten. Der Gr<strong>und</strong> dafür ist, dass zu den<br />
Taktzeiten Schlagwerke <strong>und</strong> perkussive Instrumente sehr viel Rauschen erzeugen. Es<br />
s<strong>in</strong>d also tendenziell viele Peaks vorhanden <strong>und</strong> es ist nicht klar, welche zum Fortsetzen<br />
bzw. Beg<strong>in</strong>nen der Trajektorien die geeignetsten s<strong>in</strong>d. Startet man vom Schluss des<br />
Songs, so werden zuerst die auskl<strong>in</strong>genden Töne behandelt. Verfolgt man diese dann<br />
rückwärts bis zu ihrem Anstoß, so ist es bedeutend e<strong>in</strong>facher, s<strong>in</strong>nvolle Trajektorien zu<br />
generieren.