04.06.2013 Aufrufe

Theoretische und praktische Aspekte automatischer ...

Theoretische und praktische Aspekte automatischer ...

Theoretische und praktische Aspekte automatischer ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Johann-Mattis List Sequenzanalysen historische Linguistik 15. April 2010<br />

- - - - - - - - - - - -<br />

- - - h - e - a - r - t<br />

h - h - h - h - h - h -<br />

- - - h - e - a - r - t<br />

e - e - e - e - e - e -<br />

- - - h - e - a - r - t<br />

r - r - r - r - r - r -<br />

- - - h - e - a - r - t<br />

z - z - z - z - z - z -<br />

- - - h - e - a - r - t<br />

0 1 2 3 4 5<br />

1 0 1 2 3 4<br />

2 1 0 1 2 3<br />

3 2 1 1 1 2<br />

4 3 2 2 2 2<br />

Abbildung 3: Matrix für die Alinierung von engl. “heart” <strong>und</strong> dt. “herz”<br />

1<br />

3.3.2 Multiple Alinierung<br />

θ i ɣ a t ɛ r a<br />

d ɔː ˗ ˗ t ɚ - -<br />

tʰ ɔ x ˗ tʰ ɐ - ˗<br />

tʰ ɔ x t ɐ<br />

d ɔː ˗ t ɚ<br />

tʰɔxtɐ doːtɚ<br />

θiɣatɛra<br />

Abbildung 4: Progressive Alinierung anhand eines Leitbaums<br />

Da der Rechenaufwand für eine Berechnung multipler Alinierungen mit Hilfe des dynamischen Programmieralgorithmus<br />

potentiell ansteigt, <strong>und</strong> somit ab einer Alinierung von mehr als drei Sequenzen<br />

nicht mehr praktikabel ist, werden in der Biologie meist spezielle Heuristiken zur Ermittlung multipler<br />

Alinierungen verwendet. Im Rahmen progressiver Methoden zur multiplen Alinierung, die meist eine<br />

Variante des Feng-Doolittle-Algorithmus darstellen (Feng & Doolittle 1987), wird dabei auf Gr<strong>und</strong>lage<br />

einer Berechnung paarweiser Sequenzdistanzen mit Hilfe von Clusteralgorithmen zunächst ein Leitbaum<br />

(guide-tree) erzeugt, anhand dessen die Sequenzen dann sukzessive zu einer multiplen Alinierung vereinigt<br />

werden. Es gibt jedoch keine Garantie dafür, dass die optimale multiple Alinierung durch dieses<br />

Verfahren gef<strong>und</strong>en werden kann. Die Güte einer derartigen Alinierung hängt starkt von der Struktur der<br />

Sequenzen ab, die miteinander aliniert werden. Auch kann die Konstruktion des Leitbaums erheblichen<br />

Einfluss auf die Alinierung der Sequenzen nehmen.<br />

Abbildung 4 zeigt anhand der Sequenzen gr. θιγατέρα [θiɣatɛra], engl. daughter [dɔːtɚ] <strong>und</strong> dt. Tochter<br />

[tʰɔxtʰɐ] “Tochter”, wie eine multiple Alinierung anhand eines Leitbaums erfolgt. Dabei gibt der Leitbaum<br />

zunächst eine Alinierung des englischen <strong>und</strong> des deutschen Wortes vor, welcher dann das griechische Wort<br />

7<br />

1

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!