12.07.2015 Aufrufe

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

4. Multiples Sequenzalignment 492. Auf Basis der generierten Distanzmatrix erfolgt im nächsten Schritt die Berechnungeines phylogenetischen Baumes. Mit Hilfe des Neighbour-Joining-Algorithmuswird ein binärer Baum generiert, der einerseits die Reihenfolge der iterativenAlignierung der einzelnen Sequenzen zu einem MSA festlegt, und andererseitsauch die Gewichtung der einzelnen Sequenzen bzw. deren Score bestimmt. DasGewicht der Sequenzen wird dabei über die Distanz des Endknotens zur Wurzel(root) des Baums ermittelt.3. Im letzten Schritt wird die Alignierung auf Basis des erstellten Clusterbaumesvorgenommen. Die Alignierung wird mit jener Paarung begonnen, welche denhöchsten paarweisen Score aufweist. Diese Paarung ist auch jene, die als erster inden Baum eingefügt wurde. In weiterer Folge werden die verbleibenden Sequenzensukzessiv und in der Reihenfolge des Hinzufügens der Knoten in den Baum demAlignment hinzugefügt. Weist ein Knoten zwei Kindsequenzen auf, so werden diesevorher aligniert und dann erst dem MSA hinzugefügt. Hat ein Knoten nur eineKindsequenz oder ein oder mehrere Alignments, so werden diese wenn notwendigzuvor zusammengefasst und dem MSA hinzugefügt. Ausdrücklich hervorzuhebenist, dass die Alignierung an den Endknoten immer mit der Originalsequenzenerfolgt, und nicht mit den etwaig eingefügten Gaps der vorangegangenen Alignierungzur Bestimmung des binären Baums.Der ClustalW Algorithmus ist verglichen mit anderen Methoden effizient, da eine paarweiseAlignierung nur einmal berechnet werden muss. Dennoch hat ClustalW auch einigeNachteile. Lokale Sequenzähnlichkeiten bleiben beispielsweise oft unterbewertet,da der Algorithmus auf eine Berechnung der Distanzen auf Basis eines globalen Alignmentsbasiert. Sequenzmengen, die nur eine oder wenige lokale Gemeinsamkeitenbesitzen, sich ansonsten aber weitgehend unterscheiden, sind für ClustalW wenig geeignet.Die Reihenfolge bei der Alignierung spielt ebenso wie die Distanz der alignierten Sequenzenvor allem am Beginn der Iteration eine wesentliche Rolle. Zu stark divergenteSequenzen gerade zum Beginn der Iteration, als auch die Bewertung der Einführungvon Lücken und der Verlängerung der Lücken beeinflussen das Ergebnis empfindlich.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!