12.07.2015 Aufrufe

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

4. Multiples Sequenzalignment 46doch klar, dass eine unmittelbare Verallgemeinerung der Algorithmen des paarweisen”Alignments kein gangbarer Weg zur Konstruktion eines multiplen Alignments ist“ [21,S. 183].Die Größe heutiger Datenbanken und der Aufwand eines paarweisen Vergleichs zweierSequenzen legen nahe, die Anzahl der Sequenzen und damit die Sequenzvergleichemöglichst frühzeitig zu minimieren.Grundsätzlich gibt es drei wesentliche Einflussgrößen, die den Rechenaufwand einesmultiplen Sequenzvergleichs bestimmen:• die Länge der jeweiligen Sequenzen bzw. Regionen• die Größe des Alphabets• die Anzahl der zu untersuchenden SequenzenDiese drei Faktoren können vorweg nur schwer oder nicht reduziert werden. Die Längeder Sequenzen kann nicht beliebig reduziert werden, da diese größtenteils naturgegeben“sind. Gene haben in der Regel eine Länge von mehr als 80 Codone [32], die es”bei einem globalen Alignment zu alignieren gilt. Gleiches gilt für die Größe des Alphabets,welches ebenso nicht reduzierbar ist, da bestimmte Sequenzen naturgemäßhöhere Variationen im Code aufweisen und somit mit vielen unterschiedlichen Codonebeschrieben werden.Gerade beim multiplen Sequenzalignment spielt die Menge der Ausgangssequenzen einewesentliche Rolle. Schon in der Einführung zu Kapitel 4 wird festgestellt, dass beimmultiplen Sequenzalignment die Anzahl der Eingangssequenzen bewusst hoch gehaltenwird, um zu qualitativ besseren Ergebnissen zu gelangen. Eine Methode, die bei einemmultiplen Sequenzalignment deshalb nahezu unumgänglich ist, betrifft die Vorauswahlvon Sequenzen aus einer ursprünglich größeren Sequenzmenge. Wenn es gelingt, auseiner zunächst großen Menge von Sequenzen mit einem effizienten Verfahren eine relevanteTeilmenge zu extrahieren, deren Sequenzen wahrscheinlich gut zu alignieren sindoder umgekehrt, deren Sequenzen man bei den Betrachtungen mit hoher Wahrscheinlichkeitausschließen kann, so kann der Aufwand damit deutlich reduziert werden. Dieswirft jedoch die Fragen auf, wie und welche Sequenzen aus einer Menge vorselektiert

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!