12.07.2015 Aufrufe

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

3. Grundlagen des Sequenzalignments 39Werte bzw. Scores ausgedrückt. Je höher der Score einer Sequenz ist, desto größerist die Ähnlichkeit der Sequenz zum Bezugssystem. Die Suche nach einem optimalenAlignment ist de facto immer der Suche nach einem hohen oder maximalen Score gleichzusetzen,der eine gute oder im besten Fall optimale Übereinstimmung von Sequenzenbeschreibt.Die in den vorangegangenen Kapiteln eingeführten Methoden alignieren Sequenzen undplatzieren Lücken so, dass eine möglichst hohe Übereinstimmung bei Symbolpaarungenerreicht wird. Die Distanz der Paarungen ist dabei möglichst gering, da die Menge derübereinstimmenden oder ähnlichen Paarungen optimiert wird. Bei einem paarweisenSequenzvergleich wird zwar letztlich die Distanz zweier Sequenzen ausgedrückt und dieBasiseinheit der Scores wird über die Scoring-Matrizen bestimmt, das Bezugssystemwird dabei jedoch nicht festgelegt 3 . Erst eine Schätzung eines Bezugssystems überempirische Methoden kann einen Anhaltspunkt dafür liefern, was einen guten Scoreausmacht.3.7.1 Empirische Festlegung eines Bezugssystems für ScoresEin Score für sich alleine betrachtet ist wertlos, solange keine Vergleichsmöglichkeitenund kein Bezugssysytem zur Verfügung stehen. Mit den bisher diskutierten Abstandswertenist ein Vergleich von Sequenzabständen nur untereinander möglich, eine Frageist bisher aber unbeantwortet geblieben: Wie hoch muss ein Score sein, um eine signifikanteÄhnlichkeit zweier Sequenzen auszudrücken? Um diese Frage beantworten zukönnen, wird auf zufällige (randomisierte) Sequenzen zurückgreifen [21].Ausgangspunkt der Betrachtungen ist die Einsicht, dass bei einem Vergleich zweierbeliebiger Sequenzen auch zufällige Übereinstimmungen auftreten können. Verfahren,die das Einfügen von Gaps erlauben, vergrößern die Menge der übereinstimmenden oderähnlichen Symbolpaarungen zusätzlich, da die Gaps mit dem Ziel platziert werden, einemöglichst hohe Übereinstimmung zu erreichen. Hält man die Symbole einer Sequenznun bei und erlaubt gleichzeitig eine zufällige Positionierung der Symbole (Shuffling),3 Über die wahrscheinlichkeitstheoretische Betrachtung der Log-odds im Bayes Framework lässtsich so ein Bezugssystem prinzipiell beschreiben. Derartige Berechnungen sind im Allgemeinen jedochnumerisch schwer handhabbar.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!