12.07.2015 Aufrufe

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

3. Grundlagen des Sequenzalignments 423.7.3 Standardisierung der ScoresAus dem Histogramm geht augenscheinlich hervor, dass mit einem Score von 11 eineüber dem Zufall liegende Ähnlichkeit der beiden Originalsequenzen wahrscheinlich ist.Diese Erkenntnis soll jedoch auch quantitativ ausgedrückt werden können. Als einfachzu errechnender Wert gilt dafür der Z-Score, den beispielsweise auch der FASTA 4 -Algorithmus verwendet. Der Z-Score wird dabei einer Standardisierung (Z-Transformation)über den Mittelwert und der Standardabweichung unterzogen, um die Scoresmiteinander vergleichbar zu machen und zu standardisieren [37].Der Z-Score gibt die Abweichung eines konkreten Wertes s vom Mittelwert ¯S derScoreverteilung als Vielfache der Standardabweichung σ S an [32].Z-Score := s − ¯Sσ S(3.10)Je größer der Score s ist, desto mehr weicht er an den rechten Rand der Verteilung,also in die positive X-Richtung aus. Umso weiter der Score rechts vom Mittelwert ¯Sliegt, desto größer ist die Wahrscheinlichkeit, dass der Score keinem Zufall entsprichtbzw. das Alignment nicht die Folge einer zufälliger Übereinstimmungen ist.Als zum Z-Score alternative Kenngrößen kommen auch der P-Wert (P-Value) undE-Wert (E-Value) zur Anwendung. Der P-Wert gibt die Wahrscheinlichkeit an, dassein gleich hoher oder höherer Score durch eine zufällige Übereinstimmung zustandegekommen ist. Der E-Wert hängt von der Menge der Eingangssequenzen ab. Er gibtdie erwartete Zahl jener Sequenzen der gesamten Menge an, die beim Vergleich miteiner randomisierten Sequenz zum errechneten oder einen höheren Score führen würde[21].Die bisherigen Betrachtungen haben sich ausschließlich paarweisen Sequenzvergleichenund -alignments gewidmet. Die multiple Alignierung von Sequenzen als Erweiterungobiger Verfahren gilt algorithmisch als wesentlich komplexer. Eine genauere Betrachtungdieser Problemstellung ist Thema des folgenden Kapitels.4 Der FASTA-Algorithmus wurde 1985 von David J. Lipman und William R. Pearson als FASTPfür Proteine entwickelt [28]; die aktuellen FASTA-Tools sowohl für Proteine als auch Nukleotide sindunter http://www.ebi.ac.uk/Tools/fasta/index.html zu finden.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!