12.07.2015 Aufrufe

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

3. Grundlagen des Sequenzalignments 36zeigt beispielsweise, dass bei einer Aminosäuresequenz S 1 , an deren erster Position einA (Ala) stand, mit einer Wahrscheinlichkeit von 13 % auch in der mutierten SequenzS 2 ein A (Ala) stehen wird. Ebenso besteht eine 3%ige Chance, dass in der mutiertenSequenz S 2 ein A (Ala) zu einem R (Arg) mutiert.Bis heute werden PAM-Matrizen zum Alignieren von Sequenzen verwendet, obwohl dieFrage nach der evolutionären Distanz von Proteinen bis heute nicht klar beantwortetwerden kann. Welche PAM-Matrix am ehesten anzuwenden ist, hängt auch von derjeweiligen Fragestellung und von den Ausgangssequenzen ab. Eine pragmatische Vorgehensweiseist dabei die Verwendung mehrerer unterschiedlicher Matrizen. Matrizen,die sich vor allem bei der Identifikation von Proteindomänen bewährt haben, gehörenzur Familie der BLOSUM-Matrizen [32].3.6.2 BLOSUM-MatrizenDie später als die PAM-Matrizen entwickelten BLOSUM-Matrizen (BLOSUM steht dabeifür BLOck SUbstitution Matrix), gehen auf die Untersuchungen von Henikoff undHenikoff [19] zurück. Die Autoren verwendeten für ihre Untersuchungen Daten auseiner BLOCKS Datenbank. Dabei werden stark konservierte Regionen aus multiplenSequenzalignments extrahiert und in die Datenbank aufgenommen, wobei Lücken dabeinicht zugelassen sind. Die Funktion der Motive muss nicht bekannt sein. Die Auswertungder BLOSUM-Blöcke erfolgt spaltenweise, indem für jede Aminosäure a ∈ A undb ∈ B erst deren Häufigkeit f(a) und f(b) und anschließend die Häufigkeit f(a, b) derAminosäurenpaarungen a und b in sämtlichen Spalten berechnet wird. Die Berechnungder Scores erfolgt als Log-odds-Verhältnis in der Form [32]:s a,b := log sf(a, b)f(a)f(b)(3.9)Die Einträge in der Odd-Score-Matrix repräsentieren damit Wahrscheinlichkeiten. Somitkann der Score eines Gesamtalignments über die Einzelwahrscheinlichkeiten berechnetwerden. Die Verwendung des Logarithmus bietet den Vorteil, dass die Wertemiteinander addiert werden können und nicht multipliziert werden müssen, wie bei

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!