12.07.2015 Aufrufe

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

7. Bewertung der Ergebnisse 81Im rechten Teil der Tabelle ist angeführt, um wie viele Sequenzen das Modell proZyklus erweitert wurde. Wie die Tabelle zeigt, wurde bei allen Familien bei jedemDurchlauf drei Sequenzen gefunden, die über dem vorgegebenen CDF-Threshold lagen.Damit wurde bei jedem Zyklus die Profil-MSAs um die maximale Anzahl der erlaubtenSequenzen erweitert.Jede der 9536 Sequenzen aus der im FASTA-Format vorliegenden Testdatenbank isteiner Familie zugeordnet. Die Sequenzen haben unterschiedliche Längen im Bereichvon 21 bis 1504 Zeichen. Die Verteilung der Sequenzlängen ist unregelmäßig und unabhängigvon deren Familienzugehörigkeit. Wie die Sequenzlängenverteilung in Abbildung7.1 zeigt, hat der Hauptanteil der Sequenzen eine Länge im Bereich von 50 bis180 Zeichen.Abbildung 7.1: Längenverteilung aller Sequenzen aus der Testdatenbank’astral scop 40.1.73’Wie im Kapitel 6.2.3 beschrieben, aligniert die Applikation hmmoo nicht nur einzelneSequenzen zum Profil-MSA, sondern bewertet gleichzeitig die Alignierung miteiner Reihe von Scores. Wie in der Methode der Vorauswahl der Sequenzen schonberücksichtigt wurde, folgen die Scores bestimmten Verteilungen, die für die Zweckedieser Arbeit mit einer Normalverteilung angenähert werden. Aus diesem Grund bildensowohl die Längenabhängigkeiten der Scores als auch die Dichtefunktionen (Wahrscheinlichkeitsverteilung)der Scores die Grundlage der Evaluation der multiplen Sequenzalignments,wie im folgen Abschnitt dargelegt wird.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!