12.07.2015 Aufrufe

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

6. Implementierung eines MSA mit einem Profil-HMM 77Die in der Abbildung 6.4 beschriebene Ausgangssituation entspricht dem (hellblauen)Startmodell, das mit neun (roten) Sequenzen beschrieben wird. Im ersten Alignierungszykluswerden dem Profil-MSA fünf (grüne) neue Sequenzen hinzugefügt und darausfür einen weiteren Zyklus ein neues (hellrotes) Profil-MSA mit 14 Sequenzen erzeugt.Im zweiten Zyklus werden mit dem Profil-MSA vier weitere (blaue) Sequenzen gefunden,die aufgrund der Expansion des HMMs nun in die Nähe des Profil-MSA gerücktsind. Der eingezeichnete Pfad der Modellmittelpunkte verdeutlicht den Drift des Modellsim Laufe des Prozesses. Das expandierte Profil-HMM ändert durch die Aufnahmeneuer Sequenzen nicht nur seinen Informationsgehalt, sondern auch seinen Modellmittelpunkt.Expandiert in jedem Zyklus das Modell, so können im Idealfall damit in denFolgezyklen Sequenzen gefunden werden, die mit dem Ausgangsmodell (noch) nichtgefunden wurden.Die praktische Umsetzung dieses Verfahrens erfordert Werkzeuge, um aus der entstandenenAlignierung neue Parameterdateien zu erstellen. Die dafür entwickelte Java-Applikation modmsapm.jar erfüllt den geforderten Zweck und liest die aktuelle param-Datei, mit dem die letzte Alignierung durchgeführt wurde, und die von amodseq generierteMSA-Beschreibung, um daraus eine neue Parameterdatei für den nächstenZyklus zu erstellen:java -jar modmsapm.jar -p input.param -m current.msa↩→-o nextinput.paramWesentlich bei der aktuellen Implementierung ist die Einschränkung, dass keine neuenModellspalten hinzugenommen werden, sondern das Profil-MSA ausschließlich umzusätzliche Sequenzen erweitert wird. Das Einfügen zusätzlicher Modellspalten ist mitwenig technischen Aufwand verbunden, hätte aufgrund der komplexen Auswirkungenden Vergleich der Ergebnisse aber deutlich erschwert und den Aufwand der Evaluation(siehe nächster Abschnitt) deutlich erhöht.Getaktet werden die Zyklen über ein Bash-Script, welches eine feste Anzahl von Zyklenimplementiert. In jedem dieser Zyklen werden die oben genannten Dateien erzeugt undalle Dateien zum Zweck einer späteren Evaluation gesichert. Zusätzlich werden einige

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!