12.07.2015 Aufrufe

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

6. Implementierung eines MSA mit einem Profil-HMM 74von drei Interationsschritten angewachsen ist. Dabei wird deutlich, welche Auswirkungendie Alignierung mehrerer Sequenzen mit deutlich längeren Lücken zwischenden Match-Bereichen auf das Vereinigungs-MSA hat. Das VMSA wächst in der Breiteüberproportional an.Eine mögliche Gegenmaßnahme besteht darin, diese entstandenen Lücken über alternativeVerfahren zu alignieren. Unter Anwendung von PAM- oder BLOSUM-Matrizenist eine nachträgliche Alignierung dieser Bereiche durchaus denkbar. Die Applikationamodseq bedient sich jedoch des ClustalW-Algorithmus um diese Lücken zu schließen.Zu diesem Zweck werden nach der Erstellung des Vereinigungs-MSA jene Bereicheaus dem MSA extrahiert (in der Abbildung 6.2 sind dies die umrandeten weißen undorangefarbigen Bereiche der Spalten N und i), die vom HMM nicht aligniert werden.Es entstehen sogenannte MSA-Snippets oder Profile 8 . Dabei wird zwischen den Profil-(Profil1 ; weiße Bereiche) und den hinzugefügten Bereichen (Profil2 ; orange Bereiche)unterschieden. Zu diesem Zeitpunkt kommt die Applikation ClustalW2 9 zum Einsatz,um die beiden Profile zu alignieren, wobei die Alignierung des Profil1 unverändertbleibt und das Profil2 passend dazu aligniert wird. Dieser Arbeitsschritt wird für alleLücken bzw. Snippets wiederholt. Am Ende werden die von ClustalW alignierten MSA-Snippets wieder in das Vereinigungs-MSA zurückgeschrieben. Die folgende Abbildung6.3 zeigt das Ergebnis dieses Ablaufs.Deutlich sichtbar wird der Erfolg dieser Methode, vergleicht man die Breite der Lückennach der ClustalW-Alignierung mit den Lücken zuvor. Der Bereich der Spalten 43-45(vormals die Spalten 49 bis 55) kann mit ClustalW beispielsweise erfolgreich aligniertund die Lücke damit deutlich verkleinert werden. Das Vereinigungs-MSA wird dadurchkompakter bzw. dessen Sequenzen entsprechend verkürzt.Der Aufruf der Java-Applikation amodseq für das oben beschriebene Szenario lautet:java -jar amodseq.jar -p current.hmm -a topseqs.results↩→-o current.msa -d ↩→-x 3 -TYPE=PROTEIN -GAPOPEN=10 -GAPEXT=0.18 Der Begriff Profile wird alternativ verwendet, um damit der Terminologie von ClustalW zu folgen.ClustalW werden diese Snippets als Profile1 und Profile2 zugeführt, um diese zu alignieren.9 CLUSTAL 2.0.12 Multiple Sequence Alignments; http://www.clustal.org/ (Stand: 13. April2010)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!