12.07.2015 Aufrufe

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

5. Hidden Markov Modelle 605.4.2 Decodierung eines Profil-HMMZu jeder beobachteten Sequenz kann aus dem Profil-HMM durch Decodierung die gemeinsameWahrscheinlichkeit eines Pfades aus Σ HMM und der Emission aus Σ A berechnetwerden. Je höher diese Wahrscheinlichkeit ist, als desto geringer gilt die Distanzder Beobachtung zum Modell. Gleiches gilt für Scores, denn HMM-Scores werden inden meisten Fällen von den Modell-Wahrscheinlichkeiten abgeleitet [32].Aus der schematischen Darstellung des Profil-HMMs in Abbildung 5.2 wird deutlich,dass es aufgrund der nicht beschränkten Länge der durch das HMM modellierten Sequenzenunendlich viele und demnach unendlich lange Pfade im Modell gibt, die zueiner Emission gleich einer beobachteten Sequenz führen. Die Bildung eines optimalenAlignments führt über die Suche nach dem wahrscheinlichsten aller Pfade. DieMethode, bei der alle Pfade berechnet werden, um jenen Pfad mit der höchsten gemeinsamenWahrscheinlichkeit zu erhalten, erscheint impraktikabel, da die Zahl dermöglichen Pfade exponentiell mit der Länge n des HMMs wächst. Zur Lösung des Optimierungsproblemskommt beispielsweise der sogenannte Viterbi-Algorithmus infrage,dessen Ziel die Bestimmung des optimalen Pfades (Viterbi-Pfad) bei einer gegebenenSequenz der Länge L über das Alphabet Σ A ist. Viterbi löst das Decodierungsproblemdurch dynamische Programmierung (siehe Kapitel 3.3) mit deutlich weniger Aufwand.Aufgrund der Einschränkung auf 9 Transitionen pro Modellspalte reduziert sich dieKomplexität auf O(L · 9n). Für nähere Details sei auf weiterführende Quellen wie [32],[21] oder [12] verwiesen.5.4.3 Alignment mit einem Profil-HMMIst das Profil-HMM trainiert und damit die Topologie des HMM festgelegt, so kanneine Sequenz mit dem HMM aligniert werden. Im Rahmen der Decodierung wird jenerPfad ermittelt, der die größte Wahrscheinlichkeit oder den höchsten Score aufweist. Inder Abbildung 5.3 wird eine Alignierung der Sequenz d2ez9a2 mit einem aus siebenSequenzen bestehenden MSA dargestellt. Modellspalten sind mit dem Buchstaben M(Match) markiert, Spalten die nicht in das HMM aufgenommen wurden, mit demBuchstaben N.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!