12.07.2015 Aufrufe

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

5. Hidden Markov Modelle 585.4 Verwendung von Profil-HMMsIn obigen Abschnitten wurden mehrmals die Parallelen eines Hidden Markov Modellsmit einem Automaten, der nach bestimmten Regeln das Modell in Einzelschrittendurchläuft, deutlich gemacht. In jedem dieser Schritte, die sich aus der Konfigurationdes Modells ergeben, wird ein Symbol emittiert. Welcher Pfad durch das Modell genommenwird und welche Symbole emittiert werden, bestimmen sowohl die Übergangsalsauch die Emissionswahrscheinlichkeiten des Modells.Bisher ist unerwähnt geblieben, welche Fragestellungen mit einem HMM beantwortetwerden können und wie ein Profil-HMM für ein Sequenzalignment konkret genutztwerden kann. Der Umgang mit dem Profil-HMM lässt sich in drei Aufgabenbereicheuntergliedern [21]:• Training: Das Training des Modells erfolgt über die Schätzung der Modellparametermit einer Menge alignierter Sequenzen. Aus der Zusammensetzung derSequenzen und deren Alignierungen ergibt sich letztlich die Modellbeschreibung.• Evaluation: Sie entspricht der Gewinnung einer Sequenz aus dem internen Pfad.• Decodierung: Mit der Decodierung wird der interne Pfad einer gegebenen (beobachteten)Sequenz ermittelt.Im Rahmen dieser Arbeit gilt den Aufgaben Training, vor allem aber der Decodierungdas besondere Interesse. Anhand eines konkreten Beispiels werden beide Aufgaben imFolgenden näher beschrieben, um am Ende des Kapitels zu zeigen, wie der Zustandspfadzur Alignierung einer Sequenz mit einem MSA führt.5.4.1 Training eines Profil-HMMDas Training eines Profil-HMM entspricht der Schätzung der HMM-Parameter aufBasis von Sequenzen mit einer bekannten internen Struktur. Die Sequenzen werdenaufgrund deren Strukturähnlichkeiten zu einem MSA aligniert und bilden so die Datengrundlagedes Trainingsprozesses. Während des Trainingsvorgangs werden in einemiterativen Prozess die Emissions- und Transitionswahrscheinlichkeiten unter dem

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!