12.07.2015 Aufrufe

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

5. Hidden Markov Modelle 56Konsenspositionen auch aus Einfügungen (Insertions) und Löschungen (Deletions), dieim HMM berücksichtigt werden müssen.Profil-HMMs werden mit drei grundsätzlichen Zustandstypen beschrieben [32]:• Match-Zustände m i (in der Abbildung 5.2 mit Quadraten symbolisiert) beschreibeneine Position i in der Sequenz, die innerhalb des Modells zum Konsens gehört.Dies muss nicht zwingend bedeuten, dass zwei exakt gleiche Symbole der MengeΣ übereinstimmen. Es können durchaus mehrere und unterschiedliche Symbolezum Konsens gehören, wenn die aus einem MSA einer Proteinfamilie bestehendenTrainingsdaten (Profil-MSA) die Häufung mehrerer unterschiedlicher Symbole ander betreffenden Position bestätigen. Befindet sich der Prozess im Zustand m i ,so emittiert er mit einer der Spalte i zugrundeliegenden Wahrscheinlichkeit einSymbol aus dem Alphabet Σ A .• Insert-Zustände i i (in der Abbildung 5.2 als Rhomben dargestellt) erzeugen einzusätzliches Symbol in der Sequenz, obwohl mit den Modellspalten kein Konsenserreicht wurde. Der Prozess emittiert ein Symbol aus dem Alphabet Σ A .Nachdem die Trainingsdaten selbst keine Emissionswahrscheinlichkeiten für diebetreffende Position beschreiben, kann beispielsweise auf Hintergrundwahrscheinlichkeitenzurückgegriffen werden. Voraussetzung dafür ist, dass für jedes Symbolder Menge Σ A eine Wahrscheinlichkeit größer Null definiert ist.• Bei Delete-Zuständen d i (in die Abbildung 5.2 als Kreise eingebunden) wird immereine Lücke, also der Buchstabe -“ emittiert. In diesem Fall gilt die Spalte”als verarbeitet.Um das Modell zu vervollständigen, wird es um den initialen Zustand und den terminalenZustand erweitert. Der initiale Zustand 0 entspricht dem Startzustand, derzu einem späteren Zeitpunkt niemals mehr angenommen werden kann. Der terminaleZustand ∞ emittiert nichts und ist immer der letzte Zustand der erreicht werdenkann. Der Prozess beginnt immer im initialen Zustand und endet immer im terminalenZustand.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!