MASTERARBEIT - Fachhochschule Salzburg

Weitere Magazine

Empfehlungen

Info

5. Hidden Markov Modelle 55{1, 2, . . . , λ} auf Basis der Übergangswahrscheinlichkeiten von einem Zustand inden anderen. Er entspricht einer Markov-Kette. Dieser Prozess beschreibt die interneZustandsfolge x=x 1 ,x 2 ,. . .,x l des Modells. Sie ist nicht beobachtbar bzw. istversteckt“ (engl. hidden), daher auch die Bezeichnung Hidden Markov Modell.”Eine Folge von Zuständen x∈ Λ l mit der Länge l und dem Startzustand x 0 wirdals Pfad bezeichnet.• Der zweite Prozess generiert entsprechend einer zustandsabhängigen Wahrscheinlichkeitsverteilungzu jedem Zeitpunkt i eine sichtbare Emission y=y 1 ,y 2 ,. . .,y laus dem Emissionsalphabet Σ = {1, 2, . . . , σ}. Die Folge der Emissionen ist beobachtbarund entspricht beispielsweise bezogen auf Sequenzen den einzelnenAminosäuren. Eine Folge von Emissionen y∈ Σ l mit der Länge l wird Beobachtunggenannt 3 .Der Hidden Markov Prozess kann - gleich der Markov-Kette - als zufällige Irrfahrtin einem erweiterten Zustandsgraphen des Modelles aufgefasst werden. Bei einem gedachtenExperiment stehen in jedem Knoten entlang des Zustandsgraphen zwei Auwahlmöglichkeitenzur Verfügung. Die ersten Auswahlmöglichkeit bildet die Emissionenaus dem Emissionsalphabet entsprechend den jeweiligen Emissionswahrscheinlichkeitenab. Die zweite stellt die gerichteten Kanten zu den Nachbarknoten zur Auswahl, wobeihierbei nur die Knoten des Zeitpunkts i + 1 erreicht werden können.5.3 Profil-HMMsIn der Bioinformatik kommen vorwiegend Profil-HMMs zur Anwendung. Der Aufbaudes Profil-HMMs leitet sich von den Sequenzen ab, mit denen das Hidden Markov Modelltrainiert wird. Beim Training des Modells werden die Sequenzen eines MSA spaltenweiseanalysiert und die Verteilung der Symbole innerhalb der Spalten berechnet.Spalten mit großen Symbolähnlichkeiten bilden einen Konsens (engl. Consensus) fürdie im multiplen Alignment enthalten Proteinteile. Da in einigen Sequenzen Teile fehlenkönnen oder zusätzlich zu den Consensus-Spalten Teilfolgen in einzelne Sequenzeneingefügt wurden (siehe Kapitel 3), bestehen multiple Sequenzalignments neben den3 In der konkreten Anwendung mit Aminosäuresequenzen wäre Σ = Σ A
5. Hidden Markov Modelle 56Konsenspositionen auch aus Einfügungen (Insertions) und Löschungen (Deletions), dieim HMM berücksichtigt werden müssen.Profil-HMMs werden mit drei grundsätzlichen Zustandstypen beschrieben [32]:• Match-Zustände m i (in der Abbildung 5.2 mit Quadraten symbolisiert) beschreibeneine Position i in der Sequenz, die innerhalb des Modells zum Konsens gehört.Dies muss nicht zwingend bedeuten, dass zwei exakt gleiche Symbole der MengeΣ übereinstimmen. Es können durchaus mehrere und unterschiedliche Symbolezum Konsens gehören, wenn die aus einem MSA einer Proteinfamilie bestehendenTrainingsdaten (Profil-MSA) die Häufung mehrerer unterschiedlicher Symbole ander betreffenden Position bestätigen. Befindet sich der Prozess im Zustand m i ,so emittiert er mit einer der Spalte i zugrundeliegenden Wahrscheinlichkeit einSymbol aus dem Alphabet Σ A .• Insert-Zustände i i (in der Abbildung 5.2 als Rhomben dargestellt) erzeugen einzusätzliches Symbol in der Sequenz, obwohl mit den Modellspalten kein Konsenserreicht wurde. Der Prozess emittiert ein Symbol aus dem Alphabet Σ A .Nachdem die Trainingsdaten selbst keine Emissionswahrscheinlichkeiten für diebetreffende Position beschreiben, kann beispielsweise auf Hintergrundwahrscheinlichkeitenzurückgegriffen werden. Voraussetzung dafür ist, dass für jedes Symbolder Menge Σ A eine Wahrscheinlichkeit größer Null definiert ist.• Bei Delete-Zuständen d i (in die Abbildung 5.2 als Kreise eingebunden) wird immereine Lücke, also der Buchstabe -“ emittiert. In diesem Fall gilt die Spalte”als verarbeitet.Um das Modell zu vervollständigen, wird es um den initialen Zustand und den terminalenZustand erweitert. Der initiale Zustand 0 entspricht dem Startzustand, derzu einem späteren Zeitpunkt niemals mehr angenommen werden kann. Der terminaleZustand ∞ emittiert nichts und ist immer der letzte Zustand der erreicht werdenkann. Der Prozess beginnt immer im initialen Zustand und endet immer im terminalenZustand.
Seite 1 und 2:
MASTERARBEITMultiples Sequenzalignm
Seite 3 und 4:
InformationenVor- und Zuname: DI(FH
Seite 5 und 6:
3.2.1 Hamming-Abstand und -Ähnlich
Seite 7 und 8:
B Umgebung und Applikationen 115B.1
Seite 9 und 10:
Tabellenverzeichnis2.1 Standardisie
Seite 11 und 12:
1. Einführung 2Kombination die Eig
Seite 13 und 14: 1. Einführung 4Im Kapitel 5 werden
Seite 15 und 16: 2. Allgemeine Grundlagen 62.1 Prote
Seite 17 und 18: 2. Allgemeine Grundlagen 8Heute wer
Seite 19 und 20: 2. Allgemeine Grundlagen 10Buchstab
Seite 21 und 22: 2. Allgemeine Grundlagen 12müssen
Seite 23 und 24: 2. Allgemeine Grundlagen 14verklein
Seite 25 und 26: 2. Allgemeine Grundlagen 16proteins
Seite 27 und 28: 3. Grundlagen des Sequenzalignments
Seite 53 und 54: 4. Multiples Sequenzalignment 444.1
Seite 55 und 56: 4. Multiples Sequenzalignment 46doc
Seite 57 und 58: 4. Multiples Sequenzalignment 484.4
Seite 59 und 60: 4. Multiples Sequenzalignment 50Ist
Seite 61 und 62: 5. Hidden Markov Modelle 52Haussler
Seite 63: 5. Hidden Markov Modelle 54Markov-K
Seite 67 und 68: 5. Hidden Markov Modelle 585.4 Verw
Seite 69 und 70: 5. Hidden Markov Modelle 605.4.2 De
Seite 71 und 72: 6Implementierung eines MSA miteinem
Seite 73 und 74: 6. Implementierung eines MSA mit ei
Seite 89 und 90: 7. Bewertung der Ergebnisse 80• D
Seite 91 und 92: 7. Bewertung der Ergebnisse 827.2 D
Seite 93 und 94: 7. Bewertung der Ergebnisse 84Grö
Seite 95 und 96: 7. Bewertung der Ergebnisse 86und d
Seite 97 und 98: 7. Bewertung der Ergebnisse 88Abbil
Seite 99 und 100: 7. Bewertung der Ergebnisse 90Die S
Seite 101 und 102: 7. Bewertung der Ergebnisse 92[27]
Seite 103 und 104: 7. Bewertung der Ergebnisse 94Das D
Seite 105 und 106: 7. Bewertung der Ergebnisse 96Matri
Seite 107 und 108: 7. Bewertung der Ergebnisse 98Tabel
Seite 109 und 110: 8Zusammenfassung und AusblickEines
Seite 111 und 112: 8. Zusammenfassung und Ausblick 102
Seite 113 und 114: Literaturverzeichnis 104[9] G.R. Co
Seite 115 und 116:
Literaturverzeichnis 106[28] D.J. L
Seite 117 und 118:
AbkürzungsverzeichnisBLOSUM . . .
Seite 119 und 120:
Anhang110
Seite 121 und 122:
A. Tabellen und Abbildungen 112Tabe
Seite 123 und 124:
A. Tabellen und Abbildungen 114Tabe
Seite 125 und 126:
B. Umgebung und Applikationen 116B.
Seite 127 und 128:
B. Umgebung und Applikationen 118B.
Seite 129 und 130:
CDaten- und ErgebnisdateienC.1 Astr
Seite 131 und 132:
C. Daten- und Ergebnisdateien 122C.
Seite 133 und 134:
DQuelltexteD.1 amodseq: Alignment v
Seite 135:
EDatenträger126
Alle anzeigen

MASTERARBEIT - Fachhochschule Salzburg

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?