Friedrich-Schiller - Chair for Bioinformatics Freiburg

Weitere Magazine

Empfehlungen

Info

38 KAPITEL 3. DER MULORA ANSATZ nicht überlappende Alignments Abbildung 3.5: Beispiel für nicht überlappend Alignments. Der hellgraue Bereich stellt das optimale Alignment dar, wärend der dunkel bereich das nächst-beste Alignment zeigt. a 1 und a 2 berechnet werden. Die Scores der restlichen Basenpaare mit rechten Enden b r 1 bzw. b r 2 sind dann einfach an den entsprechenden Positionen, also in x xMa a1 2 (b r 1 − 1,b r 2 −1) abzulesen. Da die bei der Berechnung von x xMa a1 2 (a r 1 −1,a r 2 −1) erhaltenen Zwischenergebnisse nicht mehr für andere Berechnungen verwendet werden können, werden sie auch nicht gespeichert. Nachdem die Einträge in D berechnet wurden, kann T(|S R1 |, |S R2 |) bestimmt werden. Der Score s pla des besten lokalen Alignments der Sequenzen S R1 und S R2 ergibt sich dann aus den maximalen Eintrag in T. Das Alignment und damit die Lösung des paarweisen lokalen Alignmentproblems (Definition 14) kann nun einfach mittels Backtracking bestimmt werden. Dazu beginnt man bei dem Eintrag in T welcher s pla enthält und verfolgt die Operationen zurück, bis ein Eintrag 0 in T erreicht ist. Die Art und die Reihenfolge der Operationen bestimmen dann eindeutig das Alignment. Den kompletten Algorithmus habe ich noch einmal auf der folgenden Seite zusammengefasst. Wie in der Beschreibung des Verfahrens begründet, berechne ich jedoch neben dem besten lokalen Alignment noch die nächstbesten Alignments, wobei ich mich für zwei Ansätze entschieden habe. Die k-besten Alignments Der erste Ansatz für die Bestimmung der k-besten Alignmnets berechnet die k lokalen paarweisen Alignments der Sequenzen S R1 und S R2 mit den höchsten Score, welche sich nicht überlappen. Dies entspricht damit dem Ansatz, wie er von Programmen wie BLAST [AGM90] bei sequenzieller Lokalität verwendet wird. Allerdings ist die Berechnung bei struktureller Lokalität wesentlich anspruchsvoller. Während sich die besten nicht-überlappenden Alignments bei der Verwendung von sequenzieller Lokalität einfach mittels Traceback aus den einmal berechneten Rekusionsgleichungen ableiten lassen, ist das bei struktureller Lokalität nicht möglich. Die Ursache dafür liegt in den Exklusionen. Da diese selbst wieder konservierte Motive enthalten können, müssen sie bei der Suche nach weiteren lokalen Alignments auch mit betrachtet werden. Abbildung 3.5 zeigt ein Beispiel für diese Situation. Da sich die Scores in diesen Bereichen aber aus den davorliegenden Bereichen ergeben, würden diese schon vorher alignierten Bereiche beim Traceback wieder verwendet werden. Deshalb ist für jedes neue Alignment über S R1 und S R2 auch eine neue Berechnung der Rekursionsgleichungen nötig, wobei dann das alignieren
3.2. BESTANDTEILE 39 Paarweiser lokaler Alignmentalgorithmus Seien S R1 und S R2 zwei RNA-Sequenzen, Ω 1 und Ω 2 die Matrizen der Basenpaare über S R1 bzw. S R2 zusammen mit ihren Wahrscheinlichkeiten und p min ein Grenzwert für die Basenpaarwahrscheinlichkeiten. Weiterhin sei α g (i) mit g ∈ {1,2} und i ∈ {1,...,|S Rg |} die Liste aller a g ∈ Ω g mit a l g = i in der Reihenfolge der rechten Basenpaarenden a r g, |α g [i]| die Anzahl der Basenpaare in α g [i] und α g [i][j ] das j-te Basenpaar in α g [i]. Dann ergibt sich das optimale paarweise lokale Alignment von S R1 und S R2 wie folgt: for i 1 := ∣ ∣ SR1 downto 1 do if ∣ ∣α 1 [i 1 ] ∣ > 0 for i 2 := ∣ ∣ SR2 downto 1 do if ∣ ∣α 2 [i 2 ] ∣ [ > 0 ][∣ { a 1 := α 1 i1 ∣α1 [i 1 ] ∣ ] [ ][∣ a 2 := α 2 i2 ∣α2 [i 2 ] ∣ ] if p SR1 (a 1 ) ≥ p min ∧ p SR2 (a 2 ) ≥ p min { Berechne x xMa a1 2 (a r 1 − 1,a r 2 − 1); for j 1 := ∣ α1 [i 1 ] ∣ downto 1 do for j 2 := ∣ α2 [i 2 ] ∣ [ ][∣ downto 1 do { b 1 := α 1 i1 ∣α1 [j 1 ] ∣ ] [ ][∣ b 2 := α 2 i2 ∣α2 [j 2 ] ∣ ] D(b 1 ,b 2 ) := x xMa a1 2 (b r 1 − 1,b r 2 − 1) + ρ SR1 (b 1 ) + ρ SR2 (b 2 ) + τ ( S R1 [b l 1 ],S R1 [b r 1 ],S R2 [b l 2 ],S R2 [b r 2 ] ) ; } } } Berechne T(|S R1 |, |S R2 |); s pla := 0; l 1 := 0; l 2 := 0; for j 1 := |S R1 | downto 1 do for j 2 := |S R2 | downto 1 do if T(j 1 ,j 2 ) > s pla { s pla := T(j 1 ,j 2 ); l 1 := j 1 ; l 2 := j 2 ; } Berechne Traceback ab T(l 1 ,l 2 ) bis Eintrag mit 0 erreicht ist;
Seite 1: Friedrich-Schiller- Universität Je
Seite 5 und 6: Inhaltsverzeichnis 1 Einleitung 1 1
Seite 7 und 8: Kapitel 1 Einleitung Für lange Zei
Seite 9 und 10: 1.1. MULTIPLE ALIGNMENTS 3 Sequenze
Seite 11 und 12: 1.1. MULTIPLE ALIGNMENTS 5 informat
Seite 13 und 14: 1.1. MULTIPLE ALIGNMENTS 7 1.1.2 Be
Seite 15 und 16: 1.2. VERWANDTE ARBEITEN 9 Eine ande
Seite 17 und 18: 1.2. VERWANDTE ARBEITEN 11 base−m
Seite 19 und 20: 1.3. ÜBERSICHT 13 a a e d b f b c
Seite 21 und 22: Kapitel 2 Vorbetrachtungen Bevor ic
Seite 23 und 24: 2.1. FORMALE DEFINITIONEN 17 Primä
Seite 25 und 26: 2.1. FORMALE DEFINITIONEN 19 Sequen
Seite 27 und 28: 2.1. FORMALE DEFINITIONEN 21 erlaub
Seite 29 und 30: 2.2. PROBLEMSTELLUNGEN 23 lokales A
Seite 31 und 32: 2.2. PROBLEMSTELLUNGEN 25 wobei p r
Seite 33 und 34: Kapitel 3 Der MuLoRA Ansatz In dies
Seite 35 und 36: 3.1. ÜBERBLICK 29 Sequenzen: A: GG
Seite 37 und 38: 3.2. BESTANDTEILE 31 3.2.1 Basenpaa
Seite 39 und 40: 3.2. BESTANDTEILE 33 Der Hofacker-A
Seite 41 und 42: 3.2. BESTANDTEILE 35 Die Rekursion
Seite 43: 3.2. BESTANDTEILE 37 T( , ) j 1 j 2
Seite 47 und 48: 3.2. BESTANDTEILE 41 Abbildung 3.6:
Seite 49 und 50: 3.2. BESTANDTEILE 43 Positionen: mu
Seite 51 und 52: 3.3. KOMPLEXITÄTSBETRACHTUNGEN 45
Seite 53 und 54: 3.3. KOMPLEXITÄTSBETRACHTUNGEN 47
Seite 55: 3.3. KOMPLEXITÄTSBETRACHTUNGEN 49
Seite 58 und 59: 52 KAPITEL 4. ERGEBNISSE dabei aus
Seite 60 und 61: 54 KAPITEL 4. ERGEBNISSE Nummer nic
Seite 62 und 63: 56 KAPITEL 4. ERGEBNISSE Sequenzlä
Seite 64 und 65: 58 KAPITEL 4. ERGEBNISSE RF00433: n
Seite 66 und 67: 60 KAPITEL 4. ERGEBNISSE Bei den Be
Seite 68 und 69: 62 KAPITEL 4. ERGEBNISSE 4.2.4 Moti
Seite 70 und 71: 64 KAPITEL 5. ZUSAMMENFASSUNG UND A
Seite 72 und 73: 66 ANHANG A. ERGEBNISTABELLEN 0,01
Seite 74 und 75: 68 ANHANG A. ERGEBNISTABELLEN MuLoR
Seite 76 und 77: 70 ANHANG A. ERGEBNISTABELLEN A.2 U
Seite 78 und 79: 72 ANHANG A. ERGEBNISTABELLEN
Seite 80 und 81: 74 LITERATURVERZEICHNIS [Hof03] [HB
Seite 83: Selbständigkeitserklärung Hiermit

Friedrich-Schiller - Chair for Bioinformatics Freiburg

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?