Friedrich-Schiller - Chair for Bioinformatics Freiburg

Weitere Magazine

Empfehlungen

Info

32 KAPITEL 3. DER MULORA ANSATZ Damit ist es nun einfach, die Wahrscheinlichkeit einer Struktur P zu bestimmen, welche sich wie folgt berechnen lässt: p[P] = E[P] e− kT Jedoch ist die Wahrscheinlichkeit einer einzelnen Sequenz biologisch nicht besonders interessant. Deshalb berechnet man die Wahrscheinlichkeiten von bestimmten Teilstrukturen. Dazu summiert man einfach alle Wahrscheinlichkeiten derjenigen Strukturen, welche diese Teilstruktur enthalten. Beschränkt man Teilstrukturen auf einzelne Basenpaare a, erhält man eine der wichtigsten Kenngrößen für die Beschreibung von Strukturen über einer Sequenz: die Basenpaarwahrscheinlichkeiten. p[a] = ∑ P ∋ap[P] = Q E[P] ∑P ∋a e− kT Q Da die Basenpaarwahrscheinlichkeiten alle Strukturen reflektieren, sind sie vollkommen unabhängig voneinander. Deshalb geben sie auch die In<strong>for</strong>mationen über alle möglichen globale Strukturen wieder. Bei der Berechnung des Zählers kann man auf die Zwischenergebnisse der Partitionsfunktion Q zurückgreifen. Dabei muss man jedoch beachten, dass ein Basenpaar sowohl in externen bzw. nicht schließenden Positionen vorkommen kann, aber auch von anderen Basenpaaren umschlossen werden kann. Letzteres hat wiederum eine Zerlegung in disjunkte Mengen zur Folge. Insgesamt kann man so in O(n 3 ) Zeit und mit O(n 2 ) Speicher alle Basenpaarwahrscheinlichkeiten einer Sequenz der Länge n bestimmen. Mit Hilfe dieser strukturellen In<strong>for</strong>mationen ist es nun möglich, die paarweisen lokalen Alignments zu berechnen. 3.2.2 Paarweise lokale Seqenz-Struktur-Alignments Bei den von mir entwickelten Algoritmus zur Lösung des in Definition 14 vorgestellten paarweisen lokalen Alignment-Problems handelt es sich um ein dynamisches Programmierverfahren. Dieses ermittelt unter Verwendung von Rekursionsgleichungen, deren Zwischenergebnisse für eine effiziente Berechnung in Tabellen gespeichert werden, den maximalen Score eines lokalen Alignments zweier Sequenzen. Die Lösung des paarweisen lokalen Alignment-Problems – also das optimale lokale Alignment – ergibt sich dann mittels Backtracking aus den Tabellen der Zwischenergebnisse. Die Rekursionsgleichungen Das Rekursionsschema des Algorithmus wird von zwei Arbeiten geprägt. Die Berechnung des Alignments bei gleichzeitiger Vorhersage einer gemeinsammen Struktur lehnt sich an einen Algorithmus von Hofacker et al. [HBS04] an. Die von mir verwendete Form der strukturellen Lokalität stammt hingegen aus einer Arbeit von Backofen und Will [BW04]. Der Hofacker-Algorithmus berechnet ein globales Alignment und findet dabei gleichzeitig die wahrscheinlichste gemeinsamme Sekundärstruktur zweier Sequenzen. Das paarweise lokale Alignment-Problems besteht hingegen daraus, das optimale lokales Sequenz-Struktur-Alignment über zwei Sequenzen zu finden. Da sowohl der Hofacker-Ansatz als auch das Alignment-Problem auf der selben Bewertungsfunktion (siehe Gleichung 2.1) beruhen, müssen die Hofacker-Rekursionsgleichungen für eine Lösung des Alignment-Problems nur dahingehend erweitert werden, dass sie ein nach Definition 12 lokales Alignment berechnen.
3.2. BESTANDTEILE 33 Der Hofacker-Algorithmus beruht dabei auf zwei Rekursionsgleichungen. Die erste Gleichung M wird dazu verwendet, um für jedes Paar von Teilsequenzen S R1 [i 1 ,j 1 ] und S R2 [i 2 ,j 2 ] über den beiden Eingabesequenzen S R1 und S R2 den Score M(i 1 ,j 1 ,i 2 ,j 2 ) des optimalen globalen Alignments von S R1 [i 1 ,j 1 ] und S R2 [i 2 ,j 2 ] zu berechnen. Dazu werden vier Rekusionsfälle unterschieden. Im ersten Fall wird ein Alignment um zwei alignierte Basen erweitert und dessen Score um die Ähnlichkeit σ der beiden Basen erhöht. Im zweiten und dritten Fall wird ein Alignment um eine Baseninsertion bzw. Basendeletion erweitert und zu dessen Score die Gap-Kosten addiert. Im vierten Fall wird schließlich ein Alignment, dessen Enden zwei gematchte Basenpaare bilden in ein anderes Alignment eingefügt und der Score der beiden Alignments kombiniert. Durch den letzten Rekusionsfall wird als Nebenprodukt zum eigentlichen Alignment auch eine gemeinsamme genestete Sekundärstruktur über den Sequenzen berechnet. Insgesamt ergibt sich also folgende Rekursionsgleichung: ⎧ M(i 1 ,j 1 − 1,i 2 ,j 2 − 1) + σ ( S R1 [j 1 ],S R2 [j 2 ] ) ⎪⎨ M(i 1 ,j 1 − 1,i 2 ,j 2 ) + γ M(i 1 ,j 1 ,i 2 ,j 2 )=max (3.1) M(i 1 ,j 1 ,i 2 ,j 2 − 1) + γ ⎪⎩ max M(i 1 ,k 1 ,i 2 ,k 2 )+ D ( (k 1 + 1,j 1 ),(k 2 +1,j 2 ) )} { i 1
Seite 1: Friedrich-Schiller- Universität Je
Seite 5 und 6: Inhaltsverzeichnis 1 Einleitung 1 1
Seite 7 und 8: Kapitel 1 Einleitung Für lange Zei
Seite 9 und 10: 1.1. MULTIPLE ALIGNMENTS 3 Sequenze
Seite 11 und 12: 1.1. MULTIPLE ALIGNMENTS 5 informat
Seite 13 und 14: 1.1. MULTIPLE ALIGNMENTS 7 1.1.2 Be
Seite 15 und 16: 1.2. VERWANDTE ARBEITEN 9 Eine ande
Seite 17 und 18: 1.2. VERWANDTE ARBEITEN 11 base−m
Seite 19 und 20: 1.3. ÜBERSICHT 13 a a e d b f b c
Seite 21 und 22: Kapitel 2 Vorbetrachtungen Bevor ic
Seite 23 und 24: 2.1. FORMALE DEFINITIONEN 17 Primä
Seite 25 und 26: 2.1. FORMALE DEFINITIONEN 19 Sequen
Seite 27 und 28: 2.1. FORMALE DEFINITIONEN 21 erlaub
Seite 29 und 30: 2.2. PROBLEMSTELLUNGEN 23 lokales A
Seite 31 und 32: 2.2. PROBLEMSTELLUNGEN 25 wobei p r
Seite 33 und 34: Kapitel 3 Der MuLoRA Ansatz In dies
Seite 35 und 36: 3.1. ÜBERBLICK 29 Sequenzen: A: GG
Seite 37: 3.2. BESTANDTEILE 31 3.2.1 Basenpaa
Seite 41 und 42: 3.2. BESTANDTEILE 35 Die Rekursion
Seite 43 und 44: 3.2. BESTANDTEILE 37 T( , ) j 1 j 2
Seite 45 und 46: 3.2. BESTANDTEILE 39 Paarweiser lok
Seite 47 und 48: 3.2. BESTANDTEILE 41 Abbildung 3.6:
Seite 49 und 50: 3.2. BESTANDTEILE 43 Positionen: mu
Seite 51 und 52: 3.3. KOMPLEXITÄTSBETRACHTUNGEN 45
Seite 53 und 54: 3.3. KOMPLEXITÄTSBETRACHTUNGEN 47
Seite 55: 3.3. KOMPLEXITÄTSBETRACHTUNGEN 49
Seite 58 und 59: 52 KAPITEL 4. ERGEBNISSE dabei aus
Seite 60 und 61: 54 KAPITEL 4. ERGEBNISSE Nummer nic
Seite 62 und 63: 56 KAPITEL 4. ERGEBNISSE Sequenzlä
Seite 64 und 65: 58 KAPITEL 4. ERGEBNISSE RF00433: n
Seite 66 und 67: 60 KAPITEL 4. ERGEBNISSE Bei den Be
Seite 68 und 69: 62 KAPITEL 4. ERGEBNISSE 4.2.4 Moti
Seite 70 und 71: 64 KAPITEL 5. ZUSAMMENFASSUNG UND A
Seite 72 und 73: 66 ANHANG A. ERGEBNISTABELLEN 0,01
Seite 74 und 75: 68 ANHANG A. ERGEBNISTABELLEN MuLoR
Seite 76 und 77: 70 ANHANG A. ERGEBNISTABELLEN A.2 U
Seite 78 und 79: 72 ANHANG A. ERGEBNISTABELLEN
Seite 80 und 81: 74 LITERATURVERZEICHNIS [Hof03] [HB
Seite 83: Selbständigkeitserklärung Hiermit

Friedrich-Schiller - Chair for Bioinformatics Freiburg

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?