Friedrich-Schiller - Chair for Bioinformatics Freiburg

Weitere Magazine

Empfehlungen

Info

20 KAPITEL 2. VORBETRACHTUNGEN • Π A g = {1...|S Rg |} ∩ { i | ∃(i,j) ∈ P Rg ∨ ∃(j,i) ∈ P Rg } ,g ∈ {1,2} (Die Menge der Positionen der g-ten Sequenz, welche in A nicht an einem alignierten Basenpaar beteiligt sind) Für die Darstellung alignierten Teilstrukturen verwende ich Motiv-Graphen. Diese bestehen nur aus denjenigen Basen und Basenpaaren, welche im Alignment durch Kanten repräsentiert werden. Definition 10 (Motiv-Graph) Seien R 1 und R 2 zwei RNAs und (S R1 ,P R1 ) und (S R2 ,P R2 ) deren Sekundärstrukturen. Ferner sei A ein Alignment von S R1 und S R2 . Dann sind die Motiv-Graphen G A g = (Vg A ,Eg A ) von A mit g ∈ {1,2} wie folgt definiert: V A g = π g E A g = { (i,i + 1) | i ∈ V A g ∧ i + 1 ∈ Vg A } ∪ P A g In Analogie zur Darstellung der Sekundärstrukturen füge ich auch bei den Motiv- Graphen die entsprechenden Basen für die Postionsnummern ein und lasse die Kanten zwischen aufeinanderfolgenden Basen weg, sofern die Reihenfolge eindeutig zu erkennen ist. Damit wäre der Begriff des Alignments geklärt. Doch was genau macht nun ein lokales RNA-Sequenz-Struktur-Alignment aus? Welche Abhängigkeiten bestehen innerhalb von Molekülen und wie sollen sich diese Einschränkungen bemerkbar machen? Diesen und andere Fragen werde ich nun nachgehen, wobei ich mich an den Lokalitätsbegriff von Backofen und Will [BW04] halten werde. In der Natur weisen Moleküle – seien dies nun Proteine, RNA oder DNA – oft nur in bestimmten Bereichen eine hohe Ähnlichkeit auf, während der Rest vollkommen divergent ist. Beispiele dafür sind Proteine, die über eine gleiche Domäne verfügen, erweiterte Bereiche von genomischer DNA oder strukturelle RNA-Motive. Aber auch Moleküle, die den selben evolutionären Ursprung besitzen, weisen mitunter nur noch in Teilbereichen eine nachweisbare Ähnlichkeit auf, da der Selektionsdruck nur für diese Bereiche hoch genug war um ein auseinanderdriften zu verhindern. Die beiden Sequenzen in Abbildung 2.3 bilden beispielsweise das gleiche strukturelle Motiv aus (siehe Abbildung 2.5), werden aber von divergenten Loops unterbrochen. Durch diesen Hintergrund motiviert ist es sinnvoll, bei der Suche nach Motiven mit Hilfe von Alignments das Weglassen bestimmter Bereiche zu erlauben – oder andersherum ausgedrückt – nur bestimmte Bereiche zu alignieren. Dabei können allerdings nicht beliebige Bereiche ausgelassen werden. Um biologisch sinnvolle Alignments zu erhalten, müssen die alignierten Bereiche in irgendeiner Form zusammenhängend sein. Bei RNAs, denen ich mich nun wieder zuwenden werde, wird der Zusammenhang zum einen von dem Polyphosphatrückgrad gebildet. Auf der Ebene der Sequenz-Alignments bestimmt diese Form des Zusammenhangs auch die herkömliche Definition lokaler Alignments als globale Alignments von Teilsequenzen. Dieser Definition liegt auch einer der bekanntesten Ansätze für lokale Sequenzalignments zugrunde, der Smith-Waterman-Algorithmus [SW81]. Eine Erweiterung dieses Ansatzes stellen Programme wie BLAST [AGM90] dar, welche gleich mehrere isolierte Paare von unabhängig alignierten und bewerteten Teilsequenzen liefern. Diese entsprechen dann einfach den k-besten nicht überlappenden lokalen Alignments. Bei Sequenz-Struktur-Alignments gestaltet sich der Lokalitätsbegriff allerdings schwieriger. Neben den Polyphosphatrückgrad kommt hier zusätzlich noch die Sekundärstruktur als neuer Faktor bei dem Zusammenhang hinzu. Dieser wird nun neben den kovalenten Bindungen des Rückgrades auch durch die Wasserstoffbrückenbindungen der Basenpaare erreicht.
2.1. FORMALE DEFINITIONEN 21 erlaubte Exklusionen: verbotene Exklusionen: C A G G 15 C A 10 G C A A A G U 5A C G G C 20 A U 1C G Y11110 G A C U C A U U A C G 10 A A A U 5 A C A A 1A 15 G U U U 20 G G 25 AF021345 C A A C U G A C A A U G C C G C A A C U G A C A A U G C C G Abbildung 2.4: Die beiden linken Sequenzstrukturen zeigen mögliche Exklusionen (grau hinterlegt) für die beiden SECIS-Motive aus Abbildung 2.3. Die beiden rechten Sequenzstrukturen enthalten hingegen nicht erlaubte Exklusionen. In der ersten wurden in einem Loop zwei Exklusionen durchgeführt, wärend sich in der zweiten Sequenzstruktur die Exklusion außerhalb eines Loops befindet. Damit erweitert sich die Definition lokaler Alignments bei Sekundärstrukturen von globalen Alignments von Teilsequenzen zu globalen Alignments von Teilstrukturen. Aus diesem Grund ist es jetzt auch möglich, aus zusammenhängenden Teilsequenzen wiederum kleinere Teilsequenzen auszuschließen. Definition 11 (Exklusion) Sei A ein Alignment zweier RNA-Sequenzen S R1 und S R2 . Eine Exklusion in S Rg mit g ∈ {1,2} ist dann als ein Bereich [u,v ] definiert, der folgende Eigenschaften erfüllt: 1. u ≤ v, 2. u − 1 ∈ π g (A), 3. v + 1 ∈ π g (A) und 4. {u,...,v} ∩ π g (A) = ∅. Allerdings darf durch eine Exklusion nicht der Zusammenhang der Teilsequenzen zerstört werden. Um dies zu gewährleisten, darf nur maximal eine Exklusion pro Loop – egal welche Art von Loop – durchgeführt werden. Abbildung 2.4 zeigt Beispiele für erlaubte und verbotene Exklusionen. Obwohl durch Exklusionen mehrere, sequentiell nicht verbundene Teilstücke entstehen, hat ein Alignment dieser Sequenzbereiche jedoch nichts mit der bereits erwähnten Erweiterung auf die k-besten nicht überlappenden lokalen Alignments zu tun. Die durch die Basenpaare hervorgerufene Abhängigkeit verbietet in diesem Fall eine unabhängige Behandlung der Teilsequenzen. Natürlich ist aber auch für Sequenz-Struktur-Alignments eine Erweiterung auf die k-besten nicht überlappenden lokalen Alignments möglich. Dabei können Teilsequenzen jedoch nur dann unabhängig aligniert werden, wenn kein Basenpaar zwischen ihnen existiert. Aus biologischer Sicht ist es bei Exklusionen jedoch nicht sinnvoll, beliebige Basenpaare für das Bilden einer Verbindung zwischen zwei ansonsten isolierten Teilsequenzen zuzulassen. Da das Ziel darin besteht, konservierte Sequenz-Struktur- Bereiche zu finden, sollten diese verbindenden Basenpaare ebenfalls konserviert sein. Dabei gilt hier ein Basenpaar genau dann als konserviert, wenn dessen Anfangs und Endpositionen im paarweisen Alignment mit den entsprechenden Positionen
Seite 1: Friedrich-Schiller- Universität Je
Seite 5 und 6: Inhaltsverzeichnis 1 Einleitung 1 1
Seite 7 und 8: Kapitel 1 Einleitung Für lange Zei
Seite 9 und 10: 1.1. MULTIPLE ALIGNMENTS 3 Sequenze
Seite 11 und 12: 1.1. MULTIPLE ALIGNMENTS 5 informat
Seite 13 und 14: 1.1. MULTIPLE ALIGNMENTS 7 1.1.2 Be
Seite 15 und 16: 1.2. VERWANDTE ARBEITEN 9 Eine ande
Seite 17 und 18: 1.2. VERWANDTE ARBEITEN 11 base−m
Seite 19 und 20: 1.3. ÜBERSICHT 13 a a e d b f b c
Seite 21 und 22: Kapitel 2 Vorbetrachtungen Bevor ic
Seite 23 und 24: 2.1. FORMALE DEFINITIONEN 17 Primä
Seite 25: 2.1. FORMALE DEFINITIONEN 19 Sequen
Seite 29 und 30: 2.2. PROBLEMSTELLUNGEN 23 lokales A
Seite 31 und 32: 2.2. PROBLEMSTELLUNGEN 25 wobei p r
Seite 33 und 34: Kapitel 3 Der MuLoRA Ansatz In dies
Seite 35 und 36: 3.1. ÜBERBLICK 29 Sequenzen: A: GG
Seite 37 und 38: 3.2. BESTANDTEILE 31 3.2.1 Basenpaa
Seite 39 und 40: 3.2. BESTANDTEILE 33 Der Hofacker-A
Seite 41 und 42: 3.2. BESTANDTEILE 35 Die Rekursion
Seite 43 und 44: 3.2. BESTANDTEILE 37 T( , ) j 1 j 2
Seite 45 und 46: 3.2. BESTANDTEILE 39 Paarweiser lok
Seite 47 und 48: 3.2. BESTANDTEILE 41 Abbildung 3.6:
Seite 49 und 50: 3.2. BESTANDTEILE 43 Positionen: mu
Seite 51 und 52: 3.3. KOMPLEXITÄTSBETRACHTUNGEN 45
Seite 53 und 54: 3.3. KOMPLEXITÄTSBETRACHTUNGEN 47
Seite 55: 3.3. KOMPLEXITÄTSBETRACHTUNGEN 49
Seite 58 und 59: 52 KAPITEL 4. ERGEBNISSE dabei aus
Seite 60 und 61: 54 KAPITEL 4. ERGEBNISSE Nummer nic
Seite 62 und 63: 56 KAPITEL 4. ERGEBNISSE Sequenzlä
Seite 64 und 65: 58 KAPITEL 4. ERGEBNISSE RF00433: n
Seite 66 und 67: 60 KAPITEL 4. ERGEBNISSE Bei den Be
Seite 68 und 69: 62 KAPITEL 4. ERGEBNISSE 4.2.4 Moti
Seite 70 und 71: 64 KAPITEL 5. ZUSAMMENFASSUNG UND A
Seite 72 und 73: 66 ANHANG A. ERGEBNISTABELLEN 0,01
Seite 74 und 75: 68 ANHANG A. ERGEBNISTABELLEN MuLoR
Seite 76 und 77:
70 ANHANG A. ERGEBNISTABELLEN A.2 U
Seite 78 und 79:
72 ANHANG A. ERGEBNISTABELLEN
Seite 80 und 81:
74 LITERATURVERZEICHNIS [Hof03] [HB
Seite 83:
Selbständigkeitserklärung Hiermit
Alle anzeigen

Friedrich-Schiller - Chair for Bioinformatics Freiburg

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?