Friedrich-Schiller - Chair for Bioinformatics Freiburg

Weitere Magazine

Empfehlungen

Info

18 KAPITEL 2. VORBETRACHTUNGEN U C C G U G 10 C A U U 5 U A G C A A U A G C A 15 U U 1 plain 23 20 U C G C G U A 10 U U C U 5 A G C A A U A G C A 15 U U 1 nested 23 20 crossing U C G C G 10 U G C UA U C U A A 5 A U A G C A 15 U U 1 23 20 plain nestet 1 5 10 15 20 U GA GU U C U C GA U C U C U A A A A U C G . . . . . . . . . . . . . . . . . . . . . . . 1 5 10 15 20 U GA GU U C U C GA U C U C U A A A A U C G . . . . . . . . ( ( ( ( . . . . . . . ) ) ) ) crossing 1 5 10 15 20 U GA GU U C U C GA U C U C U A A A A U C G . a a a . . . . ( ( ( ( A A A . . . . ) ) ) ) Abbildung 2.2: Das 3’-Ende der tRNA ähnlichen Turnip-Yellow-Mosaic-Virus-RNA in den drei Sekundärstrukturklassen. Der Pseudoknoten, welcher in der crossing- Sekundärstruktur durch das Ausbilden der grau hinterlegten Basenpaare entsteht, fungiert als Enhancer. Für die Darstellung von Sekundärstrukturen verwende ich dabei Graphen G = (V,E) mit V = {1...|S|} und E = {(i,i + 1) | 1 ≤ i < |S|} ∪P. Allerdings füge ich dabei für eine bessere Übersichtlichkeit anstatt der Positionsangaben die entsprechenden Basen ein und lasse die Kanten zwischen aufeinanderfolgenden Basen weg, sofern die Reihenfolge eindeutig zu erkennen ist. Weiterhin verwende ich eine linearisierte Darstellungsform, welche aus der Sequenz und einem zusätzlichen Strukturstring der gleichen Länge besteht. Dieser kennzeichnet dabei in genesteten Strukturen alle linken Basenpaarenden mit ’(‘, alle rechten Basenpaarenden mit ’)‘ und alle ungepaarten Basen mit ’.‘. Für genestete Sekundärstrukturen ist die Zuordnung zwischen dem linken Ende und dem rechten Ende eines Basenpaars eindeutig. Bei crossing-Sekundärstrukturen wäre das nicht der Fall. Aus diesem Grund werden da zu den Klammersymbolen zusätzlich Buchstaben verwendet, wobei kleine Buchstaben das linke Ende und große Buchstaben das rechte Ende eines Basenpaars kennzeichnen. Abbildung 2.2 zeigt ein Beispiel für die von mir verwendeten Darstellungsformen. Damit sind erst einmal die wichtigsten Begriffe zu RNA-Molekülen definiert. Als nächstes wende ich mich den Alignments zu. 2.1.2 Alignments und Lokalität Aus den Eingabesequenzen und den Sekundärstrukturinformationen in Form der Basenpaarwahrscheinlichkeiten werden als nächstes alle möglichen paarweisen Alignments berechnet. Dabei werden die Sequenzen mit Hilfe von neutralen Gap-Elementen ‘−’ so angeordnet, dass sequenziell und strukturell ähnliche Bereiche in den gleichen Regionen stehen. Formal ausgedrückt bedeutet dies folgendes: Definition 8 (paarweises Alignment) Seien R 1 und R 2 zwei RNA-Moleküle, S R1 bzw. S R2 deren Sequenzen. Ferner sei ein Alignmentalphabet Σ A wie folgt definiert: Σ A = def ({1...|S R1 |} ∪ {−}) × ({1...|S R2 |} ∪ {−}) \ {(−, −)}. Dann ist ein paarweises Alignment A von S R1 und S R2 ein Wort über Σ A , bei dem für jedes g ∈ {1,2} die Aneinanderreihung aller g-ten Elemente ungleich ‘−’ der
2.1. FORMALE DEFINITIONEN 19 Sequenzstrukturen: C A G G 15 C A 10 A A G C A G U 5A C G G C 20 A U 1C G Y11110 15 G A C U C A U U A 10 A A C G 20 A G U G 5 A C G A U A U 25 1A U AF021345 paarweises Alignment: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 − − − 15 16 17 − 18 19 20 21 22 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 Sequenzdarstellung: 1 5 10 15 20 ( ( ( ( ( . . . . ( . . . . . . . . . ) . . ) ) ) ) C A G C A U A A A G C G C A − − − G A C − GG C U G A A A C A U A A A C U A U G A C C U A GGGG U U U ( ( ( ( ( . . . . ( ( ( . . . . . ) ) ) . . ) ) ) ) 1 5 10 15 20 25 Abbildung 2.3: Paarweises Alignment der Sequenzen zweier SECIS-Motive. einzelnen Kanten in der Reihenfolg ihres Auftretens in A ein Wort ergibt, welches aus aufsteigend sortierten Zahlen besteht. Weiterhin bezeichnet: • A[i] die i-te Kante von A, • A[g ][i] das g-te Element mit g ∈ {1,2} der i-ten Kante von A und • |A| die Anzahl der Kanten innerhalb des Alignments A. Die Elemente in einer Kante geben dabei die Positionen der Buchstaben innerhalb der entsprechenden Sequenzen an. Sollten dabei Gap-Symbole ‘−’ vorkommen, werden an den entsprechenden Stellen keine Buchstaben eingefügt. Abbildung 2.3 zeigt ein Beispiel für ein Alignment der Sequenzen zweier SECIS-Motive. Für die Darstellung paarweiser Alignments in dieser Arbeit verwende ich die Sequenzen über denen das Alignment berechnet wurde. Dabei werden diese mit Hilfe des Gap-Symbols so angeordnet, dass alignierte Positionen übereinander stehen. Bei Alignments von Sekundärstrukturen gebe ich dabei zusätzlich noch den Strukturstring an. Nach Definition 8 braucht ein paarweises Alignment A nicht für jede Position der Sequenzen S R1 bzw. S R2 eine Kante zu enthalten. Damit handelt es sich bei dieser Definition nicht um globale Alignments. Diese müssten zusätzlich sowohl für jedes 1 ≤ i 1 ≤ |S R1 | als auch für jedes 1 ≤ j 2 ≤ |S R2 | ein Kante (i 1 ,i 2 ) und eine Kante (j 1 ,j 2 ) enthalten. Da das Alignment also nicht global sein muss, benötige ich noch Formalismen, welche Informationen über die im Alignment vorkommenden Sequenzabschnitte und Strukturen liefern: Definition 9 Seien R 1 und R 2 zwei Ribonukleinsäuren, (S R1 ,P R1 ) und (S R2 ,P R2 ) deren Sekundärstrukturen und A ein Alignment von S R1 und S R2 . Dann ist: • π g (A) = { i g ∈ { 1...|S Rg | } | ∃(i 1 ,i 2 ) in A } ,g ∈ {1,2} (Die Menge der in A alignierten Positionen der g-ten Sequenz) • P A g = { (i g ,j g ) ∈ P Rg | ∃(i 1 ,i 2 ) in A ∧ ∃(j 1 ,j 2 ) in A } ,g ∈ {1,2} (Die Menge der in A alignierten Basenpaare der g-ten Strukturmenge)
Seite 1: Friedrich-Schiller- Universität Je
Seite 5 und 6: Inhaltsverzeichnis 1 Einleitung 1 1
Seite 7 und 8: Kapitel 1 Einleitung Für lange Zei
Seite 9 und 10: 1.1. MULTIPLE ALIGNMENTS 3 Sequenze
Seite 11 und 12: 1.1. MULTIPLE ALIGNMENTS 5 informat
Seite 13 und 14: 1.1. MULTIPLE ALIGNMENTS 7 1.1.2 Be
Seite 15 und 16: 1.2. VERWANDTE ARBEITEN 9 Eine ande
Seite 17 und 18: 1.2. VERWANDTE ARBEITEN 11 base−m
Seite 19 und 20: 1.3. ÜBERSICHT 13 a a e d b f b c
Seite 21 und 22: Kapitel 2 Vorbetrachtungen Bevor ic
Seite 23: 2.1. FORMALE DEFINITIONEN 17 Primä
Seite 27 und 28: 2.1. FORMALE DEFINITIONEN 21 erlaub
Seite 29 und 30: 2.2. PROBLEMSTELLUNGEN 23 lokales A
Seite 31 und 32: 2.2. PROBLEMSTELLUNGEN 25 wobei p r
Seite 33 und 34: Kapitel 3 Der MuLoRA Ansatz In dies
Seite 35 und 36: 3.1. ÜBERBLICK 29 Sequenzen: A: GG
Seite 37 und 38: 3.2. BESTANDTEILE 31 3.2.1 Basenpaa
Seite 39 und 40: 3.2. BESTANDTEILE 33 Der Hofacker-A
Seite 41 und 42: 3.2. BESTANDTEILE 35 Die Rekursion
Seite 43 und 44: 3.2. BESTANDTEILE 37 T( , ) j 1 j 2
Seite 45 und 46: 3.2. BESTANDTEILE 39 Paarweiser lok
Seite 47 und 48: 3.2. BESTANDTEILE 41 Abbildung 3.6:
Seite 49 und 50: 3.2. BESTANDTEILE 43 Positionen: mu
Seite 51 und 52: 3.3. KOMPLEXITÄTSBETRACHTUNGEN 45
Seite 53 und 54: 3.3. KOMPLEXITÄTSBETRACHTUNGEN 47
Seite 55: 3.3. KOMPLEXITÄTSBETRACHTUNGEN 49
Seite 58 und 59: 52 KAPITEL 4. ERGEBNISSE dabei aus
Seite 60 und 61: 54 KAPITEL 4. ERGEBNISSE Nummer nic
Seite 62 und 63: 56 KAPITEL 4. ERGEBNISSE Sequenzlä
Seite 64 und 65: 58 KAPITEL 4. ERGEBNISSE RF00433: n
Seite 66 und 67: 60 KAPITEL 4. ERGEBNISSE Bei den Be
Seite 68 und 69: 62 KAPITEL 4. ERGEBNISSE 4.2.4 Moti
Seite 70 und 71: 64 KAPITEL 5. ZUSAMMENFASSUNG UND A
Seite 72 und 73: 66 ANHANG A. ERGEBNISTABELLEN 0,01
Seite 74 und 75:
68 ANHANG A. ERGEBNISTABELLEN MuLoR
Seite 76 und 77:
70 ANHANG A. ERGEBNISTABELLEN A.2 U
Seite 78 und 79:
72 ANHANG A. ERGEBNISTABELLEN
Seite 80 und 81:
74 LITERATURVERZEICHNIS [Hof03] [HB
Seite 83:
Selbständigkeitserklärung Hiermit
Alle anzeigen

Friedrich-Schiller - Chair for Bioinformatics Freiburg

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?