Friedrich-Schiller - Chair for Bioinformatics Freiburg
Friedrich-Schiller - Chair for Bioinformatics Freiburg
Friedrich-Schiller - Chair for Bioinformatics Freiburg
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
18 KAPITEL 2. VORBETRACHTUNGEN<br />
U<br />
C C G<br />
U<br />
G<br />
10<br />
C<br />
A U<br />
U<br />
5 U A<br />
G C A<br />
A U A<br />
G C A<br />
15<br />
U<br />
U<br />
1<br />
plain<br />
23<br />
20<br />
U<br />
C<br />
G<br />
C G<br />
U A<br />
10<br />
U<br />
U<br />
C<br />
U<br />
5 A<br />
G C A<br />
A U A<br />
G C A<br />
15<br />
U<br />
U<br />
1<br />
nested<br />
23<br />
20<br />
crossing<br />
U<br />
C<br />
G<br />
C G<br />
10<br />
U<br />
G C UA<br />
U<br />
C<br />
U<br />
A<br />
A<br />
5<br />
A U A<br />
G C A<br />
15<br />
U<br />
U<br />
1<br />
23<br />
20<br />
plain<br />
nestet<br />
1 5 10 15 20<br />
U GA GU U C U C GA U C U C U A A A A U C G<br />
. . . . . . . . . . . . . . . . . . . . . . .<br />
1 5 10 15 20<br />
U GA GU U C U C GA U C U C U A A A A U C G<br />
. . . . . . . . ( ( ( ( . . . . . . . ) ) ) )<br />
crossing<br />
1 5 10 15 20<br />
U GA GU U C U C GA U C U C U A A A A U C G<br />
. a a a . . . . ( ( ( ( A A A . . . . ) ) ) )<br />
Abbildung 2.2: Das 3’-Ende der tRNA ähnlichen Turnip-Yellow-Mosaic-Virus-RNA<br />
in den drei Sekundärstrukturklassen. Der Pseudoknoten, welcher in der crossing-<br />
Sekundärstruktur durch das Ausbilden der grau hinterlegten Basenpaare entsteht,<br />
fungiert als Enhancer.<br />
Für die Darstellung von Sekundärstrukturen verwende ich dabei Graphen G =<br />
(V,E) mit V = {1...|S|} und E = {(i,i + 1) | 1 ≤ i < |S|} ∪P. Allerdings füge ich<br />
dabei für eine bessere Übersichtlichkeit anstatt der Positionsangaben die entsprechenden<br />
Basen ein und lasse die Kanten zwischen aufeinanderfolgenden Basen weg,<br />
sofern die Reihenfolge eindeutig zu erkennen ist.<br />
Weiterhin verwende ich eine linearisierte Darstellungs<strong>for</strong>m, welche aus der Sequenz<br />
und einem zusätzlichen Strukturstring der gleichen Länge besteht. Dieser<br />
kennzeichnet dabei in genesteten Strukturen alle linken Basenpaarenden mit ’(‘,<br />
alle rechten Basenpaarenden mit ’)‘ und alle ungepaarten Basen mit ’.‘.<br />
Für genestete Sekundärstrukturen ist die Zuordnung zwischen dem linken Ende<br />
und dem rechten Ende eines Basenpaars eindeutig. Bei crossing-Sekundärstrukturen<br />
wäre das nicht der Fall. Aus diesem Grund werden da zu den Klammersymbolen<br />
zusätzlich Buchstaben verwendet, wobei kleine Buchstaben das linke Ende und<br />
große Buchstaben das rechte Ende eines Basenpaars kennzeichnen. Abbildung 2.2<br />
zeigt ein Beispiel für die von mir verwendeten Darstellungs<strong>for</strong>men.<br />
Damit sind erst einmal die wichtigsten Begriffe zu RNA-Molekülen definiert. Als<br />
nächstes wende ich mich den Alignments zu.<br />
2.1.2 Alignments und Lokalität<br />
Aus den Eingabesequenzen und den Sekundärstrukturin<strong>for</strong>mationen in Form der<br />
Basenpaarwahrscheinlichkeiten werden als nächstes alle möglichen paarweisen Alignments<br />
berechnet. Dabei werden die Sequenzen mit Hilfe von neutralen Gap-Elementen<br />
‘−’ so angeordnet, dass sequenziell und strukturell ähnliche Bereiche in den<br />
gleichen Regionen stehen. Formal ausgedrückt bedeutet dies folgendes:<br />
Definition 8 (paarweises Alignment)<br />
Seien R 1 und R 2 zwei RNA-Moleküle, S R1 bzw. S R2 deren Sequenzen. Ferner sei<br />
ein Alignmentalphabet Σ A wie folgt definiert:<br />
Σ A = def ({1...|S R1 |} ∪ {−}) × ({1...|S R2 |} ∪ {−}) \ {(−, −)}.<br />
Dann ist ein paarweises Alignment A von S R1 und S R2 ein Wort über Σ A , bei dem<br />
für jedes g ∈ {1,2} die Aneinanderreihung aller g-ten Elemente ungleich ‘−’ der