29.12.2013 Aufrufe

Friedrich-Schiller - Chair for Bioinformatics Freiburg

Friedrich-Schiller - Chair for Bioinformatics Freiburg

Friedrich-Schiller - Chair for Bioinformatics Freiburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

18 KAPITEL 2. VORBETRACHTUNGEN<br />

U<br />

C C G<br />

U<br />

G<br />

10<br />

C<br />

A U<br />

U<br />

5 U A<br />

G C A<br />

A U A<br />

G C A<br />

15<br />

U<br />

U<br />

1<br />

plain<br />

23<br />

20<br />

U<br />

C<br />

G<br />

C G<br />

U A<br />

10<br />

U<br />

U<br />

C<br />

U<br />

5 A<br />

G C A<br />

A U A<br />

G C A<br />

15<br />

U<br />

U<br />

1<br />

nested<br />

23<br />

20<br />

crossing<br />

U<br />

C<br />

G<br />

C G<br />

10<br />

U<br />

G C UA<br />

U<br />

C<br />

U<br />

A<br />

A<br />

5<br />

A U A<br />

G C A<br />

15<br />

U<br />

U<br />

1<br />

23<br />

20<br />

plain<br />

nestet<br />

1 5 10 15 20<br />

U GA GU U C U C GA U C U C U A A A A U C G<br />

. . . . . . . . . . . . . . . . . . . . . . .<br />

1 5 10 15 20<br />

U GA GU U C U C GA U C U C U A A A A U C G<br />

. . . . . . . . ( ( ( ( . . . . . . . ) ) ) )<br />

crossing<br />

1 5 10 15 20<br />

U GA GU U C U C GA U C U C U A A A A U C G<br />

. a a a . . . . ( ( ( ( A A A . . . . ) ) ) )<br />

Abbildung 2.2: Das 3’-Ende der tRNA ähnlichen Turnip-Yellow-Mosaic-Virus-RNA<br />

in den drei Sekundärstrukturklassen. Der Pseudoknoten, welcher in der crossing-<br />

Sekundärstruktur durch das Ausbilden der grau hinterlegten Basenpaare entsteht,<br />

fungiert als Enhancer.<br />

Für die Darstellung von Sekundärstrukturen verwende ich dabei Graphen G =<br />

(V,E) mit V = {1...|S|} und E = {(i,i + 1) | 1 ≤ i < |S|} ∪P. Allerdings füge ich<br />

dabei für eine bessere Übersichtlichkeit anstatt der Positionsangaben die entsprechenden<br />

Basen ein und lasse die Kanten zwischen aufeinanderfolgenden Basen weg,<br />

sofern die Reihenfolge eindeutig zu erkennen ist.<br />

Weiterhin verwende ich eine linearisierte Darstellungs<strong>for</strong>m, welche aus der Sequenz<br />

und einem zusätzlichen Strukturstring der gleichen Länge besteht. Dieser<br />

kennzeichnet dabei in genesteten Strukturen alle linken Basenpaarenden mit ’(‘,<br />

alle rechten Basenpaarenden mit ’)‘ und alle ungepaarten Basen mit ’.‘.<br />

Für genestete Sekundärstrukturen ist die Zuordnung zwischen dem linken Ende<br />

und dem rechten Ende eines Basenpaars eindeutig. Bei crossing-Sekundärstrukturen<br />

wäre das nicht der Fall. Aus diesem Grund werden da zu den Klammersymbolen<br />

zusätzlich Buchstaben verwendet, wobei kleine Buchstaben das linke Ende und<br />

große Buchstaben das rechte Ende eines Basenpaars kennzeichnen. Abbildung 2.2<br />

zeigt ein Beispiel für die von mir verwendeten Darstellungs<strong>for</strong>men.<br />

Damit sind erst einmal die wichtigsten Begriffe zu RNA-Molekülen definiert. Als<br />

nächstes wende ich mich den Alignments zu.<br />

2.1.2 Alignments und Lokalität<br />

Aus den Eingabesequenzen und den Sekundärstrukturin<strong>for</strong>mationen in Form der<br />

Basenpaarwahrscheinlichkeiten werden als nächstes alle möglichen paarweisen Alignments<br />

berechnet. Dabei werden die Sequenzen mit Hilfe von neutralen Gap-Elementen<br />

‘−’ so angeordnet, dass sequenziell und strukturell ähnliche Bereiche in den<br />

gleichen Regionen stehen. Formal ausgedrückt bedeutet dies folgendes:<br />

Definition 8 (paarweises Alignment)<br />

Seien R 1 und R 2 zwei RNA-Moleküle, S R1 bzw. S R2 deren Sequenzen. Ferner sei<br />

ein Alignmentalphabet Σ A wie folgt definiert:<br />

Σ A = def ({1...|S R1 |} ∪ {−}) × ({1...|S R2 |} ∪ {−}) \ {(−, −)}.<br />

Dann ist ein paarweises Alignment A von S R1 und S R2 ein Wort über Σ A , bei dem<br />

für jedes g ∈ {1,2} die Aneinanderreihung aller g-ten Elemente ungleich ‘−’ der

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!