Friedrich-Schiller - Chair for Bioinformatics Freiburg
Friedrich-Schiller - Chair for Bioinformatics Freiburg
Friedrich-Schiller - Chair for Bioinformatics Freiburg
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
22 KAPITEL 2. VORBETRACHTUNGEN<br />
eines anderen Basenpaares gematcht sind. Damit lässt sich diese Form von Lokalität<br />
jedoch nur für Alignments und nicht für einzelne RNA-Moleküle definieren.<br />
Definition 12 (lokales paarweises Alignment)<br />
Seien R 1 und R 2 zwei Ribonukleinsäuren, (S R1 ,P R1 ) und (S R2 ,P R2 ) deren Sekundärstrukturen<br />
und A ein Alignment von S R1 und S R2 . Ferner sei ein konserviertes<br />
Basenpaar (i,j) aus Pg<br />
A mit g ∈ {1,2} genau dann direkter Nachfolger einer<br />
Exklusion [u,v ] in S Rg , wenn i < u ≤ v < j gilt und kein weiteres konserviertes<br />
Basenpaar (k,l) mit i < k < u ≤ v < l < j aus Pg<br />
A existiert.<br />
Dann ist A genau dann ein lokales paarweises Alignment, wenn es ohne Exklusionen<br />
ein globales Alignment zweier zusammenhängender Teilsequenzen von S R1<br />
und S R2 ist und die folgenden drei Punkte erfüllt sind:<br />
1. Für jede Exklusion [u 1 ,v 1 ] in S R1 existiert ein konserviertes Basenpaar (i 1 ,j 1 )<br />
aus P A 1 , welches direkter Nachfolger der Exklusion ist und keine andere Exklusion<br />
[u ′ 1,v ′ 1] hat (i 1 ,j 1 ) als direkten Nachfolger.<br />
2. Für jede Exklusion [u 2 ,v 2 ] in S R2 existiert ein konserviertes Basenpaar (i 2 ,j 2 )<br />
aus P A 2 , welches direkter Nachfolger der Exklusion ist und keine andere Exklusion<br />
[u ′ 2,v ′ 2] hat (i 2 ,j 2 ) als direkten Nachfolger.<br />
3. Für jedes Basenpaar (i g ,j g ) aus P A g mit g ∈ {1,2} exisitert eine Kante (i 1 ,i 2 )<br />
und eine Kante (j 1 ,j 2 ) in A.<br />
Durch die dritte Forderung wird die Behandlung von Basenpaaren als Einheit sichergestellt.<br />
Entweder sind beide Enden eines Basenpaars aligniert oder keines. Da<br />
der von mir verwendete Algorithmus zur Berechnung lokaler paarweiser Alignments<br />
die Struktur zusammen mit dem Alignment berechnet, wird diese Forderung von<br />
MuLoRA allerdings von vornherein erfüllt.<br />
Definition 12 entspricht damit genau der Vorstellung von zusammenhängenden<br />
Teilstrukturen. In ihrer Arbeit beweisen Backofen und Will [BW04] dazu, dass ein<br />
Alignment A zweier RNA-Sequenzen S R1 und S R2 genau dann lokal ist, wenn dessen<br />
Motiv-Graphen G A 1 und G A 2 jeweils zusammenhängend sind. Als Beispiel zeigt Abbildung<br />
2.5 ein lokales Alignment der beiden SECIS-Motive aus Abbildung 2.3, welchen<br />
die Exklusionen aus Abbildung 2.4 enthalten, sowie deren zusammenhängende<br />
Motiv-Graphen.<br />
Nachdem MuLoRA alle lokalen paarweisen Alignments berechnet hat, besteht<br />
die nächste Aufgabe darin, aus den erhaltenen Alignmentkanten ein multiples Alignment<br />
abzuleiten. Dabei stellt ein multiples Alignment eine natürliche Erweiterung<br />
eines paarweisen Alignments auf mehr als zwei Ribonukleinsäuren dar.<br />
Definition 13 (multiples Alignment)<br />
Seien R 1 bis R m RNA-Moleküle und S R1 bis S Rm deren Sequenzen. Ferner sei ein<br />
Alignmentalphabet Σ A m wie folgt definiert:<br />
Σ A m = def ({1...|S R1 |} ∪ {−}) × ... × ({1...|S Rm |} ∪ {−}) \ {(−,...,−)}.<br />
Dann ist ein multiples Alignment A m von S R1 bis S Rm ein Wort über Σ A m, bei<br />
dem für jedes g ∈ {1,...,m} die Aneinanderreihung aller g-ten Elemente ungleich<br />
‘−’ der einzelnen Kanten in der Reihenfolg ihres auftretens in A m ein Wort ergibt,<br />
welches aus aufsteigend sortierten Zahlen besteht.<br />
Weiterhin bezeichnet:<br />
• A m [i] die i-te Kante von A m ,<br />
• A m [g ][i] das g-te Element mit g ∈ {1,...,m} der i-ten Kante von A m und<br />
• |A m | die Anzahl der Kanten innerhalb des Alignments A m .