Friedrich-Schiller - Chair for Bioinformatics Freiburg
Friedrich-Schiller - Chair for Bioinformatics Freiburg
Friedrich-Schiller - Chair for Bioinformatics Freiburg
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
20 KAPITEL 2. VORBETRACHTUNGEN<br />
• Π A g = {1...|S Rg |} ∩ { i | ∃(i,j) ∈ P Rg ∨ ∃(j,i) ∈ P Rg<br />
}<br />
,g ∈ {1,2}<br />
(Die Menge der Positionen der g-ten Sequenz, welche in A nicht an einem<br />
alignierten Basenpaar beteiligt sind)<br />
Für die Darstellung alignierten Teilstrukturen verwende ich Motiv-Graphen. Diese<br />
bestehen nur aus denjenigen Basen und Basenpaaren, welche im Alignment durch<br />
Kanten repräsentiert werden.<br />
Definition 10 (Motiv-Graph)<br />
Seien R 1 und R 2 zwei RNAs und (S R1 ,P R1 ) und (S R2 ,P R2 ) deren Sekundärstrukturen.<br />
Ferner sei A ein Alignment von S R1 und S R2 . Dann sind die Motiv-Graphen<br />
G A g = (Vg A ,Eg A ) von A mit g ∈ {1,2} wie folgt definiert:<br />
V A<br />
g = π g<br />
E A g = { (i,i + 1) | i ∈ V A<br />
g<br />
∧ i + 1 ∈ Vg<br />
A }<br />
∪ P<br />
A<br />
g<br />
In Analogie zur Darstellung der Sekundärstrukturen füge ich auch bei den Motiv-<br />
Graphen die entsprechenden Basen für die Postionsnummern ein und lasse die Kanten<br />
zwischen aufeinanderfolgenden Basen weg, sofern die Reihenfolge eindeutig zu<br />
erkennen ist.<br />
Damit wäre der Begriff des Alignments geklärt. Doch was genau macht nun<br />
ein lokales RNA-Sequenz-Struktur-Alignment aus? Welche Abhängigkeiten bestehen<br />
innerhalb von Molekülen und wie sollen sich diese Einschränkungen bemerkbar<br />
machen? Diesen und andere Fragen werde ich nun nachgehen, wobei ich mich an<br />
den Lokalitätsbegriff von Backofen und Will [BW04] halten werde.<br />
In der Natur weisen Moleküle – seien dies nun Proteine, RNA oder DNA – oft<br />
nur in bestimmten Bereichen eine hohe Ähnlichkeit auf, während der Rest vollkommen<br />
divergent ist. Beispiele dafür sind Proteine, die über eine gleiche Domäne<br />
verfügen, erweiterte Bereiche von genomischer DNA oder strukturelle RNA-Motive.<br />
Aber auch Moleküle, die den selben evolutionären Ursprung besitzen, weisen mitunter<br />
nur noch in Teilbereichen eine nachweisbare Ähnlichkeit auf, da der Selektionsdruck<br />
nur für diese Bereiche hoch genug war um ein auseinanderdriften zu verhindern.<br />
Die beiden Sequenzen in Abbildung 2.3 bilden beispielsweise das gleiche<br />
strukturelle Motiv aus (siehe Abbildung 2.5), werden aber von divergenten Loops<br />
unterbrochen.<br />
Durch diesen Hintergrund motiviert ist es sinnvoll, bei der Suche nach Motiven<br />
mit Hilfe von Alignments das Weglassen bestimmter Bereiche zu erlauben – oder<br />
andersherum ausgedrückt – nur bestimmte Bereiche zu alignieren.<br />
Dabei können allerdings nicht beliebige Bereiche ausgelassen werden. Um biologisch<br />
sinnvolle Alignments zu erhalten, müssen die alignierten Bereiche in irgendeiner<br />
Form zusammenhängend sein. Bei RNAs, denen ich mich nun wieder zuwenden<br />
werde, wird der Zusammenhang zum einen von dem Polyphosphatrückgrad gebildet.<br />
Auf der Ebene der Sequenz-Alignments bestimmt diese Form des Zusammenhangs<br />
auch die herkömliche Definition lokaler Alignments als globale Alignments von Teilsequenzen.<br />
Dieser Definition liegt auch einer der bekanntesten Ansätze für lokale<br />
Sequenzalignments zugrunde, der Smith-Waterman-Algorithmus [SW81].<br />
Eine Erweiterung dieses Ansatzes stellen Programme wie BLAST [AGM90]<br />
dar, welche gleich mehrere isolierte Paare von unabhängig alignierten und bewerteten<br />
Teilsequenzen liefern. Diese entsprechen dann einfach den k-besten nicht<br />
überlappenden lokalen Alignments.<br />
Bei Sequenz-Struktur-Alignments gestaltet sich der Lokalitätsbegriff allerdings<br />
schwieriger. Neben den Polyphosphatrückgrad kommt hier zusätzlich noch die Sekundärstruktur<br />
als neuer Faktor bei dem Zusammenhang hinzu. Dieser wird nun neben<br />
den kovalenten Bindungen des Rückgrades auch durch die Wasserstoffbrückenbindungen<br />
der Basenpaare erreicht.