29.12.2013 Aufrufe

Friedrich-Schiller - Chair for Bioinformatics Freiburg

Friedrich-Schiller - Chair for Bioinformatics Freiburg

Friedrich-Schiller - Chair for Bioinformatics Freiburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

20 KAPITEL 2. VORBETRACHTUNGEN<br />

• Π A g = {1...|S Rg |} ∩ { i | ∃(i,j) ∈ P Rg ∨ ∃(j,i) ∈ P Rg<br />

}<br />

,g ∈ {1,2}<br />

(Die Menge der Positionen der g-ten Sequenz, welche in A nicht an einem<br />

alignierten Basenpaar beteiligt sind)<br />

Für die Darstellung alignierten Teilstrukturen verwende ich Motiv-Graphen. Diese<br />

bestehen nur aus denjenigen Basen und Basenpaaren, welche im Alignment durch<br />

Kanten repräsentiert werden.<br />

Definition 10 (Motiv-Graph)<br />

Seien R 1 und R 2 zwei RNAs und (S R1 ,P R1 ) und (S R2 ,P R2 ) deren Sekundärstrukturen.<br />

Ferner sei A ein Alignment von S R1 und S R2 . Dann sind die Motiv-Graphen<br />

G A g = (Vg A ,Eg A ) von A mit g ∈ {1,2} wie folgt definiert:<br />

V A<br />

g = π g<br />

E A g = { (i,i + 1) | i ∈ V A<br />

g<br />

∧ i + 1 ∈ Vg<br />

A }<br />

∪ P<br />

A<br />

g<br />

In Analogie zur Darstellung der Sekundärstrukturen füge ich auch bei den Motiv-<br />

Graphen die entsprechenden Basen für die Postionsnummern ein und lasse die Kanten<br />

zwischen aufeinanderfolgenden Basen weg, sofern die Reihenfolge eindeutig zu<br />

erkennen ist.<br />

Damit wäre der Begriff des Alignments geklärt. Doch was genau macht nun<br />

ein lokales RNA-Sequenz-Struktur-Alignment aus? Welche Abhängigkeiten bestehen<br />

innerhalb von Molekülen und wie sollen sich diese Einschränkungen bemerkbar<br />

machen? Diesen und andere Fragen werde ich nun nachgehen, wobei ich mich an<br />

den Lokalitätsbegriff von Backofen und Will [BW04] halten werde.<br />

In der Natur weisen Moleküle – seien dies nun Proteine, RNA oder DNA – oft<br />

nur in bestimmten Bereichen eine hohe Ähnlichkeit auf, während der Rest vollkommen<br />

divergent ist. Beispiele dafür sind Proteine, die über eine gleiche Domäne<br />

verfügen, erweiterte Bereiche von genomischer DNA oder strukturelle RNA-Motive.<br />

Aber auch Moleküle, die den selben evolutionären Ursprung besitzen, weisen mitunter<br />

nur noch in Teilbereichen eine nachweisbare Ähnlichkeit auf, da der Selektionsdruck<br />

nur für diese Bereiche hoch genug war um ein auseinanderdriften zu verhindern.<br />

Die beiden Sequenzen in Abbildung 2.3 bilden beispielsweise das gleiche<br />

strukturelle Motiv aus (siehe Abbildung 2.5), werden aber von divergenten Loops<br />

unterbrochen.<br />

Durch diesen Hintergrund motiviert ist es sinnvoll, bei der Suche nach Motiven<br />

mit Hilfe von Alignments das Weglassen bestimmter Bereiche zu erlauben – oder<br />

andersherum ausgedrückt – nur bestimmte Bereiche zu alignieren.<br />

Dabei können allerdings nicht beliebige Bereiche ausgelassen werden. Um biologisch<br />

sinnvolle Alignments zu erhalten, müssen die alignierten Bereiche in irgendeiner<br />

Form zusammenhängend sein. Bei RNAs, denen ich mich nun wieder zuwenden<br />

werde, wird der Zusammenhang zum einen von dem Polyphosphatrückgrad gebildet.<br />

Auf der Ebene der Sequenz-Alignments bestimmt diese Form des Zusammenhangs<br />

auch die herkömliche Definition lokaler Alignments als globale Alignments von Teilsequenzen.<br />

Dieser Definition liegt auch einer der bekanntesten Ansätze für lokale<br />

Sequenzalignments zugrunde, der Smith-Waterman-Algorithmus [SW81].<br />

Eine Erweiterung dieses Ansatzes stellen Programme wie BLAST [AGM90]<br />

dar, welche gleich mehrere isolierte Paare von unabhängig alignierten und bewerteten<br />

Teilsequenzen liefern. Diese entsprechen dann einfach den k-besten nicht<br />

überlappenden lokalen Alignments.<br />

Bei Sequenz-Struktur-Alignments gestaltet sich der Lokalitätsbegriff allerdings<br />

schwieriger. Neben den Polyphosphatrückgrad kommt hier zusätzlich noch die Sekundärstruktur<br />

als neuer Faktor bei dem Zusammenhang hinzu. Dieser wird nun neben<br />

den kovalenten Bindungen des Rückgrades auch durch die Wasserstoffbrückenbindungen<br />

der Basenpaare erreicht.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!