Friedrich-Schiller - Chair for Bioinformatics Freiburg
Friedrich-Schiller - Chair for Bioinformatics Freiburg
Friedrich-Schiller - Chair for Bioinformatics Freiburg
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Zusammenfassung<br />
Für lange Zeit galten Ribonukleinsäuren in der Wissenschaft hauptsächlich als Botenstoffe<br />
bei der Umwandlung genetischer In<strong>for</strong>mationen in Proteine. Doch mit<br />
der Entdeckung einer Vielzahl neuer Funktionen wanderten die RNAs in den letzten<br />
Jahren immer mehr in den Blickpunkt der Forschung, wobei vor allem nicht<br />
kodierenden RNAs und untranslatierten Bereichen in mRNAs bedeutende Rollen<br />
zukommen.<br />
Die Funktionen der Ribonukleinsäuren werden dabei meist von konservierten<br />
Strukturen bestimmt, weshalb die Suche nach solchen Strukturbereichen mit Hilfe<br />
von multiplen Alignments in der Bioin<strong>for</strong>matik eine bedeutende Rolle spielt. Da<br />
Strukturen in RNAs aber nur selten auch auf Sequenzebene konserviert sind, muss<br />
diese Suche auch auf Strukturebene durchgeführt werden, wobei man sich aus Komplexitätsgründen<br />
auf die Sekundärstruktur beschränkt.<br />
Allerdings können für einzelne RNA-Sequenzen viele thermodynamisch plausible<br />
Sekundärstrukturen vorhergesagt werden von denen fast alle keine funktionelle<br />
Relevanz besitzen. Deshalb reicht es bei der Suche nach Strukturmotiven nicht aus,<br />
nur die energetisch günstigsten Strukturen zu verwenden. Vielmehr sollten dabei<br />
alle plausiblen Strukturen betrachtet werden.<br />
Ein weiterer wichtiger Punkt besteht darin, dass die gleichen strukturellen Motive<br />
in ansonsten vollkommen anderen strukturellen Umfeldern vorkommen, weshalb<br />
die Suche nach Motiven auch lokal sein sollte. Da ein Strukturmotiv aber aus mehreren<br />
unzusammenhängenden Teilsequenzen bestehen kann, ist dabei eine besondere<br />
strukturelle Form der Lokalität notwendig.<br />
Da es bis jetzt keine Ansatz für ein multiples Sequenz-Struktur-Alignment mit<br />
einer auf Strukturen zugeschnittener Form von Lokalität gab, habe ich mich in<br />
meiner Arbeit diesem Problem angenommen und MuLoRA – einen Ansatz für<br />
multiple, lokale RNA-Sequenz-Struktur-Alignments – entwickelt.<br />
Für die Berechnung eines multiplen Alignments aus einer Menge von Sequenzen<br />
verwende ich dabei einen progressiven Ansatz, welcher für jeden einzelnen Alignmentschritt<br />
die lokalen Sequenz-Struktur-In<strong>for</strong>mationen innerhalb aller Sequenzen<br />
berücksichtigt.<br />
Um diese In<strong>for</strong>mationen zu erhalten, habe ich einen Algorithmus für paarweise<br />
lokale Alignments entwickelt, der für alle Paare der Eingabesequenzen die Teilstrukturen<br />
mit maximaler Ähnlichkeit in beiden Sequenzen sucht. Die Grundlage für die<br />
Bewertung der strukturellen Ähnlichkeit bilden dabei thermodynamische In<strong>for</strong>mationen<br />
in Form von Basenpaarwahrscheinlichkeiten.<br />
Aus dem so gewonnenen multiplen Alignment leite ich schließlich die Konsensussequenz<br />
und – wieder unter Verwendung der Basenpaarwahrscheinlichkeiten – die<br />
Konsensusstruktur ab und erhalte so die in den Sequenzen konservierte Struktur.<br />
Der so entstandene Ansatz arbeitet effizient und zeigt bei Testdurchläufen sehr<br />
gute Ergebnisse.<br />
iii