29.12.2013 Aufrufe

Friedrich-Schiller - Chair for Bioinformatics Freiburg

Friedrich-Schiller - Chair for Bioinformatics Freiburg

Friedrich-Schiller - Chair for Bioinformatics Freiburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Zusammenfassung<br />

Für lange Zeit galten Ribonukleinsäuren in der Wissenschaft hauptsächlich als Botenstoffe<br />

bei der Umwandlung genetischer In<strong>for</strong>mationen in Proteine. Doch mit<br />

der Entdeckung einer Vielzahl neuer Funktionen wanderten die RNAs in den letzten<br />

Jahren immer mehr in den Blickpunkt der Forschung, wobei vor allem nicht<br />

kodierenden RNAs und untranslatierten Bereichen in mRNAs bedeutende Rollen<br />

zukommen.<br />

Die Funktionen der Ribonukleinsäuren werden dabei meist von konservierten<br />

Strukturen bestimmt, weshalb die Suche nach solchen Strukturbereichen mit Hilfe<br />

von multiplen Alignments in der Bioin<strong>for</strong>matik eine bedeutende Rolle spielt. Da<br />

Strukturen in RNAs aber nur selten auch auf Sequenzebene konserviert sind, muss<br />

diese Suche auch auf Strukturebene durchgeführt werden, wobei man sich aus Komplexitätsgründen<br />

auf die Sekundärstruktur beschränkt.<br />

Allerdings können für einzelne RNA-Sequenzen viele thermodynamisch plausible<br />

Sekundärstrukturen vorhergesagt werden von denen fast alle keine funktionelle<br />

Relevanz besitzen. Deshalb reicht es bei der Suche nach Strukturmotiven nicht aus,<br />

nur die energetisch günstigsten Strukturen zu verwenden. Vielmehr sollten dabei<br />

alle plausiblen Strukturen betrachtet werden.<br />

Ein weiterer wichtiger Punkt besteht darin, dass die gleichen strukturellen Motive<br />

in ansonsten vollkommen anderen strukturellen Umfeldern vorkommen, weshalb<br />

die Suche nach Motiven auch lokal sein sollte. Da ein Strukturmotiv aber aus mehreren<br />

unzusammenhängenden Teilsequenzen bestehen kann, ist dabei eine besondere<br />

strukturelle Form der Lokalität notwendig.<br />

Da es bis jetzt keine Ansatz für ein multiples Sequenz-Struktur-Alignment mit<br />

einer auf Strukturen zugeschnittener Form von Lokalität gab, habe ich mich in<br />

meiner Arbeit diesem Problem angenommen und MuLoRA – einen Ansatz für<br />

multiple, lokale RNA-Sequenz-Struktur-Alignments – entwickelt.<br />

Für die Berechnung eines multiplen Alignments aus einer Menge von Sequenzen<br />

verwende ich dabei einen progressiven Ansatz, welcher für jeden einzelnen Alignmentschritt<br />

die lokalen Sequenz-Struktur-In<strong>for</strong>mationen innerhalb aller Sequenzen<br />

berücksichtigt.<br />

Um diese In<strong>for</strong>mationen zu erhalten, habe ich einen Algorithmus für paarweise<br />

lokale Alignments entwickelt, der für alle Paare der Eingabesequenzen die Teilstrukturen<br />

mit maximaler Ähnlichkeit in beiden Sequenzen sucht. Die Grundlage für die<br />

Bewertung der strukturellen Ähnlichkeit bilden dabei thermodynamische In<strong>for</strong>mationen<br />

in Form von Basenpaarwahrscheinlichkeiten.<br />

Aus dem so gewonnenen multiplen Alignment leite ich schließlich die Konsensussequenz<br />

und – wieder unter Verwendung der Basenpaarwahrscheinlichkeiten – die<br />

Konsensusstruktur ab und erhalte so die in den Sequenzen konservierte Struktur.<br />

Der so entstandene Ansatz arbeitet effizient und zeigt bei Testdurchläufen sehr<br />

gute Ergebnisse.<br />

iii

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!