Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...
Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...
Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
2 Kapitel 1. Bezeichnungen <strong>und</strong> Gr<strong>und</strong>lagen<br />
den sich Wasserstoffbrückenb<strong>in</strong>dungen aus. Diese halten die beiden antiparallelen<br />
Stränge zusammen <strong>und</strong> sorgen so für die die sogenannte Doppelhelix-Struktur der<br />
DNS. Da es somit zu jeder Base auf dem e<strong>in</strong>en Strang e<strong>in</strong>e komplementäre Base<br />
auf dem anderen Strang gibt, werden die Länge der Doppelhelix <strong>und</strong> Abstände<br />
darauf auch <strong>in</strong> der E<strong>in</strong>heit Basenpaare oder kurz bp angegeben.<br />
Die Replikation der DNS geschieht durch das Aufw<strong>in</strong>den der Doppelhelix <strong>und</strong><br />
Trennen der beiden Stränge. Hierfür <strong>in</strong>itiieren bestimmte Prote<strong>in</strong>e, sogenannte<br />
Helikasen, an e<strong>in</strong>em speziellen ”<br />
Replikations-Ursprung“ oder ”<br />
Startpunkt“ das<br />
Entw<strong>in</strong>den der beiden Stränge, so dass die Wasserstoffbrückenb<strong>in</strong>dungen gelöst<br />
werden können. Jeder E<strong>in</strong>zelstrang dient dann als Vorlage für den entsprechenden<br />
komplementären Strang, so dass dieser durch die Polymerase synthetisiert wird.<br />
Dieser hier stark vere<strong>in</strong>facht dargestellte Vorgang steht im Mittelpunkt vieler Forschungsarbeiten.<br />
So s<strong>in</strong>d sowohl Veränderungen bei der Replikation von großem<br />
Interesse, als auch beispielsweise das Lokalisieren e<strong>in</strong>es Replikations-Ursprungs.<br />
Die DNS fungiert daher als e<strong>in</strong>e Art ”<br />
genetische Datenbank“, <strong>in</strong> der auf diese<br />
Weise Unmengen an Information ”<br />
gespeichert“ wird. So besteht das Genom<br />
des Escherichia coli, e<strong>in</strong> Colibakterium, das gerne als Modellorganismus herangezogen<br />
wird, weil es sehr gut erforscht ist, aus etwa 5 · 10 6 Basenpaaren, das der<br />
Drosophila, der allseits bekannten Fliege, aus etwa 2·10 8 <strong>und</strong> das menschliche Genom<br />
aus etwa 3 · 10 9 Basenpaaren. Hieraus wird offensichtlich, dass automatische<br />
Verfahren gebraucht werden, um diese enormen Datenmengen zu untersuchen.<br />
So müssen beispielsweise DNS-Sequenzen verglichen <strong>und</strong> signifikante Ähnlichkeiten<br />
ermittelt werden, um von bekannten Organismen auf zu erforschende schließen<br />
zu können oder es müssen Regionen mit speziellen Funktionen gef<strong>und</strong>en werden,<br />
um die Infektion e<strong>in</strong>er Wirtszelle durch e<strong>in</strong>en Virus zu untersuchen. Diese<br />
Verfahren benötigen zum e<strong>in</strong>en immer ausgeklügeltere Algorithmen sowie mehr<br />
Rechenleistung <strong>und</strong> zum anderen immer bessere statistische Verfahren um die<br />
Signifikanz der ermittelten Ergebnisse e<strong>in</strong>zuschätzen.<br />
Die Informationen s<strong>in</strong>d <strong>in</strong> funktionellen Gruppen, den Genen, auf der DNS angeordnet.<br />
Diese machen nur e<strong>in</strong>en Bruchteil der DNS aus. Dazwischen liegen große<br />
Teile, die oft als ”<br />
DNS-Müll“ beziehungsweise englisch ”<br />
junk DNA“ bezeichnet<br />
wurden. Man geht jedoch mittlerweile davon aus, dass diese Intergensequenzen<br />
regulatorische Aufgaben erfüllen. Da die Intergensequenzen jedoch ke<strong>in</strong>e direkte<br />
Bedeutung für die Struktur der Translationsprodukte besitzen, tendieren sie <strong>in</strong><br />
höherem Maße zur Mutation, so dass sie sich bei verschiedenen Individuen <strong>in</strong> der<br />
Regel messbar unterscheiden. Sie werden daher für den sogenannten genetischen<br />
F<strong>in</strong>gerabdruck oder für Abstammungsgutachten, volkstümlich auch Vaterschaftstest<br />
genannt, benutzt.<br />
Zur Erforschung von Verwandschaften auf evolutionärer Ebene s<strong>in</strong>d dagegen die<br />
Gene geeignet. Anhand der Ähnlichkeit der Sequenz von Genen mit vergleichbarer<br />
Funktion werden mithilfe des sogenannten ”<br />
Sequence Match<strong>in</strong>g“ beispielsweise<br />
phylogenetische Bäume erstellt.