Muster und Alignments in zufÃ¤lligen Zeichenketten - Abteilung fÃ¼r ...

Weitere Magazine

Empfehlungen

Info

2 Kapitel 1. Bezeichnungen und Grundlagen den sich Wasserstoffbrückenbindungen aus. Diese halten die beiden antiparallelen Stränge zusammen und sorgen so für die die sogenannte Doppelhelix-Struktur der DNS. Da es somit zu jeder Base auf dem einen Strang eine komplementäre Base auf dem anderen Strang gibt, werden die Länge der Doppelhelix und Abstände darauf auch in der Einheit Basenpaare oder kurz bp angegeben. Die Replikation der DNS geschieht durch das Aufwinden der Doppelhelix und Trennen der beiden Stränge. Hierfür initiieren bestimmte Proteine, sogenannte Helikasen, an einem speziellen ” Replikations-Ursprung“ oder ” Startpunkt“ das Entwinden der beiden Stränge, so dass die Wasserstoffbrückenbindungen gelöst werden können. Jeder Einzelstrang dient dann als Vorlage für den entsprechenden komplementären Strang, so dass dieser durch die Polymerase synthetisiert wird. Dieser hier stark vereinfacht dargestellte Vorgang steht im Mittelpunkt vieler Forschungsarbeiten. So sind sowohl Veränderungen bei der Replikation von großem Interesse, als auch beispielsweise das Lokalisieren eines Replikations-Ursprungs. Die DNS fungiert daher als eine Art ” genetische Datenbank“, in der auf diese Weise Unmengen an Information ” gespeichert“ wird. So besteht das Genom des Escherichia coli, ein Colibakterium, das gerne als Modellorganismus herangezogen wird, weil es sehr gut erforscht ist, aus etwa 5 · 10 6 Basenpaaren, das der Drosophila, der allseits bekannten Fliege, aus etwa 2·10 8 und das menschliche Genom aus etwa 3 · 10 9 Basenpaaren. Hieraus wird offensichtlich, dass automatische Verfahren gebraucht werden, um diese enormen Datenmengen zu untersuchen. So müssen beispielsweise DNS-Sequenzen verglichen und signifikante Ähnlichkeiten ermittelt werden, um von bekannten Organismen auf zu erforschende schließen zu können oder es müssen Regionen mit speziellen Funktionen gefunden werden, um die Infektion einer Wirtszelle durch einen Virus zu untersuchen. Diese Verfahren benötigen zum einen immer ausgeklügeltere Algorithmen sowie mehr Rechenleistung und zum anderen immer bessere statistische Verfahren um die Signifikanz der ermittelten Ergebnisse einzuschätzen. Die Informationen sind in funktionellen Gruppen, den Genen, auf der DNS angeordnet. Diese machen nur einen Bruchteil der DNS aus. Dazwischen liegen große Teile, die oft als ” DNS-Müll“ beziehungsweise englisch ” junk DNA“ bezeichnet wurden. Man geht jedoch mittlerweile davon aus, dass diese Intergensequenzen regulatorische Aufgaben erfüllen. Da die Intergensequenzen jedoch keine direkte Bedeutung für die Struktur der Translationsprodukte besitzen, tendieren sie in höherem Maße zur Mutation, so dass sie sich bei verschiedenen Individuen in der Regel messbar unterscheiden. Sie werden daher für den sogenannten genetischen Fingerabdruck oder für Abstammungsgutachten, volkstümlich auch Vaterschaftstest genannt, benutzt. Zur Erforschung von Verwandschaften auf evolutionärer Ebene sind dagegen die Gene geeignet. Anhand der Ähnlichkeit der Sequenz von Genen mit vergleichbarer Funktion werden mithilfe des sogenannten ” Sequence Matching“ beispielsweise phylogenetische Bäume erstellt.
1.1. Biologische Grundlagen 3 Der erste Schritt bei der Proteinsynthese ist das Auswerten von Informationen aus der ” Datenbank“ DNS. Hierzu wird ein Gen ” abgelesen“ und dient bei einem ähnlichen Vorgang wie der oben beschriebenen Replikation als Vorlage für die Synthese eines neuen Ribonukleinsäure-Strangs. Dieser Vorgang heißt Transkription. Die Ribonukleinsäure, im Folgenden als RNS abgekürzt, ähnelt im Aufbau dem der DNS. Die Struktur ist jedoch einzelsträngig und wird von einem Ribose- Phosphat-Rückgrat gegeben, bei dem an jede Pentose eine der Basen Adenin, Guanin, Cytosin oder Uracil angekoppelt ist. Daher wird hier in der Regel das Alphabet A = {A,G,C,U} zur Beschreibung verwendet. Uracil ist wie bei der DNS Thymin die komplementäre Base zu Adenin. Während die DNS ihrer Funktion gemäß eine sehr stabiles Molekül ist, ist die RNS reaktiv genug, um verschiedene Funktionen zu übernehmen. So dient beispielsweise die sogenannte messenger RNA, meist mRNA abgekürzt, als Vorlage für die Proteinsynthese im Cytoplasma. Hier wird in einem Zwischenschritt zunächst die prä-mRNA oder auch hnRNA aus der DNS transkribiert. Aus dieser werden dann die nicht codierenden Regionen, die sogenannten Introns, herausgespleißt. Die übrig bleibenden Exons bilden die mRNA. Bei der sogenannten Translation der mRNA werden jeweils drei Nukleinsäuren, die auch als Codon bezeichnet werden, zu einer Aminosäure übersetzt. Hier sind drei verschieden ” Leserahmen“ möglich, die in der Regel zu völlig unterschiedlichen Translationen führen. Die Zuordnungsvorschrift der 4 3 = 64 möglichen Codons zu einer der 20 direkt erzeugten Aminosäuren wird auch als ” genetischer Code“ bezeichnet, vergleiche Waterman [94, Tabelle 1.2]. Eine Sonderstellung nimmt die Aminosäure Selenocystein ein, da sie nicht direkt durch Translation entsteht, sondern durch sogenannte ” Rekodierung“ eingebaut wird. Des Weiteren gibt es ein sogenanntes Startcodon, das die Translation initiiert und drei Stoppcodons, die die Translation terminieren. Die Proteine erfüllen vielfältige Aufgaben: So ermöglichen Enzyme viele chemische Reaktionen und steuern Abläufe in der Zelle, Strukturproteine bestimmen den Aufbau der Zelle, das Transportprotein Hämoglobin versorgt das Gewebe mit Sauerstoff, um nur einige Beispiele zu nennen. Die räumliche Struktur der Proteine ist wesentlich komplexer, als die der DNS: Die Primärstruktur ist durch die Abfolge der Aminosäuren gegeben und wird hier als Text über einem Alphabet mit 20 beziehungsweise 21 Zeichen modelliert, so dass sie aus mathematischer Sicht ähnlich wie DNS behandelt werden kann. Die sogenannte Sekundärstruktur beschreibt Sequenzabschnitte mit regelmäßiger lokaler Ordnung, wie etwa Helices, Bögen oder Faltungen, die durch Wasserstoffbrückenbindungen entstehen. Die vollständige räumliche Gestalt wird als Tertiärstruktur bezeichnet, die Kooperation mehrerer Tertiärstrukturen zu einem
Seite 1 und 2: Muster und Alignments in zufällige
Seite 3 und 4: i Einleitung Die Fortschritte der M
Seite 5 und 6: iii Mithilfe der Stein-Chen-Methode
Seite 7: v in ein neues allgemeineres Modell
Seite 10 und 11: viii Inhaltsverzeichnis 5 Das Hidde
Seite 14 und 15: 4 Kapitel 1. Bezeichnungen und Grun
Seite 20 und 21: 10 Kapitel 2. Vergleich zweier Zeic
Seite 44 und 45: 34 Kapitel 3. Scan-Statistiken mit
Seite 62 und 63:
52 Kapitel 4. Der empirische Muster
Seite 64 und 65:
Seite 66 und 67:
Seite 68 und 69:
Seite 70 und 71:
Seite 72 und 73:
Seite 74 und 75:
Seite 76 und 77:
Seite 78 und 79:
Seite 80 und 81:
70 Kapitel 5. Das ” Hidden ϕ-/ψ
Seite 82 und 83:
Seite 84 und 85:
Seite 86 und 87:
Seite 88 und 89:
Seite 90 und 91:
Seite 92 und 93:
Seite 94 und 95:
Seite 96 und 97:
86 Literaturverzeichnis [10] Balakr
Seite 98 und 99:
88 Literaturverzeichnis [35] Dembo,
Seite 100 und 101:
90 Literaturverzeichnis [60] Maxwel
Seite 102:
92 Literaturverzeichnis [85] Siegmu
Alle anzeigen

Muster und Alignments in zufÃ¤lligen Zeichenketten - Abteilung fÃ¼r ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?