Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...
Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...
Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
i<br />
E<strong>in</strong>leitung<br />
Die Fortschritte der Molekularbiologie seit der Entdeckung der Doppelhelixstruktur<br />
im Jahr 1953 durch Watson <strong>und</strong> Crick [95] eröffneten völlig neuartige Möglichkeiten<br />
zur Diagnostik <strong>und</strong> Therapie <strong>in</strong> der Mediz<strong>in</strong>, trugen zum vieldiskutierten<br />
E<strong>in</strong>satz der Gentechnik <strong>in</strong> der Agrarwirtschaft beziehungsweise Nahrungsmittel<strong>in</strong>dustrie<br />
bei, s<strong>in</strong>d fester Bestandteil <strong>in</strong> der Krim<strong>in</strong>altechnik sowie Gr<strong>und</strong>lage für<br />
viele historische <strong>und</strong> anthropologische Studien <strong>und</strong> haben viele andere Lebensbereiche<br />
bee<strong>in</strong>flusst. Der E<strong>in</strong>satz dieser neuen Erkenntnisse wäre zumeist nicht<br />
ohne die Methoden der Mathematik, <strong>in</strong>sbesondere der mathematischen Statistik,<br />
möglich gewesen. Viele Ergebnisse beruhen auf neuen Methoden Daten auszuwerten,<br />
zu verarbeiten, zu klassifizieren <strong>und</strong> zu <strong>in</strong>terpretieren. Insbesondere bei der<br />
Klassifikation <strong>und</strong> Interpretation g<strong>in</strong>g die Forschung im Labor mit gravierenden<br />
Fortschritten <strong>in</strong> der Mathematik e<strong>in</strong>her, die Relevanz der beobachteten Daten<br />
e<strong>in</strong>schätzen zu können.<br />
Um die Forschung auf diesem Gebiet voranzubr<strong>in</strong>gen war <strong>und</strong> ist e<strong>in</strong>e fächerübergreifende<br />
Zusammenarbeit verschiedener Diszipl<strong>in</strong>en notwendig:<br />
• Das Erfassen der Problemstellung erfordert e<strong>in</strong> gr<strong>und</strong>legendes Verständnis<br />
der biologischen <strong>und</strong> chemischen Zusammenhänge.<br />
• Ohne den E<strong>in</strong>satz immer effizienterer Algorithmen aus dem Gebiet der Informatik<br />
hätte wohl auch der rasante Fortschritt <strong>in</strong> der Computertechnik<br />
nicht ausgereicht, um die auftretenden Datenmengen zu verarbeiten.<br />
• Aus dem Bereich der mathematischen Statistik werden für die neuen<br />
Fragestellungen <strong>und</strong> den daraus entstehenden Verfahren präzise Formeln<br />
zur Berechnung beziehungsweise Approximation von Wahrsche<strong>in</strong>lichkeiten<br />
benötigt, um die Signifikanz der im Labor oder numerisch ermittelten Daten<br />
e<strong>in</strong>schätzen zu können.<br />
Historisch s<strong>in</strong>d die mathematischen Fragestellungen auf die Artikel von Erdös<br />
<strong>und</strong> Rényi [41], wo 1970 das Auftreten von außergewöhnlich vielen ”<br />
1“en <strong>in</strong> e<strong>in</strong>er<br />
Folge von Bernoulli-verteilten Zufallsvariablen betrachtet wurde <strong>und</strong> von Chvátal<br />
<strong>und</strong> Sankoff [27], wo 1975 die Länge der längsten geme<strong>in</strong>samen Teilfolge zweier<br />
zufälliger <strong>Zeichenketten</strong> untersucht wurde, zurückzuführen.