Muster und Alignments in zufÃ¤lligen Zeichenketten - Abteilung fÃ¼r ...

Weitere Magazine

Empfehlungen

Info

iv maximale Scan-Statistik zu approximieren. Im Fall r n ↘ 0 erhält man lediglich die Konvergenz der endlichdimensionalen Randverteilungen. Im vierten Kapitel soll eine neue Sichtweise auf die Mustersuche eingenommen werden: Wie verändert sich der Prozess, der die Anzahl des Vorkommens eines Musters beschreibt, mit der Wahrscheinlichkeitsverteilung auf dem Alphabet? Diese Fragestellung wurde 2004 von Aki [1] für eine Zeichenkette, die von einer unabhängigen Zufallsfolge auf einem binären Alphabet erzeugt wird, untersucht. Zum Beweis der Konvergenz des dort konstruierten Musterprozesses mit einem Parameter gegen einen Gauß-Prozess wurden analoge Methoden, wie für den Nachweis der Konvergenz der empirischen Verteilungsfunktion in Billingsley [17, Abschnitt 22] verwendet. Dieses Ergebnis wird in der vorliegenden Arbeit in mehrere Richtungen verallgemeinert: So wird hier die zu durchsuchende Zeichenkette von einer ϕ-mischenden Folge von Zufallsvariablen erzeugt. Des Weiteren wird ein beliebiges endliches Alphabet mit ξ Zeichen betrachtet, so dass der Musterprozess von ξ-1 Parametern, die die Wahrscheinlichkeitsverteilung auf dem Alphabet angeben, abhängt. Außerdem wird ein zusätzlicher ” Zeitparameter“ eingeführt, der die Position innerhalb der Zeichenkette X 1 , . . . , X n angibt. Mithilfe eines Ergebnisses von Balacheff und Dupont [9] wird gezeigt, dass der empirische Musterprozess konvergiert und dass der Grenzprozess stetig von der Verteilung der Zeichen und dem Zeitparameter abhängt. Hierzu wird das Problem im Kontext der Theorie der empirischen Prozesse betrachtet. Da die Wahrscheinlichkeitsverteilung auf dem Alphabet in der Praxis zumeist aus den Beobachtungen geschätzt wird, rechtfertigt die bewiesene Stetigkeit die Annahme, dass eine hinreichend gute Schätzung der Zeichenwahrscheinlichkeiten eine gute Approximation des Musterprozesses ergibt. Konkrete Fehlerabschätzungen erhöhen den praktischen Nutzen der Ergebnisse. Um das Erzeugen der zufälligen Zeichenkette in einem möglichst allgemeinen Modell geht es im fünften Kapitel. Das schon 1966 von Baum und Petrie in [14] untersuchte Hidden-Markov“-Modell wird in der Praxis auch heute noch verwendet, da es viele konkrete Anpassungen des Modells an praktische Fragestellungen ” und effiziente Methoden zur Bestimmung oder Schätzung der Parameter gibt. Vallée [92] lieferte 2001 mit den Dynamischen Quellen“ einen Ansatz, der durch ” die Theorie der Dynamischen Systeme motiviert ist. Beiden Modellen ist gemein, dass die Zeichenkette durch einen verborgenen“ Prozess erzeugt wird, dessen Zustand nicht direkt beobachtet werden kann. Dieser wird in Baum und Petrie [14] ” durch eine Markov-Kette und in Vallée [92] durch eine deterministische Iteration mit zufälligem Startwert gegeben. Eine nicht notwendigerweise deterministische Abbildung vom Zustandsraum in den Raum der Beobachtungen bestimmt die emittierten“ Zeichen, das heißt den sichtbaren Prozess, der nach den Mustern ” durchsucht wird. Hidden-Markov-Modelle und Dynamische Quellen werden hier
v in ein neues allgemeineres Modell eingebettet, in dem der nicht beobachtbare Prozess durch eine ϕ- beziehungsweise ψ-mischende Zufallsfolge modelliert wird. Es wird gezeigt, dass der mehrdimensionale Musterprozess mehrerer fester Muster gegen eine mehrdimensionale Brownsche Bewegung konvergiert. Dies zeigt insbesondere, dass sich das neu vorgestellte Modell in der Praxis anwenden lässt. Modelle, in denen ein verborgener Prozess, bezüglich dessen die Abhängigkeiten kontrolliert werden, und ein sichtbarer Prozess, dessen Zustand gemessen wird, unterschieden werden, spiegeln die Anschauung wider, dass in vielen Experimenten nur ein Bruchteil des Mechanismus beobachtet werden kann, der den zufälligen Prozess bestimmt. Liegt eine solche Situation vor, so ist davon auszugehen, dass ein Modell, das nur den sichtbaren Prozess berücksichtigt, unzureichend ist, da sich dessen Parameter bei einer nicht beobachtbaren Zustandsänderung des verborgenen Prozesses sprunghaft ändern können. Mein Dank gilt all denen, die mich auf meinem Weg zu dieser Arbeit unterstützt haben. Jede Liste, die ich hier anführen könnte, wäre sicherlich unvollständig. Daher möchte ich hier diejenigen nennen, die unmittelbar mit dieser Arbeit in Verbindung stehen: Herrn Prof. Dr. L. Rüschendorf danke ich für die Anregung zu dieser Arbeit und die gute Betreuung; die hilfreichen Diskussionen und persönlichen Ermunterungen haben wesentlich zum Gelingen beigetragen. Ebenso bedanke ich mich bei Sarah Weiß für das sorgfältige Korrekturlesen des Manuskripts und bei Monika Hattenbach für die geduldige Hilfe bei allerlei L A TEX- Fragen. Ich danke meinen Kolleginnen und Kollegen und den Mitarbeitern der Abteilung für Mathematische Stochastik für die gute Arbeitsatmosphäre und allen, die mit kritischen und konstruktiven Verbesserungsvorschlägen zum Gelingen dieser Arbeit beigetragen haben. Besonders bedanken möchte ich mich bei meinen Freunden und meiner Familie für ihre Unterstützung. Nicht zuletzt danke ich Angelika für ihre Geduld und Hilfsbereitschaft.
Seite 1 und 2: Muster und Alignments in zufällige
Seite 3 und 4: i Einleitung Die Fortschritte der M
Seite 5: iii Mithilfe der Stein-Chen-Methode
Seite 10 und 11: viii Inhaltsverzeichnis 5 Das Hidde
Seite 12 und 13: 2 Kapitel 1. Bezeichnungen und Grun
Seite 20 und 21: 10 Kapitel 2. Vergleich zweier Zeic
Seite 44 und 45: 34 Kapitel 3. Scan-Statistiken mit
Seite 56 und 57:
46 Kapitel 3. Scan-Statistiken mit
Seite 58 und 59:
Seite 60 und 61:
Seite 62 und 63:
52 Kapitel 4. Der empirische Muster
Seite 64 und 65:
Seite 66 und 67:
Seite 68 und 69:
Seite 70 und 71:
Seite 72 und 73:
Seite 74 und 75:
Seite 76 und 77:
Seite 78 und 79:
Seite 80 und 81:
70 Kapitel 5. Das ” Hidden ϕ-/ψ
Seite 82 und 83:
Seite 84 und 85:
Seite 86 und 87:
Seite 88 und 89:
Seite 90 und 91:
Seite 92 und 93:
Seite 94 und 95:
Seite 96 und 97:
86 Literaturverzeichnis [10] Balakr
Seite 98 und 99:
88 Literaturverzeichnis [35] Dembo,
Seite 100 und 101:
90 Literaturverzeichnis [60] Maxwel
Seite 102:
92 Literaturverzeichnis [85] Siegmu
Alle anzeigen

Muster und Alignments in zufÃ¤lligen Zeichenketten - Abteilung fÃ¼r ...

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?