Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...
Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...
Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
69<br />
Kapitel 5<br />
Das ”<br />
Hidden ϕ-/ψ-Mix<strong>in</strong>g“<br />
Modell<br />
Gegenstand dieses Kapitels ist e<strong>in</strong> funktionaler Zentraler Grenzwertsatz für die<br />
Häufigkeit des Auftretens mehrerer <strong>Muster</strong> <strong>in</strong> e<strong>in</strong>em zufälligen Text. Unter allgeme<strong>in</strong>en<br />
Voraussetzungen wird die Konvergenz des im Folgenden def<strong>in</strong>ierten<br />
mehrdimensionalen <strong>Muster</strong>prozesses Z n gegen e<strong>in</strong>e Brownsche Bewegung gezeigt.<br />
Seit Erdös <strong>und</strong> Rényi 1970 im Artikel [41] sogenannte Long Head Runs“, das<br />
”<br />
heißt das Auftreten von außergewöhnlich vielen aufe<strong>in</strong>ander folgenden 1“en <strong>in</strong> ”<br />
e<strong>in</strong>er Folge von unabhängigen Bernoulli-verteilten Zufallsvariablen, untersucht<br />
haben, wurde die <strong>Muster</strong>suche <strong>in</strong> zwei Richtungen verallgeme<strong>in</strong>ert:<br />
Zum e<strong>in</strong>en werden allgeme<strong>in</strong>ere <strong>Muster</strong> als Head Runs“ betrachtet, von sogenannten<br />
Hidden Patterns“ <strong>in</strong> Flajolet, Guivarc’h, Szpankowski <strong>und</strong> Vallée [42],<br />
”<br />
”<br />
wo das gesuchte <strong>Muster</strong> nicht an aufe<strong>in</strong>ander folgenden Positionen vorkommen<br />
muss, bis h<strong>in</strong> zu Regulären Ausdrücken“, wie sie <strong>in</strong> der theoretischen Informatik<br />
”<br />
zur Beschreibung formaler Sprachen verwendet werden (vergleiche Schön<strong>in</strong>g [82,<br />
Abschnitt 1.2.3]), die beispielsweise von Nicodème, Salvy <strong>und</strong> Flajolet <strong>in</strong> [62] als<br />
” Motif“ oder von Regnier <strong>in</strong> [71] als Language“ bezeichnet werden.<br />
”<br />
Zum anderen werden komplexe Abhängigkeitsstrukturen im zeichenerzeugenden<br />
Modell behandelt. Hierbei handelt es sich unter anderem um Markov-Ketten <strong>in</strong><br />
Régnier <strong>und</strong> Szpankowski [73], Rob<strong>in</strong> <strong>und</strong> Daud<strong>in</strong> [77], Kleffe <strong>und</strong> Borodovsky<br />
[55] oder Stefanov [88], um Hidden Markov“ Modelle oder um Dynamische<br />
” ”<br />
Quellen“. Für Literatur zu den letzten beiden Modellen sei auf Abschnitt 5.3 verwiesen,<br />
da diese dort ausführlicher behandelt <strong>und</strong> <strong>in</strong> e<strong>in</strong>en geme<strong>in</strong>samen Kontext<br />
e<strong>in</strong>geordnet werden.<br />
Hier soll die zeichenerzeugende Quelle weiter verallgeme<strong>in</strong>ert werden. In e<strong>in</strong>er<br />
von e<strong>in</strong>em verborgenen“ stochastischen Prozess erzeugten Zeichenkette sollen<br />
”<br />
<strong>Muster</strong> gesucht werden. Da dieser als ϕ- beziehungsweise ψ-mischende Folge vorausgesetzt<br />
wird, soll das Modell hier als Hidden ϕ-/ψ-Mix<strong>in</strong>g“ Modell bezeich-<br />
”