27.08.2014 Aufrufe

Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...

Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...

Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

69<br />

Kapitel 5<br />

Das ”<br />

Hidden ϕ-/ψ-Mix<strong>in</strong>g“<br />

Modell<br />

Gegenstand dieses Kapitels ist e<strong>in</strong> funktionaler Zentraler Grenzwertsatz für die<br />

Häufigkeit des Auftretens mehrerer <strong>Muster</strong> <strong>in</strong> e<strong>in</strong>em zufälligen Text. Unter allgeme<strong>in</strong>en<br />

Voraussetzungen wird die Konvergenz des im Folgenden def<strong>in</strong>ierten<br />

mehrdimensionalen <strong>Muster</strong>prozesses Z n gegen e<strong>in</strong>e Brownsche Bewegung gezeigt.<br />

Seit Erdös <strong>und</strong> Rényi 1970 im Artikel [41] sogenannte Long Head Runs“, das<br />

”<br />

heißt das Auftreten von außergewöhnlich vielen aufe<strong>in</strong>ander folgenden 1“en <strong>in</strong> ”<br />

e<strong>in</strong>er Folge von unabhängigen Bernoulli-verteilten Zufallsvariablen, untersucht<br />

haben, wurde die <strong>Muster</strong>suche <strong>in</strong> zwei Richtungen verallgeme<strong>in</strong>ert:<br />

Zum e<strong>in</strong>en werden allgeme<strong>in</strong>ere <strong>Muster</strong> als Head Runs“ betrachtet, von sogenannten<br />

Hidden Patterns“ <strong>in</strong> Flajolet, Guivarc’h, Szpankowski <strong>und</strong> Vallée [42],<br />

”<br />

”<br />

wo das gesuchte <strong>Muster</strong> nicht an aufe<strong>in</strong>ander folgenden Positionen vorkommen<br />

muss, bis h<strong>in</strong> zu Regulären Ausdrücken“, wie sie <strong>in</strong> der theoretischen Informatik<br />

”<br />

zur Beschreibung formaler Sprachen verwendet werden (vergleiche Schön<strong>in</strong>g [82,<br />

Abschnitt 1.2.3]), die beispielsweise von Nicodème, Salvy <strong>und</strong> Flajolet <strong>in</strong> [62] als<br />

” Motif“ oder von Regnier <strong>in</strong> [71] als Language“ bezeichnet werden.<br />

”<br />

Zum anderen werden komplexe Abhängigkeitsstrukturen im zeichenerzeugenden<br />

Modell behandelt. Hierbei handelt es sich unter anderem um Markov-Ketten <strong>in</strong><br />

Régnier <strong>und</strong> Szpankowski [73], Rob<strong>in</strong> <strong>und</strong> Daud<strong>in</strong> [77], Kleffe <strong>und</strong> Borodovsky<br />

[55] oder Stefanov [88], um Hidden Markov“ Modelle oder um Dynamische<br />

” ”<br />

Quellen“. Für Literatur zu den letzten beiden Modellen sei auf Abschnitt 5.3 verwiesen,<br />

da diese dort ausführlicher behandelt <strong>und</strong> <strong>in</strong> e<strong>in</strong>en geme<strong>in</strong>samen Kontext<br />

e<strong>in</strong>geordnet werden.<br />

Hier soll die zeichenerzeugende Quelle weiter verallgeme<strong>in</strong>ert werden. In e<strong>in</strong>er<br />

von e<strong>in</strong>em verborgenen“ stochastischen Prozess erzeugten Zeichenkette sollen<br />

”<br />

<strong>Muster</strong> gesucht werden. Da dieser als ϕ- beziehungsweise ψ-mischende Folge vorausgesetzt<br />

wird, soll das Modell hier als Hidden ϕ-/ψ-Mix<strong>in</strong>g“ Modell bezeich-<br />

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!