27.08.2014 Aufrufe

Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...

Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...

Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

2.2. Starkes Gesetz großer Zahlen 15<br />

Def<strong>in</strong>ition 2.2<br />

Für die Länge l ɛ N <strong>und</strong> das Wort w = w 1 · · · w l ɛ A l ist die empirische Verteilung<br />

L l (w) = ( L l (w) 1 , . . . , L l (w) ξ<br />

)<br />

von w gegeben durch:<br />

L l (w) k := 1 l<br />

l∑<br />

1 {wi }(k) für alle k ∈ {1, . . . , ξ}.<br />

i=1<br />

2.2 Starkes Gesetz großer Zahlen<br />

Gegenstand dieses Abschnitts ist e<strong>in</strong> starkes Gesetz großer Zahlen für die d<br />

größten Scores. Dies ist e<strong>in</strong>e Verallgeme<strong>in</strong>erung von Dembo, Karl<strong>in</strong> <strong>und</strong> Zeitouni<br />

[33, Theorem 3 <strong>und</strong> 4].<br />

Satz 2.3<br />

Es gelten die Voraussetzungen aus Abschnitt 2.1. Dann verhalten sich die d<br />

größten Scores asymptotisch logarithmisch, das heißt für alle k ɛ {1, . . . , d} gilt:<br />

M n<br />

(k)<br />

log n −→ 2<br />

n→∞<br />

Θ . ∗<br />

Insbesondere unterscheiden sich also die d größten Scores bei logarithmischer<br />

Normierung asymptotisch nicht.<br />

Beweis:<br />

Sei d ɛ N fest. Nach Def<strong>in</strong>ition der ( M n<br />

(k) )1≤k≤d gilt M n = M n<br />

(1) ≥ . . . ≥ M n (d) .<br />

In Dembo, Karl<strong>in</strong> <strong>und</strong> Zeitouni [33, Theorem 3 <strong>und</strong> 4] wurde für den maximalen<br />

M<br />

Score gezeigt, dass lim sup n<br />

≤ 2<br />

n→∞ ist. Somit reicht es zu zeigen, dass<br />

log n Θ ∗<br />

lim <strong>in</strong>f<br />

n→∞<br />

M (d)<br />

n<br />

log n ≥ 2 Θ ∗<br />

gilt. Hierzu werden die <strong>Zeichenketten</strong> X <strong>und</strong> Y <strong>in</strong> Blöcke der Länge l ɛ N aufgeteilt<br />

<strong>und</strong> bewiesen, dass <strong>in</strong> den Diagonalen dieser Blöcke bereits ausreichend große<br />

Scores vorkommen.<br />

Seien also l, n ɛ N, l ≤ n, n ∗ := l⌊ n⌋ <strong>und</strong> γ ɛ M l l(A 2 ). Da M n<br />

(d) monoton wachsend<br />

<strong>in</strong> n ist, wird hier ohne E<strong>in</strong>schränkung von n = n ∗ ausgegangen. Zunächst wird<br />

die ( Wahrsche<strong>in</strong>lichkeit dafür abgeschätzt, dass weniger als d Blöcke der Form<br />

(Xil+1 , Y jl+1 ), . . . , (X (i+1)l , Y (j+1)l ) ) , i, j ɛ {0, . . . n −1} mit empirischer Verteilung<br />

l<br />

γ vorkommen.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!