Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...
Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...
Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
2.2. Starkes Gesetz großer Zahlen 15<br />
Def<strong>in</strong>ition 2.2<br />
Für die Länge l ɛ N <strong>und</strong> das Wort w = w 1 · · · w l ɛ A l ist die empirische Verteilung<br />
L l (w) = ( L l (w) 1 , . . . , L l (w) ξ<br />
)<br />
von w gegeben durch:<br />
L l (w) k := 1 l<br />
l∑<br />
1 {wi }(k) für alle k ∈ {1, . . . , ξ}.<br />
i=1<br />
2.2 Starkes Gesetz großer Zahlen<br />
Gegenstand dieses Abschnitts ist e<strong>in</strong> starkes Gesetz großer Zahlen für die d<br />
größten Scores. Dies ist e<strong>in</strong>e Verallgeme<strong>in</strong>erung von Dembo, Karl<strong>in</strong> <strong>und</strong> Zeitouni<br />
[33, Theorem 3 <strong>und</strong> 4].<br />
Satz 2.3<br />
Es gelten die Voraussetzungen aus Abschnitt 2.1. Dann verhalten sich die d<br />
größten Scores asymptotisch logarithmisch, das heißt für alle k ɛ {1, . . . , d} gilt:<br />
M n<br />
(k)<br />
log n −→ 2<br />
n→∞<br />
Θ . ∗<br />
Insbesondere unterscheiden sich also die d größten Scores bei logarithmischer<br />
Normierung asymptotisch nicht.<br />
Beweis:<br />
Sei d ɛ N fest. Nach Def<strong>in</strong>ition der ( M n<br />
(k) )1≤k≤d gilt M n = M n<br />
(1) ≥ . . . ≥ M n (d) .<br />
In Dembo, Karl<strong>in</strong> <strong>und</strong> Zeitouni [33, Theorem 3 <strong>und</strong> 4] wurde für den maximalen<br />
M<br />
Score gezeigt, dass lim sup n<br />
≤ 2<br />
n→∞ ist. Somit reicht es zu zeigen, dass<br />
log n Θ ∗<br />
lim <strong>in</strong>f<br />
n→∞<br />
M (d)<br />
n<br />
log n ≥ 2 Θ ∗<br />
gilt. Hierzu werden die <strong>Zeichenketten</strong> X <strong>und</strong> Y <strong>in</strong> Blöcke der Länge l ɛ N aufgeteilt<br />
<strong>und</strong> bewiesen, dass <strong>in</strong> den Diagonalen dieser Blöcke bereits ausreichend große<br />
Scores vorkommen.<br />
Seien also l, n ɛ N, l ≤ n, n ∗ := l⌊ n⌋ <strong>und</strong> γ ɛ M l l(A 2 ). Da M n<br />
(d) monoton wachsend<br />
<strong>in</strong> n ist, wird hier ohne E<strong>in</strong>schränkung von n = n ∗ ausgegangen. Zunächst wird<br />
die ( Wahrsche<strong>in</strong>lichkeit dafür abgeschätzt, dass weniger als d Blöcke der Form<br />
(Xil+1 , Y jl+1 ), . . . , (X (i+1)l , Y (j+1)l ) ) , i, j ɛ {0, . . . n −1} mit empirischer Verteilung<br />
l<br />
γ vorkommen.