Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...
Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...
Muster und Alignments in zufälligen Zeichenketten - Abteilung für ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
2.3. Poisson Approximation 23<br />
(Ω, A). Dann ist die Totalvariation von µ <strong>und</strong> ν gegeben durch:<br />
∫ ∫<br />
d TV (µ, ν) := sup ∣ fdµ − fdν∣<br />
|f|≤1<br />
∣<br />
= 2 sup ∣ µ(A) − ν(A) ∣.<br />
A ɛ A<br />
Bemerkungen:<br />
1. Die Totalvariation ist e<strong>in</strong>e Metrik auf M 1 (Ω, A). Für Eigenschaften <strong>und</strong> Zusammenhänge<br />
zu anderen Metriken auf M 1 (Ω, A) siehe etwa Daley <strong>und</strong> Vere-<br />
Jones [31, Kapitel 9], Barbour, Holst <strong>und</strong> Janson [12, Appendix A.1] oder<br />
Reiss [74, Abschnitt 1.3 <strong>und</strong> 3.2].<br />
2. Die Totalvariation ist für die folgende Untersuchung geeignet, weil sie e<strong>in</strong>erseits<br />
stark genug ist, so dass zum Beispiel aus der Konvergenz d TV (µ n , µ) −→ n→∞<br />
0 für<br />
µ n , µ ɛ M 1 (Ω, A) auch die Konvergenz <strong>in</strong> Verteilung µ D<br />
n −→ µ folgt. Andererseits<br />
ist sie nicht zu stark, so dass sich <strong>in</strong> vielen Anwendungen Abschätzungen<br />
der Totalvariation f<strong>in</strong>den lassen.<br />
Ist I e<strong>in</strong>e Indexmenge <strong>und</strong> (I i ) i ɛ I e<strong>in</strong>e Familie von Bernoulli-verteilten Zufallsvariablen,<br />
so wird durch Ĩ(B) := ∑ i ɛ B I i, B ⊂ I <strong>in</strong> e<strong>in</strong>deutiger Weise e<strong>in</strong> Punktprozess<br />
mit Intensitätsmaß ν(B) = ∑ i ɛ B E I i, B ⊂ I def<strong>in</strong>iert, vergleiche beispielsweise<br />
Resnick [75, Abschnitt 3.1] oder Reiss [74, Abschnitt 1.1]. Der Punktprozess<br />
Ĩ wird im Folgenden mit (I i ) i ɛ I identifiziert <strong>und</strong> auch mit (I i ) i ɛ I bezeichnet, da<br />
auf e<strong>in</strong>e Unterscheidung hier verzichtet werden kann.<br />
Damit lässt sich nun das wichtigste Resultat dieses Kapitels formulieren. Im folgenden<br />
Satz wird die Wahrsche<strong>in</strong>lichkeit, dass die größten Scores große Schwellenwerte<br />
überschreiten, approximiert:<br />
Satz 2.5<br />
Seien d ɛ N <strong>und</strong> x (1) > · · · > x (d) > 0 gegeben. Def<strong>in</strong>iert man die Schwellen<br />
t (k)<br />
n<br />
:= log n2 + x (k)<br />
, für alle k ɛ {1, . . . , d},<br />
Θ ∗<br />
so konvergiert die Anzahl der Überschreitungen dieser Schwellen<br />
N (k)<br />
n<br />
:= ∑ 1 (k) {t n