Muster und Alignments in zufÃ¤lligen Zeichenketten - Abteilung fÃ¼r ...

Weitere Magazine

Empfehlungen

Info

22 Kapitel 2. Vergleich zweier Zeichenketten Für alle n ≥ N 0 := max{N 1 , N 2 , N 3 , N 4 , e K } existiert genau ein k ≥ K, so dass n k ≤ n < n k+1 = e k+1 . Somit folgt auf M: M (d) n ≥ M (d) n k ≥ (1 − 2ε) 2 Θ ∗ k ≥ (1 − 3ε) 2 Θ ∗ (k + 1) = (1 − 3ε) 2 Θ ∗ log n k+1 ≥ (1 − 3ε) 2 Θ ∗ log n. Wegen P (M) = 1 ergibt sich die Behauptung mit ε −→ 0. ✷ Bemerkung: Die bewiesene Aussage lässt sich mit den in Arratia und Waterman [6] oder Dembo, Karlin und Zeitouni [33] vorgestellten Methoden auch auf die d größten Scores mit empirischer Verteilung in einer gegeben Teilmenge U ⊂ M 1 (A 2 ) verallgemeinern. Dies bringt keine neuen Erkenntnisse, erfordert aber stellenweise eine wesentlich aufwendigere Notation. Daher wurde hier darauf verzichtet, um den Beweis übersichtlich und die Struktur erkennbar zu halten. 2.3 Poisson Approximation In diesem Abschnitt wird die gemeinsame Verteilung der Maxima gegen unabhängige Gumbel-Verteilungen gezeigt. In der Anwendung dürfte die asymptotische Unabhängikeit von Bedeutung sein, da diese Eigenschaft eine sehr einfache Berechnung der approximativen Wahrscheinlichkeiten ermöglicht. Anschaulich lässt sich diese Eigenschaft damit erklären, dass es sich beim Überschreiten eines großen Schwellenwerts um ein seltenes Ereignis handelt. Ist die Anzahl der betrachteten Zeichen hinreichend groß, so lässt sich die gegenseitige Beeinflussung dieser Ereignisse kontrollieren. Als geeignete Metrik hat sich für diese Fragestellung die sogenannte ” Totalvariation“ herausgestellt. In der Literatur sind zwei unterschiedliche Definitionen üblich, die sich um den Faktor 2 unterscheiden. Hier wird die Variante verwendet, wie sie von Arratia, Goldstein und Gordon in [3] und [4] in Zusammenhang mit der Stein–Chen-Methode definiert wird. Definition 2.4 (Totalvariation) Seien (Ω, A) ein Messraum und µ, ν ɛ M 1 (Ω, A) Wahrscheinlichkeitsmaße auf
2.3. Poisson Approximation 23 (Ω, A). Dann ist die Totalvariation von µ und ν gegeben durch: ∫ ∫ d TV (µ, ν) := sup ∣ fdµ − fdν∣ |f|≤1 ∣ = 2 sup ∣ µ(A) − ν(A) ∣. A ɛ A Bemerkungen: 1. Die Totalvariation ist eine Metrik auf M 1 (Ω, A). Für Eigenschaften und Zusammenhänge zu anderen Metriken auf M 1 (Ω, A) siehe etwa Daley und Vere- Jones [31, Kapitel 9], Barbour, Holst und Janson [12, Appendix A.1] oder Reiss [74, Abschnitt 1.3 und 3.2]. 2. Die Totalvariation ist für die folgende Untersuchung geeignet, weil sie einerseits stark genug ist, so dass zum Beispiel aus der Konvergenz d TV (µ n , µ) −→ n→∞ 0 für µ n , µ ɛ M 1 (Ω, A) auch die Konvergenz in Verteilung µ D n −→ µ folgt. Andererseits ist sie nicht zu stark, so dass sich in vielen Anwendungen Abschätzungen der Totalvariation finden lassen. Ist I eine Indexmenge und (I i ) i ɛ I eine Familie von Bernoulli-verteilten Zufallsvariablen, so wird durch Ĩ(B) := ∑ i ɛ B I i, B ⊂ I in eindeutiger Weise ein Punktprozess mit Intensitätsmaß ν(B) = ∑ i ɛ B E I i, B ⊂ I definiert, vergleiche beispielsweise Resnick [75, Abschnitt 3.1] oder Reiss [74, Abschnitt 1.1]. Der Punktprozess Ĩ wird im Folgenden mit (I i ) i ɛ I identifiziert und auch mit (I i ) i ɛ I bezeichnet, da auf eine Unterscheidung hier verzichtet werden kann. Damit lässt sich nun das wichtigste Resultat dieses Kapitels formulieren. Im folgenden Satz wird die Wahrscheinlichkeit, dass die größten Scores große Schwellenwerte überschreiten, approximiert: Satz 2.5 Seien d ɛ N und x (1) > · · · > x (d) > 0 gegeben. Definiert man die Schwellen t (k) n := log n2 + x (k) , für alle k ɛ {1, . . . , d}, Θ ∗ so konvergiert die Anzahl der Überschreitungen dieser Schwellen N (k) n := ∑ 1 (k) {t n
Seite 1 und 2: Muster und Alignments in zufällige
Seite 3 und 4: i Einleitung Die Fortschritte der M
Seite 5 und 6: iii Mithilfe der Stein-Chen-Methode
Seite 7: v in ein neues allgemeineres Modell
Seite 10 und 11: viii Inhaltsverzeichnis 5 Das Hidde
Seite 12 und 13: 2 Kapitel 1. Bezeichnungen und Grun
Seite 20 und 21: 10 Kapitel 2. Vergleich zweier Zeic
Seite 44 und 45: 34 Kapitel 3. Scan-Statistiken mit
Seite 62 und 63: 52 Kapitel 4. Der empirische Muster
Seite 80 und 81: 70 Kapitel 5. Das ” Hidden ϕ-/ψ
Seite 82 und 83:
72 Kapitel 5. Das ” Hidden ϕ-/ψ
Seite 84 und 85:
Seite 86 und 87:
Seite 88 und 89:
Seite 90 und 91:
Seite 92 und 93:
Seite 94 und 95:
Seite 96 und 97:
86 Literaturverzeichnis [10] Balakr
Seite 98 und 99:
88 Literaturverzeichnis [35] Dembo,
Seite 100 und 101:
90 Literaturverzeichnis [60] Maxwel
Seite 102:
92 Literaturverzeichnis [85] Siegmu
Alle anzeigen

Muster und Alignments in zufÃ¤lligen Zeichenketten - Abteilung fÃ¼r ...

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?