Muster und Alignments in zufÃ¤lligen Zeichenketten - Abteilung fÃ¼r ...

Weitere Magazine

Empfehlungen

Info

16 Kapitel 2. Vergleich zweier Zeichenketten in X bezie- Die Anzahl der Blöcke der Länge l mit empirischer Verteilung γ X hungsweise γ Y in Y ist gegeben durch: n l −1 ∑ M := M(γ X ) := 1 {L l (X il+1···X (i+1)l )=γ X } beziehungsweise i=0 n l −1 ∑ N := M(γ Y ) := 1 {L l (Y jl+1···Y (j+1)l )=γ Y }. j=0 Für den Fall M ≥ 1 und N ≥ 1 seien dies die Blöcke πX 1 , . . . , πM X πY 1 , . . . , πN Y , das heißt, für alle i ɛ {1, . . . , M}, j ɛ {1, . . . , N} ist: beziehungsweise L l( X π i X l+1 · · · X (π i X +1)l) = γX und L l( Y π j Y l+1 · · · Y (π j Y +1)l ) = γY . Das Ereignis, dass der i-te Block in X und der j-te Block in Y gemeinsame empirische Verteilung γ aufweisen, bezeichnet man für i ɛ {1, . . . , M}, j ɛ {1, . . . , N} mit: B i,j := B i,j (γ) := { L l( (X π i X l+1, Y π j Y l+1), . . . , (X (π i X +1)l , Y (π j Y +1)l)) = γ } . Für jeden Block X π i X l+1 · · · X (π i X +1)l beziehungsweise Y π j Y l+1 · · · Y (π j Y +1)l stimmt die empirische Verteilung mit γ X beziehungsweise γ Y überein. Somit hängt es nur von der Reihenfolge der einzelnen Buchstaben innerhalb eines solchen Blockpaares ab, ob (X π i X l+1, Y π j l+1), . . . , (X (π i Y X +1)l , Y (π j Y +1)l) gemeinsame empirische Verteilung γ hat. Dies bedeutet, für alle i ɛ {1, . . . , M}, j ɛ {1, . . . , N} gilt: P (B i,j ) = P (B 1,1 ) =: p unabhängig von i, j. Definiert man die Anzahl von Block-Paaren mit empirischer Verteilung γ als: M∑ N∑ W := W (γ) := 1 Bi,j , so erhält man für den bedingten Erwartungswert von W bei gegebenem M und N: E[W | M, N] = MNp und für alle i ɛ {1, . . . , M}, j ɛ {1, . . . , N}: E ( exp(p − 1 Bi,j ) ) = e p( 1 − p + p e i=1 j=1 ) = e p (1 − cp), mit c = e − 1 e ɛ (0, 1). Aufgrund der Unabhängigkeit der Zeichenketten sind B i,j und B i ′ ,j ′ für alle i, i ′ ɛ {1, . . . , M}, j, j ′ ɛ {1, . . . , N} mit (i, j) ≠ (i ′ , j ′ ) unabhängig. Mit einfachen analytischen Mitteln lässt sich zeigen, dass für alle a ɛ (0, 1), v > 0 gilt:
2.2. Starkes Gesetz großer Zahlen 17 (1−a) v ≤ 1 . Somit folgt bei gegebenem M und N aus der Markov-Ungleichung: av P (W ≤ d − 1 | M, N) = P ( E[W |M, N] − W ≥ E[W |M, N] − d + 1 ∣ ) M, N ≤ E( exp(E[W |M, N] − W ) ∣ ) M, N exp ( E[W |M, N] − d + 1 ) ∑ N j=1 (p − 1 B i,j ) ) ∣ ∣ M, N ) = E ( exp ( ∑ M i=1 exp(MN p − d + 1) ∏ M ∏ N i=1 j=1 E ( exp(p − 1 Bi,j ) ) = (e p ) MN e −d+1 ( ) MN e p (1 − cp) = e d−1 e p ≤ ed−1 MN cp = ed e − 1 · 1 MNp . Da M und N unabhängig sind, folgt mit der Glättungsregel für die Wahrscheinlichkeit, dass höchstens d-1 Paare von Blöcken empirische Verteilung γ haben: P (W ≤ d − 1) ≤ E [ 1 {W ≤d−1} 1 {M≥1} 1 {N≥1} ] + P (M = 0) + P (N = 0) = E [ ] P (W ≤ d−1 | M, N)1 {M≥1} 1 {N≥1} + P (M =0) + P (N =0) e d [ ≤ (e − 1)p E 1{M≥1} ] [ 1{N≥1} ] E + P (M = 0) + P (N = 0), M N mit der Konvention 0 := 0, um unnötige Fallunterscheidungen zu vermeiden. Für 0 alle n ≥ 0 gilt 1 {n≥1} (n + 1) ≤ 2n und somit 1 {n≥1} ≤ 2 . M ist binomialverteilt n n+1 mit Parameter ñ := n ɛ l N und ˜p := P( ) L l (X 1 · · · X l ) = γ X . Somit ergibt sich für den ersten Erwartungswert: [ 1{M≥1} ] [ 2 ] E ≤ E M M + 1 en∑ (ñ ) 1 = 2 ˜p k (1 − ˜p) en−k k + 1 k k=0 2 [ = ] 1 − (1 − ˜p) en+1 (ñ + 1)˜p ≤ 2 ˜p ñ = 2l P ( L l (X 1 · · · X l ) = γ X ) n .
Seite 1 und 2: Muster und Alignments in zufällige
Seite 3 und 4: i Einleitung Die Fortschritte der M
Seite 5 und 6: iii Mithilfe der Stein-Chen-Methode
Seite 7: v in ein neues allgemeineres Modell
Seite 10 und 11: viii Inhaltsverzeichnis 5 Das Hidde
Seite 12 und 13: 2 Kapitel 1. Bezeichnungen und Grun
Seite 20 und 21: 10 Kapitel 2. Vergleich zweier Zeic
Seite 44 und 45: 34 Kapitel 3. Scan-Statistiken mit
Seite 62 und 63: 52 Kapitel 4. Der empirische Muster
Seite 76 und 77:
66 Kapitel 4. Der empirische Muster
Seite 78 und 79:
68 Kapitel 4. Der empirische Muster
Seite 80 und 81:
70 Kapitel 5. Das ” Hidden ϕ-/ψ
Seite 82 und 83:
Seite 84 und 85:
Seite 86 und 87:
Seite 88 und 89:
Seite 90 und 91:
Seite 92 und 93:
Seite 94 und 95:
Seite 96 und 97:
86 Literaturverzeichnis [10] Balakr
Seite 98 und 99:
88 Literaturverzeichnis [35] Dembo,
Seite 100 und 101:
90 Literaturverzeichnis [60] Maxwel
Seite 102:
92 Literaturverzeichnis [85] Siegmu
Alle anzeigen

Muster und Alignments in zufÃ¤lligen Zeichenketten - Abteilung fÃ¼r ...

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?