12.07.2015 Aufrufe

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

6. Implementierung eines MSA mit einem Profil-HMM 69Entropie, die zu einem späteren Zeitpunkt in dieser Arbeit noch einmal diskutiert undberechnet wird.Die Lösung beider Probleme besteht darin, Ausreißer und Sequenzen mit auffälligenScores auszuschließen und nur jene weiterzuverarbeiten, die obige Kriterien erfüllen.Diese Lösung bedarf der genauen Festlegung des Begriffs Ausreißer und der Klärungder Frage, wie eine Variable als Ausreißer erkannt werden kann, wenn der Wertebereichnicht bekannt ist. Dafür wurden in grepseq eine Lösung implementiert, der statistischeÜberlegungen zugrunde liegen:Untersucht man die Scores nach deren Verteilung, so stellt man fest, dass diese inden meisten Fällen einer Verteilungsfunktion entsprechen. So zeigt beispielsweise dieUntersuchung des Reverse Corrected Score“ von etwa 9500 Datensätzen, dass dieser”annähernd einer Normalverteilung entspricht (siehe Abbildung 6.1). Dieser Erkenntnisentsprechend kann aus dem Mittelwert µ und der Standardabweichung σ der Scoreseine Normalverteilung angenähert werden.Abbildung 6.1: Reale Verteilung und Annäherung der Normalverteilung für ReverseCorrected Scores auf Basis des Mittelwerts für Sequenzen der Familie d.38.1.5.Mit der Annahme, ein Score würde zufällig sein und die Verteilung eines Scores inallen Datensätzen würde einer Normalverteilung entsprechen, kann über die kumulativeVerteilungsfunktion (cumulative distribution function; CDF ) die Wahrscheinlichkeitberechnet werden, mit der ein Score einen Wert in einem bestimmten Bereich einnimmt.Realisiert wurde dies über die Möglichkeit der Angabe eines Grenzwertes (Threshold)

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!