12.07.2015 Aufrufe

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

7. Bewertung der Ergebnisse 86und damit die Erkennungsrate zu verbessern. Die Interpretation der Veränderungen anden Dichtefunktionen soll der Beantwortung folgender Fragen dienen:• Wie ändert sich das Profil-HMM in Bezug auf die Scores?• Sind mit den erweiterten Profil-HMMs bessere oder schlechtere Erkennungsratenzu erwarten?• Kommt es zu einer Überanpassung des Modells oder zu einer Diversifikation desModells?Die Änderung des Bewertungssystems zeigt sich am besten im direkten Vergleich derDichtefunktionen von einem Zyklus zum anderen. Wie im vorangegangenen Abschnittbegründet wurde, ist der Abstand der Dichtefunktionen der Family-, Superfamily- undOther-Sequenzen ein wesentliches Merkmal in Bezug auf die erwarteten Erkennungsraten.Liegen die Dichtefunktionen in Relation dicht beisammen, ist eine klare Zuordnungschwierig; liegen sie weit auseinander, so ist eine klare Zuordnung einer Sequenz zu einerFamily oder Superfamily einfacher. Ziel jedes Modells ist deshalb die Verwendungeines Scores, der eine klare Zuordnung möglich macht und eine scharfe Trennung dereinzelnen Familien und Superfamilien vom Rest der Sequenzen ermöglicht. Ziel jederVeränderung am Modell ist aber auch, dass das Modell zum Guten“ verändert wird,”so dass sich die Mittelwerte der Dichtefunktionen voneinander entfernen.7.5 Graphische Bewertung der ScoresDie Abbildung 7.4 zeigt die Dichtefunktionen des Simple Corrected Score (SCS) und desReverse Corrected Score (RCS) nachdem die Sequenzen mit dem Profil-HMM der Familiee.3.1.1 einmal aligniert wurden. Die Abbildung zeigt, dass die Family-Sequenzender Familie e.3.1.1 über die Scores eindeutig klassifiziert werden können und deshalbhoch bewertet sind. Der standardisierte RCS liegt im Beispiel im Bereich von etwa 5 bis30. Diese eindeutige Trennung der Family-Sequenzen vom Rest kann auch bei den anderenScores beobachtet werden. Die Sequenzen der Superfamily heben sich zwar sowohlvon den Family- also auch von den Other-Sequenzen ab, Überlappungen auf beidenSeiten machen eine eindeutige Klassifizierung der Sequenzen im Überlappungsbereich

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!