12.07.2015 Aufrufe

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

7. Bewertung der Ergebnisse 94Das Diagramm in der Abbildung 7.9 belegt die Abhängigkeiten der Scores auch, vergleichtman es beispielsweise mit den Reverse Corrected Score Diagrammen aus Abbildung7.8. Wie aus dem Diagramm deutlich wird, unterscheidet sich das PCA Diagrammkaum vom Ergebnis anderer Scorepaarungen. Paarungen mit dem Reverse CorrectedScore und dem Reverse Correted Score (Foreward) zeigen durchaus vergleichbare Ergebnisse.Dies ist insofern bemerkenswert, als die PCA eine Linearkombination allersechs Dimensionen bildet. Dies bestätigt aber auch die Annahme, dass die Abhängigkeitder Scores untereinander groß ist und schon ein bis zwei Scores die Informationen nahezuvollständig enthalten 5 .Die Voraussetzungen für mindestens zwei elementare unabhängige Merkmale ist damitkaum gegeben. Keine der dargestellten Scorepaarungen würde demnach in der untersuchtenFamilie wesentlich zur Bildung eines trennfähigen nichtelementaren Merkmalsgeeignet sein.7.8 Entropie der EmissionsmatrixZur Überprüfung von Scoring-Matrizen wird vielfach der Informationsgehalt oder dieInformationsdichte der Matrizen festgestellt. Diese gibt - vereinfacht ausgedrückt -darüber Auskunft, inwieweit eine Scoring-Matrix Informationen über die Verteilungvon Aminosäuren in Sequenzen widerspiegelt oder ob eine Matrix eine reine Zufallsverteilungbeschreibt, also keinerlei verwertbare Information innehat. Grundlage derBemessung des Informationsgehalts ist die Annahme, dass die Information, die eineNachricht enthält, umgekehrt proportional zu ihrer Eintrittswahrscheinlichkeit ist.Tritt innerhalb einer Sequenz ein Zeichen mit der Wahrscheinlichkeit p = 1.0 auf, soenthält dieses Ereignis keinerlei Information. Ist ein Ereignis unwahrscheinlich und trittes doch ein, so vermittelt dies eine Information größer Null. Die gleiche Annahme giltbei Scoring-Matrizen für die einzelnen Zeichenpaarungen, die darin abgebildet werden.5 Genauere Vergleiche der PCA Ergebnisse zeigen, dass mit den meisten getesteten HMMs in einemScore schon 90% und mit zwei Scores 98% der Varianz beschrieben werden. Werden im Laufe derIterationen Sequenzen dem Profil-MSA hinzugefügt, so sinkt dieser Wert nach 6 Zyklen auf etwa 80%mit einem Score und 95% mit zwei Scores.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!