12.07.2015 Aufrufe

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

7. Bewertung der Ergebnisse 90Die Scores der Sequenzen der gleichen Familie werden kleiner, lassen aber im Vergleichzu den Other-Sequenzen noch eine Klassifizierung zu. Die Standardabweichung derSuperfamily hat sich deutlich vergrößert, sodass sich die standardisierten Scores derSuperfamily nun über den Bereich von -5 bis 8 erstrecken und eine Abgrenzung sowohlzu den Other- als auch zu den Family Sequenzen nicht über alle Bereiche hinwegmöglich ist. Der Grund für dieses Verhalten kann teilweise damit begründet werden,dass das ursprüngliche Profil-MSA weniger Sequenzen hat und das Profil-HMM wenigerEmissionsspalten aufweist. In Relation dazu ist die Aufnahme von sechs entfernt verwandtenzusätzlichen Sequenzen in seinen Auswirkungen gewichtiger, als bei Modellenmit vielen und längeren Sequenzen, zu denen einige kurze Sequenzen aligniert werden.Ebenso ist eine teilweise Unschärfe“ in der SCOP Klassifikation der Sequenzen der”Testdatenbank möglich. Es ist nicht klar, ob mit Hilfe von sequenzbasierten Methodendie auf Struktur- und Funktionsinformation beruhende Klassifikation von SCOP (sieheKapitel 2.5.1) in allen Familien gleich gut abbildbar ist.7.6 Numerische Bewertung der ScoresDie Beurteilung der multiplen Sequenzalignments über alle Familien und alle Modelleauf Basis von Dichtediagrammen ist aufwendig und nicht objektivierbar. Nach einigenTestläufen stellt sich heraus, dass bestimmte Modelle gut, andere wiederum schlechterauf die progressive Expansion der Modelle reagieren. So spricht das Modell der Familieb.6.1.1 und e.3.1.1 positiv auf das Hinzufügen neuer Sequenzen in den ersten zweiZyklen an, jenes von a.138.1.1 und a.3.1.4 jedoch nicht. Wie kann dieser Effekt inZahlen dargestellt werden?Um diese Effekte numerisch auszudrücken, wird nach jedem Zyklus für jede Family derMittelwert der standardisierten Family-, Superfamily- und Fold-Dichtefunktionen berechnetund der Abstand in Relation zur Standardabweichung der Other-Dichtefunktiongesetzt. Am Ende jedes Zyklus kann damit der Mittelwert über alle Familien ermitteltwerden, um einen Gesamttrend abzulesen. Diese globalen Trendzahlen streichen zwarkeine einzelnen Modelle und Familien als besonders geeignet und ungeeignet heraus,machen aber eine globale Tendenz über alle Familien und Zyklen hinweg sichtbar.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!