29.12.2013 Aufrufe

Friedrich-Schiller - Chair for Bioinformatics Freiburg

Friedrich-Schiller - Chair for Bioinformatics Freiburg

Friedrich-Schiller - Chair for Bioinformatics Freiburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

40 KAPITEL 3. DER MULORA ANSATZ<br />

schon einmal alignierter Bereiche verboten wird. Zu diesem Zweck speichere ich alle<br />

schon alignierten Positionen in einer Liste und überprüfe in jedem Alignmentschritt<br />

ob die gerade betrachteten Positionen darin enthalten sind.<br />

Der zweite Ansatz verzichtet auf die Einschränkung auf nicht-überlappene Alignments<br />

und berechnet damit einfach nur die k besten Alignments. Um diese zu<br />

bestimmen ändere ich die Rekusionsfälle dahingehend ab, dass für jedes gematchte<br />

Positionspaar (i 1 ,i 2 ) zusätzlich eine Betrag ψ · υ(i 1 ,i 2 ) addiert wird.<br />

Dabei entspricht υ einer Funktion, welche für zwei Positionen die Anzahl angibt,<br />

wie oft diese beiden Positionen schon gematcht waren und ψ ein Strafscore<br />

für das wiederholte Verwenden gleicher Alignmentkanten zwischen zwei Basen. Da<br />

die Strafscores nur zu alternativen Motiven und nicht zu einem schlechteren Alignmentscore<br />

führen sollen, addiere ich alle angewanten Strafscores auf und korregiere<br />

nach der Berechnung des Alignments dessen Score mit Hilfe dieser Summe.<br />

Auch bei diesem Ansatz muss der paarweise lokale Alignment-Algorithmus k-mal<br />

ausgeführt werden. Die so berechneten Alignment liefern dann entweder alternative<br />

konservierte Bereiche oder geben einen Hinweis auf besonders stabile Motive.<br />

Als nächstes leitet MuLoRA mittels T-Coffee aus den paarweisen Alignments<br />

ein mutiples Alignment ab.<br />

3.2.3 Multiples Alignment<br />

Für die Berechnung des multiplen Alignments benötigt T-Coffee erst einmal die<br />

Bibliothek aller Alignmentkanten der paarweisen Alignments über den Sequenzen.<br />

Kantengewichte<br />

Wie im ersten Abschnitt dieses Kapitels schon erwähnt, sollen die Kantengewichte<br />

ihrer Zuverlässigkeit entsprechen, weshalb ich den Score der entsprechenden Alignments<br />

für die Gewichtung der Kanten verwende. Dieser wird dabei auf alle Alignmentkanten<br />

zwischen zwei Basen aufgeteilt. Kanten, die ein Gap enthalten bekommen<br />

hingegen ein Gewicht von 0, da sie keine In<strong>for</strong>mationen für die Berechnung<br />

des multiplen Alignments liefern. Falls dabei eine Kante durch die Berechnung<br />

überlappender Alignments mehrfach vorkommen sollte, werden die einzelnen<br />

Gewichte addiert.<br />

Damit hängt das Gewicht ζ einer Alignmentkante (i 1 ,i 2 ) in den k besten lokalen<br />

Alignments zweier Sequenzen S Rg1 und S Rg2 von dem Score s(A g1,g 2,k) des k-ten<br />

Alignments, und der Menge B(A g1,g 2,k) aller Kanten in A g1,g 2,k zwischen zwei Basen<br />

ab. Insgesamt ergibt sich so folgende Funktion zur Berechnung der Gewichte:<br />

⎧ ∑(<br />

)<br />

s(A g1 ,g<br />

⎪⎨<br />

2 ,k)<br />

k |B(A g1<br />

falls (i<br />

,g 2 ,k)| 1 ,i 2 ) ∈ B(A g1,g 2,k)<br />

ζ g1,g 2<br />

(i 1 ,i 2 ) =<br />

(3.9)<br />

⎪⎩<br />

0 sonst.<br />

T-Coffee<br />

Progressive Alignmentansätze leiten unter dem Problem, dass Fehler in den ersten<br />

Alignmentsschritten beim Einfügen der restlichen Sequenzen nicht mehr verbessert<br />

werden können. Um dieses Problem zu minimieren, beginnt T-Coffee mit denjenigen<br />

Alignmentsschritten, welche von den meisten anderen paarweisen Alignments<br />

bestätigt werden.<br />

Dazu erweitert das Programm in einem Vorverarbeitungsschritt die primäre Bibliothek.<br />

Das Ziel dabei ist, die einzelnen Kantengewichte so zu kombinieren, dass<br />

die neuen Gewichte die In<strong>for</strong>mationen aus der gesamten Bibliothek reflektieren. Um<br />

dies zu erreichen, verwenden Notredame et al. einen Triplet-Ansatz.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!