Friedrich-Schiller - Chair for Bioinformatics Freiburg
Friedrich-Schiller - Chair for Bioinformatics Freiburg
Friedrich-Schiller - Chair for Bioinformatics Freiburg
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
38 KAPITEL 3. DER MULORA ANSATZ<br />
nicht überlappende Alignments<br />
Abbildung 3.5: Beispiel für nicht überlappend Alignments. Der hellgraue Bereich<br />
stellt das optimale Alignment dar, wärend der dunkel bereich das nächst-beste Alignment<br />
zeigt.<br />
a 1 und a 2 berechnet werden. Die Scores der restlichen Basenpaare mit rechten Enden<br />
b r 1 bzw. b r 2 sind dann einfach an den entsprechenden Positionen, also in x xMa a1<br />
2<br />
(b r 1 −<br />
1,b r 2 −1) abzulesen. Da die bei der Berechnung von x xMa a1<br />
2<br />
(a r 1 −1,a r 2 −1) erhaltenen<br />
Zwischenergebnisse nicht mehr für andere Berechnungen verwendet werden können,<br />
werden sie auch nicht gespeichert.<br />
Nachdem die Einträge in D berechnet wurden, kann T(|S R1 |, |S R2 |) bestimmt<br />
werden. Der Score s pla des besten lokalen Alignments der Sequenzen S R1 und S R2<br />
ergibt sich dann aus den maximalen Eintrag in T. Das Alignment und damit die<br />
Lösung des paarweisen lokalen Alignmentproblems (Definition 14) kann nun einfach<br />
mittels Backtracking bestimmt werden. Dazu beginnt man bei dem Eintrag in T<br />
welcher s pla enthält und verfolgt die Operationen zurück, bis ein Eintrag 0 in T<br />
erreicht ist. Die Art und die Reihenfolge der Operationen bestimmen dann eindeutig<br />
das Alignment. Den kompletten Algorithmus habe ich noch einmal auf der folgenden<br />
Seite zusammengefasst.<br />
Wie in der Beschreibung des Verfahrens begründet, berechne ich jedoch neben<br />
dem besten lokalen Alignment noch die nächstbesten Alignments, wobei ich mich<br />
für zwei Ansätze entschieden habe.<br />
Die k-besten Alignments<br />
Der erste Ansatz für die Bestimmung der k-besten Alignmnets berechnet die k<br />
lokalen paarweisen Alignments der Sequenzen S R1 und S R2 mit den höchsten Score,<br />
welche sich nicht überlappen. Dies entspricht damit dem Ansatz, wie er von<br />
Programmen wie BLAST [AGM90] bei sequenzieller Lokalität verwendet wird. Allerdings<br />
ist die Berechnung bei struktureller Lokalität wesentlich anspruchsvoller.<br />
Während sich die besten nicht-überlappenden Alignments bei der Verwendung<br />
von sequenzieller Lokalität einfach mittels Traceback aus den einmal berechneten<br />
Rekusionsgleichungen ableiten lassen, ist das bei struktureller Lokalität nicht<br />
möglich. Die Ursache dafür liegt in den Exklusionen. Da diese selbst wieder konservierte<br />
Motive enthalten können, müssen sie bei der Suche nach weiteren lokalen<br />
Alignments auch mit betrachtet werden. Abbildung 3.5 zeigt ein Beispiel für diese<br />
Situation.<br />
Da sich die Scores in diesen Bereichen aber aus den davorliegenden Bereichen<br />
ergeben, würden diese schon vorher alignierten Bereiche beim Traceback wieder<br />
verwendet werden. Deshalb ist für jedes neue Alignment über S R1 und S R2 auch<br />
eine neue Berechnung der Rekursionsgleichungen nötig, wobei dann das alignieren