12.07.2015 Aufrufe

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

3. Grundlagen des Sequenzalignments 23(insert), m die Übereinstimmungs- (match) und d für die Lösch-Operation (delete).Weist man nun jeder dieser Operationen bestimmte Kosten zu, dann lassen sich darausähnlich wie bei der gewichteten Hamming-Distanz die sogenannte Levenshtein-Distanzermitteln [32].Die Berechnung des Editierabstands der Zeichenketten A := a 1 a 2 . . . a m mit der Längem und B := b 1 b 2 . . . b n mit der Länge n erfolgt in einer Matrix D mit der Dimension(m + 1) × (n + 1). Beginnend von D 0,0 werden die Zellen aufsteigend belegt [30]:m = |A| n = |B|∀ 1 ≤ i ≤ m, 1 ≤ j ≤ nD 0,0 = 0; D i,0 = i; D 0,j = j⎧D ⎪⎨ i−1,j−1 +1 ai ≠b jD i,j = min D i−1,j +1⎪⎩ D i,j−1 +1(3.4)Nach der Berechnung steht die minimale Anzahl der Editieroperationen in der MatrixzelleD m,n . Die Tabelle 3.1 im Folgeabschnitt auf Seite 26 zeigt eine vollständig besetzteLevenshtein-Matrix für die beiden Zeichenketten VINTNER und WRITERS.Bei genauer Betrachtung der Levenshtein-Beispiele stellt man fest, dass eine Berechnungauch immer eine Alignierung der Sequenzen zur Folge hat. In den beiden BeispielsequenzenA und B wurden hierfür Längenkorrekturen der Zeichenketten vorgenommen.Das Zeichen ’-’ symbolisiert dabei eine eingefügte Leerstelle. Symbolpaarungenkönnen so verbessert werden, da die nachfolgenden Symbole eines Strings damit jeweilsum eine Position gegenüber den Symbolen des zweiten Strings verschoben werden. BeiVersuchen mit einfachen Zeichenketten wird auch schnell deutlich, dass damit durchausunterschiedliche Alignierungen und Levenshtein-Distanzen möglich sind. WeitereAlignierungen für A und B wären beispielsweise:A : V I N T N E R - A : - V I N T N E R -| | | | | | |Op : r r r m d m m i Op : i r m d m d m m i| | | | | | |B : W R I T - E R S B : W R I - T - E R S

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!