Friedrich-Schiller - Chair for Bioinformatics Freiburg
Friedrich-Schiller - Chair for Bioinformatics Freiburg
Friedrich-Schiller - Chair for Bioinformatics Freiburg
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
4 KAPITEL 1. EINLEITUNG<br />
Sequenzen:<br />
AB062402./11−40<br />
AC109352.3/19020−19048<br />
AP003174.2/91762−91734<br />
S57280.1/391−417<br />
UUUCCUGCUUCAACAGUGCUUGGACGGAAC<br />
UUUCCUGUUUCAACAGUGCUUGGAGGAAC<br />
UUUCUUCUUCAACAGUGUUUGGAUGGAAC<br />
UCGUUCGUCCUCAGUGCAGGGCAAUAG<br />
Multiples Alignment:<br />
AB062402./11−40<br />
AC109352.3/19020−19048<br />
AP003174.2/91762−91734<br />
S57280.1/391−417<br />
U − − U U C C U G U U U C A A C A G U G C U U GG A − GG − A A C − −<br />
U − − U U C U U − C U U C A A C A G U G U U U GG A U GG − A A C − −<br />
U − − U U C C U G C U U C A A C A G U G C U U GG A C GG − A A C − −<br />
U C G U U C G U − C C U C A − − − G U G C − − A G − − GG C A A U A G<br />
Abbildung 1.3: Multiples Alignment von vier Iron-Response-Elementen. Das Alignment<br />
beruht dabei nur auf den Sequenzin<strong>for</strong>mationen und vernachlässigt eventuell<br />
enthaltene Strukturen komplett.<br />
te sich dabei sowohl auf die Struktur, als auch auf den evolutionären Hintergrund<br />
beziehen. Idealerweise würden also die Basen innerhalb einer Spalte ähnliche strukturelle<br />
Positionen aufweisen und von einem gemeinsamen Vorfahren abstammen.<br />
Die Aufgabe von multiplen Alignments besteht also im Organisieren, Visualisieren<br />
und Analysieren mehrerer Sequenzen. Damit spielen sie als Eingabe für viele<br />
nachfolgende Methoden der Datenanalyse eine wichtige Rolle, weshalb ihr Anwendungsbereich<br />
in der Biologie fast keine Grenzen kennt.<br />
Allgemein könnte man multiple Alignments als eine Erweiterung der paarweisen<br />
Alignments betrachten. Alles was paarweise Alignments können, können auch<br />
multiple Alignments – allerdings um einiges besser, da sie viel genauere In<strong>for</strong>mationen<br />
über die Verteilung an einzelnen Positionen liefern. So ist es beispielsweise<br />
möglich, dass gemeinsame funktionelle Bereiche in Proteinfamilien erst durch die<br />
Verstärkung eines multiplen Alignments klar erkennbar werden, da die gegenseitigen<br />
Ähnlichkeiten für sich zu schwach sind, um durch ein paarweises Alignment<br />
hervorgehoben zu werden. Oder um es in den anschaulichen Worten des Molekularbiologen<br />
Arthur M. Lesk auszudrücken: “One or two homologous sequences whisper<br />
– a full multiple alignment shouts out loud.”<br />
Darüber hinaus bieten multiple Alignments aber noch Fähigkeiten, die über<br />
eine bloße Verallgemeinerung der paarweisen Alignments hinausgehen. Paarweise<br />
Alignments werden in der Regel verwendet, um für neue Sequenzen mit unbekannter<br />
Funktion möglichst ähnliche mit bekannter Funktion zu finden. Da man annimmt,<br />
dass ähnliche Sequenzen auch ähnliche Funktionen nachsichziehen, schließt man so<br />
auf die Funktion der neuen Sequenz.<br />
Will man hingegen diesen Schluss umkehren, kommt man mit paarweisen Alignments<br />
nicht weiter. Es gibt jede Menge Fälle, in denen sehr unterschiedliche<br />
Sequenzen trotz allem eine ähnliche Funktion aufweisen. Hier können nun multiple<br />
Alignments ihre Stärke ausspielen. Hat man mehrere Sequenzen, die trotz<br />
großer syntaktischer Unterschiede funktionsverwandt sind, versucht man mit multiplen<br />
Alignments herauszufinden, wo gemeinsame Kernbereiche hoher Ähnlichkeit<br />
liegen. Diese Kernbereiche könnten die essentiellen Teile der Moleküle sein, über die<br />
sich die Funktion definiert. So gesehen entsprechen multiple Alignments eher den<br />
Zielsetzungen der Abstraktion, Regelfindung, Generalisierung oder Erklärung.<br />
Neben der Identifikation von funktionsrelevanten und evolutionär konservierten<br />
Merkmalen gibt es jedoch noch eine Vielzahl von anderen Anwendungsmöglichkeiten.<br />
So bilden multiple Alignments auch die Grundlage für die Ableitung evolutionärer<br />
Historie aus DNA- oder Proteinsequenzen wie das Abschätzen von evolutionären<br />
Distanzen oder die Suche nach Hinweisen für Selektion. Die Verteilungs-