12.07.2015 Aufrufe

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MASTERARBEIT - Fachhochschule Salzburg

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

2. Allgemeine Grundlagen 8Heute werden mit dem sogenannten Shotgun-Sequencing meistens zufällige Teilsegmenteeiner längeren DNA-Sequenz sequenziert und dann beim sogenannten Sequence Assemblingdie überlappenden Einzelteile mit speziellen Algorithmen zusammengefügt[21, 32]. Um Sequenzen softwaretechnisch verarbeiten und austauschen zu können, bedarfes einer Abstraktion der Sequenzen und speziellen Codierung der Grundbausteine.Eine DNA oder RNA als Sequenz dargestellt besteht aus einer Abfolge von vier Basen.Diese hintereinander gereiht bilden den genetischen Bauplan bzw. im Falle einesGenoms die komplette Erbinformation eines Lebewesens. Den Bioinformatikern dienteine Abfolge von Buchstaben der Abstraktion von Sequenzen. DNA-Sequenzen werdenbeispielsweise aus den vier Zeichen A, C, G und T gebildet, welche für vier Basen 2stehen. Die Menge Σ D der Zeichen zur Beschreibung der DNA und die Menge Σ R derZeichen zur Beschreibung der RNA lautet:Σ D = {A,G,C,T}Σ R = {A,G,C,U}Unter Transkription bezeichnet man allgemein die Übertragung eines Textes von einemSystem in ein anderes System. In Analogie dazu wird der Übersetzungsprozess von einerDNA-Sequenz in eine RNA-Sequenz von Biologen ebenso Transkription genannt [32].Aus der Sicht der Symbole entspricht eine Transkription einer DNA- in eine RNA-Sequenz formal einem Alphabetwechsel von Σ D nach Σ R [21]. Vereinfacht dargestelltentsteht aus einer DNA-Sequenz durch den Austausch der Base T (Thymin) gegen eineBase U (Uracil) eine RNA-Sequenz.Σ D = {A, G, C, T }T −→ UΣ R = {A, G, C, U}TranskriptionA G T C T C G T T A C T T C T T C AA G U C U C G U U A C U U C U U C ADas hierbei entstehende RNA-Molekül wird Transkript genannt [32] und trägt zurÜbersetzung der genetischen Informationen in Proteine bei.Bei Proteinen bilden Aminosäuren die Grundbausteine der Proteinsequenzen. Die Darstellungvon Proteinsequenzen erfolgt mittels eines standardisierten Alphabets mit demsogenannten One-Letter-Code.2 Die Buchstaben zur Darstellung einer DNA- oder RNA-Sequenz stehen dabei jeweils für die Namenvon Basen. Dabei steht für Adenin ein ’A’, für Guanin ein ’G’, für Thymin ein ’T’, für Cytosin ein’C’ und für Uracil ein ’U’.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!