1 Menneskets genom

18209 01.fm7 Page 13 Friday, March 3, 2006 12:37 PM 

1 

Indledning 

Menneskets genom 

Eigil Kjeldsen og Søren Nørby 

Alle cellulære organismer lige fra de simpleste 

bakterier til de mest komplekse eukaryote organismer, 

herunder mennesket, har DNA som 

bærer af den genetiske information. 

De enkelte organismers liv afhænger af cellernes 

evne til at kunne opbevare, åbne og oversætte 

de genetiske instruktioner som kræves for 

at kunne danne og vedligeholde den levende 

organisme. For artens eksistens er det endvidere 

nødvendigt at cellerne kan føre den genetiske 

information videre til næste generation (se videre 

i kapitel 2). 

Den genetiske information ligger lagret på en 

digital måde i DNA’et, som er opbygget af kulhydratet 

deoxyribose, fosfat og fire baser. De fire 

baser kaldes A, G, C og T, forkortelser for henholdsvis 

adenin, guanin, cytosin og thymin, og 

det er rækkefølgen af disse som definerer den 

genetiske information. Den genetiske information 

er lineær og kan beskrives som et sprog 

hvor alfabetet har fire bogstaver. Organismer er 

forskellige fra hinanden som følge af at rækkefølgen 

og antallet af bogstaver er forskellig. 

Et individs genom kan defineres som den 

fuldstændige genetiske information (DNAindhold) 

i den pågældendes celler. Den geneti- 

ske information er indeholdt i baserækkefølgen, 

som kan aflæses ved DNA-sekventering. Menneskets 

arvemasse beskrives ofte som bestående 

af to genomer: et komplekst nukleært genom 

(kerne-DNA), som udgør 99,9995% af den 

samlede genetiske information og et mere simpelt 

opbygget mitokondrie-genom (mitokondrie-DNA, 

mtDNA), som udgør de resterende 

0,0005% (Figur 1.1). 

Hver af de omkring 1013 

(10.000 milliarder) 

somatiske celler, som et udvokset menneske 

består af, har sin egen kopi af det nukleære genom. 

Det nukleære genom er i de somatiske celler 

diploidt og organiseret i 23 par lineære 

DNA-molekyler, ét for hvert af cellens 46 kromosomer, 

44 autosomer og 2 kønskromosomer, 

XX for kvinder og XY for mænd (Figur 

1.5 og 1.8). 

Mitokondriegenomet er anderledes organiseret 

og består af et lille cirkulært DNA-molekyle, 

som findes i mange kopier i det enkelte mitokondrie 

ligesom der er flere mitokondrier i 

den enkelte celle (se nærmere side 38ff). En referencesekvens 

for menneskets mtDNA blev 

første gang offentliggjort i 1981, og endeligt 

bekræftet med korrektioner i 1999. 

13


1 Menneskets genom 

I 1990 blev det offentlige konsortium International 

Human Genome Sequencing Consortium 

(IHGSC), bestående af 20 centre i 6 lande, dannet 

med det formål at etablere en meget nøjagtig 

DNA-sekvens af det humane genom (reelt 

det nukleære genom). Der blev nogle få år senere 

også etableret et privat konsortium, Celera 

Genomics, 

med samme formål. Den største del af 

genomsekvensen, den såkaldte råskitse (eng. 

draft sequence), 

blev publiceret samtidig under 

stor mediebevågenhed af de to konsortier i februar 

2001. Da de to konsortier har anvendt 

hvert sit udgangsmateriale til sekventeringen, er 

råskitserne ikke identiske. I begge råskitser var 

der endvidere store mangler, idet bl.a. ca. 10% 

af eukromatinets DNA ikke var sekventeret 

(Boks 1.2). I oktober 2004 blev en færdig 

DNA-sekvens af det humane genom publiceret, 

hvor >99% af eukromatinet er sekventeret 

færdig. 

De to eksisterende referencesekvenser for det 

humane genom indeholder hver sin sekvens af 

14 

Menneskecelle 

Cellekernen 

(det nukleære 

genom) 

Mitokondrie 

(mitokondriegenomet) 

Figur 1.1 Et menneskes arvemasse består af to distinkte 

dele: 1) det nukleære genom som i sin diploide 

form indeholder ca. 6 milliarder basepar (6 Gb), der er 

fordelt på 23 par lineære DNA-molekyler, ét for hvert 

kromosom, hvor det korteste er ca. 47 mio. basepar 

langt og det længste er omkring 246 mio. basepar 

langt; 2) mitokondrie-genomet, som er et cirkulært 

DNA-molekyle på 16,6 kb, og med flere kopier i hvert 

mitokondrie. 

DNA-molekylerne i de 22 autosomer og de to 

kønskromosomer X og Y. En sådan referencesekvens 

af de 24 forskellige DNA-molekyler 

betegnes »det haploide humane genom« og består 

af ca. 3,1 milliarder nukleotidpar. 

Den humane referencesekvens indeholder 

meget overraskende kun omkring 27.000 protein-kodende 

gener (Tabel 1.1), hvor man tidligere 

troede, at der var mellem 65.000 og 

100.000. De tidligere skøn var så høje, fordi de 

bl.a. var baseret på en antagelse om at hvert gen 

definerede ét enkelt protein. Vi ved i dag at en 

proces som alternativ splejsning af mRNA (se 

side 27) udgør en langt mere væsentlig del af 

genom-ekspressionen end tidligere antaget, og 

at et gen derfor kan kode for dannelse af flere 

forskellige proteiner med forskellige funktioner. 

Mitokondrie-genomet indeholder 37 gener, 

hvoraf 13 koder for proteiner der er involveret 

i ATP-produktionen, den oxidative fosforylering. 

Resten koder for de RNA-molekyler der 

er involveret i den mitokondrielle protein-syntese 

(se Figur 1.27). 

Figur 1.2 skitserer flowet af den genetiske information 

i forbindelse med gen-ekspression: 

fra DNA til RNA til protein. Genomet er den 

samlede DNA-sekvens, transkriptomet udgøres 

af RNA-transkripterne, og proteomet er den 

samlede gruppe af proteiner som bliver udtrykt. 

Mennesket består af mere end 250 forskellige 

celletyper, og alle somatiske, kerneholdige celler 

fra samme individ indeholder samme genom, 

mens transkriptomet og proteomet er forskelligt 

fra celle til celle som følge af variation i 

gen-ekspressionen. 

I de følgende afsnit vil den genetiske informations 

struktur, funktion og dynamik på de 

enkelte niveauer blive gennemgået i mere detaljeret 

form.


Nukleinsyrernes opbygning 

DNA 

DNA som kemisk enhed blev opdaget af Johann 

Friedrich Miescher (1844-95). Det var dog først 

i 1930’erne at man blev i stand til at undersøge 

den kemiske struktur nærmere. 

DNA’s centrale biologiske funktion blev først 

erkendt i begyndelsen af 1940’erne, hvor den 

amerikanske mikrobiolog Oswald Avery (1877- 

1955) og medarbejdere kunne vise at DNA er 

bærer af den genetiske information. Før den tid 

havde man ikke skænket DNA megen opmærksomhed 

i genetisk henseende, idet man mente at 

et så relativt monotont opbygget molekyle, som 

man troede der var tale om, ikke kunne give anledning 

til den mangfoldighed af arter vi kender. 

Efter Averys opdagelse interesserede man sig mere 

for DNA-molekylet, og biokemikeren Erwin 

Chargaff (1905-2002) fandt i slutningen af 

1940’erne at i ethvert DNA-molekyle er antallet 

af A’er lig med antallet af T’er og på samme måde 

er antallet af G’er lig antallet af C’er. Chargaff 

fandt også at sammensætningen af DNA varierer 

fra art til art mht. de relative mængder af A+T og 

G+C. Samtidig lykkedes det biofysikeren Rosalind 

Franklin (1920-58) ved hjælp af røntgen-krystallografi 

at vise at DNA sandsynligvis er spiralsnoet 

som en helix, men om der var to eller tre 

kæder var uklart. 


Genom Transkriptom Proteom 

DNA 

Replikation 

Transkription 

RNA 

Translation 

Protein 

Figur 1.2 Skitse af flowet af den genetiske information i en menneskecelle. Genomet er den samlede DNA-sekvens, 

transkriptomet udgøres af RNA-transkripterne, og proteomet er den samlede gruppe af proteiner som genomet koder for. 

James Watson (f. 1928) og Francis Crick 

(1916-2004) kunne i 1953 offentliggøre den 

korrekte model for et DNA-molekyle, som bestående 

af to strenge snoet omkring hinanden i 

en dobbelthelix1 

(også kaldet Watson-Crickmodellen, 

Figur 1.3A). Hver DNA-streng består 

af en kæde af alternerende deoxyribose og 

fosfat med en base bundet til hver deoxyriboseenhed. 

I modellen danner de to DNA-strenge en stige 

formet som en højredrejet spiral (Figur 

1.3A). Det er senere vist, at en DNA-dobbelthelix 

også kan antage andre former, som bl.a. 

har betydning for binding af regulatoriske proteiner. 

De to kæder holdes sammen af hydrogen-bindinger 

mellem baserne, hvor A i den 

ene kæde parres med T i den anden, og G tilsvarende 

med C. Heraf følger, at kender man 

base-rækkefølgen (sekvensen) i den ene streng, 

så kender man automatisk også rækkefølgen i 

den anden streng – de to strenges basesekvenser 

er komplementære. Det bemærkes at der er 3 

hydrogen-bindinger mellem G og C og kun 2 

mellem A og T. Dette betyder at jo højere indholdet 

af GC-par er i et DNA-segment, desto 

1 1953a Watson JD & Crick FHC. Molecular structure of nucleic 

acids: a structure for deoxyribose nucleic acid. Nature 

171: 737-738 og 1953b Watson JD & Crick FHC. Genetical 

implications of the structure of deoxyribonucleic 

acid. Nature 171: 964-967 

15



mere energi skal der til for at bryde hydrogenbindingerne 

og adskille de to DNA-strenge i 

det pågældende område. Dette har betydning 

16 

A 

B 

CH 3 

N 

5' 3' 

C G 

A T 

G C 

T A 

C G 

A T 

T A 

C G 

C G 

A T 

A T 

C G 

A T 

C G 

G C 

3' 5' 

O N 

N N 

O 

H 

Hydrogen 

bindinger 

N 

Thymin Adenin 

N 

5' 

3' 

O 

O P OH 

O 

CH2 5' O 

C H H C 

4' 

H C C H 

3' 

O H 

O P OH 

O 

2' 

C G 

CH2 5' O 

C H C 

4' 

H C H 

3' 

O H 

O P OH 

O 

2' 

O 

C C 

O 

CH2 O 

HO P O 

G C 

H 

C 

CH T A 

2 

5' O 

C H H C 

4' 

H C C 

3' 

H 

2' 

O H 

3' 

H 

H 

2' 

H 

1' 

4' 

C H H C 

5' 

O 

C C 

O 

CH2 O 

HO P O 

O 

3' 

H 

2' 

H 

1' 

C H H 

5' C 

H 

4' 

C C 

O 

CH2 O 

HO P O 

O 

3' 

1' 

1' 

H 

H 

2' 

H 

1' 

4' 

C H H C 

5' 

1' 

N 

H 

N O 

N N 

O 

N 

ved DNA-replikation og transkription samt 

ved DNA-analyse. 

N 

N 

H 

Cytosin Guanin 

Figur 1.3 DNA-molekylets struktur. A. Til venstre er vist DNA-dobbelthelix, som består af to DNA-polynukleotidstrenge, 

som er snoet om hinanden og danner en højredrejet spiral der holdes sammen af hydrogen-bindinger mellem 

de parrede baser. Til højre er vist, at polynukleotidstrengene består af deoxyribose-fosfat-kæder, hvor nukleotiderne i 

hver streng er koblet sammen med 3'-5' fosfodiester-bindinger og baserne (A, G, C og T) er kovalent bundet til deoxyribosen. 

Pilene angiver orienteringen af de to DNA-strenge, der er antiparallelle i forhold til hinanden. B. DNA indeholder 

4 forskellige baser, som parvis er komplementære. Basernes kemiske struktur gør at der kun effektivt kan dannes 

hydrogen-bindinger mellem A og T samt mellem G og C i DNA-dobbelthelix. Der dannes to hydrogen-bindinger mellem 

A og T mens der dannes tre hydrogen-bindinger mellem G og C. Denne baseparring mellem de to polynukleotidstrenge 

kan kun ske når disse er antiparallelt orienteret. 

N 

3' 

5'


A 

B 

HOCH2 O OH 

H 

H H 

H 

OH OH 

Ribose 

O 

HC 

C 

NH 

HC 

N 

H 

C 

Uracil 

O 

HOCH 2 O OH 

H 

H H 

OH H 

H 

Deoxyribose 

H 3 C 

Når to DNA-strenge ved baseparring associeres 

til en DNA-dobbelthelix sker det i modsat 

orientering, hvilket vil sige at hvis den ene 

streng fx er orienteret i 5'→3'-retning 

så vil den 

anden streng orienteres i 3'→5'-retning; 

de er 

antiparallelle, som vist i Figur 1.3A. Nomenklaturen 

for retningen skyldes, at nukleotiderne 

under syntesen af DNA-strengen bindes sammen 

af esterbindingen mellem den fri OHgruppe 

i det sidst indbyggede nukleotid og fosfatgruppen 

i det ny. Den fri OH-gruppe sidder 

på det C-atom i deoxyribosen der betegnes 

med 3' og definerer dermed DNA-strengens 3'ende. 

Tilsvarende defineres 5'-enden af den fri 

fosfatgruppe på deoxyribosens 5'-C. 

En DNA-streng består således af en lang række 

enheder (nukleotider), som hver igen består 

af følgende tre elementer: 1) deoxyribose, som 

er et kulhydrat med 5 C-atomer (en pentose), 

hvortil der dels er bundet 2) en nitrogenholdig 

base (A, G, C eller T), dels 3) en fosfatgruppe. 

Cytosin og thymin tilhører pyrimidingruppen af 

baser, der er opbygget af en sekskantet pyrimi- 

C 

HC 

O 

C 

NH 

C 

ON 

H 

Thymin 

C 

5' 3' 


Figur 1.4 Strukturelle forskelle mellem RNA og DNA. 

A. RNA indeholder kulhydratet ribose, som svarer til DNA’ets deoxyribose, men ribosen har en ekstra OH-gruppe. 

B. RNA indeholder basen uracil, som ligner thymin, men mangler CH3-gruppen. C. I RNA er nukleotiderne som i DNA 

koblet sammen med 3'-5' fosfodiester-bindinger. I modsætning til DNA er RNA enkeltstrenget, men indeholder ofte 

korte strækninger af nukleotider som baseparrer med komplementære sekvenser andre steder i samme molekyle ( ). 

Dette medfører at et RNA-molekyle kan foldes i en tredimensionel struktur bestemt af nukleotidsekvensen. 

G 

U 

A 

U 

C 

C 

A 

U 

A 

G 

dinring, mens guanin og adenin tilhører puringruppen, 

som har en femkantet ring koblet til 

den sekskantede (se Figur 1.3B). 

RNA 

RNA-molekyler er polynukleotider, ligesom 

DNA-molekylet, men adskiller sig på tre væsentlige 

punkter fra DNA (Figur 1.4): 1) kulhydrat-molekylet 

i RNA-nukleotiderne er ribose, 

Boks 1.1 

Længdeenheder i DNA- og RNA-molekyler 

Da DNA er dobbeltstrenget, angives længden af molekylerne 

i antal basepar (bp). Et kilobasepar (kb) er 

103 bp og et megabasepar (Mb) er 106 bp. Et gigabasepar 

(Gb) er 109 bp. 

1 kb = 1000 bp 

1Mb = 1000 kb = 1.000.000 bp 

1 Gb = 1000 Mb = 1.000.000 kb = 1.000.000.000 bp 

Længden af RNA-molekyler kan ikke udtrykkes i bp, da 

de er enkeltstrengede, hvorfor længden angives i antal 

nukleotider. 

17



2) RNA indeholder ikke thymin, men i stedet 

pyrimidinen uracil, som ligeledes er komplementær 

til adenin, og 3) RNA-molekyler er 

enkeltstrengede, men indeholder oftest korte 

strækninger af nukleotider som baseparrer med 

komplementære sekvenser andre steder i molekylet 

(Figur 1.4C). 

Pakning af DNA til kromosomer 

Kromosomerne gennem cellecyklus 

Kromosomer afbildes næsten altid i en tilstand 

hvor kromatinet, dvs. DNA og associerede 

proteiner, er mest kompakt. Denne tilstand optræder 

kun i en meget kort periode af cellens 

livscyklus, nemlig i metafasen i celledelingen 

(Figur 1.5 og 1.6; se også Kapitel 2). 

På alle andre tidspunkter ligger kromosomerne 

som lange, tynde og fine tråde i cellekernen, 

og kan kun vanskeligt visualiseres i mikroskopet. 

Et kromosom fungerer som en strukturel 

enhed i cellen, og hvert enkelt kromosom ligger 

i et afgrænset afsnit ( compartment) 

i cellekernen 

(Figur 1.6). 

18 

Figur 1.5 Spredte kromosomer fra en celle i metafasen 

efter Giemsa-farvning, hvor man kan se lyse og mørke 

bånd langs de enkelte kromosomer. Parvis er kromosomernes 

båndmønster ens undtagen for X- og Y-kromosomerne. 

Tallene angiver eksempler på kromosompar, 

her nr. 1 og 13 samt kønskromosomerne X og Y. 

Hvert kromatid (G1-fase-kromosom/G2-fa 

se-kromosomhalvdel – se Figur 2.1) indeholder 

ét langt, lineært, dobbeltstrenget DNA-molekyle 

som er mange millioner basepar langt. 

Figur 1.6 Til venstre er vist en FISH-farvning af metafase-kromosomer fra dyrkede lymfocytter med whole chromosome 

painting-prober for kromosom 2 (rød) og kromosom 16 (grøn) (Se Kap. 4 for beskrivelse af FISH-farvning). Kontrastfarven 

er 4’,6-diamidino-2-fenylindol (DAPI), som farver de øvrige kromosomer (blå). Til højre er vist en cellekerne, 

hvor man kan se de enkelte kromosomer (2 og 16) liggende i hvert sit compartment. De øvrige kromosomer kan ikke 

ses individuelt, men er kontrastfarvet blå.


Længden af det enkelte DNA-molekyle afhænger 

af størrelsen af kromosomet som vist i Tabel 

1.1. 

Kromosomstrukturen og graden af kromosomernes 

kondensering varierer med cellecyklus 

(se Mitosen, side 52), og man skelner på 

den baggrund mellem mitotiske kromosomer 

og interfasekromosomer. 


Tabel 1.1 Det haploide humane genom. DNA-indholdet samt antallet funktionelle gener i hvert 

kromosom. 

Fra National Center for Biotechnology Information (NCBI) Human Genome Project, november 2005 

Kromosom Mb % af genomet Samlede antal gener Antal Gener/Mb * % af gener i alt 

1 246 8,0 2610 10,6 9,7 

2 243 7,9 1748 7,2 6,5 

3 200 6,5 1381 6,9 5,2 

4 191 6,2 1024 5,4 3,8 

5 189 6,1 1190 6,3 4,4 

6 171 5,5 1394 8,2 5,2 

7 159 5,1 1378 8,7 5,1 

8 146 4,7 927 6,3 3,5 

9 138 4,5 1076 7,8 4,0 

10 135 4,4 983 7,3 3,7 

11 135 4,4 1692 12,5 6,3 

12 132 4,3 1268 9,6 4,7 

13 114 3,7 496 4,3 1,9 

14 106 3,4 1173 11,0 4,4 

15 100 3,3 906 9,0 3,4 

16 89 2,9 1032 11,6 3,8 

17 79 2,6 1394 17,7 5,2 

18 76 2,5 400 5,3 1,5 

19 64 2,1 1592 25,0 5,9 

20 62 2,0 710 11,4 2,6 

21 47 1,5 337 7,2 1,3 

22 50 1,6 701 14,1 2,6 

X 155 5,0 1141 7,4 4,3 

Y 58 1,9 255 4,4 1,0 

3085 100,0 26808 8,7 100,0 

* Bemærk variationen i gen-tætheden på de enkelte kromosomer 

Interfasekromosomer og kromatindomæner 

Den samlede længde af alle 46 DNA-molekyler 

i en cellekerne i G1-fasen er ca. 2 meter. De er 

pakket i en cellekerne som for en typisk menneskecelle 

vil være omkring 5-8 µm i diameter. 

Omregnet svarer det til at hvis man forestiller 

sig cellekernen på størrelse med en tennisbold 

19



så skulle den indeholde en ca. 20 km lang og 

meget tynd tråd (ca. 20 µm i tykkelse). 

For at cellekernen skal kunne rumme ca. 2 meter 

DNA, må det nøgne DNA pakkes med forskellige 

proteiner til det kompleks der kaldes kromatin. 

Disse proteiner består af en familie af basiske 

proteiner kaldet histoner og en heterogen 

gruppe af sure såkaldte non-histon-proteiner, 

som er knap så velkarakteriserede som histonerne. 

De forskellige hierarkiske niveauer i pakningen 

af kromosomer er skematiseret i Figur 1.7. 

Der er fem hovedtyper af histoner (H1, H2A, 

H2B, H3 og H4) som spiller en særdeles vigtig 

rolle for pakningen af DNA’et i cellekernen. 

Aminosyresekvenserne (aminosyrer er byggesten 

i proteiner) af H2A, H2B, H3 og H4 er 

20 

600 nm 

Kromatinloop 

(~75 kb) 

p 

q 

13 

12 

11.2 

11.1 

11.1 

11.2 

12 

21.1 

21.2 

21.3 

22 

23 

24 

25 

Kromatider 

600 nm 600 nm 

Scaffold 

30 nm 

9,5 Mb 

6,0 Mb 

7,0 Mb 

4,5 Mb 

5,5 Mb 

3,0 Mb 

8,5 Mb 

8,0 Mb 

4,5 Mb 

7,5 Mb 

8,0 Mb 

10 nm 

1,5 Mb 

Nukleosom 

30 nm 10 nm 

Kromatinfiber 

2 nm 

Linker DNAdobbelthelix 

Figur 1.7 Fra DNA-dobbelthelix til metafase-kromosom. Her er vist et ideogram for human kromosom 17 i G-båndmønster 

(400-bånds opløsning). Til venstre på ideogrammet er vist båndnummereringen og til højre på ideogrammet 

er vist de omtrentlige længder af DNA-dobbelthelix indeholdt i de enkelte lyse og mørke bånd. Til højre for ideogrammet 

er vist en stiliseret tegning som viser princippet i at de to kromatider hver består af en lang DNA-dobbelthelix. 

Disse er pakket på den måde som er illustreret nederst i figuren. Den estimerede pakningsratio for humane kromosomer 

er 1:10 på nukleosom-niveau, 1:36 for 30 nm kromatin-fiberen og 1: >10.000 for metafase-kromosomet. 

meget velbevaret gennem evolutionen, som 

vist i Tabel 1.2 for H4, hvor der er en meget 

høj grad af sekvens-identitet mellem meget forskellige 

eukaryote arter. Dette betyder at 

DNA-pakningen er en grundlæggende mekanisme, 

som er ens for selv meget forskelligartede 

eukaryote organismer. To kopier af hver af 

disse fire histoner danner tilsammen en histonoktamer, 

som et segment af DNA-dobbelthelixen 

på ca. 140 bp vindes omkring ligesom en 

tråd om en spole. Det svarer til at dobbelthelixen 

er vundet lige under 2 gange rundt om oktameren 

og fortsætter i et kort linker-segment 

på 

mellem 20 og 60 basepar til næste histon-oktamer. 

Det enkelte kompleks bestående af histonoktamer 

og DNA kaldes et nukleosom, 

og er


den grundlæggende strukturelle enhed i kromatinet. 

Histon H1, hvis aminosyresekvens varierer 

en del mere mellem arterne end de øvrige 

histoners, synes at binde til DNA fra kanten af 

hvert nukleosom. 

Igennem cellecyklus undergår kromosomerne 

en ordnet cyklus af kondensering og dekondensering. 

I interfasekernen er kromosomerne og 

kromatinet relativt dekondenseret sammenlignet 

med kondenseringsgraden af kromatinet i metafase-kromosomerne. 

Dog er det sådan at selv i 

interfasekernen er DNA mere kondenseret end 

det ville være i sin native, proteinfrie form (også 

kaldet nøgent DNA). Det meste, hvis ikke alt, 

DNA i cellekernen er associeret med histoner, 

hvilket kondenserer det til ca. 10% af dets native 

længde (Figur 1.7). Eksempelvis vil DNA’et i 

kromosom 17 i sin native, nøgne form have en 

længde på ca. 5 cm og efter kompleksdannelsen 

med histonerne vil den være ca. 0,5 cm. 

Nukleosomfiberen (10 nm-fiberen, Figur 

1.7), som har et perler-på-en-snor-udseende, er 

igen pakket som en helix i en sekundær kromatinstruktur 

kaldet en solenoide. I et elektronmikroskop 

kan denne kromatinfiber ses som en 30 

nm tyk fiber og er således ca. 3 gange tykkere 

end nukleosomfiberen. 


Tabel 1.2 Aminosyre-sekvenserne i ét-bogstavkode (se Kap. 17, side ##) for histon H4 fra forskellige 

arter. Understregning viser forskel fra den humane sekvens og »……« angiver manglende aminosyrer. 

Data er fra NCBI. 

Menneske 

Okse 

Kylling 

Rotte 

Majs 

Bananflue 

S. pombe (gær) 

aminosyre nr 1 103 

msgrgkggkg lgkggakrhr kvlrdniqgi tkpairrlar rggvkrisgl iyeetrgvlk vflenvirda vtytehakrk tvtamdvvya lkrqgrtlyg fgg 




msgrgkggkg lgkggakrhr kvlrdniqgi tkpairrlar rggvkrisgl iyeetrgvlk iflenvirda vtyteharrk tvtamdvvya lkrqgrtlyg fgg 

mtgrgkggkg lgkggakrhr kvlrdniqgi tkpairrlar rggvkrisgl iyeetrgvlk vflenvirda vtytehakrk tvtamdvvya lkrqgrtlyg fgg 

msgrgkggkg lgkggakrhr kilrdniqgi tkpairrlar rggvkrisal vyeetravlk lflenvirda vtytehakrk tvtsldvvys lkrqgrtiyg fgg 

Pyrenomonas salina msgrgkggkg lgkggakrhr kvlrdniqgi tkpairrlar rggvkrisgl iyeetrsvlk vflenvirda vtyteharrk tvtamdvvya lkrqgrtlyg fgg 

Aspergillus nidus 

msgrg...........akrhr kilrdniqgi tkpairrlar rggvkrisam iyeetrgvlk tflegvirda vtytehakrk tvtsldvvya lkrqgrtlyg fgg 

Hver omdrejning i solenoiden svarer til seks 

nukleosomer og synes at udgøre den grundlæggende 

enhed i kromatin-organisationen. Pakket 

således vil DNA’et i kromosom 17 være ca. 

0,1 cm langt. 

Hver solenoide er igen pakket i form af såkaldte 

loops (slynger) eller domæner, som med 

intervaller på omkring 10-100 kb er fastgjort til 

Boks 1.2 

HETEROKROMATIN 

1 Konstitutivt heterokromatin repræsenterer DNA 

som ikke indeholder gener og altid bevares kompakt 

i sin organisation. Denne del omfatter bl.a. 

centromer- og telomer-DNA. 

2 Fakultativt heterokromatin mener man indeholder 

gener som er inaktive i nogle celler, eller er inaktive 

i bestemte dele af cellecyklus, mens de i andre celler 

eller andre dele af cellecyklus er aktive. Når generne 

er inaktive, pakkes de som heterokromatin. 

Det menes at kromatinstrukturen er så kompakt at 

de proteiner som er involveret i gen-ekspression ikke 

kan komme til. 

EUKROMATIN 

De resterende kromosomregioner som indeholder 

de aktive gener, er mindre kompakte og tillader at 

ekspressions-proteinerne kan komme til. Eukromatin 

findes spredt i kromosomerne. 

21



et non-histon-protein-netværk også kaldet matrix 

eller scaffold (proteinskelet) (Figur 1.9A). 

De enkelte loops er bundet til protein-skelettet 

via AT-rige DNA-regioner kaldet MARs ( matrix-associated 

regions) 

eller SARs ( scaffold attachment 

regions). 

Det er ikke endeligt afklaret om 

disse loops er de grundlæggende funktionelle 

enheder ved eksempelvis replikation eller 

transkription eller begge dele. 

Når cellerne ikke er i deling, kan man med 

lysmikroskopi se at cellekernen har lyse og 

mørkt farvede områder. De mørkt farvede 

områder synes at koncentrere sig i periferien af 

cellekernen og kaldes heterokromatin. Det er 

relativt kompakt i sin organisation, selvom det 

er mindre kompakt end i metafase-kromosom-strukturen. 

Man skelner mellem konstitutivt 

og fakultativt heterokromatin (Boks 

1.2), 

Mitotiske kromosomer 

De ovenfor omtalte loops kan udgøre begyndelsen 

til de fortykkelser som kan ses i mikroskopet 

i den tidlige profase, hvor mitosen begynder. 

I selve profasen kan kromosomerne let ses 

i lysmikroskopet. Efter farvning af kromosomerne 

kan der identificeres 1000 bånd eller flere 

(høj-opløsnings-båndfarvning), og et bånd 

vil således kunne rumme flere millioner basepar 

og måske 30-100 gener. I profasen er kromosom 

17 kondenseret til en længde på ca. 15 µm 

svarende til 1/3000 af længden af DNA-molekylets 

native form. 

Når kondenseringen er maksimal, som i 

metafasen, har kromosomerne en længde på ca. 

1/50.000 af DNA’ets native længde. I en metafase 

efter båndfarvning kan et bånd således teoretisk 

indeholde ca. 5-20 millioner basepar. 

Med menneskets ca. 27.000 gener og et samlet 

antal bånd på metafasekromosomerne på 400 

bliver den gennemsnitlige gentæthed ca. 70 gener 

per bånd. 

22 

Efter mitosen dekondenserer kromosomerne 

og indtager igen deres kromatinstruktur i interfasekernen, 

hvor de er klar til at begynde en ny 

cyklus. 

Strukturer i kromosomet 

Metafasekromosomet, der dannes på et tidspunkt 

i cellecyklus, efter at DNA-replikationen 

har fundet sted (se videre i kapitel 2), består 

af to udgaver af et lineært DNA-molekyle 

repræsenteret ved de to kromatider, som holdes 

sammen i centromeret (Figur 1.8 og 

1.9B). Centromeret har forskellig placering på 

de enkelte kromosomer (se karyotypen, Figur 

1.8). 

En vigtig del af centromer-funktionen knytter 

sig dels til at holde kromatiderne sammen, 

dels til selve adskillelsen heraf i mitosen og 

meiosen (Figur 1.11). En plade-lignende struktur, 

kinetokoren, der ligger på overfladen af de 

to kromatider i centromer-regionen, fungerer 

som vedhæftningspunkt for de mikrotubuli, 

der stråler ud fra centriolerne, og trækker de 

segregerende kromatider til hver deres dattercelle. 

Det er særlige DNA-sekvenser, kaldet 

alphoid DNA (se Tabel 1.5), som udgør 

DNA’et i centromer-regionerne, og der er stor 

sekvenslighed mellem disse fra forskellige arter. 

De fungerer som bindingssted for centromerspecifikke 

proteiner, hvoraf der er mindst fem 

forskellige, og som hæfter tentrådene. 

En anden vigtig region på kromosomet er den 

terminale region, telomeren, dvs. den yderste 

ende af kromosomets to arme (Figur 1.10). Telomer-regionen 

består af DNA, der udgøres af 

den repeterede enhed: 5'-TTAGGG-3' (hhv. 

5'-CCCTAA-3'). Den er repeteret op til et par 

tusind gange og udgør op til ca. 12 kb i hver ende 

af kromatiderne. Yderst er der et 3'-overhæng, 

som består af enkeltstrenget DNA (se Figur 

1.12).


Telomer-længden er vigtig for kromosomets 

stabilitet, men bliver lidt mindre efter hver replikation, 

og når længden kommer ned under 

en bestemt grænse, er det en afgørende og 

medvirkende årsag til celle-aldring og snarlig - 

død. Cancerceller har dog bevaret aktiviteten af 

nogle gener, der koder for proteiner (bl.a. telomeraser), 

som kan sikre bevarelsen af telomerlængden 

under replikationen, hvilket har betydning 

for deres immortalitet. 

Genomets struktur 

Figur 1.8 Et eksempel på en kromosom-undersøgelse med G-båndfarvning af celler fra en knoglemarvsprøve. Resultatet 

er den mandlige karyotype 46,XY. Til højre for hvert kromosompar er vist et G-båndsideogram i 400-bånds opløsning 

hvor de små tal angiver eksempler på båndnummerering (se Kap. 17, side 252). De røde områder viser centromererne. 

De har forskellig placering på de enkelte kromosomer og markerer skellet mellem den korte (p) og lange (q) arm 

heraf. De akrocentriske kromosomer 13, 14, 15, 21 og 22 indeholder på den korte arm rRNA-generne, der koder for ribosom-RNA 

(rRNA). rRNA-generne er repeteret flere hundrede gange. De gråt markerede områder på den lange arm 

nær centromeret på kromosomerne 1, 3, 4, 9, 16 og 19, de korte arme af de akrocentriske kromosomer samt Yq12 angiver 

lokalisationen af konstitutivt heterokromatin, se Boks 1.2. 


Generelt 

Den genetiske information i en menneskecelle 

består, som tidligere omtalt, af to genomer: et 

kompliceret nukleært genom og et mere simpelt 

mitokondrie-genom (Figur 1.13). Det nukleære 

genom udgør langt hovedparten af den genetiske 

information mens mitokondrie-genomet 

samlet kun er ansvarligt for en mindre del heraf 

og i øvrigt kun en del som vedrører nogle af de 

23



Figur 1.9 A. Et elektronmikroskopisk udsnit af en cellekerne, 

hvor man efter særlig protein-ekstraktion kan 

se de enkelte kromatin-fibre strækkende sig ud fra 

scaffold. B. Et scanningelektron-mikroskopibillede af et 

metafasekromosom, som viser de to kromatider bundet 

sammen i centromeret. De mange små knude-formede 

projektioner viser de enkelte grupper af kromatin-loops 

(se også Figur 1.7). 

specifikke mitokondrielle, omend livsnødvendige, 

funktioner. 

Med udgangspunkt i skitsen ovenfor af det 

humane genom vil de enkelte dele heraf blive 

gennemgået mere detaljeret. 

24 

Mikrotubuli 

Kinetokor 

Figur 1.11 Kinetokoren er det sted, hvor mikrotubuli 

vedhæfter og trækker de segregerende kromatider til 

hver deres dattercelle. 

A 

B 

Kromatid 

Telomer 

Centromer 

Subtelomer 

region 

100-300 kb ˜ 12 kb 

Telomer- Telomer 

associerede 

repeats 

Figur 1.10 A. Et metafasekromosom består af to kromatider 

(kaldet søsterkromatider), som holdes sammen 

i centromeret. Regionerne i enderne af kromatiderne 

benævnes telomerer. B. Et udsnit af den ene ende af et 

kromatid, hvor telomeren udgør de terminale ca. 12 kb, 

Telomer-associerede repeats udgør 100-300 kb (se Tabel 

1.5) og mest centromert ligger subtelomer-regionen, 

som er rig på gener. 

Det nukleære genoms opbygning 

Kernen i en menneskecelle indeholder mere 

end 99% af cellens samlede DNA-indhold, der 

i det haploide genom udgør 3,1 Gb. Det indeholder, 

som tidligere angivet, omkring 27.000 

gener. Den samlede DNA-mængde i en celle, 

udgør i interfasen ca. 7 pg (1 pg = 10 -12 gram). 

Som det fremgår af Figur 1.13 består genomet 

i cellekernen af dels gener og gen-relaterede 

sekvenser, dels intergenisk DNA. Gener og 

5’ 

3’ 

..... AGGGTTAGGGTTAGGGTTAGGGTTAGGGTTAG 

••••••••••••••••••••••••••• 

..... TCCCAATCCCAATCCCAATCCCAATCC 

3’ 5’ 

Figur 1.12 Telomer-regionen. De terminale op til 12 

kb af et kromosom udgøres af den repeterede enhed 

5'-TTAGGG-3' (indrammet). Enheden er repeteret op til 

et par tusinde gange. Ved hver celledeling bliver regionen 

kortere.


Gener og genrelaterede 

sekvenser 

1.100 Mb 

Kodende 

DNA 48 Mb 

Pseudogener 

Ikke-kodende 

DNA 1.052 Mb 

Genfragmenter 

Introns, 

UTR 

Det nukleære genom 

3.100 Mb 

~27.000 gener 

LINEs 

640 Mb 

gen-relaterede sekvenser udgør ca. 35% af genomet, 

hvor den kodende del kun udgør i alt 

ca. 1,5% af det samlede genom. 

Langt hovedparten af genomet, ca. 65%, udgøres 

af intergenisk DNA, dvs. DNA-sekvenser 

som ligger mellem generne. Det intergeniske 

DNA består hovedsageligt af forskellige former 

for repeterede DNA-sekvenser, som vil blive 

beskrevet nærmere nedenfor (se side 35ff). 

Gener og gen-relaterede sekvenser 

Kodende DNA – genernes struktur 

En organismes DNA koder for al RNA og dermed 

de proteiner som er nødvendige for, at organismen 

kan danne og vedligeholde sine celler, 

væv og organer. Samlet udgør den proteinkodende 

information hovedparten af det omkring 

48 Mb kodende DNA, dvs. ca. 1,5% af hele 

genomet. 

Et gen kan defineres som et segment af kromosomalt 

DNA der er indeholder den nødvendige 

information for dannelsen af et funktionelt 

produkt. Man skelner nu mellem to grupper af 

gener: 1) gener som transkriberes til mRNA, 

Menneskets genom 

Intergenisk DNA 

2.000 Mb 

Interspersed 

repeats 1.400 Mb 

SINEs 

420 Mb 

LTRelementer 

250 Mb 

Transposoner 

90 Mb 

2 rRNAgener 

Mitokondrie-genomet 

16,6 kb 

37 gener 

22 tRNAgener 

Andre intergeniske 

regioner 600 Mb 

Mikrosatellitter 

90 Mb 

Figur 1.13 Skematisk oversigt som viser de forskellige elementer i menneskets genom. 

Andre 

510 Mb 


13 polypeptidkodende 

gener 

der i ribosomer translateres til protein, og 2) gener, 

hvis transkripter er ikke-kodende og som 

anvendes direkte til særlige funktioner (fx tR- 

NA, rRNA, snRNA osv). – se Boks 1.3. 

Boks 1.3 Ikke-kodende RNA (udvalgte eksempler) 

Type Funktion 

rRNA proteinsyntese 

tRNA proteinsyntese 

snRNA mRNA-processering 

snoRNA RNA-processering 

Xist-RNA X-kromosom-inaktivering 

telomerase-RNA telomersyntese 

miRNA RNA-interferens 

Det bemærkes at ifølge denne definition indeholder 

et gen ikke kun de kodende sekvenser 

man kan genfinde i transkriptet, men også de 

ofte tætved liggende regulatoriske sekvenser, 

der er nødvendige for en kontrolleret ekspression 

af genet (promotor, enhancere mv., se Figur 

1.18 og 1.19 og afsnittet »Fra DNA til protein«, 

side 40ff). 

25



Hos eukaryote organismer er de proteinkodende 

gener som regel diskontinuerte, forstået 

på den måde at genets proteinkodende in- 

26 

Kodende RNA 

(mRNA) 

Gener 

Ikke-kodende RNA 

(fx tRNA, rRNA) 

Figur 1.14 Genernes transkriptionsprodukter kan 

som følge af deres funktion opdeles i to hovedgrupper: 

1) kodende RNA, koder for dannelse af proteiner, 

2) ikke-kodende RNA, som kan have enzymatisk eller 

strukturel funktion (Boks 1.3). 

3' 

5' 

-75 

CCAAT 

box 

Promotorsekvenser 

-30 

TATA 

box 

Transkriptionsstart 

Exon 1 

1 30 31 

Exon 2 

104 

intron 1 intron 2 

+1 

Cap ATG 

site startcodon 

} 

C A 

AAGGT 

G AGT 

} 

(Y) n NYAGG 

Konsensus-sekvenser for 

5'- (donor) og 3'- (acceptor) 

splejsningssignaler 

formation, er delt op i en serie af delsekvenser 

kaldet exons, som er adskilt af ikke-kodende 

såkaldte intron-sekvenser som illustreret i Figur 

1.15. 

»Opstrøms« (upstream) og »nedstrøms« (downstream) 

er begreber, som hhv. definerer 5'- og 3'regionerne 

og bruges ved stedsangivelse i forhold 

til en given position i et gens DNA, i RNA 

eller i cDNA. Opstrøms- hhv. nedstrøms-regionerne 

for transkriptionsstart og -stop indeholder 

ofte områder som er af betydning for regulationen 

af et givet gens ekspression, dvs. hvor 

meget og hvornår et gen skal udtrykkes. 

Transkriptionen (dvs. dannelsen af en RNAkopi) 

af et gen foregår altid således at transkriptet 

(RNA-kopien) syntetiseres i retningen 

} 

Transkription 

og capping 

105 

} 

Exon 3 

146 

TAA 

stopcodon 

Transkriptionsstop 

5' 

3' 

AATAAA 

signal for trimning 

og polyadenylering 

Cap Exon 1 Exon 2 Exon 3 

5' 

intron 1 intron 2 3' 

UTR 

Det primære transkript 

(præ-mRNA) 

UTR 

Figur 1.15 Nukleære proteinkodende geners anatomi. Her er som et eksempel vist β-globin-genet med regulatoriske 

promotor-sekvenser (CCAAT-box og TATA-box), som sidder opstrøms for start af de aminosyre-kodende sekvenser 

(ATG). Disse promotor-sekvenser har betydning for reguleringen af ekspressionen. Opstrøms sidder et Cap site og nedstrøms 

sidder et polyadenyleringssignal. Når transkriptionen er til ende, bliver 3 transkriptionsproduktet trimmet og 

polyadenyleret i 3'-enden, hvilket beskytter transkriptet mod nedbrydning og desuden faciliterer transport ud af cellekernen. 

Endvidere bemærkes det at proteinkodende gener hos eukaryote organismer med få undtagelser er diskontinuerte, 

dvs. de kodende sekvenser er afbrudt af introns også kaldet intervening sequences (IVS). Der er konsensussekvenser 

i intron-exon-overgangene som har betydning for at introns splejses rigtigt ud ved den post-transkriptionelle 

processering af præ-mRNA’et (se afsnittet Splejsningsmutationer, side 61). UTR = untranslated region.


3’ 

5’ 

Gen II Gen III 

Gen I 

Intergenisk 

DNA 

5'→3', da RNA-forlængelsen finder sted i den 

ende som har en fri 3'-OH-gruppe. Kun den 

ene af genets to DNA-strenge anvendes som 

template (skabelon) for RNA’et; template-strengen 

er den streng der er antiparallel til den nydannede 

RNA-kopi. Det er bestemte nukleotidsekvenser 

i opstrøms-regionen, som definerer 

startpunktet for transkriptionen. Nogle gener 

i et kromosom kodes fra den ene DNAstreng 

mens andre gener kodes fra den anden 

streng og da i modsat retning (Figur 1.16). 

Proteinkodende gener koder for et intermediært 

RNA-molekyle kaldet messenger-RNA 

(mRNA). Det dannede mRNA transporteres 

ud til cytoplasmaet, hvor det via sin nukleotidsekvens 

styrer syntesen af det protein som sekvensen 

koder for, ved en proces kaldet translation 

(se nærmere herom side 43ff). 

Når et proteinkodende gen udtrykkes, dannes 

der først en RNA-kopi af genets ene DNAstreng 

(fra og med transkriptionsstartpunktet), 

inklusive alle exons og introns. Dette primære 

transkript betegnes præ-mRNA. Ved en proces 

der kaldes splejsning, fjernes intronsekvenserne, 

og exons samles derved til én proteinkodende 

sekvens under dannelse af det mRNA, 

som til slut transporteres ud i cytoplasmaet, 

hvor det dirigerer proteinsyntesen (Figur 1.29). 

Ud over splejsningen sker der en modifikation 

5’ 

3’ 

Figur 1.16 I et kromosoms DNA-molekyle er den 

ene streng template-strengen for nogle af generne, 

mens den anden er det for andre gener. Generne er 

skitseret svarende til deres template-streng. Pilene 

angiver transkriptionsretningen. 


(processering) af det primære transkripts 3'-ende 

i form af en trimning (fjernelse af en kortere 

el. længere nukleotidsekvens) og en polyadenylering 

(påsætning af ca. 200 adenosinnukleotider, 

AMP), begge dele signaleret af polyadenyleringssignalet, 

5'-AATAAA-3' (se Figur 1.15). 

Der kan være flere polyadenyleringssignaler, 

som anvendes cellespecifikt (Figur 1.18). Endelig, 

men reelt som den første modifikation, påsættes 

der tidligt under transkriptionen et guanosin-nukleotid 

(den såkaldte cap) i transkriptets 

5'-ende. 

Tidligere troede man at splejsningsprocessen 

var en lige-ud-ad-landevejen proces, hvor hver 

exon blev samlet med sine nabo-exons for at 

danne et bestemt mRNA-molekyle. Det har 

imidlertid vist sig, at mange præ-mRNA-molekyler 

undergår såkaldt alternativ splejsning, 

hvorved der dannes mRNA-molekyler med 

forskellige kombinationer af exons. Der kan således 

fra et givet gen laves flere forskellige slags 

mRNA, der styrer syntesen af forskellige proteiner 

(Figur 1.17 og 1.18). 

Alternativ splejsning er en af de processer 

som gør det muligt for celler at danne forskellige 

mRNA’er ud fra samme gen. Denne type 

proces har man tidligere anset for relativt sjældent 

forekommende, men med nye studier, 

Præ-mRNA 

1 2 3 

1 2 

Figur 1.17 Alternativ splejsning, hvor det ene 

mRNA består af exon 1 og 2, mens det andet består af 

exon 1 og 3, fra samme gen. Til højre i figuren er skitseret 

de resulterende proteiner med forskellige funktionelle 

domæner. 

13 

27



baseret på bl.a. råskitsen af det humane genom, 

regner man nu med at den slags RNA-processering, 

er almindeligt forekommende. Dette 

betyder, at et givet gen kan danne grundlag for 

dannelsen af flere forskellige isoformer af proteiner. 

Det forhold at der kan dannes forskellige 

proteiner fra samme gen betyder ikke nødvendigvis 

at de forskellige proteiner laves af 

samme celle eller celletype. Det synes snarere 

som om der i én celletype anvendes én exonkombination 

i mRNA’et, mens der i en anden 

celletype anvendes en anden kombination. Eksempelvis 

koder et α-tropomyosin-gen for forskellige 

isoformer af proteinet, der regulerer 

kontraktionen i muskelceller, men som formentlig 

har andre funktioner i andre celletyper 

(Figur 1.18). 

Menneskets gener udviser stor variation i størrelse 

og intern organisation 

Hos bakterier er generne som regel ret små og 

relativt ens i størrelse, hvorimod der hos mere 

komplekse organismer er meget stor variation i 

genernes størrelse. Hos mennesket kan længden 

af generne variere fra at være nogle få hundrede 

basepar til flere megabaser (Figur 1.19 og 1.20). 

28 

3’ 

5’ 

5’ 

5’ 

5’ 

5’ 

5’ 

α-tropomyosin-gen 

Transkription + splejsning 

3’ 

3’ 

5’ 

3’ 

DNA 

Muskel-mRNA 

3’ Glat muskel-mRNA 

3’ Fibroblast-mRNA 

3’ Fibroblast-mRNA 

Hjerne-mRNA 

Figur 1.18 Eksempel på alternativ splejsning, hvor de enkelte splejningsmønstre er specifikke for de enkelte celler. 

α-Tropomyosin har betydning for muskel-kontraktionen, mens dets rolle i andre celler er uklar. Pilene angiver steder 

for polyadenyleringssignaler. 

Som man måske kunne forvente, er der en 

positiv korrelation mellem størrelsen af genet 

og størrelsen af gen-produktet – jo større gen, 

desto større protein. Men der findes undtagelser; 

fx kodes proteinet apolipoprotein B, der 

består af 4.563 aminosyrer, af et gen på ca. 45 

kb, mens muskelproteinet dystrofin, som er 

3.685 aminosyrer langt, kodes af et gen på 

2.400 kb – altså næsten samme antal aminosyrer 

i de to proteiner, men mindst 50 gange forskel 

i genernes størrelse. 

Der synes at være en negativ korrelation mellem 

gen-størrelsen og den andel af gen-længden 

som findes udtrykt på mRNA-niveau, 

hvilket omskrevet betyder at jo større gen, jo 

mindre er den relative exon-andel af hele genet. 

Dette skyldes ikke at exons i store gener er 

mindre end exons i små gener. I stedet er forklaringen 

at store gener har lange intron-sekvenser, 

hvilket søjlediagrammerne i Figur 1.20 

illustrerer. 

Mange gener har en genomisk udstrækning 

på over 100 kb; det størst kendte er dystrofingenet 

(DMD, det gen der er muteret ved Duchennes 

muskeldystrofi), der er på 2,4 Mb. Variationen 

i størrelsesfordelingen af de kodende


β-globin 

HPRT 

»CAT« 

»GC-rig« 

»TATA« 

»TATA« 

sekvenser er mindre ekstrem, og man har beregnet 

at gennemsnitslængden for en exon hos 

mennesket er ca. 200 bp, selvom der forekommer 

yderligheder. Det kan bl.a. nævnes at genet 

for det gigantiske muskelprotein titin (med isoformer 

på op til 33.000 aminosyrers længde) 

har den til dato længste samlede kodende gensekvens 

på 114.414 basepar (ud af ialt 294 kb), 

fordelt på det ligeledes største antal exons (363) 

og med den ligeledes størst kendte enkeltexon 

(17,1 kb). 

Som det fremgår af ovenstående, kan antallet 

af exons og introns samt deres størrelse variere 

ganske betydeligt, og som følge heraf varierer 

størrelsen af de enkelte gener også ganske meget. 

Et gennemsnitsgen hos mennesket har ca. 

9 exons med en middellængde på ca. 200 bp, en 

samlet intronlængde på ca. 3 kb, 27 kb i 

genomisk udstrækning og koder for et polypeptid 

på ca. 450 aminosyrer. 

Der findes også eksempler, om end få, på gener 

hos mennesket som mangler introns, men 

1 2 3 

0 0,5 1,0 1,5 2,0 kb 

1 2 3 4 5 6 78 9 

0 25 50 kb 

Faktor VIII 

1 2-6 7 - 13 14 15 - 22 7 - 13 26 

0 50 100 150 200 kb 


Figur 1.19 Tre eksempler på gener hos mennesket. De enkelte exons er nummererede. »CAT«, »TATA« og »GC-rig« 

er regulatoriske elementer i opstrøms regionen (promotor-regionen). 

HPRT = hypoxanthin-guanin-phosphoribosyl-transferase. 

disse gener er generelt små (fx histon-gener og 

tRNA-gener, Figur 1.20). 

Genernes fordeling i genomet 

Som tidligere anført kan man beregne, at der 

ville være ét gen pr. ca. 120 kb genomsekvens, 

hvis generne var jævnt fordelt (omkring 27.000 

gener fordelt over 3,1 Gb). Det er de imidlertid 

ikke, og man har fundet at gentætheden varierer 

et sted mellem 0 og 64 gener pr. 100 kb. 

Denne ulige fordeling i genomet kendte man til 

længe før råskitsen af genomet var færdiggjort, 

og denne viden var resultatet af forskellige typer 

studier, bl.a. Giemsa-farvning af kromosomerne, 

som giver et kromosomspecifikt båndmønster 

(Boks 1.4). 

Man ved fra andre undersøgelser at farvestoffet 

Giemsa har en højere affinitet for AT-rige 

DNA-regioner, og man vidste yderligere, at 

hos mennesket er ca. 60% af DNA’ets basepar 

AT-par. Det var derfor oplagt at antage at de 

29



mørke G-bånd i kromosomerne må have et 

AT-indhold som ligger over 60%. 

Cytogenetiske undersøgelser sammenholdt 

med kliniske observationer tydede endvidere på 

at der måtte være færre gener i de mørke G- 

30 

Klasse I HLA 46% 

β-globin 38% 

Insulin 33% 

α-interferon 100% 

Histon H4 100% 

tRNA 100% 

0 2 4 6 

Phenylalaninhydroxylase 

3% 

LDL-receptor 11% 

Apolipoprotein B 33% 

HPRT 4% 

α1 (II) collagen 20% 

Serumalbumin 12% 

kb 0 20 40 60 80 100 kb 

Dystrophin 0,6% 

Utrophin 1,4% 

NF1 4% 

CFTR 2,4% 

Faktor VIII 3% 

0 500 

1000 1500 2000 2500 

Figur 1.20 Eksempler på gen-størrelser i kb. Exon-indhold er angivet som % ud for hver søjle. Bemærk den omvendte 

relation mellem gen-størrelse og exon-indhold. 

NF1 = neurofibromatose type 1-genet, CFTR = cystic fibrosis transmembrane regulator. 

Boks 1.4 

G-båndmønster Egenskaber 

Mørke bånd Indeholder AT-rigt DNA. 

Replikeres sent i S-fasen, men 

kondenserer tidligt i cellecyklus. 

Gen-fattigt (indeholder hovedsageligt 

vævsspecifikke gener). 

Generne kan være store pga. meget 

lange introns. 

Lyse bånd Indeholder GC-rigt DNA. 

Replikeres tidligt i S-fasen, men 

kondenserer sent i cellecyklus. 

Gen-rigt (både husholdningsgener 

og vævsspecifikke). 

Generne er relativt små, primært 

pga. små introns. 

bånd og som følge heraf at de lyse G-bånd måtte 

indeholde flere gener end målt gennemsnitligt 

over genomet. En forudsigelse som er bekræftet 

af det humane genomprojekt. Det er 

også påvist, at subtelomer-regionerne, dvs. regionerne 

100-300 kb centromert for telomererne 

(se Figur 1.10B), der er lyse ved G-båndfarvning, 

har den største gentæthed overhovedet 

i genomet. 

Hvilke typer gener indeholder det humane genom? 

Man kan gruppere generne hos eukaryote organismer 

på forskellig måde. Én måde er at inddele 

dem efter deres funktion, hvilket har den 

fordel at man fra disse ret brede funktionelle 

grupper (Figur 1.21) kan underinddele i et hierarkisk 

system med stigende specificitet og opnå 

en funktionel beskrivelse hvor der bliver gradvis 

færre gener i hver gruppe. 

En ulempe som denne inddeling ikke tager 

højde for, er at der er mange gener som vi endnu 

ikke kender den samlede funktion af, hvor- 

kb


Andre 

aktiviteter 

38% 

Ekspression, 

replikation etc. 23% 

Signaltransduktion 

21% 

Figur 1.21 Gener inddelt efter funktion 

Almene 

biokemiske 

cellulære 

funktioner 18% 

for de ved denne type inddeling må udelades fra 

en funktionel beskrivelse. 

En bedre metode, som man nu benytter, er at 

anvende en klassifikation, som baserer sig på de 

enkelte strukturelle enheder i proteinerne, og 

altså ikke proteinets samlede funktion som sådan. 

Et typisk proteinmolekyle er opbygget af 

en række forskellige domæner, som hver især 

har en biokemisk funktion. Hver type domæne 

har en karakteristisk aminosyresekvens, som 

måske ikke er helt præcis den samme i alle de 

proteiner det forekommer i, men tæt nok på sådan 

at funktionen ikke varierer nævneværdigt 

når man sammenligner domænerne de enkelte 

proteiner imellem. 

Med afslutningen af det human genomprojekt 

har man fundet at næsten alle proteiner har 

større eller mindre strukturelle ligheder med 

hinanden. Kendskab til disse forhold er vigtig 

for forståelsen af genernes evolution og udvik- 


ling. Der er på internationalt plan udarbejdet 

en omfattende webdatabase (Structural Classification 

of Proteins, SCOP, se Kap. 17 side 254), 

hvor alle kendte proteiner er organiseret i henhold 

til deres evolutionære og strukturelle 

slægtsskab. Protein-domæner med fælles almen 

funktion tilhører en familier – det er i denne 

sammenhæng værd at bemærke, at proteiner 

eller gener kan tilhøre flere familier afhængigt 

af hvor mange domæner de indeholder. Som et 

par eksempler på domænefamilier kan nævnes 

DEAD box-familien og WD-repeat-familien. 

DEAD box-familien indeholder aminosyresekvensen: 

Asp-Glu-Ala-Asp; med ét-bogstavkoden: 

D-E-A-D (Tabel 17.2, side 250). 

Blandt DEAD box-proteinerne er RNA-helicaser 

de mest almindelige og er involveret i 

næsten alle processer vedrørende RNA bl.a. 

som co-aktivator af transkriptionen ved at 

hjælpe til med adskillelsen af DNA-strengene i 

dobbelt-helixen. WD-repeat-familien indeholder 

aminosyre-sekvensen: Trp-Asp sv.t. W-D 

i ét-bogstav-koden. Proteiner med WD-repeats 

er involveret i protein-protein-interaktioner 

og regulerer en række forskellige cellulære 

funktioner, bl.a. kromatin-remodellering og 

transkription. 

Man kan også se på hvordan antallet af protein-domæner 

i genomer fra forskellige organismer 

fordeler sig (Tabel 1.3). Som det ses anvender 

de mere komplekse organismer de enkelte 

typer domæner i flere gener ligesom de også har 

Tabel 1.3 Eksempler på forskellige genomers indhold af gener der koder for proteindomæner 

Antal gener i genomet som koder for domænet 

Domæne Funktion Mennesket Bananfluen Gær 

Zinkfinger, C2H2-type 

Zinkfinger, GATA-type 

Homeobox 

Death 

Connexin 

Ephrin 

DNA-binding 

DNA-binding 

Gen-regulering ved fx fosterudvikling 

Programmeret celledød 

Elektrisk kobling mellem celler 

Nervecellevækst 

564 

011 

160 

016 

014 

007 

234 

005 

100 

005 

000 

002 

034 

009 

006 

000 

000 

000 

31



flere typer domæner. Eksempler på det første er 

zinkfinger-motiverne (C2H2- og GATA-typerne). 

Det er domæner der gør proteinet i stand 

til at binde til DNA. Som det fremgår af tabellen 

har mennesket mere end 500 gener, hvor 

disse domæner forekommer. I bananfluen og 

gær forekommer disse domæner i færre antal 

gener hhv. 239 og 43. 

Disse forskelle er sandsynligvis resultatet af en 

evolutionær proces hvor exons fra forskellige 

gener er blevet kopieret og splejset sammen, såkaldt 

exon shuffling (Figur 1.22). Man har eksperimentelt 

påvist at visse af de komplekse proteiner 

hos mennesket har domæner som meget 

ligner bakteriers simple proteiner således at proteindomæner 

med meget grundlæggende biokemiske 

funktioner, har en høj grad af sekvenslighed 

selv mellem meget simple og meget 

komplekse organismer. 

Det funktionelle antal gener i et genom kan 

øges på andre måder, hvoraf man nu kender to 

typer usædvanlig gen-organisation: 1) overlappende 

gener, og 2) gener-i-gener. 

32 

NH 2 COOH EGF 

NH 2 COOH Chymotrypsin 

NH 2 COOH Urokinase 

NH 2 COOH Faktor IX 

NH 2 COOH Plasminogen 

Figur 1.22 Nogle resultater af exon shuffling. Hvert 

symbol repræsenterer en familie af proteindomæner, 

som hver består af 30-50 aminosyrer. Domænerne repræsenterer 

exons som på et tidspunkt i evolutionsforløbet 

er forenet for at danne nye, større og mere 

komplekse proteiner. Ud for hvert protein er angivet 

dets navn. 

EGF = epidermal growth factor. 

DNA-sekvens 

(L-strengen) 

Start 

Met Leu… 

5'–CCAATGCTAA–3' 

…Gln 

Cys Stop 

Gen 

ND4 

ND4L 

Figur 1.23 Overlappende gener i mitokondrie-DNA, 

jf. Figur 1.27. Begyndelsen af genet ND4 overlapper 

afslutningen af genet ND4L. Aminosyresekvenserne i 

hhv. begyndelsen og afslutningen af de to polypeptider 

er anført i trebogstavkode. Det ses at læserammerne 

for de to gener er forskudt i forhold til hinanden. 

Gener der overlapper hinanden har enten 

hver sin template-streng eller deres mRNA’er 

translateres i overlapsområdet i hver sin læseramme, 

dvs aflæsningen af mRNA-sekvenserne 

sker med forskellige og faseforskudte startpunkter. 

Overlappende gener findes ofte i små kompakte 

genomer som fx virusgenomer. De er 

sjældne i nukleære genomer fra højerestående 

eukaryoter. Der er et enkelt eksempel på et beskedent 

overlap i det kompakte mitokondriegenom 

(Figur 1.23). 

Den anden type, gener-i-gener, er derimod 

relativt hyppigt forekommende i nukleære genomer. 

Et eksempel herpå i det humane genom 

ses i neurofibromatose type 1-genet (NF1) som 

i intron 35 indeholder tre små gener, OMG, 

EVI2A og EVI2B (Figur 1.24). Hvert af disse 

»interne« gener er igen opdelt i egne exons og 

introns. Sådanne gener transkriberes ofte omvendt 

i forhold til værtsgenets transkriptionsretning 

– eller, sagt med andre ord, disse »interne« 

gener har værtsgenets ikke-template-streng som 

deres egen template-streng. Et andet eksempel er 

snoRNA-gener (small nucleolar RNA, som er 

ikke-kodende RNA der kemisk modificerer 

andre RNA’er) som ligeledes er beliggende i 

andre geners intron-sekvenser.


3’ 

5’ 

Neurofibromatose type 1-genet 

Intron 35 

OMG EVI2B EVI2A 

5kb 

Genfamilier: Multigenfamilier og superfamilier 

Når man taler om genfamilier er det vigtigt at 

huske at det humane genom, som det ser ud i 

dag, er resultatet af en lang evolutionær proces 

som stadig pågår. 

Genfamilier kan inddeles efter deres evolutionære 

og strukturelle fællesskab (Boks 1.5). 

Den ene familie defineres som en gruppe af gener 

eller proteiner, der har sekvenshomologi 

med relaterede overlappende funktioner og 

hvor der er et klart evolutionært slægtskab. Er 

det en gruppe af proteiner eller gener, hvor der 

er en fælles evolutionær oprindelse, men hvor 

der ikke er overlappende funktioner, defineres 

de som tilhørende en superfamilie. Det er værd 

at bemærke at et protein eller gen godt kan til- 

5’ 

3’ 

Figur 1.24 Gener-i-gener. Forekommer relativt hyppigt 

i det nukleære genom, hvor genet er indeholdt i en 

intron af et andet gen. Et eksempel herpå er neurofibromatose 

type 1 genet, som indeholder tre små gener 

(OMG, EVI2A og EVI2B) i intron 35. Hvert af de små interne 

gener har egne exons og introns. Generne er 

skitseret på deres template-streng og pilene viser 

transkriptionsretningen (jf. Figur 1.16). 

OMG = oligodendrocyte myelin glycoprotein 

EVI = ectopic viral integration site 

Boks 1.5 Klassifikation af genfamilier med 

angivelse af kendte antal (oktober 2004). 

1. Familier, hvor der er et klart evolutionært slægtskab 

(2845 familier). 

2. Superfamilier, hvor der er en fælles evolutionær 

oprindelse (1539 superfamilier). 

3. Protein-domæner (folds), hvor der eksisterer strukturelle 

ligheder (945 foldninger). 

α-globin-genklyngen 

Kromosom 16p 


ζ ψζ ψα2 ψα1 α2 α1 θ 

5’ 3’ 

β-globin-genklyngen 

Kromosom 11p 

ε Gγ Aγ ψβ δ β 

5’ 3’ 

0 20 40 60 kb 

Figur 1.25 Menneskets α- og β-globin-genklynger. 

Begge klynger indeholder gener som udtrykkes på forskellige 

trin i individets udvikling. Gen-klyngerne indeholder 

flere pseudogener (ψζ, ψα1, ψα2, ψβ og θ), se 

side 34. 

høre flere superfamilier. Hvis der er områder, 

domæner, hvor der kun er mindre, strukturelle 

ligheder mellem proteiner eller gener, kan de 

inddeles herefter. 

Visse genfamiliers gen-ekspression er mere 

eller mindre fælles mens andre ikke har koordineret 

regulation heraf. Disse forskelle synes at 

være resultatet af en evolutionær proces som 

har haft betydning for deres genomiske organisation. 

Hvis man ser på hvordan de forskellige genfamilier 

er organiseret i genomet kan man skelne 

mellem tre overordnede typer af arrangementer: 

1. Familier, hvor generne ligger i relativt tætte 

klynger (clusters) og som har et evolutionært 

og funktionelt slægtskab. Som eksempler 

herpå kan nævnes multigenfamilien for ribosomalt 

RNA (rRNA) og histon-multigenfamilien. 

Andre genfamilier har lidt mere forskelligartede 

funktioner, hvor de bedst 

kendte eksempler er α- og β-globin-generne, 

som er beliggende på hhv. kromosom 

16p og 11p (Figur 1.25). Man regner med at 

de er opstået ved gentagne duplikationer i 

løbet af hvirveldyrenes evolution gennem de 

33



seneste 500 millioner år. Disse to klynger af 

gener koder for globin-kæder, der udtrykkes 

på forskellige udviklingstrin fra embryonet 

til det fødte individ. Til denne familie hører 

også myoglobin-genet på kromosom 22q. 

Flere af α- og β-globin-genklyngernes genlignende 

sekvenser producerer ikke noget 

RNA- eller protein-produkt, og de er således 

uden kendt funktion. Sådanne ikke-fungerende 

gen-lignende sekvenser kaldes 

pseudogener (se nærmere næste spalte). 

2. Superfamilier, hvor generne både ligger i 

klynger og spredt i genomet. De gener, som 

ligger i klynger danner ofte multigen-familier 

med overlappende funktioner, mens de 

der ligger spredt har mere forskelligartede 

funktioner. Den største genfamilie i menneskets 

genom er måske immunglobulin-gensuperfamilien, 

der består af gener på kromosom 

6 (HLA-vævstype-antigen-komplekset), 

på kromosomerne 7 og 14 (T-celle-receptor-gener) 

og på kromosomerne 2, 14 og 

22 (gener for immunglobulinernes tunge og 

lette kæder). 

3. Familier, hvor generne kun findes spredt i 

genomet. Mange af de spredte genfamilier 

mener man er dannet ved revers transkription 

af RNA og efterfølgende integrering i 

genomet. Den integrerede sekvens, også kaldet 

retrosekvens, er deriveret fra mRNAtranskriptet 

af det oprindelige gen og indeholder 

derfor ikke introns. De fleste af disse 

retrosekvenser er degenererede og blevet til 

pseudogener, men nogle få sekvenser har bevaret 

deres funktion – en sådan funktionel 

retrosekvens benævnes retrogen eller processeret 

gen. Det autosomale gen for enzymet 

phosphoglyceratkinase (PGK2) beliggende 

på 6p er et eksempel herpå. Det er interessant, 

at ekspressionsmønstret for dette 

gen er forskelligt fra det oprindelige gens 

(PGK1), som ligger på X-kromosomet. 

34 

Ikke-kodende DNA 

Det ikke-kodende DNA udgør omkring 1.052 

Mb og kan inddeles i følgende 3 grupper: 1) 

pseudogener, 2) gen-fragmenter, og 3) introns 

og UTR’er. 

Et pseudogen defineres som et genomisk 

DNA-segment som i sin basesekvens ligner et 

regulært funktionelt gen, men som ikke har noget 

(funktionelt) genprodukt. Et pseudogen, 

der har en høj grad af lighed med et funktionelt 

gen betegnes ligesom dette, men med ψ foran 

gen-symbolet (jf. pseudogenerne i globingenklyngerne, 

Figur 1.25). Denne gruppe af 

pseudogener anses for at være evolutionære 

restprodukter, som er blevet inaktiveret af mutationer 

i deres kodende og/eller regulatoriske 

sekvenser. En anden gruppe pseudogener er tilsyneladende 

opstået ved en proces, hvor en ekstra 

DNA-kopi er dannet fra mRNA ved revers 

transkription og efterfølgende integrering heraf 

i genomet (retrotransposon). Sådanne pseudogener 

mangler introns og kaldes ofte for processerede 

pseudogener. De er typisk beliggende i 

en anden kromosom-region end det gen hvis 

mRNA de er en kopi af. Der er beskrevet i alt 

ca. 15.000 pseudogener i menneskets genom. 

Gen-fragmenter er en anden gruppe af genrester 

der er en følge af evolutionen. Denne 

gruppe består af trunkerede gener og andre 

gen-segmenter. De trunkerede gener mangler 

en større eller mindre del af den ene ende af det 

fuldstændige gen, mens gen-segmenterne er 

små isolerede regioner fra det oprindelige gen. 

Introns er omtalt ovenfor (side 26 og Figur 

1.15). UTR står for untranslated region som er 

betegnelse for nogle andre, ikke-translaterede 

regioner i proteinkodende gener. Der findes 

typisk 2 sådanne regioner i hvert proteinkodende 

gen, hhv. opstrøms (5'-UTR) og 

nedstrøms (3'-UTR) for den proteinkodende 

sekvens. UTR-sekvenserne transkriberes, og i


Tabel 1.4 De forskellige typer af interspersed repeat DNA i menneskets genom. 

modsætning til introns udsplejser de ikke fra 

præ-mRNA’et. 

Intergenisk DNA 

Intergenisk DNA er det DNA som ligger mellem 

generne. Det udgør omkring 5 af hele genomet, 

og ca. 70% heraf udgøres af repeterede 

DNA-sekvenser (repetitivt DNA). 

Det er fortsat uafklaret hvorfor genomet indeholder 

så megen tilsyneladende nyttesløst 

DNA (junk DNA). En af hypoteserne går på, at 

der ikke er et selektiontryk for at fjerne det, 

hvorfor det tolereres. Man mener, at det repetitive 

DNA mindsker sandsynligheden for at 

mutationer rammer vigtige gener og derfor har 

været en selektiv fordel. Der er også undersøgelser 

som tyder på at det repetitive DNA kan 

være medvirkende til dannelsen af nye gener, 

gen-domæner eller regulatoriske områder. 

Intergenisk DNA kan inddeles i to overordnede 

grupper: 1) interspersed repeats, hvis individuelle 

repeterede enheder er fordelt over hele 

genomet på en tilsyneladende tilfældig måde og 


Type af repeat Undertype Størrelse på repeat-enhed Antal kopier % af genomet 

SINEs: 

Short Interspersed 

Nuclear Elements 

LINEs: 

Long Interspersed 

Nuclear Elements 

Alu 

MIR-familier 

LINE-1 (Kpn) 

LINE-2 

LINE-3 

LTR-elementer: 

Long Terminal Repeats ERV klasse I 

ERV(K) klasse II 

ERV(L) klasse III 

MaLR 

Andre DNA-transposoner 

hAT 

Tc-1 

PiggyBack 

Uklassificeret 

Fuld længde 0,3 kb 

Middelstørrelse 0,13 kb 

Fuld længde 6,1 kb, men 



- 

- Middelstørrelse 1,3 kb 

- 


Varierende, men middelstørrelse 

måske 0,25 kb 

Middelstørrelse måske 0,4 kb 

1.558.000 

1.090.000 

468.000 

868.000 

516.000 

315.000 

037.000 

443.000 

112.000 

8.000 

83.000 

240.000 

294.000 

195.000 

75.000 

2.000 

60.000 

10% 

2% 

5-13% 

2,1% 

0,2% 

- 

0,2% 

- 

4% 

2,5% 

0,8% 

2) tandem-repeteret DNA hvis repeterede enheder 

ligger ved siden af hinanden på række. 

Interspersed repeats 

Omkring 44% af menneskets genom udgøres af 

interspersed repeat DNA. Det er nukleotidsekvenser 

som er deriveret fra såkaldte transposoner. 

Man mener at de har en vigtig funktion i 

genomets evolution. Der findes 4 typer af transposoner: 

SINEs, LINEs, LTR-elementer og 

andre DNA-transposoner (Tabel 1.4). 

Transposoner kaldes sådan fordi de udviser 

mobilitet idenfor genomet, enten ved at skifte 

plads af og til (»jumping genes«) eller – hyppigere 

– ved at blive kopieret ind på en anden lokalitet. 

Dette sker via et intermediært RNA-produkt, 

som ved revers transkription danner 

DNA, der indsættes som en ny kopi, kaldet en 

retrotransposon, et andet sted i genomet (se også 

afsnittet Insertion ved transposition side 68). 

Transposoner er meget udbredte i genomet 

og hyppige i gen-relaterede sekvenser, herunder 

untranslated regions (UTRs). De kan have regulerende 

funktioner i genomet ved bl.a. at ud- 

35



gøre alternative promotorer i forskellige gener 

(se side 47, herunder Figur 1.31 for nærmere 

beskrivelse heraf). 

Blandt de forskellige transposoner er de primat-specifikke 

Alu-sekvenser blandt de hyppigst 

forekommende med 1,1 million kopier. 

De udgør i alt ca. 10% af genomet. Alu-elementerne 

er 300bp repeat-enheder, og man har 

påvist at de bl.a. har betydning for genomisk regulation 

af gen-ekspressionen. Nyere undersøgelser 

tyder på at de kan have patogenetisk betydning 

også. 

Et eksempel på et meget »Alu-rigt« gen er 

BRCA1-genet, som er involveret i arvelig disposition 

til mamma- og ovarie-cancer. Genet 

har en genomisk udstrækning på ca. 80 kb og 

omkring 40% heraf udgøres af Alu-sekvenser. 

Man har påvist, at BRCA1-mRNA forekommer 

i to former – den ene med en kort 5'-UTR, 

som udtrykkes i normalt mamma-væv. Den anden 

form har en længere 5'-UTR, som følge af 

Alu-element-insertion, og udtrykkes i mammacancer-væv 

ved den sporadiske form. Når 

5'-UTR-regionen er blevet forlænget som følge 

af Alu-element-insertion i BRCA1-mRNA bliver 

translationseffektiviteten reduceret med 

90%. Ved den arvelige form for mamma-cancer 

har man fundet mutationer i BRCA1-genet, 

som medfører nedsat funktion af BRCA1-proteinet. 

Den patofysiologiske mekanisme i de to 

situationer er den samme, nemlig nedsat funktion 

af BRCA1-proteinet, men den genetiske årsag 

er forskellig. 

Af andre sygdomme, hvor man har fundet at 

transposoner spiller en rolle, kan bl.a. nævnes 

hæmofili A (Faktor VIII) og B (Faktor IX) og 

prædisposition til colonpolypper og -cancer 

(APC-genet). 

Tandemrepeteret DNA 

Tandemrepeteret DNA er almindeligt forekommende 

i eukaryote genomer, inklusive 

36 

menneskets. Denne type af repeteret DNA kaldes 

satellit-DNA, fordi DNA-fragmenter indeholdende 

tandemrepeterede sekvenser danner 

satellitbånd (bånd ved siden af hovedbåndet) 

når det genomiske DNA fraktioneres ved densitetsgradientcentrifugering 

(Figur 1.26). 

Disse familier består af blokke (arrays) af 

tandemt repeterede DNA-sekvenser. De enkelte 

blokke kan forekomme på få eller på mange 

kromosomale lokalisationer og kan have betydning 

i forbindelse med eksempelvis den rekombination 

der foregår under meiosen samt 

for dannelsen af duplikationer (Figur 3.1 og 

3.9). Afhængigt af størrelsen af den repeterede 

enhed kan det stærkt repeterede ikke-kodende 

DNA inddeles i fire grupper: 1) megasatellit- 

DNA; 2) satellit-DNA; 3) minisatellit-DNA; 

og 4) mikrosatellit-DNA (Tabel 1.5). 

Megasatellit–DNA-gruppen består af blokke 

som samlet er op imod 1 Mb i længde. Den 

enkelte repeat-enhed er 2-5 kb lang og er moderat 

repeteret. 

1,60 

1,65 

1,70 

1,75 

1,80 

g/cm 3 

Satellitbånd 

Hovedbånd 

Figur 1.26 Gradientcentrifugering af DNA fra menneskeceller. 

Repeterede DNA-fragmenter migrerer til 

en satellitposition oven over hovedbåndet pga. forskelle 

i GC-indhold. Begrebet »satellit-DNA« kommer 

af den måde hvorpå dette repetitive DNA er blevet oprenset 

fra den resterende del af DNA’et i en menneskecelle 

(hovedbånd). Det foregår ved en såkaldt densitetsgradientcentrifugering 

ved et meget højt antal 

omdrejninger (ultracentrifugering) med anvendelse af 

en CsCl (cæsiumklorid)-gradient.


Tabel 1.5 Tandemrepeteret DNA. 

Gruppe Størrelse på 

repeat enhed 

Megasatellit-DNA (blokke er på op mod Mange kb 

hundrede kb) 

RS447 

Ikke navngivet 

Ikke navngivet 

Satellit-DNA (blokke er på 100 kb til mange 

Mb i længden) 

α-satellit-DNA (alphoid DNA) 

β-satellit-DNA (Sau3A-familie) 

Satellit 1 (AT-rigt) 

Satellit 2 og 3 

Minisatellit-DNA (blokke er på 0,1-20 kb) 

Telomer familie 

Hypervariabel familie og 

Telomer-associerede repeats 

Mikrosatellit-DNA (blokke er ofte mindre 

end 150 bp) 

4,7 kb 

2,5 kb 

3,0 kb 

5-171 bp 

171 bp 

68 bp 

25-48 bp 

5 bp 

6-64 bp 

6 bp 

9-64 bp 

1-4 bp 

Satellit-DNA-gruppen består af blokke som 

samlet kan blive op imod 1-5 Mb i længden. 

Den enkelte repeat-enhed er typisk 5-171 bp 

lang og repeteret flere tusinde gange. Alphoid 

DNA, som findes i centromererne, er et typisk 

eksempel herpå. 

Minisatellit-DNA består af mindre blokke, 

hvor størrelsen af repeat-enheden er på 6-64 bp. 

Dette resulterer i samlede repeat-blokke på typisk 

mellem 100 bp og 20 kb. De første højvariable 

DNA-markører man anvendte i retsgenetiske 

undersøgelser (DNA-profilanalyser) var 

minisatellitter (se afsnittet Genetiske markører 

og markøranalyse, side 69). 

Mikrosatellit-DNA udgøres hovedsageligt 

af repeterede enheder som sjældent er mere end 

4 bp i længden. De betegnes derfor også short 

tandem repeats (STR) og udgør ca. 3% af genomet. 

Det er karakteristisk for mikrosatellitterne 

at antallet af repeterede enheder kan ændres, 

Kromosomal lokalisation 


Forskellige lokaliseringer på visse kromosomer 

50-70 kopier i 4p15 og flere kopier distalt på 8p 

~400 kopier på 4q13 og 19q13 

~50 kopier på X-kromosomet 

Især ved centromererne 

Centromert heterokromatin på alle kromosomer 

Centromert heterokromatin på 1,9,13,14,15,21,22 og Y 

Centromert heterokromatin på de fleste kromosomer 

De fleste, måske alle, kromosomer 

Ved eller tæt på telomerer af alle kromosomer 

Alle telomerer 

Alle kromosomer, ofte tæt på telomerer 

Spredt rundt på alle kromosomer 

hvilket sandsynligvis skyldes fejl i forbindelse 

med DNA-replikationen eller er en følge af 

skæv overkrydsning (se Kap. 3). Trinukleotidsygdommene 

er eksempler herpå (se side 

221ff). En gruppe af disse kaldes polyglutaminsygdomme. 

De skyldes en ekspansion i antallet 

af trinukleotidet 5'-CAG-3'. Denne enhed er 

normalt repeteret et varierende antal gange i 

flere gener (fx huntingtin-genet og spinocerebellar 

aktasi-generne). Enheden bliver ved disse 

gener translateret og koder for aminosyren glutamin. 

Når der sker en ekspansion i antallet af 

CAG-repeats, forøges antallet af glutamin-enheder 

i de ramte proteiner, hvorved disse proteiners 

funktion ændres. Man kender til dato 8 

forskellige polyglutamin-sygdomme (mere herom 

i Kap. 14). Dinukleotid-enheden 5'-CA-3' 

er meget almindelig i det humane genom og 

udgør omkring 0,5% af hele genomet. Mononukleotid-enheden 

5'-A-3' udgør ca. 0,3%. 

37



Den store variation i længden af mange miniog 

mikrosatellitblokke gør dem til vigtige genetiske 

markører (se Kap. 3, side 69). 

Large-scale copy number variation (LCV) 

Man har inden for de seneste år overraskende 

fundet en ny type af genomvariation den såkaldte 

large-scale copy number variation (LCV) i 

forbindelse med anvendelsen af array komparativ 

genomhybridisering (CGH, se side 89) er 

blevet mere udbredt. Det drejer sig om variationer 

der omfatter duplikation eller deletion af 

store DNA-segmenter på mellem 100 og 2.000 

kb, uden tilsyneladende association med sygdom. 

Til dato (2006) er der påvist 255 LCVområder 

i genomet, og 24 heraf er fundet hos 

mere end 10% af de undersøgte personer. 

Man forstår endnu ikke betydningen af denne 

genomvariation og kender bl.a. ikke hyppigheden 

heraf eller udbredelsen i genomet. 

Forekomsten af LCV hos fænotypisk normale 

individer har udvidet rammerne for den genetiske 

variation hos mennesket, og kun fremtiden 

kan vise betydningen eller konsekvenserne, 

om nogen, af sådanne store polymorfier i genomet. 

Mitokondrie-DNA (mtDNA) 

En somatisk celle indeholder flere hundrede, 

evt. – afhængigt af celletypen – flere tusind mitokondrier, 

som igen hver især indeholder op 

til 10 molekyler mtDNA. Der kan således forekomme 

mange tusinde kopier af dette molekyle 

i hver celle. For de modne kønscellers vedkommende 

er der den dramatiske forskel at et æg indeholder 

omkring 100.000 mtDNA-molekyler, 

mens en sædcelle i sit langt mindre cytoplasma-volumen 

kun indeholder op mod 100 

mitokondrier, som yderligere under normale 

forhold nedbrydes hvis de indføres i ægcellen 

under befrugtningen. 

38 

Dette er baggrunden for at mitokondrie- 

DNA nedarves via ægceller, dvs. i rene kvindelinjer 

– såkaldt matroklin arvegang (Kap. 5). 

Forekomsten af sygdomsfremkaldende (patogene) 

mutationer i mtDNA gør at også denne del 

af genomet har betydelig medicinsk vigtighed. 

Det er derfor nødvendigt at kende til mitokondrie-DNA 

og de patogene mtDNA-mutationers 

kliniske manifestationer, ligesom det ved 

udredning af familieanamnese og fortolkning af 

stamtræer er nødvendigt at være opmærksom 

på om de foreliggende oplysninger er forenelige 

eller uforenelige med matroklin arvegang (se 

Kap. 5, Figurerne 5.1e & 5.1f). 

mtDNA-molekylet 

Menneskets mtDNA er et lille, ringsluttet 

DNA-molekyle på 16,6 kb. 

Den fuldstændige nukleotidsekvens af et 

menneske-mtDNA blev offentliggjort for første 

gang i 1981 1 . Det pågældende molekyle fandtes 

at være på 16.569 bp, og dets sekvens blev straks 

(under betegnelsen Cambridge-referencesekvensen 

(CRS), eller Anderson-sekvensen) referencesekvens 

for alle efterfølgende mtDNAsekvensanalyser 

hos mennesket. Til dette formål 

har man lige fra begyndelsen benyttet en 

fortløbende nummerering af molekylets basepar 

med et bestemt basepar i den såkaldte kontrolregion 

som nr. 1 (Figur 1.27). 

Efterhånden som mange laboratorier verden 

over gennemførte sekvensanalyser af mtDNA, 

blev det imidlertid klart at der måtte være en 

del fejl i den oprindelige referencesekvens. Faktisk 

stammede en lille del af sekvensen fra en 

anden persons mtDNA, og en anden, mindre 

del fra okse-mtDNA. Det har derfor været 

nødvendigt at revidere sekvensen, hvilket blev 

gjort i 1999, efter at man havde haft lejlighed 

1 Anderson S et al. Sequence and organization of the human 

mitochondrial genome. Nature 1981; 290: 457-465.


Leu (UUR) 

ND1 

IIe 

Met 

ND2 

Trp 

OL 16S 

Gln 

Ala 

Asn 

Cys 

Tyr 

CO I 

Val 

12S 

til, med nyere og bedre metoder, på ny at sekventere 

det oprindelige, bevarede mtDNA fra 

Cambridge 1 . Ved revisionen slog man bl.a. fast 

at der i 1981-sekvensen var anført et basepar for 

meget i position 3106-3107 (i genet for 16S 

rRNA). Den reviderede referencesekvens 

(rCRS) er således rent faktisk kun på 16.568 bp. 

Af hensyn til den allerede meget omfattende lit- 

1 Andrews RM et al. Reanalysis and revision of the Cambridge 

reference sequence for human mitochondrial DNA. 

Nature genetics 1999; 23: 147. 

Kontrolregionen 

Phe 

O H 

Thr 

Pro 

Glu 

ND6 

L-strengen 

Cytb 

Ser (UCN) 

Asp 

Lys 

Gly 

Arg 

ND3 

CO III 

CO II 

ATPase 6 

ATPase 8 

Mitokondrie-DNA (mtDNA) 

H-strengen 

ND4 

ND4L 

teratur om variation i bestemte positioner af 

mtDNA-sekvensen, med grundigt indarbejdede 

numre der for de allerflestes vedkommende 

ville blive ændret ved en konsekvent revision, 

har man valgt at bibeholde den oprindelige 

nummerering, men med et hul (gap) i sekvensen 

sv.t. position 3107. 

mtDNA’s kodende funktion 

ND5 

Leu (CUN) 

Ser (AGY) 

His 

Figur 1.27 Genetisk kort over menneskets mitokondrie-DNA (mtDNA). 

mtDNA’ets 37 gener er markeret på den af de to strenge der er template ved syntesen af det funktionelle RNA (mRNA, 

rRNA og tRNA). Gensymbolerne er følgende: 12S og 16S koder for hhv. 12S og 16S rRNA, ND1-6 for subunits i NADHdehydrogenase, 

CO I-III for subunits i cytokrom c-oxidase, ATPase 6 og 8 for subunits i ATP-syntase, Cytb for cytokrom 

b. De små udfyldte cirkler angiver tRNA-gener og er markeret med trebogstavsymbolet for den tilhørende aminosyre 

(se tabel i Kap. 17, side 250). Leucin-tRNA (Leu) og serin-tRNA (Ser) har hver to gener sv.t. deres to codon-familier (Tabel 

1.6), jf. codon-angivelserne i de anførte parenteser (R = A el. G; Y = C el. U; N = A, G, C el. U). OH og OL angiver 

replikationsstart for hhv. den tunge og den lette streng. Kontrolregionen er ikke kodende, men indeholder – foruden OH 

– separate transkriptionsstartsekvenser for de to strenge samt to regioner med højvariable sekvenser. Molekylets basepar 

nummereres fortløbende fra basepar nr. 1 (i kontrolregionen) og frem, i retning mod uret (pilen). (Adapteret fra 

Attardi, G. The elucidation of the human mitochondrial genome. A historical perspective. BioEssays 1986;5:34-9.) 

Siden 1986 har man kendt hele mitokondrie- 

DNA’ets kodende funktion (Figur 1.27). Den- 

39



ne del af menneskets genom har således været 

beskrevet i detaljer flere år før den store kortlægning 

af menneskets nukleære genom tog sin 

begyndelse. 

mtDNA indeholder i alt 37 gener. Heraf koder 

2 for ribosomalt RNA (hhv. 12S og 16S 

rRNA), 22 koder for tRNA, og 13 er proteinkodende. 

De 13 polypeptider er alle engageret 

i den oxidative fosforylering (OXPHOS) og 

dermed i mitokondriernes livsvigtige syntese af 

ATP (adenosintrifosfat). 

Pga. den ulige fordeling af puriner (adenin og 

guanin) og pyrimidiner (cytosin og thymin) 

mellem mtDNA-molekylets to strenge, betegnes 

den ene streng som tung (H-strengen, H = 

heavy), den anden som let (L-strengen, L = 

light). For 12 af de 13 proteinkodende gener i 

mtDNA er H-strengen template-streng ved 

transkriptionen, og L-strengen derfor »den 

RNA-lignende streng«, dvs. den streng hvis 

nukleotidsekvens er lig mRNA-sekvensen, såfremt 

thymin (T) erstattes med uracil (U). Dette 

er baggrunden for at man, når man beskriver 

mtDNA-sekvenser og -mutationer, bruger Lstrengens 

sekvens (se fx Tabel 5.5 s. 110), også 

i de tilfælde hvor L-strengen er genets templatestreng, 

jf ND6. 

Mitokondriegenomet er specielt ved at ingen 

af dets gener indeholder introns, ligesom 

der stort set heller ikke findes ikke-kodende 

basepar mellem generne, når undtages den såkaldte 

kontrolregion: det ca. 1100 bp store 

område mellem generne for prolin-tRNA 

(tRNA Pro ) og phenylalanin-tRNA (tRNA Phe ) 

(Figur 1.27). Den informationsmæssige kompakthed 

i mtDNA’et understreges af at 

transkripterne fra de fleste af de proteinkodende 

gener afsluttes med en ufuldstændig stopcodon 

der først fuldendes til UAA ved den posttranskriptionelle 

polyadenylering af mRNA’et. 

40 

Sekvensvariation i mtDNA 

Ved rutinemæssig mtDNA-analyse vil man hos 

de allerfleste personer kun påvise én mtDNAsekvens. 

Denne homogene tilstand betegnes 

homoplasmi; dette til forskel fra den sjældnere 

situation hvor der påvises to forskellige sekvenser, 

såkaldt heteroplasmi. 

På populationsniveau er der til gengæld tale 

om en betydelig sekvensvariation mellem tilfældigt 

udvalgte individer der således udviser 

homoplasmi for hver deres mtDNA-sekvens. 

Den typiske sekvensvariation mellem individer 

er uden fænotypiske konsekvenser og betegnes 

derfor som normalgenetisk variation. 

Dertil kommer den lejlighedsvise variation der 

skyldes patogene mutationer; disse vil blive 

omtalt i Kap 5, se afsnittet Mitokondriesygdomme, 

side 108ff). 

Haplotyper og haplogrupper 

Da mtDNA nedarves som et fast sammentømret 

molekyle, betegnes en persons mtDNA-sekvens 

også som vedkommendes mtDNAhaplotype. 

De mange forskellige haplotyper 

som blev kortlagt ved omfattende populationsgenetiske 

studier i 1980’erne og -90’erne har 

kunnet indpasses i et sammenhængende, overordnet 

stamtræ over udviklingen af mtDNA’ets 

sekvensdiversitet hos mennesket. I forbindelse 

hermed har man defineret et antal hovedgrupper 

af haplotyper som har fået betegnelsen 

haplogrupper. 

Fra DNA til protein 

Gen-ekspression 

I det følgende gives en oversigt over de væsentligste 

elementer, set fra et genetisk synpunkt, af 

processerne transkription og translation. 

Transkription og translation er samlet den måde 

hvorpå celler udlæser, eller udtrykker, deres genetiske 

information (Figur 1.2 og 1.28).


cDNA 

N C 

N . . . . . C 

rRNA 

Kromosomalt 

DNA 

Transkription 

Cellekernen 

tRNA 

mRNA Andet RNA 

Protein 

Der kan dannes mange identiske RNA-kopier 

fra det samme gen, og hvert mRNA-molekyle 

kan dirigere dannelsen af mange identiske proteinmolekyler. 

Selvom der for de allerfleste proteinkodende 

geners vedkommende kun findes to 

kopier af hvert gen i hver celle (en maternel og 

en paternel allel), vil den successive amplifikation 

via mRNA gøre cellen i stand til at syntetisere 

den nødvendige mængde af protein. 

Gener hvis processerede transkript er slutproduktet, 

forekommer ofte i mange kopier. For 

eksempel findes der ca. 200 kopier af de gener 

der koder for ribosomalt RNA (rRNA). De 

5’ 

Eksport til andre 

celler/væv 

3’ 

Kerneproteiner 

snRNA 

Andre 

proteiner 

rRNA 

Ribosomproteiner 

Translation 

N C 

Andre organeller + cytosol 


Mitokondrie 

mtDNA 

Transkription 

mRNA tRNA 

OXPHOS 

Figur 1.28 Gen-ekspressionen i en menneskecelle. Der foregår transkription i både cellekernen og mitokondrierne. I 

cellekernen dannes et primært transkript som processeres før det transporteres ud af cellekernen. Bemærk at en lille 

del af RNA-molekylerne i cellekernen naturligt kan omdannes til cDNA af viralt eller cellulært kodet revers transkriptase 

og derefter integreres forskellige steder i det kromosomale DNA. Mitokondrierne syntetiserer dets eget rRNA og 

tRNA samt nogle få proteiner som er involveret i den oxidative fosforylering (OXPHOS). De mitokondrielle DNA- og 

RNA-polymeraser, proteinerne i mitokondriets ribosomer, enzymerne i trikarboxidationen og urinstofcyklus mv. samt 

hovedparten af proteinerne i den oxidative fosforylering kodes af nukleære gener. 

· · · · · markerer post-translationelle modifikationer såsom fx glykosylering og fosforylering. 

sidder fordelt på den korte arm af de akrocentriske 

kromosomer (13, 14, 15, 21 og 22, se 

Figur 1.8) og er alle aktive. Dette betyder at disse 

gener særdeles effektivt kan danne rRNA til 

de mange ribosomer der er nødvendige for 

proteinsyntesen. For de gener, hvor der kun 

findes to kopier kan den enkelte allel transkriberes 

og translateres med forskellig effektivitet, 

hvilket gør cellen i stand til at regulere mængden 

af de forskellige proteiner i og uden for cellen. 

En celles transkription foregår dels i cellekernen, 

hvor det nukleære DNA befinder sig, dels 

41



i mitokondrierne (Figur 1.28). For at mRNA 

fra de nukleære gener kan translateres, må det 

transporteres ud af cellekernen hvilket sker 

gennem porer i kernemembranen. Før RNA 

forlader cellekernen undergår det nogle processeringstrin. 

Afhængigt af om transkriptet skal 

blive til mRNA eller en anden slags RNA bliver 

det processeret forskelligt før det forlader 

cellekernen. Kun det RNA som skal blive til 

mRNA udsættes for: 1) RNA-capping i 5'-enden 

og 2) polyadenylering i 3'-enden. Disse trin 

har betydning for mRNA-stabiliteten og er af 

betydning for eksporten ud af cellekernen. 

Endvidere fungerer modifikationerne som signaler 

for proteinsyntese-maskineriet sådan at 

når begge modifikationer er til stede, opfattes 

molekylet som intakt, og translationen kan begynde 

(se dog afsnittet nonsense-medieret 

RNA-nedbrydning, side 67). RNA syntetiseret 

i mitokondrierne forbliver i mitokondriet og 

indgår i translationen dér. 

De fleste nukleære præmRNA-molekyler 

må undergå endnu et processeringstrin i form af 

RNA-splejsning (se nærmere beskrivelse side 

27). 

Eksempler på måder for regulation af 

genekspression – promotorer, enhancere og 

silencere 

Mennesket består af ca. 250 forskellige slags celler. 

Hos et normalt individ har de somatiske 

celler samme DNA-indhold, dvs. de har samme 

genetiske information til rådighed. Celler fra 

forskellige væv er imidlertid meget forskellige 

mht. hvilke gener de udtrykker, dvs. hvilken 

del af den genetiske information de udnytter. 

Eksempelvis indeholder et individs leukocytter 

og hjerneceller den samme genetiske information, 

men deres RNA- og protein-indhold er 

meget forskelligt. Man skelner mellem såkaldte 

husholdningsproteiner, der findes i alle celler 

og har betydning for cellens basale funktion, og 

42 

de såkaldte celle/vævs-specifikke proteiner, der 

kun produceres i visse celler og som har særlige 

og specialiserede funktioner enten i eller uden 

for cellen/vævet. 

Før RNA-syntesen kan begynde, skal der 

samles et transkriptionsinitieringskompleks opstrøms 

for genet, idet RNA-polymeraser hos 

mennesket ikke kan initiere transkription selvstændigt. 

I umiddelbar nærhed af genets kodende 

sekvens er der nogle korte sekvenselementer 

der agerer som genkendelsessignaler for transkriptionsfaktorer 

der binder til DNA og dermed 

guider og aktiverer RNA-polymerasen. 

Disse korte sekvenser ligger oftest opstrøms for 

den kodende sekvens og benævnes kollektivt 

promotor-regionen. 

Der findes bl.a. en særlig promotor, kaldet 

»TATA-boksen«, foran gener der koder for 

celle/vævsspecifikke proteiner (se Figurerne 

1.15 og 1.19). Den består af sekvensen 

5'-TATAAAA-3' ca. 25-30 basepar opstrøms 

for transkriptionsinitieringsstedet. Gener der 

koder for husholdningsproteiner har sædvanligvis 

en eller flere »GC-bokse« (sekvensen 

5'-GGGCGG-3') i varierende afstand fra 

transkriptionsinitieringsstedet (Figur 1.19). Et 

andet almindeligt promotor-element er »CATboksen« 

(fx 5'-CCAAT-3') som sidder 75-80 

bp opstrøms for transkriptionsinitieringsstedet 

(Figur 1.15 og 1.19) ligesom der ofte findes enhancer- 

og silencer-sekvenser i nogen afstand fra 

de enkelte gener. Det er sekvenser som binder 

forskellige faktorer, der regulerer ekspressionen 

af generne ved hhv. at øge og nedsætte transkriptionsinitieringen. 

Transkription og translation 

Ved transkriptionen bliver nukleotidsekvensen 

i genets ene DNA-streng kopieret til et komplementært 

RNA-molekyle (det primære 

transkript) vha. en DNA-afhængig RNA-polymerase. 

DNA’ets dobbelthelix åbnes, og den


DNA-streng der er orienteret i 3'→5'-retningen 

fungerer som template for transkriptionen. 

Syntesen af RNA foregår i 5'→3'-retningen. 

Translationen (proteinsyntesen) foregår i en 

læseramme hvis begyndelse defineres af startcodon, 

AUG, der koder for aminosyren methionin 

(Figur 1.15 og 1.29b). I det nysyntetiserede 

polypeptid vil denne methionin altså være den 

N-terminale aminosyre og polypeptidkædeforlængelsen 

er sket i retning mod den C-terminale 

ende. For de fleste proteiners vedkommende 

fraspaltes den N-terminale methionin dog 

umiddelbart efter syntesen. 

Ved translationen oversættes mRNA’ets basesekvens 

i grupper af 3 baser (codons), som definerer 

polypeptidets aminosyresekvens. Aminosyrerne 

føres til ribosomerne vha. transfer- 

RNA (tRNA) (Figur 1.29b-d). Hver aminosyre 

har sit eget tRNA, som i molekylet har en såkaldt 

anticodon, der er komplementær til den 

codon i mRNA som tRNA’et bindes til, mens 

det afleverer aminosyren. Eksempelvis kan 

nævnes at tRNA for glycin har 3'-CCG-5' som 

anticodon og baseparrer med codon 5'-GGC-3' 

på mRNA, se Figur 1.29b og 1.29c. Codon 1, 

2, 3 og 4 i det skitserede mRNA translateres til 

aminosyresekvensen methionin (Met), glycin 

(Gly), serin (Ser) og isoleucin (Ile). Glycin og 

alanin følger i positionerne 5 og 6. 

Selve translationsprocessen kan inddeles i tre 

trin (Figur 1.29c): 1) Initiering, hvor der dannes 

et initieringskompleks bestående af mRNA, et 

ribosom og tRNA sv.t. codon 1; dette kræver 

forskellige initieringsfaktorer. 2) Elongering er 

det næste trin, og består af codon-genkendelse 

(binding af tRNA), etablering af peptid-binding 

og flytning af ribosomet, vha. en translokase, 

3 baser frem i 3'-retningen på mRNA; 

dette trin kræver tilstedeværelsen af elongeringsfaktorer 

sådan at de successive aminosyrer 

påsættes det voksende polypeptid. 3) Termine- 


ringen er det sidste trin, og translationen stopper 

når en af de tre stopcodons UAA, UGA eller 

UAG nås. Det dannede polypeptid forlader 

ribosomet, som dissocierer til dets subunits og 

mRNA. 

mRNA har en begrænset levetid i cytoplasmaet, 

forskelligt for de enkelte mRNA’er. Eksempelvis 

har β-globin-mRNA en halveringstid 

(t1) på omkring 10 timer, mens andre har en 

t1 < 30 min. 

Den genetiske kode 

Den genetiske kode udgør et sæt biologiske 

regler der bestemmer hvordan nukleotidsekvensen 

i DNA oversættes til aminosyresekvens 

via mRNA. Den anvendte genetiske 

kode er næsten universel for nukleære gener, 

dvs. at med enkelte undtagelser benytter alle 

arter samme kode for kernegenernes vedkommende. 

Bakterier ligeså. 

Koden er opbygget af kodeord (codons), der 

udgøres af en sekvens på 3 baser som bestemmer 

hvilken aminosyre der skal kobles på ved 

translationen. Hver codon angiver én aminosyre. 

Derimod kan en aminosyre godt kan have 

flere forskellige codons (jf. Tabel 1.6). Den genetiske 

kode kaldes derfor degenereret, hvilket 

kan eksemplificeres ved at aminosyren fenylalanin, 

har to codons: UUU og UUC, mens der 

er seks forskellige codons for aminosyren serin: 

UCU, UCC, UCA, UCG, AGU og AGC. 

Den genetiske kode blev dechifreret og beskrevet 

i 1966 og er angivet i sin helhed i Tabel 1.6, 

se også kodetabellen side 249. Der er anført 20 

forskellige aminosyrer, men rent faktisk indeholder 

nogle få proteiner en 21. aminosyre, selenocystein 

(Sec), hvis tRNA genkender codonen 

UGA (jf Tabel 1.6). 

Mitokondriernes genetiske kode er lidt anderledes. 

Translationen af deres 13 mRNAmolekyler 

sker på mitokondriernes egne ribosomer, 

under anvendelse af det mitokondrielle 

43



44 

a. Transkription 

5' 

3' 

DNA-dobbelthelix 

b. Translation 

RNA 

Methionin Glycin Serin Isoleucin Glycin Alanin 

Polypeptid 

A U G G G C U C C A U C G G C G C A G C A A G C 

5' 1 2 3 4 5 6 7 8 3' 

Codons 

mRNA 

c. Translationsforløb 

3' 

C C G C G T 

5' A U G G G C U C C A U G G G C U C C 

A G U U A A U C C 3' 

U A C 

Ribosom 

Met 

1. Initiering 

d. Strukturen af transfer-RNA (tRNA) 

1. Kløverbladstruktur 

5' 

G 

C 

G 

G 

A 

U 

A 

C 

C 

A 

C 

G 

C 

U 

U 

A 

A 

G A C A C C U 

U 

G A 

U 

G 

C U C A 

C U G U G C 

G G A G C U 

G G 

A 

A 

G 

C 

C 

A 

G 

A 

C 

U 

G A A 

Loop 3 

Loop 1 

Variabel loop 

G 

G 

U 

C 

Loop 2 A 

3' 

Anticodon 

Figur 1.29 Se Billedtekst på siden overfor. 

Met 

C C G 

Gly 

Ribosom 

A G G 

Ser 

2. Elongering 

Phe 

2. Tredimensionel struktur 

Loop 3 

20 

Variabel loop 

Anticodon-loop 

(Loop 2) 

54 

44 

32 

U C A 

Leu Met Ser 

64 

Ribosom 

3. Terminering 

4 

7 

26 

38 

12 

69 

5' 

Loop 1 

Anticodon 

72 

3' 

5' 

76 

3' 

Acceptorende


sæt af tRNA-molekyler som definerer mitokondriernes 

specielle variant af den genetiske 

kode (Tabel 1.7); her koder UGA for tryptofan 

(Trp), og AGA og AGG fungerer som supplerende 

stopcodons i stedet for at kode for arginin 

(Arg). 

Translation og posttranslationelle 

modifikationer 

Et segment af en nukleotidsekvens kan læses i tre 

forskellige læserammer (Figur 1.30, læserammerne 

A, B og C), men kun én af dem er rigtig (A i 

Figur 1.30 se dog side 32, Figur 1.23). Den defineres 

oftest af den første AUG-sekvens i mR- 

NA’et, som så er codon 1, og nysyntetiserede 

polypeptider har, som tidligere nævnt (side 43), 


Tabel 1.6 Den genetiske standardkode. Aminosyrerne er angivet ved deres tre- og étbogstavkode (se tabel 

i Appendix, side 35). Man har konventionelt bestemt at en codon skrives med 5'-nukleotidet til venstre. 

GCA 

GCC 

GCG 

GCU 

AGA 

AGG 

CGA 

CGC 

CGG 

CGU AAC 

AAU GAC 

GAU UGC 

UGU CAA 

CAG GAA 

GAG 

GGA 

GGC 

GGG 

GGU CAC 

CAU 

AUA 

AUC 

AUU 

UUA 

UUG 

CUA 

CUC 

CUG 

CUU AAA 

AAG AUG UUC 

UUU 

A R N D C Q E G H I L K M F P S T W Y V 

*) I enkelte nukleære gener fungerer UGA som codon for selenocystein. 

methionin som N-terminal aminosyre. Efter 

translationen undergår polypeptidet forskellige 

former for kemiske ændringer, såkaldte posttranslationelle 

modifikationer, som er nødvendige 

for at opnå det modne slutprodukt, fx et aktive 

enzym. Ud over fraspaltning af en eller flere 

aminosyrer, herunder den N-terminale methionin, 

kan de posttranslationelle modifikationer typisk 

bestå i oxidation af cysteiner for at danne 

disulfidbroer, samt i glykosylering, fosforylering 

etc. Et polypeptids aminosyresekvens betegnes 

dets primære struktur og er af afgørende betydning 

for sekundærstrukturen, der er den tredimensionelle 

form på dele af et polypeptid eksempelvis 

α-helix og β-sheet. Den tertiære struktur 

er den foldede form af hele polypeptidet, 

Figur 1.29 Transkription og translation. A. Det første trin i gen-ekspressionen er transkription af den ene DNA-streng 

med dannelse af komplementært RNA. Processen styres af mange proteiner kaldet transkriptionsfaktorer. RNA-syntesen 

foregår ved hjælp af RNA-polymerase og kræver at DNA-dobbelthelix åbnes. Syntesen sker i 5' → 3'-retningen, 

dvs. komplementært til 3' → 5'-retningen på den DNA-streng der fungerer som template. 

Efter transkriptionen sker der en RNA-processering og -splejsning med dannelse af mRNA. B. Translationen er den 

proces hvor en række af codons i mRNA oversættes til en korresponderende aminosyresekvens på ribosomerne i cytoplasmaet. 

Translationen sker i en læseramme, som defineres af start-codon AUG. De enkelte codons er nummereret. 

C. Man definerer tre trin under translationen: initiering, elongering og terminering. Hvert af disse trin har forskellige 

proteiner som regulerer processen. De enkelte aminosyrer bringes til ribosomet af specifikke tRNA-molekyler via anticodon 

som baseparrer med den rette aminosyrecodon i mRNA. Når to aminosyrer sidder tæt ved hinanden dannes der 

en peptidbinding mellem dem, det næstsidst ankomne tRNA frigøres, og ribosomet bevæger sig en codon til højre, hvor 

processen gentages til der optræder en stopcodon. D. Til venstre er vist tRNA på såkaldt kløverbladsform. Acceptorarmen 

(3'-enden) binder den specifikke aminosyre, i dette eksempel fenylalanin, hvilket kan aflæses af anticodon. Den 

tredimensionelle struktur af tRNA er vist til højre. De forskellige loops har funktioner i relation til at elongeringsprocessen 

forløber uden fejl. markerer modificeret nukleotid. 

CCA 

CCC 

CCG 

CCU 

AGC 

AGU 

UCA 

UCC 

UCG 

UCU 

ACA 

ACC 

ACG 

ACU UGG UAC 

UAU 

Ala Arg Asn Asp Cys Gln Glu Gly Hls Ile Leu Lys Met Phe Pro Ser Thr Trp Tyr Val stop 

GUA 

GUC 

GUG 

GUU 

UAA 

UAG 

UGA * 

45



A 

B 

C 

mens den kvaternære form er den sluttelige konformation 

af et multimert protein. Fx hæmoglobin, 

som består af 2 α-globin-monomerer, 2 βglobin 

monomerer og 4 hæmmolekyler hver 

med ét jernatom. 

Genomisk regulation af 

gen-ekspressionen 

Med afslutningen af det humane genomprojekt 

har vi en næsten komplet liste over de gener 

som er nødvendige for at danne et individ og 

vedligeholde dets celler og organsystemer. Forståelsen 

af hvordan den biologiske information 

anvendes, kræver dog langt mere end et simpelt 

katalog over gener selvom det er en væsentlig 

information. 

Man har påvist, at andelen af mRNA udgør 

omkring 2-3% af det samlede RNA i en menneskecelle. 

Et lille antal mRNA’er findes i flere 

tusinde kopier, andre findes i flere hundrede 

kopier, mens hovedparten findes i mindre end 

10 kopier pr. celle. Man regner med, at der i alt 

findes omkring 500.000 mRNA-molekyler i 

en enkelt menneskecelle. Af de omkring 

27.000 gener man har fundet i menneskets genom, 

er det kun omkring en tredjedel, der udtrykkes 

i de enkelte væv og celletyper. Da der 

er hundredevis af forskellige celletyper dannende 

forskellige organer, der desuden har forskellige 

fysiologiske, udviklingsmæssige og patofy- 

46 

CAGUCUAUGGCAAAUAAGGUAGACCAU 

Met Ala Asn Lys Val Asp His 

Tyr Gly Lys 

Leu Trp Glu 

STOP 

Ile Arg STOP 

Figur 1.30 Læserammen for translationen. Se teksten 

for detaljer. 

Tabel 1.7 

mtDNA. 

Den genetiske kode for menneskets 

Forskelle fra kernekoden 

codon kernekode mtDNA-kode 

AUU Ile Ile (startcodon i ND2) 

AUA Ile Met 

UGA Stop Trp 

AGA Arg Stop 

AGG Arg Stop 

siologiske tilstande, eksisterer der således tusinder 

af forskellige transkriptomer. 

Beskrivelse og forståelse af de biologiske systemer 

som bestemmer hvilke af disse mange 

gener der skal være aktive i hvilke celler og på 

hvilket tidspunkt, samt hvilke regioner af de 

enkelte gener som skal udtrykkes i de enkelte 

celler, er mindst lige så vigtig som selve det humane 

genoms sekvensinformation. Man har allerede 

påvist vigtige faktorer i disse systemer, 

såkaldte epigenetiske markører, der har betydning 

for den differentierede anvendelse af den 

biologiske information som de enkelte celler 

har. De epigenetiske markører varierer fra celletype 

til celletype og har yderligere den vigtige 

egenskab at de kan videregives ved celledelingen. 

Faktorer i dette system ændrer ikke DNAbaserækkefølgen, 

men modificerer i stedet nogle 

af baserne, modificerer mængden og typen af 

transkript posttranskriptionelt eller modificerer 

proteiner omkring DNA-molekylet (Tabel 

1.8). 

Alternativ transkription og processering 

Ud over de kontrolmekanisker som har betydning 

for styringen af transkripters initiering og 

elongering, eksisterer der mekanismer som regulerer 

hvilke specifikke alternative transkripter 

der udtrykkes fra et gen. Ved genekspression 

kan en celle anvende flere forskellige pro-


Tabel 1.8 Eksempler på epigenetiske modifikationer 

til regulation af gen-ekspressionen. 

Alternativ transkription og processering 

alternativ splejsning meget hyppig 

alternativ anvendelse af promotorer almindelig 

alternativ polyadenylering almindelig 

RNA-editering 

Genomiske modifikationer 

sjælden 

metylering/demetylering af DNA meget hyppig 

acetylering/deacetylering af histon 

RNA-interferens 

meget hyppig 

nedbrydning af mRNA almindelig 

motorer og differentiel RNA-processering og 

der kan således ud fra et relativt lille antal gener 

dannes et stort antal forskellige isoformer af 

genprodukter. Disse opdagelser har ændret den 

klassiske definition af et gen, og den simple relation 

»ét gen – ét polypeptid« er ikke mere 

gældende. 

Mange gener har to eller flere alternative promotorer 

hvilket kan resultere i dannelsen af forskellige 

isoformer af genprodukter med forskellige 

egenskaber. Et af de bedst undersøgte gener, 

hvor differentiel promotor anvendes, er 

Genomisk regulation af gen-ekspressionen 

det store dystrofin-gen (DMD), som består af 

79 exons fordelt på 2,4 Mb. Mindst 8 forskellige 

promotorer er beskrevet (Figur 1.31), og de 

anvendes til celletypespecifik ekspression af 

dystrofin-genet. Atter andre isoformer af dystrofin-genet 

skyldes alternativ splejsning. 

Omkring halvdelen af menneskets gener har 

primære transkripter der undergår alternativ 

splejsning, hvor forskellige exon-kombinationer 

bliver inkluderet i det færdige transkript 

ved RNA-processering (Figur 1.17 og 1.18). 

Det har vist sig at visse transkripter har bestemte 

exon-kombinationer i forskellige væv. De forskellige 

isoformer i de forskellige væv giver 

mange muligheder for ændrede funktionelle 

egenskaber, men detaljeret viden herom mangler 

endnu. Alternativ splejsning har vist sig at 

være en af de vigtigste mekanismer bag dannelsen 

af forskellige isoformer. 

Alternativ polyadenylering er en anden almindelig 

måde til dannelse af isoformer. Et eksempel 

herpå er alternativ polyadenylering af 

calcitonin-transkriptet, hvilket resulterer i 

vævsspecifik ekspression af to isoformer (Figur 

1.32). Calcitonin er et cirkulerende Ca 2+ -homøostatisk 

hormon som produceres i gl. thyroidea. 

Det calcitonin-gen-relaterede peptid 

L C M P R CNS S G 

L1 C1 M1 P1 

0 500 1000 1500 2000 

2 5 10 15 20 30 40 45 50 55 60 70 79 

Dp427 Dp260 Dp140 Dp116 Dp71 

Figur 1.31 Mindst 8 forskellige promotorer benyttes til cellespecifik ekspression af dystrofin-genet. Positionen af de 

8 alternative promotorer er vist øverst: L i lymfocytter, C i hjernebarken (cortex cerebri), M i muskel, P i Purkinjefibre, 

R i retina, CNS i central nervesystemet, S i schwannske celler, G for generel promotor. Exons er nummererede 1-79. 

Notér at promotorvalget afgør hvilken exon der bliver den første i det pågældende transkript (L1, C1, M1, P1, R1 osv.). 

Dp427, Dp260, Dp140, Dp116, Dp71 refererer til størrelsen af færdige peptid i kDa, eksempelvis 427 kDa for Dp427. 

kb 

47



(CGRP) syntetiseres i hypothalamus og har 

neuromodulatoriske egenskaber. Ud fra samme 

gen kan der således dannes peptider med forskellige 

egenskaber relateret til forskellige funktioner 

i forskellige væv. 

RNA-editering er en sjældnere form for 

posttranskriptionel processering hos mennesket 

og involverer enzym-medieret insertion, deletion 

eller modifikation af enkelte nukleotider 

på RNA-niveau (fx deaminering af cytosin til 

uracil) som fører til ændret mRNA-sekvens. 

Man kender til dato kun få gener, hvor denne 

måde til dannelse af isoformer anvendes (fx 

apolipoprotein B). 

Genomiske modifikationer til regulation 

af gen-ekspressionen 

I Tabel 1.9 er der givet en oversigt over de epigenetiske 

modifikationer, som har betydning 

for aktive og mindre aktive gener. 

48 

Calcitoningenet 

mRNA 

Polypeptidforstadium 

Polypeptid 

Cap 

Gl. thyroidea 

Neuronalt 

væv 

Gl. thyroidea 

1 2 3 4 

Calcitonin 

pA1 pA2 1 2 3 4 5a 5b 

Poly- 

A 

Differentiel splejsning 

og polyadenylering 

Translation 

Posttranslationel 

kløvning 

Cap 

Neuronalt væv 

1 2 3 5a 

CGRP 

5b 

Poly- 

A 

Figur 1.32 Differentiel RNA-processering resulterer i vævsspecifikke calcitoningen-produkter. pA1 og pA2 repræsenterer 

alternative polyadenyleringssignaler som anvendes i hhv. gl. thyroidea og neuronalt væv. Notér at calcitonin 

kodes af exon 4-sekvenser i gl. thyroidea, mens calcitonin-gen-relateret-peptid (CGRP) i neuronalt væv syntetiseres fra 

5'-delen af exon 5 (5a) som et resultat af alternativ splejsning. 

Den eneste kendte modifikation af DNA hos 

mennesket er metylering af cytosin i position 5 

i CpG-dinukleotider. I normale celler foregår 

DNA-metylering især i dé genomiske områder 

som har repeterede sekvenser såsom satellit- 

DNA, SINEs og LINEs. Hypermetylering af et 

gen eller gen-område nedsætter ekspressionen 

af disse og omvendt ved hypometylering. 

En anden vigtig epigenetisk modifikation er 

den posttranskriptionelle modifikation af histonerne 

som DNA er viklet omkring. Denne 

modifikation består i påsætning af acetyl-grupper 

på lysin-enheder tæt på den N-terminale 

ende af histonerne. De acetylerede N-termini 

danner haler som stikker ud fra histon-oktameren. 

Acetylerede histoner har mindre affinitet 

over for DNA og medfører en mere åben 

struktur, der er bedre egnet til transkription. 

Med andre ord, acetylering af histoner fremmer


Tabel 1.9 Epigenetiske modifikationer ved aktive og inaktive gener. 

gen-ekspressionen mens de-acetylering hæmmer 

denne ekspression. 

For nylig er det blevet vist at processerne for 

DNA-metylering og histon-acetylering er koblede, 

men den nærmere biologiske betydning 

heraf er endnu ikke klarlagt. 

DNA-metylering og 

imprintningsygdomme 

Tidligt i embryogenesen hos kvinder sker der i 

somatiske celler normalt en permanent og tilfældig 

inaktivering af det ene X-kromosom 

som følge af en hypermetylering. Dette betyder 

at ca. halvdelen af de somatiske celler hos kvinder 

har det paternelt nedarvede X-kromosom 

aktivt mens de øvrige celler har det maternelle 

X-kromosom aktivt (se nærmere om X-inaktivering 

i Kap. 5, side 106ff). 

Epigenetiske modifikationer har også sygdomsmæssig 

betydning, hvilket bl.a. understreges 

af det stigende antal sygdomme, hvor det er 

påvist at disse modifikationer er involveret i patogenesen. 

En kobling mellem DNA-metylering og 

cancer blev kendt for flere år siden, hvor det 

blev vist at cancercellers genom er relativt hypometyleret 

i forhold til normale cellers. Det er 

interessant at dette tab af metylering hovedsageligt 

er sket i de repetitive områder af genomet. 

Et andet fænomen er imprintning. Visse regioner 

i de maternelle og paternelle genomer er 

ikke funktionelle ækvivalenter. Gener i sådanne 

regioner har forskellig ekspression afhængig af 

den parentale oprindelse. En sådan forskel i 

gen-ekspressionen som følge af den parentale 

Genomisk regulation af gen-ekspressionen 

Epigenetisk modifikation Aktive gener Inaktive gener 

DNA-metylering Relativ hypometylering 

specielt af promotor-regionen 

Relativ hypermetylering 

inklusive promotor-regionen 

Histon-acetylering Acetylerede histoner De-acetylerede histoner 

oprindelse kaldes for imprintning. Grunden til 

dette fænomen er at der er forskel i graden af 

metylering mellem den maternelle og paternelle 

allel. Eksempelvis, hvis et maternelt gen er 

metyleret (inaktivt) mens det paternelle ikke er, 

vil kun det paternelle blive udtrykt. Hvis der 

sker forstyrrelser i dette normale imprintningsystem, 

medfører det udvikling af forskellige 

sygdomme afhængigt af de berørte regioner. 

Det har vist sig at visse cancerformer såsom 

Wilms’ tumor og kolorektal cancer har forstyrrelser 

i de imprintede gener. Der findes også andre 

grupper af sygdomme, hvor forstyrret imprintning 

har patogenetisk betydning, eksempelvis 

Beckwith-Wiedemanns syndrom samt 

Prader-Willis og Angelmans syndromer (se 

nærmere herom i Kap. 15, side 238ff). 

Med baggrund i ovenstående syndromer er 

der nu betydelig farmakologisk interesse i at udvikle 

medikamina som skal kunne revertere 

epigenetiske abnormiteter. 

RNA-interferens 

Man har for nylig fundet at ekspressionen af ca. 

3 af alle menneskets gener reguleres af en ny 

klasse af molekyler kaldet miRNA. Det er en 

forkortelse for mikro-RNA, der udgøres af små 

RNA-molekyler med en længde på 21-30 nukleotider. 

De er ikke peptidkodende, men udtrykkes 

vævs- og udviklingsmæssigt specifikt og 

regulerer ekspressionen af andre gener ved at 

binde sig til specifikke mRNA-molekyler og 

iværksætte nedbrydning heraf. 

Til dato har man identificeret omkring 400 

forskellige miRNA’er som har betydning for 

49


udvikling og vedligeholdelse af stamceller, hjerne- 

og muskelceller. Det har endvidere vist sig 

at tab af bestemte miRNA’er kan føre til dysreguleret 

insulinsekretion og til celler der ikke 

kan dele sig som følge af manglende funktionelle 

centromerer. 

Betydning og Perspektiver 

Det humane genom har gennem de sidste 10 år 

haft høj grad af fokus inden for den biologiske 

og medicinske forskning, og dette vil utvivlsomt 

fortsætte endnu en rum tid. Men hvorfor 

er al den aktivitet koncentreret om dette og andre 

genomer (fx mus, gris og ris)? Der er flere 

grunde hertil. 

For det første vil det humane genom danne 

grundlag for et genkatalog, hvor man kender 

sekvensen af hvert gen selvom man måske ikke 

kender dets funktion. Herudover vil man have 

adgang til oplysninger om de enkelte geners regulatoriske 

områder og om hvordan generne er 

lokaliseret i forhold til andre gener. Mange af 

disse gener vil, når de ikke fungerer korrekt, give 

anledning til genetisk sygdom. Via et genka- 

talog for mennesket vil man have hurtig adgang 

til sekvensdetaljerne om disse gener, hvilket er 

udgangspunktet for at kunne undersøge og forstå 

sygdomsmekanismerne, hvilket igen vil 

kunne føre til strategier for behandling og profylakse. 

Det humane genkatalog er endnu i sin vorden 

og mens det færdiggøres, vil der nu blive 

rettet mere fokus på transkriptomet og proteomet 

(Figur 1.2), som udgør nøglefaktorer for at 

forstå hvordan den genetiske information indeholdt 

i genomet omsættes i den enkelte celle, 

herunder hvad der sker i forbindelse med forskellige 

sygdomme. Det bliver også interessant 

at se hvilken funktion alt det intergeniske DNA 

har. Det udgør trods alt ca. 5 af genomet. 

Sekventeringen af det humane og andre genomer 

presser teknologien til det yderste og 

fungerer derfor også som drivkraft i den fortsatte 

teknologiske udvikling af nye og mere effektive 

metoder inden for den basalbiologiske og 

medicinske forskning, og til betydelig forbedret 

diagnostik.

1 Menneskets genom

Create successful ePaper yourself

Delete template?

Save as template?