11.07.2015 Views

Homologi - BEA

Homologi - BEA

Homologi - BEA

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Vad är bioinformatik?• Analysera biologiska data systematiskt på ettstandardiserat sätt.– Kräver oftast datorer och statistik• Bioinformatik är ett samlingsnamn för en mängdolika tekniker och är inte ett forskningsfält i sigsjälvt.


Den nya biologin!• in vivo: biologiska experiment som utförs i levande celler– Enstaka celler, vävnader eller organismer• in vitro: biologiska problem som utförs i cell-fria system– T.ex. enzymkinetik med rena komponenter• ”in silico”: biologiska experiment som utförs helt och hållet ien dator


Exempel:• Sekvensanalys:– Hitta likheter mellan biologiska sekvenser– Etablera evolutionära förhållanden mellan biologiska sekvenser– Hitta potentiella gener i nya genomiska sekvenser– Jämföra genom från olika arter– Förutspå protein- och RNA strukturer från primärsekvenser• Expressionsanalys (David Brodin & Co):– Hur regleraras gener under specifika förhållanden– Hitta grupper med gener som regleras på samma sätt


“Kurslitteratur”• Wikipedia !– Bioinformatics, homology, convergent evolution, sequencealignment, phylogenetic analysis, gene family, proteinfamily, protein domain, metagenomics…


<strong>Homologi</strong>”Nothing in biology makes sense except inthe light of evolution.”Theodosius Dobzhansky, 1973


Morfologi hos ryggradsdjurgrodasalamanderpadda


groda padda salamander


grön mambakopparödlaödla


grön mambakopparödlaödla


“sugar glider”flygekorredelfin


“sugar glider”flygekorredelfin


• Likheter i ryggradsdjurens morfologi uppkommerantingen:– 1. pga ett gemensamt evolutionärt ursprung (de har ärvtderas morfologi från en gemensam förfader)– 2. pga att de har anpassat sig till liknandelevnadsförhållanden (adaption) på liknande sätt menoberoende av varandra


Genomiska DNA sekvenser hos primaterSchimpans (kromosom 2)GTGCTGGCCGGAAGCCCCTCAAGTCGGGTATGAAGGAGCTGGCCGTGTTCCGGGAGAAGGTCACTGAGCA||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||GTGCTGGCCGGAAGCCCCTCAAGTCGGGTATGAAGGAGCTGGCCGTGTTCCGGGAGAAGGTCACTGAGCAMänniska (kromosom 2)


Schimpans (kromosom 2)GTGCTGGCCGGAAG||||||||||||||GTGCTGGCCGGAAGMänniska (kromosom 9)


Proteinsekvenser hos primaterSchimpansVYTPRCGQGLRCYPHPGSELPLQALVMGEGTCEKRRDAEYGASPEQVA||||||||||||||||||||||||||||||||||||||||||||||||VYTPRCGQGLRCYPHPGSELPLQALVMGEGTCEKRRDAEYGASPEQVAMänniska


SchimpansVYTPRC||||||VYTPRCMänniska


• Likheter i biologiska sekvenser uppkommerantingen:– 1. pga ett gemensamt evolutionärt ursprung, dehärstammar från en och samma sekvens– 2. pga en ren slump (men ju större likheten är mellan tvåsekvenser desto mer sannolikt är det att denna likhetinte har uppstått slumpmässigt)


Begreppet homologi• Sir Richard Owen var den som uppfanntermen “homologi” 1843 för att beskrivalikheter i anatomi mellan olika djurarter.• Det var först senare som homologidefinierades som likartade biologiskakaraktärer orsakade av ett gemensamtevolutionärt ursprung.– anatomi, morfologi– beteende– biologiska sekvenserRichard Owen


Vad är sekvenshomologi• Om två sekvenser verkar lika nog för att antyda att dehärstammar från en gemensam “förfader” så kan anses devara homologer.• <strong>Homologi</strong> är ett kvalitativt uttryck – två sekvenser kanantingen vara homologer eller så är de inte det.• Likhet (similarity) kan mätas kvantitativt (t.ex. % identitet).• När man kallar en sekvens för en homolog så man alltså redantagit ställning till sekvens evolutionära förhållande till enannan sekvens.• Extremt vanligt att folk blandar ihop likhet med homologi.


”Biologists look at a sequence and say 'protein X is 43%homologous to protein Y'. Well, it's not. The twosequences can be 43% identical or they can be 43%similar, but they can't be 43% homologous. There is nosuch thing as percent homology. The meaning ofhomologous is 'related by divergent evolution from acommon ancestor'. That's the only thing it means. Youcan't be partially homologous: that would be like beingpartially dead, or partially pregnant. You're eitherhomologous or you're not.”Gregory Petsko (2001), Genome Biology


Ameloot et al., 2001Bishop et al., 2002Kuiper et al., 1996Luke et al., 2005Suzuki et al., 2001


Muncke et al., 2003Davis et al., 2002(Cell !!!)Booth et al., 2000Baumli et al., 2004Berti et al., 2001


Sekvenskonservering(sequence conservation)• Varför går det då att urskilja likheter mellan tvåsekvenser med gemensamt ursprung?• Delar av sekvenserna bevaras (konserveras) därföratt de sekvenskaraktärerna är viktiga eller t.o.m.kritiska för genens/proteinets funktion.• Biologiska sekvenser kan endast förändras inomvissa ramar.


• Två homologa sekvenser har enligt definition en gemensam“förfadersekvens”.• Homologa sekvenser kan (men måste inte) likna varandra.• Homologa sekvenser kan (men måste inte) ha liknandebiologiska funktioner.• Det enda homologi betyder är ett gemensamt evolutionärtursprung hos en biologisk karaktär!


Kan två sekvenser vara homologa utanatt likna varandra det minsta?• Det kan de. Det enda homologi betyder är att dehar ett gemensamt evolutionärt ursprung.• Tyvärr så är sekvenslikhet är det vanligasteverktyget vi har för att kunna avgöra om tvåsekvenser kan tänkas vara homologer.


Ursprunglig sekvens ABI detta fall ärsekvenserna A och Bhomologa men vi kan intese det om vi inte hittaren “felande länk” dvs ensekvens där A och Bfortfarande sitter ihop.Sekvens A0 % likhetSekvens B


När likhet inte har med gemensamtursprung att göra - konvergens• Likhet behöver inte alltid ha med ett gemensamtevolutionärt ursprung att göra.• Ibland uppstår liknande biologiska karaktäreroberoende av varandra.• Detta kallas konvergent evolution (eller parallellevolution).• Konvergenta karaktärer kallas för analoger.


Kroppsform hos simmande ryggradsdjurbarracuda(fisk)delfin(däggdjur)itchyosaur(utdöd reptil)


Marklevande sociala insektertermit(Isoptera)myra(Formicidae)


Ökenväxterkaktus(Cactaceae, Amerika)euforbia(Euphoriaceae, Afrika)


Hur uppstår homologa sekvenser?• Homologa gener uppstår från redan existerande gener.• Dessa ”nya” gener kan sedan vanligtvis inte utbyta genetisktinformation med sin föregångare via rekombinering .– De nya generna blir genetiskt och evolutionärt isolerade frånsina föregångare (divergens).Gen 1Gen 2


Hur skapar man en ny populationisolerade gener?• Två sätt:– Artbildning: t.ex. det sker (förhoppningsvis) inget utbyteav genetisk information mellan schimpansgener och våragener sedan vi skiljdes åt i evolutionen. Det gjorde detdäremot hos vår gemensamme förfader.– Genduplikation


• Homologa sekvenser som separerats pga artbildning kallas förortologa sekvenser eller ortologer– Exempel: insulingenerna hos människa och schimpans är varandrasortologer• Homologa sekvenser som separerats pga av genduplikation kallas förparaloga sekvenser eller paraloger– Exempel: generna för hemoglobin α1, α2, β1, β2 och myoglobin i detmänskliga genomet är varandras paraloger.– Ibland defineras paraloger som homologa sekvenser inom ett och sammagenom (vilket är delvis korrekt)


artbildninggenduplikationα βα β


Ortologer vs. paralogerPanthera leoPanthera tigrishemoglobin αhemoglobin βhemoglobin αhemoglobin β


Ortologa sekvenserPanthera leoPanthera tigrishemoglobin αhemoglobin βhemoglobin αhemoglobin β


Paraloga sekvenserPanthera leoPanthera tigrishemoglobin αhemoglobin βhemoglobin αhemoglobin β


Genduplikation• En mycket viktig evolutionär mekanism för att generera nyagener med nya funktioner.– Unequal cross-over, delar av kromosomer– Kromosomduplikation– Genomduplikation• En extra genkopia känner inte av samma selektionstryck ochkan mutera snabbare än den sekvens den härstammar från.– Så småningom kan den få en egen funktion och då ökarselektionstrycket som i sin tur sänker mutationsfrekvensen.


Pseudogener• Det är dock sällan duplicerade gener bevaras i genomet ochhar tid att få nya funktioner.• I de flesta fallen inaktiveras genen ganska snabbt på etteller fler av följande sätt:– Icke-funktionellt protein (mutationer i den kodande sekvensen)– Translateras inte (mutationer i startkodonet)– Transkriberas inte (mutationer i promotorsekvensen)• Dessa gener kallas pseudogener och betecknas med ”ψ”.• Det finns mellan 3,000 och 19,000 pseudogener i vårt genom– beroende på analysmetod och definition.


Gen- och proteinfamiljer(gene families, protein families)• Homologa gener och proteiner kan grupperas i familjer– Vår uppfattning av en gen- eller proteinfamilj begränsas av dehomologer vi kan hitta• Det finns ett stort antal familjer (> 8,000) men det totalaantalet är inte känt och påverkas också av hur vi definieraren gen- eller proteinfamilj– Zink-finger protein– Nuklerära hormonreceptorer– Globiner (hemoglobin, myoglobulin etc)– Kinaser– ATPaser– …


Antal proteinfamiljer?≈ 60,000 9,318PotentiellaproteinfamiljerVerifieradeproteinfamiljerKunin et al., 2002 Pfam databasen v. 22, juli 2007


Proteinfamiljer vs. domänfamiljer• Delar av en proteinsekvens (proteindomäner) kan ha separataevolutionära ursprung.• Ett enskilt protein kan därmed ingå i flera olikaproteinfamiljer (exempel: Hrp1 proteinet i jästsvampenSchizosaccharomyces pombe, se nedan).• Vissa använder därför nu hellre begreppet domänfamilj.Potentiella:# 1# 2# 3Verifierade:chromodomänerSNF2-Ndomänhelikasdomän

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!