12.01.2013 Views

Dragoş Lucian Gorgan - Editura Bioflux

Dragoş Lucian Gorgan - Editura Bioflux

Dragoş Lucian Gorgan - Editura Bioflux

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

verosimilitudini (ML) avem nevoie de probabilităţile schimbării oricărui caracter în<br />

oricare altul înt-un ram de lungime t. Matricea probabilităţii substituţiilor se calculează<br />

ca:<br />

P( t)<br />

<br />

Aceleaşi modele de mai sus pot fi folosite şi pentru a calcula distanţa dintre două<br />

secvenţe nucleotidice X şi Y care s-au diferenţiat dintr-un strămoş comun t timp în<br />

urmă.<br />

2.4.3. ESTIMAREA NUMĂRULUI DE SUBSTITUŢII NUCLEOTIDICE<br />

Qt<br />

e<br />

2.4.3.1. MODELUL JUKES – CANTOR<br />

Cel mai simplu model de substituţie nucleotidică este cel propus de Jukes şi<br />

Cantor în 1969. Acest model presupune că substituţia nucleotidică intervine în orice<br />

site cu frecvenţă egală, astfel încât, o nucleotidă este înlocuită cu una din celelalte trei<br />

nucleotide rămase cu o probabilitate α pe an (sau o altă unitate de timp). Mai mult,<br />

probabilitatea de înlocuire a unei nucleotide cu oricare din celelalte trei, este r=3α,<br />

unde r reprezintă probabilitatea de înlocuire pe site pe an. Dacă luăm în considerare<br />

două secvenţe X şi Y care au evoluat divergent dintr-o secvenţă comună ancestrală,<br />

cu t ani în urmă. Dacă notăm cu qt nucleotidele comune dintre cele două secvenţe şi<br />

cu pt (pt=1 – qt) proporţia nucleotidelor diferite, procentul nucleotidelor comune qt+1<br />

în timpul t+1 (măsurat în ani), poate fi obţinut astfel – în primul rând, trebuie să<br />

precizăm că acest site care prezintă nucleotide comune pentru X şi Y în timpul t, va<br />

rămâne neschimbat în timp, adică în t+1, cu o probabilitate (1-r)2 sau aproximativ 1-<br />

2r, deoarece r reprezintă o cantitate foarte mică astfel încât r2 poate fi neglijat. În plus,<br />

un site care prezintă nucleotide diferite în timpul t, va avea aceleaşi nucleotide în<br />

timpul t+1 cu o probabilitate 2r/3. Această probabilitate este obţinută ţinând cont de<br />

faptul că în momentul în care secvenţele X şi Z au nucleotidele i respectiv j, în timpul t,<br />

ele devin identice dacă i în X se schimbă cu j, dar j din Y rămâne neschimbată sau<br />

dacă j din Y este înlocuită cu i, iar i din X rămâne neschimbată. Probabilitatea de<br />

apariţie a primului eveniment este de α(1-r)=r(1-r)/3, deoarece i in X trebuie să fie<br />

înlocuită cu nucleotida j (cu o probabilitate mai mare decât cazul celorlalte două<br />

nucleotide), iar nucleotida j din Y trebuie să rămână neschimbată. Probabilitatea de<br />

apariţie a celui de-al doilea eveniment este de asemenea r(1-r)/3. Mai mult,<br />

probabilitatea totală este 2r(1-r)/3, care devine aproximativ 2r/3 dacă nu se ţine cont<br />

de valoarea lui r2.<br />

Dacă:<br />

2<br />

qt 12rqtr1qt, care poate fi scrisă ca:<br />

1<br />

3<br />

2r<br />

8r<br />

qt<br />

1 qt<br />

qt<br />

3 3<br />

Dacă notăm diferenţa qt 1 qt<br />

cu dq/dt, atunci vom abţine:<br />

dq 2r 8r<br />

q ; ţinând cont de condiţia iniţială q=1 la t=0, atunci:<br />

dt 3 3<br />

30

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!