12.01.2013 Views

Dragoş Lucian Gorgan - Editura Bioflux

Dragoş Lucian Gorgan - Editura Bioflux

Dragoş Lucian Gorgan - Editura Bioflux

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

p nd<br />

n / ˆ <br />

unde nd şi n sunt numărul de nucleotide diferite şi numărul total de situsuri,<br />

varianţa lui p este aceiaşi ca pentru secvenţele de aminoacizi. Pe lângă acest indice<br />

ades este necesar să cunoaştem frecvenţele diferitelor perechi de nucleotide dintre<br />

două secvenţe, X şi Y. Existând patru nucleotide, A, T, G şi C în fiecare secvenţă<br />

există 16 perechi diferite de nucleotide. Patru perechi sunt formate din nucleotide<br />

identice (AA, TT, CC şi GG), patru sunt perechi de tipul tranziţiilor (AG, GA, TC şi CT)<br />

şi opt sunt perechi de tipul transversiilor (restul perechilor). Frecvenţele totale ale<br />

perechilor de nucleotide identice, perechilor de tipul tranziţiilor, şi perechilor de tipul<br />

transversiilor pot fi notate cu O, P şi Q respectiv, deci p = P + Q. Dacă substituţiile de<br />

nucleotide ar avea loc aleatoriu Q ar trebui să fie de două ori mai mare ca P (8 : 4)<br />

pentru un p mic. De fapt tranziţiile au loc mai frecvent ca transversiile şi deci P poate fi<br />

mai mare decât Q. Raportul R dintre tranziţii şi transversii poate fi calculat după<br />

formula Rˆ<br />

Pˆ<br />

/ Qˆ<br />

unde Pˆ şi Qˆ sunt valorile observate ale lui P şi Q. R este de<br />

obicei de 0,5 – 2 pentru multe gene nucleare, iar pentru genele mitocondriale poate fi<br />

până la 15. Rˆ este supus unei mari erori când numărul de nucleotide studiate este<br />

mic şi varianţa este dată de :<br />

<br />

V Rˆ<br />

2 1 1<br />

( ) R <br />

nP nQ <br />

fapt ce indică că dacă nP şi nQ nu sunt mari, varianţa lui Rˆ poate fi foarte mare. În<br />

calculele lui V (Rˆ<br />

) , R din ecuaţia de mai sus este înlocuit cu Rˆ .<br />

Ca şi în cazul secvenţelor de aminoacizi distanţa p dă o estimare corectă a<br />

numărului de substituţii per situs numai dacă secvenţele sunt destul de apropiate.,<br />

dacă p este mare apare o subestimare a numărului de substituţii deoarece nu sunt<br />

luate în calcul substituţiile paralele şi cele ce au loc înapoi. În cazul secvenţelor<br />

nucleotidice aceasta este mult mai grav deoarece există doar patru stări posibile în loc<br />

de 20.<br />

2.4.2 MODELE DE EVOLUŢIE ALE SECVENŢELOR NUCLEOTIDICE<br />

Pentru a putea estima numărul de substituţii nucleotidice este necesară<br />

utilizarea unor modele matematice care să corecteze substituţiile multiple. Din această<br />

cauză au fost dezvoltate un număr mare de modele. Expresia matematică a unui<br />

model de substituţie este un tabel al ratelor de substituţie per situs şi per unitate de<br />

distanţă evolutivă. Pentru secvenţele de ADN aceste rate pot fi exprimate ca o matrice<br />

de 4 4 în care fiecare element ij reprezintă rata schimbării de la baza i la<br />

baza j în timpul unei perioade de timp dt infinit de mică. Cea mai generală formă a<br />

acestei matrici este:<br />

26

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!