Dragoş Lucian Gorgan - Editura Bioflux
Dragoş Lucian Gorgan - Editura Bioflux
Dragoş Lucian Gorgan - Editura Bioflux
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
p nd<br />
n / ˆ <br />
unde nd şi n sunt numărul de nucleotide diferite şi numărul total de situsuri,<br />
varianţa lui p este aceiaşi ca pentru secvenţele de aminoacizi. Pe lângă acest indice<br />
ades este necesar să cunoaştem frecvenţele diferitelor perechi de nucleotide dintre<br />
două secvenţe, X şi Y. Existând patru nucleotide, A, T, G şi C în fiecare secvenţă<br />
există 16 perechi diferite de nucleotide. Patru perechi sunt formate din nucleotide<br />
identice (AA, TT, CC şi GG), patru sunt perechi de tipul tranziţiilor (AG, GA, TC şi CT)<br />
şi opt sunt perechi de tipul transversiilor (restul perechilor). Frecvenţele totale ale<br />
perechilor de nucleotide identice, perechilor de tipul tranziţiilor, şi perechilor de tipul<br />
transversiilor pot fi notate cu O, P şi Q respectiv, deci p = P + Q. Dacă substituţiile de<br />
nucleotide ar avea loc aleatoriu Q ar trebui să fie de două ori mai mare ca P (8 : 4)<br />
pentru un p mic. De fapt tranziţiile au loc mai frecvent ca transversiile şi deci P poate fi<br />
mai mare decât Q. Raportul R dintre tranziţii şi transversii poate fi calculat după<br />
formula Rˆ<br />
Pˆ<br />
/ Qˆ<br />
unde Pˆ şi Qˆ sunt valorile observate ale lui P şi Q. R este de<br />
obicei de 0,5 – 2 pentru multe gene nucleare, iar pentru genele mitocondriale poate fi<br />
până la 15. Rˆ este supus unei mari erori când numărul de nucleotide studiate este<br />
mic şi varianţa este dată de :<br />
<br />
V Rˆ<br />
2 1 1<br />
( ) R <br />
nP nQ <br />
fapt ce indică că dacă nP şi nQ nu sunt mari, varianţa lui Rˆ poate fi foarte mare. În<br />
calculele lui V (Rˆ<br />
) , R din ecuaţia de mai sus este înlocuit cu Rˆ .<br />
Ca şi în cazul secvenţelor de aminoacizi distanţa p dă o estimare corectă a<br />
numărului de substituţii per situs numai dacă secvenţele sunt destul de apropiate.,<br />
dacă p este mare apare o subestimare a numărului de substituţii deoarece nu sunt<br />
luate în calcul substituţiile paralele şi cele ce au loc înapoi. În cazul secvenţelor<br />
nucleotidice aceasta este mult mai grav deoarece există doar patru stări posibile în loc<br />
de 20.<br />
2.4.2 MODELE DE EVOLUŢIE ALE SECVENŢELOR NUCLEOTIDICE<br />
Pentru a putea estima numărul de substituţii nucleotidice este necesară<br />
utilizarea unor modele matematice care să corecteze substituţiile multiple. Din această<br />
cauză au fost dezvoltate un număr mare de modele. Expresia matematică a unui<br />
model de substituţie este un tabel al ratelor de substituţie per situs şi per unitate de<br />
distanţă evolutivă. Pentru secvenţele de ADN aceste rate pot fi exprimate ca o matrice<br />
de 4 4 în care fiecare element ij reprezintă rata schimbării de la baza i la<br />
baza j în timpul unei perioade de timp dt infinit de mică. Cea mai generală formă a<br />
acestei matrici este:<br />
26