Dragoş Lucian Gorgan - Editura Bioflux
Dragoş Lucian Gorgan - Editura Bioflux
Dragoş Lucian Gorgan - Editura Bioflux
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Ak<br />
Această distanţă este dată de:<br />
d d d 2<br />
d <br />
ik<br />
jk<br />
ij<br />
Dacă se calculează toate distanţele pe baza acestei valori, vom obţine o nouă<br />
matrice de tipul (m-1)(m-1). Pentru această nouă matrice, putem calcula o nouă sumă<br />
Sij, care va fi notată cu Sij`, deoarece nu include lungimea ramurilor externe pentru<br />
prima pereche de taxoni vecini identificaţi, astfel încât apare ca fiind mai mică decât<br />
suma totală (Sij) a lungimii braţelor la acest nivel al construcţiei arborelui filogenetic.<br />
Pentru găsirea unei noi perechi de taxoni vecini, se ia în considerare din nou<br />
perechea cu cea mai mică valoare Sij. Un nou nod B poate fi creat pentru această<br />
nouă pereche de taxoni şi o nouă valoare a matricei distanţei (m-2)(m-2) este<br />
calculată. Această procedură se repetă, până când toţi taxonii sunt grupaţi într-un<br />
singur arbore fără punct de origine (unrooted tree) de tip neighbour joining (Figurile 12<br />
- 14).<br />
2.5.2.4. ALEGEREA TIPULUI DE DISTANŢĂ EVOLUTIVĂ FOLOSITĂ ÎN<br />
RECONSTRUCŢIILE FILOGENETICE<br />
Acurateţea unei filogenii deduse pe bază de secvenţe depinde de doi factori : (1)<br />
relaţia liniară dintre distanţa estimată şi numărul real de substituţii şi (2) eroarea<br />
standard a coeficientului de variaţie a distanţei utilizate. Până în momentul de faţă nu<br />
a fost pus la punct nici un test statistic general valabil pentru a putea alege modul de<br />
estimare a distanţei evolutive. Totuşi în urma estimărilor pe calculator şi a datelor<br />
experimentale s-a ajuns la o serie de generalizări utile:<br />
1. Când numărul de substituţii nucleotidice estimat prin metoda JC este 0,<br />
05<br />
se recomandă utilizarea distanţei p sau distanţa JC chiar dacă există diferenţă între<br />
numărul de transversii şi tranziţii sau dacă rata de substituţie r variază de la situs la<br />
situs. În acest caz utilizarea modelului K2P sau a altor modele mai complexe dă<br />
acelaşi rezultat însă aceste metode au o varianţă mai mare datorită numărului mai<br />
mare de parametri.<br />
2. Când 0,05 1 pentru mai multe perechi de secvenţe arborele filogenetic construit<br />
este de obicei greşit (din cauza varianţei mari a distanţelor estimate şi a erorilor de<br />
aliniere). Acest tip de seturi de date trebuiesc ocolite pe cât este posibil eliminând<br />
porţiunile slab conservate folosindu-le pe cele mai puţin variabile (ca în cazul<br />
46