12.01.2013 Views

Dragoş Lucian Gorgan - Editura Bioflux

Dragoş Lucian Gorgan - Editura Bioflux

Dragoş Lucian Gorgan - Editura Bioflux

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Ak<br />

Această distanţă este dată de:<br />

d d d 2<br />

d <br />

ik<br />

jk<br />

ij<br />

Dacă se calculează toate distanţele pe baza acestei valori, vom obţine o nouă<br />

matrice de tipul (m-1)(m-1). Pentru această nouă matrice, putem calcula o nouă sumă<br />

Sij, care va fi notată cu Sij`, deoarece nu include lungimea ramurilor externe pentru<br />

prima pereche de taxoni vecini identificaţi, astfel încât apare ca fiind mai mică decât<br />

suma totală (Sij) a lungimii braţelor la acest nivel al construcţiei arborelui filogenetic.<br />

Pentru găsirea unei noi perechi de taxoni vecini, se ia în considerare din nou<br />

perechea cu cea mai mică valoare Sij. Un nou nod B poate fi creat pentru această<br />

nouă pereche de taxoni şi o nouă valoare a matricei distanţei (m-2)(m-2) este<br />

calculată. Această procedură se repetă, până când toţi taxonii sunt grupaţi într-un<br />

singur arbore fără punct de origine (unrooted tree) de tip neighbour joining (Figurile 12<br />

- 14).<br />

2.5.2.4. ALEGEREA TIPULUI DE DISTANŢĂ EVOLUTIVĂ FOLOSITĂ ÎN<br />

RECONSTRUCŢIILE FILOGENETICE<br />

Acurateţea unei filogenii deduse pe bază de secvenţe depinde de doi factori : (1)<br />

relaţia liniară dintre distanţa estimată şi numărul real de substituţii şi (2) eroarea<br />

standard a coeficientului de variaţie a distanţei utilizate. Până în momentul de faţă nu<br />

a fost pus la punct nici un test statistic general valabil pentru a putea alege modul de<br />

estimare a distanţei evolutive. Totuşi în urma estimărilor pe calculator şi a datelor<br />

experimentale s-a ajuns la o serie de generalizări utile:<br />

1. Când numărul de substituţii nucleotidice estimat prin metoda JC este 0,<br />

05<br />

se recomandă utilizarea distanţei p sau distanţa JC chiar dacă există diferenţă între<br />

numărul de transversii şi tranziţii sau dacă rata de substituţie r variază de la situs la<br />

situs. În acest caz utilizarea modelului K2P sau a altor modele mai complexe dă<br />

acelaşi rezultat însă aceste metode au o varianţă mai mare datorită numărului mai<br />

mare de parametri.<br />

2. Când 0,05 1 pentru mai multe perechi de secvenţe arborele filogenetic construit<br />

este de obicei greşit (din cauza varianţei mari a distanţelor estimate şi a erorilor de<br />

aliniere). Acest tip de seturi de date trebuiesc ocolite pe cât este posibil eliminând<br />

porţiunile slab conservate folosindu-le pe cele mai puţin variabile (ca în cazul<br />

46

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!