20.07.2013 Views

Raport de cercetare - Lorentz JÄNTSCHI

Raport de cercetare - Lorentz JÄNTSCHI

Raport de cercetare - Lorentz JÄNTSCHI

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

mo<strong>de</strong>lele în care interacţiunile sunt <strong>de</strong>nse dar la distanţă (`M` şi `m`), şi două pentru<br />

mo<strong>de</strong>lele în care interacţiunile sunt <strong>de</strong>nse şi apropiate (`D` şi `d`);<br />

o gena f care codifică algoritmul <strong>de</strong> fragmentare moleculară pe perechi <strong>de</strong> atomi, care poate<br />

avea una din următoarele 4 valori: `P` - pentru fragmentare bazată pe căi; `D` - pentru<br />

fragmentare bazată pe distanţe; `M` - pentru fragmentare în fragmente maximale; `m` -<br />

pentru fragmentare în fragmente minimale (fragmente triviale conţinând un singur atom);<br />

o gena M care codifică modalitatea <strong>de</strong> suprapunere globală a interacţiunilor fragmentelor, care<br />

poate lua una din următoarele 19 valori împărţite în 4 grupuri: grupul <strong>de</strong> mărimi ( `m` -<br />

selectează cea mai mică valoare; `M` - cea mai mare valoare; `n` - cea mai mică valoare<br />

absolută; `N` - cea mai mare valoare absolută); grupul <strong>de</strong> medii ( `S` - suma; `A` - media<br />

aritmetică după numărul <strong>de</strong> proprietăţi <strong>de</strong> fragmente; `a` - media aritmetică după numărul<br />

<strong>de</strong> fragmente; `B` - media aritmetică după numărul <strong>de</strong> atomi; `b` - media aritmetică după<br />

numărul <strong>de</strong> legături); grupul geometric (`P` - multiplicare; `G` - medie geometrică după<br />

numărul <strong>de</strong> proprietăţi <strong>de</strong> fragmente; `g` - medie geometrică după numărul <strong>de</strong> fragmente;<br />

`F` - medie geometrică după numărul <strong>de</strong> atomi; `f`` - media geometrică după numărul <strong>de</strong><br />

legături); grupul armonic (`s` - suma armonică; `H` - medie armonică după numărul <strong>de</strong><br />

proprietăţi <strong>de</strong> fragmente; `h` - medie armonică după numărul <strong>de</strong> fragmente; `I` - medie<br />

armonică după numărul <strong>de</strong> atomi; `i`` - media armonică după numărul <strong>de</strong> legături);<br />

o gena L care rezultă în algoritm în urma unei mutaţii <strong>de</strong>terministe asupra fenotipului şi<br />

reprezintă unul din cei 6 operatori <strong>de</strong> linearizare ce urmează: `I` - i<strong>de</strong>ntitate, `i` - inversa,<br />

`A` - valoarea absolută, `a` - inversa valorii absolute, `L` - logaritmul valorii absolute, `l` -<br />

logaritmul;<br />

÷ Scorul (funcţia obiectiv): având proprietatea măsurată pentru cei 209 compuşi exprimată în şirul<br />

Y (cu 209 valori), urmează:<br />

o Fenotipul, caracterizat <strong>de</strong> genele care compun cromozomul este transformat în fenotip când<br />

se calculează valorile corespunzătoare genotipului pentru fiecare din cele 209 molecule ale<br />

setului <strong>de</strong> PCBs.<br />

o Pentru o funcţie obiectiv <strong>de</strong> estimare a proprietăţii măsurate folosind 2 genotipuri (în cazul<br />

general putând fi un număr oarecare fixat <strong>de</strong> genotipuri, r), ecuaţia <strong>de</strong> regresie este <strong>de</strong><br />

forma: Ŷ = a0 + a1·Fenotip1 + a2·Fenotip2, (în general: Ŷ = a0 + Σ1≤i≤rai·Fenotipi), un<strong>de</strong>:<br />

Ŷ este estimatorul proprietăţii măsurate;<br />

a0..a2 sunt coeficienţii care rezultă din minimizarea pătratelor diferenţelor între valorile<br />

măsurate Y şi cele estimate prin intermediul lui Ŷ pentru setul <strong>de</strong> 209 compuşi;<br />

Fenotip1=Fenotip(Genotip1) şi Fenotip2=Fenotip(Genotip2) sunt fenotipurile (şirurile <strong>de</strong><br />

valori ale <strong>de</strong>scriptorilor moleculari obţinuţi prin operaţiile prescrise <strong>de</strong> genotipurile<br />

Genotip1=d1p1I1O1f1M1L1 şi Genotip2=d2p2I2O2f2M2L2 pentru cei 209 compuşi;<br />

o Tăria (scorul) unei perechi <strong>de</strong> genotipuri (sau mai multe, pentru regresia multivariată) poate<br />

fi exprimată <strong>de</strong> una din următoarele (Tabelul 18).<br />

Tabelul 18. Funcţii <strong>de</strong> scor pentru penalizarea regresiilor cu perechi <strong>de</strong> fenotipuri<br />

Nr. Scor (i=1..2) Semnificaţie Obiectiv Remarci<br />

1 Suma minim Uzual p=2; pentru p = 1 şi mai mult pentru p<br />

Σ(Y-a0-Σiai·Fenotipi) p<br />

reziduurilor<br />

<strong>de</strong> estimare<br />

=1/2 există avantajul că se favorizează<br />

tendinţa generală în regresie în <strong>de</strong>favoarea<br />

abaterilor grosolane <strong>de</strong> la ecuaţia <strong>de</strong> regresie<br />

2 r 2 (Y,a0+Σiai·Fenotipi) Coeficient <strong>de</strong> maxim Are avantajul legăturii cu scopul general al<br />

<strong>de</strong>terminare optimizării (maximizarea coeficientului <strong>de</strong><br />

<strong>de</strong>terminare)<br />

÷ Încrucişarea:<br />

o Se selectează (folosind una din meto<strong>de</strong>le <strong>de</strong> selecţie <strong>de</strong>scrise în Tabelul 17) două genotipuri,<br />

Genotip1=d1p1I1O1f1M1L1 şi Genotip2=d2p2I2O2f2M2L2;<br />

o Se generează două numere aleatoare (din distribuţia uniformă) între 0 şi 6 (fie ele 2 şi 4);<br />

130

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!