Raport de cercetare - Lorentz JÄNTSCHI
Raport de cercetare - Lorentz JÄNTSCHI
Raport de cercetare - Lorentz JÄNTSCHI
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
mo<strong>de</strong>lele în care interacţiunile sunt <strong>de</strong>nse dar la distanţă (`M` şi `m`), şi două pentru<br />
mo<strong>de</strong>lele în care interacţiunile sunt <strong>de</strong>nse şi apropiate (`D` şi `d`);<br />
o gena f care codifică algoritmul <strong>de</strong> fragmentare moleculară pe perechi <strong>de</strong> atomi, care poate<br />
avea una din următoarele 4 valori: `P` - pentru fragmentare bazată pe căi; `D` - pentru<br />
fragmentare bazată pe distanţe; `M` - pentru fragmentare în fragmente maximale; `m` -<br />
pentru fragmentare în fragmente minimale (fragmente triviale conţinând un singur atom);<br />
o gena M care codifică modalitatea <strong>de</strong> suprapunere globală a interacţiunilor fragmentelor, care<br />
poate lua una din următoarele 19 valori împărţite în 4 grupuri: grupul <strong>de</strong> mărimi ( `m` -<br />
selectează cea mai mică valoare; `M` - cea mai mare valoare; `n` - cea mai mică valoare<br />
absolută; `N` - cea mai mare valoare absolută); grupul <strong>de</strong> medii ( `S` - suma; `A` - media<br />
aritmetică după numărul <strong>de</strong> proprietăţi <strong>de</strong> fragmente; `a` - media aritmetică după numărul<br />
<strong>de</strong> fragmente; `B` - media aritmetică după numărul <strong>de</strong> atomi; `b` - media aritmetică după<br />
numărul <strong>de</strong> legături); grupul geometric (`P` - multiplicare; `G` - medie geometrică după<br />
numărul <strong>de</strong> proprietăţi <strong>de</strong> fragmente; `g` - medie geometrică după numărul <strong>de</strong> fragmente;<br />
`F` - medie geometrică după numărul <strong>de</strong> atomi; `f`` - media geometrică după numărul <strong>de</strong><br />
legături); grupul armonic (`s` - suma armonică; `H` - medie armonică după numărul <strong>de</strong><br />
proprietăţi <strong>de</strong> fragmente; `h` - medie armonică după numărul <strong>de</strong> fragmente; `I` - medie<br />
armonică după numărul <strong>de</strong> atomi; `i`` - media armonică după numărul <strong>de</strong> legături);<br />
o gena L care rezultă în algoritm în urma unei mutaţii <strong>de</strong>terministe asupra fenotipului şi<br />
reprezintă unul din cei 6 operatori <strong>de</strong> linearizare ce urmează: `I` - i<strong>de</strong>ntitate, `i` - inversa,<br />
`A` - valoarea absolută, `a` - inversa valorii absolute, `L` - logaritmul valorii absolute, `l` -<br />
logaritmul;<br />
÷ Scorul (funcţia obiectiv): având proprietatea măsurată pentru cei 209 compuşi exprimată în şirul<br />
Y (cu 209 valori), urmează:<br />
o Fenotipul, caracterizat <strong>de</strong> genele care compun cromozomul este transformat în fenotip când<br />
se calculează valorile corespunzătoare genotipului pentru fiecare din cele 209 molecule ale<br />
setului <strong>de</strong> PCBs.<br />
o Pentru o funcţie obiectiv <strong>de</strong> estimare a proprietăţii măsurate folosind 2 genotipuri (în cazul<br />
general putând fi un număr oarecare fixat <strong>de</strong> genotipuri, r), ecuaţia <strong>de</strong> regresie este <strong>de</strong><br />
forma: Ŷ = a0 + a1·Fenotip1 + a2·Fenotip2, (în general: Ŷ = a0 + Σ1≤i≤rai·Fenotipi), un<strong>de</strong>:<br />
Ŷ este estimatorul proprietăţii măsurate;<br />
a0..a2 sunt coeficienţii care rezultă din minimizarea pătratelor diferenţelor între valorile<br />
măsurate Y şi cele estimate prin intermediul lui Ŷ pentru setul <strong>de</strong> 209 compuşi;<br />
Fenotip1=Fenotip(Genotip1) şi Fenotip2=Fenotip(Genotip2) sunt fenotipurile (şirurile <strong>de</strong><br />
valori ale <strong>de</strong>scriptorilor moleculari obţinuţi prin operaţiile prescrise <strong>de</strong> genotipurile<br />
Genotip1=d1p1I1O1f1M1L1 şi Genotip2=d2p2I2O2f2M2L2 pentru cei 209 compuşi;<br />
o Tăria (scorul) unei perechi <strong>de</strong> genotipuri (sau mai multe, pentru regresia multivariată) poate<br />
fi exprimată <strong>de</strong> una din următoarele (Tabelul 18).<br />
Tabelul 18. Funcţii <strong>de</strong> scor pentru penalizarea regresiilor cu perechi <strong>de</strong> fenotipuri<br />
Nr. Scor (i=1..2) Semnificaţie Obiectiv Remarci<br />
1 Suma minim Uzual p=2; pentru p = 1 şi mai mult pentru p<br />
Σ(Y-a0-Σiai·Fenotipi) p<br />
reziduurilor<br />
<strong>de</strong> estimare<br />
=1/2 există avantajul că se favorizează<br />
tendinţa generală în regresie în <strong>de</strong>favoarea<br />
abaterilor grosolane <strong>de</strong> la ecuaţia <strong>de</strong> regresie<br />
2 r 2 (Y,a0+Σiai·Fenotipi) Coeficient <strong>de</strong> maxim Are avantajul legăturii cu scopul general al<br />
<strong>de</strong>terminare optimizării (maximizarea coeficientului <strong>de</strong><br />
<strong>de</strong>terminare)<br />
÷ Încrucişarea:<br />
o Se selectează (folosind una din meto<strong>de</strong>le <strong>de</strong> selecţie <strong>de</strong>scrise în Tabelul 17) două genotipuri,<br />
Genotip1=d1p1I1O1f1M1L1 şi Genotip2=d2p2I2O2f2M2L2;<br />
o Se generează două numere aleatoare (din distribuţia uniformă) între 0 şi 6 (fie ele 2 şi 4);<br />
130