20.07.2013 Views

Raport de cercetare - Lorentz JÄNTSCHI

Raport de cercetare - Lorentz JÄNTSCHI

Raport de cercetare - Lorentz JÄNTSCHI

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

(qSPR) se exprimă prin intermediul unor ecuaţii care au un domeniu <strong>de</strong> aplicabilitate <strong>de</strong>finit cel mai<br />

frecvent <strong>de</strong> seria <strong>de</strong> compuşi pe care au fost obţinute şi <strong>de</strong> proprietatea sau activitatea supusă<br />

observaţiei.<br />

Unul din avantajele majore pe care le conferă obţinerea unei relaţii cantitative structurăactivitate/proprietate<br />

(qSPAR) este posibilitatea efectuării <strong>de</strong> predicţii cu privire la<br />

proprietatea/activitatea unor compuşi congeneri cu cei din seria pe care s-a obţinut relaţia qSPAR.<br />

De cele mai multe ori, o relaţie qSPAR are asociată, pe lângă domeniul <strong>de</strong> aplicabilitate şi o<br />

semnificaţie statistică. Cu cât semnificaţia statistică a unei relaţii qSPAR este mai mare, cu atât<br />

predicţia activităţii/proprietăţii pentru compuşi congeneri cu cei ai seriei pe care s-a obţinut relaţia<br />

qSPAR are şanse <strong>de</strong> reuşită mai mari.<br />

Aşa cum un singur atom sau o singură regiune a moleculei nu este singura responsabilă pentru<br />

manifestarea unei proprietăţi moleculare, nici relaţiile qSPAR nu se exprimă cu ajutorul unui singur<br />

<strong>de</strong>scriptor <strong>de</strong> structură. În mod frecvent în expresia unei ecuaţii qSPAR intră 2 sau mai mulţi<br />

<strong>de</strong>scriptori <strong>de</strong> structură. Este important însă <strong>de</strong> ştiut că odată cu creşterea numărului <strong>de</strong> <strong>de</strong>scriptori<br />

într-o ecuaţie qSPAR sca<strong>de</strong> şi semnificaţia statistică a parametrilor acesteia. Astfel, pe lângă<br />

căutarea celei mai potrivite ecuaţii sub aspectul maximizării <strong>de</strong>terminării statistice a<br />

proprietăţii/activităţii măsurate, mai apare şi problema minimizării numărului <strong>de</strong> variabile ce intră<br />

în această ecuaţie.<br />

Ecuaţia qSPAR este o ecuaţie <strong>de</strong> regresie multiplă între <strong>de</strong>scriptorii <strong>de</strong> structură asupra cărora se<br />

face ipoteza că nu sunt afectaţi <strong>de</strong> erori întâmplătoare (atâta vreme cât structura compusului<br />

respectiv este <strong>de</strong> asemenea o certitudine) şi proprietatea/activitatea măsurată (care este variabila<br />

<strong>de</strong>pen<strong>de</strong>ntă şi în acelaşi timp supusă erorii experimentale întâmplătoare).<br />

Ecuaţiile <strong>de</strong> regresie liniară (multiplă) au avantajul <strong>de</strong>scompunerii (liniare) a varianţei<br />

experimentale observate în varianţe aditive pentru (asociate) fiecare variabilă in<strong>de</strong>pen<strong>de</strong>ntă a<br />

ecuaţiei. Existenţa a două sau mai multe variabile in<strong>de</strong>pen<strong>de</strong>nte nu presupune absenţa corelaţiei<br />

liniare între acestea, corelaţia putând fi pusă pe seama întâmplării, sau, mai exact, pe seama<br />

măsurării (sau exprimării unei măsuri) a două sau mai multe mărimi parţial corelate.<br />

Dacă variabilele ce <strong>de</strong>scriu structura nu sunt corelate liniar cu proprietatea măsurată se preferă<br />

linearizarea acestora şi exprimarea unei ecuaţii <strong>de</strong> regresie liniare cu aceste variabile ce <strong>de</strong>scriu<br />

structura transformate (linearizate) corespunzător.<br />

O ecuaţie <strong>de</strong> regresie multiplă <strong>de</strong>scriind o relaţie qSPAR este semnificativă statistic dacă toţi<br />

parametrii (coeficienţii) acesteia sunt semnificativ statistic diferiţi <strong>de</strong> zero (în caz contrar expresia<br />

ecuaţiei se reduce corespunzător prin eliminarea variabilelor ale căror coeficienţi nu sunt<br />

semnificativ diferiţi <strong>de</strong> zero) şi coeficientul <strong>de</strong> corelaţie este <strong>de</strong> asemenea semnificativ diferit <strong>de</strong><br />

zero (în caz contrar respingându-se întreaga ecuaţie <strong>de</strong> regresie). Aprecierea semnificaţiei<br />

parametrilor ecuaţiei <strong>de</strong> regresie se face prin raportarea valorii parametrului la varianţa acestuia,<br />

folosind pentru interpretare testul Stu<strong>de</strong>nt t.<br />

O ecuaţie <strong>de</strong> regresie liniară multiplă qSPAR implicând o familie <strong>de</strong> <strong>de</strong>scriptori <strong>de</strong> structură este o<br />

ecuaţie <strong>de</strong> forma:<br />

b0 + b1X1 + ... +bnXn = Ŷ ~ Y (1)<br />

un<strong>de</strong> Y reprezintă şirul măsurătorilor proprietăţii/activităţii la `m` molecule (|Y|=m) iar {X1, ..., Xn}<br />

reprezintă o submulţime a familiei <strong>de</strong> <strong>de</strong>scriptori {Xi}1≤i≤N.<br />

Pentru ca ecuaţia (1) să admită soluţie unică este necesar (nu însă şi suficient) ca n ≤ m-1. Pentru ca<br />

parametrii ecuaţiei <strong>de</strong> regresie (bi)0≤i≤n să aibă şi semnificaţie statistică este necesar (nu însă şi<br />

suficient) ca n ≤ m-6.<br />

În absenţa semnificaţiei statistice pentru coeficientul b0, ecuaţia (1) se poate restrânge la:<br />

b1X1 + ... +bnXn = Ŷ ~ Y (2)<br />

Se asumă ipoteza <strong>de</strong> distribuţie normală a valorilor Y şi X1, ..., Xn şi ipoteza că şirul Y este rezultat<br />

dintr-o măsurătoare experimentală a cărei eroare <strong>de</strong> măsură este întâmplătoare şi distribuită normal<br />

în timp ce şirurile X sunt X1, ..., Xn sunt valori cunoscute care sunt <strong>de</strong> asemenea normal distribuite<br />

dar nu sunt afectate <strong>de</strong> erori. În aceste ipoteze problema <strong>de</strong>terminării coeficienţilor (bi) ale ecuaţiei<br />

(1) sau (2) se rezolvă prin minimizarea sumei erorilor observat vs. cunoscut:<br />

264

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!