Raport de cercetare - Lorentz JÄNTSCHI
Raport de cercetare - Lorentz JÄNTSCHI
Raport de cercetare - Lorentz JÄNTSCHI
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>Raport</strong> <strong>de</strong> <strong>cercetare</strong><br />
- lucrare în extenso -<br />
cuprinzând activităţile <strong>de</strong>sfăşurate şi rezultatele obţinute în proiectul<br />
De la Chimia Matematică la Chimia Cuantică şi Chimia Medicală<br />
÷ Număr proiect: ID-1051/2007;<br />
÷ Competiţie: IDEI;<br />
÷ Cod competiţie: PNII-PCE-2007-1;<br />
÷ Cod program: 206/2007;<br />
÷ Durata <strong>de</strong> <strong>de</strong>sfăşurare: Octombrie 2007 - Septembrie 2010;<br />
÷ Director <strong>de</strong> proiect: <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, conf. dr.;<br />
÷ Contractor: Unitatea Executivă pentru Finanţarea Învăţământului Superior şi Cercetării<br />
Ştiinţifice Universitare (UEFISCSU);<br />
÷ Contractant: Universitatea Tehnică din Cluj-Napoca (UTCN), prin reprezentanţii săi legali<br />
(Rector, Contabil Şef şi Jurist) şi subsemnatul (conf. dr. <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>) în calitate <strong>de</strong><br />
director <strong>de</strong> proiect;<br />
CUPRINS<br />
1. Introducere .................................................................................................................................. 2<br />
2. Scop şi obiective........................................................................................................................... 3<br />
3. Activităţi şi rezultate................................................................................................................... 8<br />
4. Livrabile................................................................................................................................... 306<br />
5. Concluzii .................................................................................................................................. 318
1. Introducere<br />
Activităţile <strong>de</strong> <strong>cercetare</strong> prevăzute a se <strong>de</strong>sfăşura la începutul proiectului (la faza <strong>de</strong> contractare) au<br />
suferit modificări pe parcursul <strong>de</strong>rulării proiectului, şi au constituit obiectul unui şir <strong>de</strong> acte<br />
adiţionale consemnate între contractor (UEFISCSU) şi contractant (UTCN). Modificările suferite au<br />
avut ca obiect obiectivele, activităţile, livrabilele (cumulând rezultatele minimale aşteptate) cât şi<br />
sumele contractate pentru acestea.<br />
În forma sa finală (în urma modificărilor aduse) - şi finalizată a proiectului <strong>de</strong> <strong>cercetare</strong> - planul <strong>de</strong><br />
activităţi este prezentat în tabelul următor (Tabelul 1).<br />
Tabelul 1. Plan <strong>de</strong> realizare: Ani-Obiective-Activităţi-Livrabile<br />
Ani Obiective Activităţi Livrabile<br />
2007 Actualizare 1. Planificarea activităţilor experimentale; <strong>de</strong>rularea experimentelor <strong>de</strong>monstrative (<strong>de</strong> Site web<br />
documentare testare a meto<strong>de</strong>lor <strong>de</strong> analiză)<br />
proiect<br />
la nivelul 2. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi 1 BDI<br />
anului 2007 dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în 1 ISI<br />
Management străinătate)<br />
cunoştinţe 3. Selectare (abstracts), colectare (full text) informaţii private (pay per view), din publicaţii<br />
Elsevier & Springer<br />
4. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi<br />
dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în<br />
străinătate)<br />
5. Selectare (abstracts), colectare (full text) informaţii private (pay per view), din publicaţii<br />
Taylor&Francis & Wiley&Sons<br />
6. I<strong>de</strong>ntificarea surselor <strong>de</strong> date şi metodologiilor <strong>de</strong> colectare (eşantionare, criterii <strong>de</strong><br />
inclu<strong>de</strong>re şi exclu<strong>de</strong>re în studiu), şi <strong>de</strong> experimentare<br />
2008 Management 1. I<strong>de</strong>ntificarea meto<strong>de</strong>lor <strong>de</strong> analiză 2 BDI<br />
cunoştinţe 2. Analiza rezultatelor obţinute şi interpretarea rezultatelor 1 ISI<br />
Management 3. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi<br />
resurse<br />
dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în<br />
materiale străinătate)<br />
Management 4. Stabilirea necesarelor <strong>de</strong> materiale şi consumabile, i<strong>de</strong>ntificarea furnizorilor şi<br />
informaţie condiţiilor <strong>de</strong> procurare, întocmirea documentaţiilor <strong>de</strong> procurare, <strong>de</strong>rularea licitaţiilor<br />
pentru achiziţii<br />
5. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi<br />
dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în<br />
străinătate)<br />
6. Planificarea activităţilor experimentale; <strong>de</strong>rularea experimentelor <strong>de</strong>monstrative (<strong>de</strong><br />
testare a meto<strong>de</strong>lor <strong>de</strong> analiză)<br />
7. Proiectarea şi crearea bazelor <strong>de</strong> date pentru managementul cercetării şi a rezultatelor<br />
cercetării<br />
8. Completarea bazelor <strong>de</strong> date cu cunoştinţele provenite din documentare şi actualizare<br />
documentare (O1/2007) şi respectiv managementul cunoştinţelor (O2/2007)<br />
9. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi<br />
dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în<br />
străinătate)<br />
2009 Management 1. Crearea aplicaţiilor pentru interogarea bazei <strong>de</strong> date pentru managementul cercetării 2 BDI<br />
informaţie 2. Construirea mo<strong>de</strong>lelor moleculare (chimie cuantică) 1 ISI<br />
Partea 3. Colectarea informaţiei medicale <strong>de</strong> activitate terapeutică (chimie medicală)<br />
experimentală 4. Construirea mo<strong>de</strong>lelor Structură - Activitate folosind instrumentele specifice <strong>de</strong>zvoltate<br />
Integrarea 5. Obţinerea relaţiilor (semi)Cantitative Structură-Activitate, sQSARs<br />
cunoştinţelor 6. Validarea mo<strong>de</strong>lelor (TvT - Training versus Test, cv-loo - cross validation leave-oneout,<br />
CCA - Correlated Correlations Analysis)<br />
2010 "Drug 1. Aplicarea procedurilor QSAR şi colectarea informaţiei 2 BDI<br />
Design" 2. Construirea librăriilor <strong>de</strong> compuşi chimici virtuali (chimie combinatorială)<br />
2 ISI<br />
Realizarea 3. Interogarea bazelor <strong>de</strong> date internaţionale (Cambridge SDb, Protein Db, Visual Mol.<br />
spaţiului Dyn., MMDB - Mol. Mod. Db, PubChem Comp., PubChem Subst.), colectare<br />
virtual<br />
informaţii, elaborarea mo<strong>de</strong>lelor moleculare compuşi virtuali (chimie computaţională)<br />
Valorificarea 4. Obţinerea (Q)SRR, (Q)SPR, (Q)PAR, şi (Q)AAR (chimie farmaceutică)<br />
şi transferul 5. Construirea bazei <strong>de</strong> date cu cunoştinţe Compus chimic - Mo<strong>de</strong>l cuantic 3D -<br />
cercetării Descriptori moleculari - Proprietăţi fizico-bio-chimice - Activităţi terapeutice<br />
6. Proiectarea portalului web, Implementarea algoritmilor <strong>de</strong> interogare, Publicarea<br />
portalului web<br />
2
2. Scop şi obiective<br />
Scopul proiectului "De la chimia matematică la chimia cuantică şi chimia medicală" a fost<br />
integrarea <strong>de</strong> cunoştinţe specifice domeniului chimie matematică (şi anume elementele şi noţiunile<br />
<strong>de</strong> topologie moleculară) cu noţiunile <strong>de</strong> chimie cuantică (şi anume elementele şi noţiunile <strong>de</strong><br />
mo<strong>de</strong>lare moleculară) având ca <strong>de</strong>stinaţie realizarea <strong>de</strong> instrumente specifice chimiei medicale (şi<br />
anume relaţii cantitative între structura şi activitatea biologică <strong>de</strong> interes medical a seriilor <strong>de</strong><br />
compuşi chimici).<br />
Pentru atingerea acestui scop s-au stabilit, urmărit şi atins o serie <strong>de</strong> obiective <strong>de</strong>taliate în<br />
continuare:<br />
÷ Actualizare documentare la nivelul anului 2007<br />
o Pornind <strong>de</strong> la faptul că evoluţia conceptelor specifice domeniilor <strong>de</strong> frontieră (cum<br />
este cazul celor 3 domenii <strong>de</strong> frontieră în cadrul cărora proiectul se situează - chimie<br />
matematică, chimie cuantică şi chimie medicală) se realizează rapid, şi cu atât mai<br />
mult dacă este implicată şi puterea <strong>de</strong> calcul - fiind cazul pentru toate cele trei<br />
domenii - chimia matematică necesitând calcule complexe, chimia cuantică<br />
necesitând atât calcule complexe cât şi volum mare <strong>de</strong> date <strong>de</strong> intrare, iar chimia<br />
medicală operând cu volum mare <strong>de</strong> date <strong>de</strong> intrare - necesitatea actualizării<br />
documentării la începutul şi pe parcursul <strong>de</strong>sfăşurării proiectelor este şi a fost o<br />
necesitate;<br />
o Actualizarea documentării s-a realizat prin accesul la baze <strong>de</strong> date <strong>de</strong> specialitate<br />
cuprinzând lucrări reprezentative specifice domeniilor vizate, acces care a fost<br />
realizat parte în instituţia gazdă (a directorului <strong>de</strong> proiect) pentru acele baze <strong>de</strong> date<br />
şi pentru acele perioa<strong>de</strong> <strong>de</strong> timp la care accesul a fost posibil prin agrementurile<br />
instituţionale în care instituţia gazdă a fost parte, în parte în instituţia parteneră -<br />
UMF Cluj-Napoca prin coinvestigator Dr. Med. S. D. Bolboacă - membru al echipei<br />
<strong>de</strong> <strong>cercetare</strong>, şi ultima parte - prin accesul la bazele <strong>de</strong> date în instituţiile în care s-a<br />
participat la şcoli <strong>de</strong> vară, simpozioane, cursuri intensive, conferinţe, ş.a.m.d.<br />
prevăzute şi <strong>de</strong>sfăşurate ca activităţi în cadrul proiectului <strong>de</strong> fată; bazele <strong>de</strong> date<br />
folosite în documentare au fost (în principal): ScienceDirect (Elsevier), SpringerLink<br />
(Springer), InterScience (Wiley-Blackwell), BenthamDirect (Bentham), JSTOR<br />
(ITHAKA).<br />
÷ Management cunoştinţe<br />
o Analiza literaturii <strong>de</strong> specialitate a avut menirea <strong>de</strong> a oferi acele noţiunile specifice<br />
cu ajutorul cărora scopul proiectului să fie atins; obiectivul managementul<br />
cunoştinţelor a vizat obţinerea principiilor cu ajutorul cărora să se realizeze<br />
organizarea şi sistematizarea cunoştinţelor, pe baza instrumentelor şi mijloacelor<br />
care au stat la baza obţinerii acestora, cu referire directă la criteriile <strong>de</strong> inclu<strong>de</strong>re în<br />
studiu şi/sau exclu<strong>de</strong>re din studiu folosite în studiile colectate, modalităţile în care sa<br />
realizat eşantionarea, tipul <strong>de</strong> experiment ştiinţific folosit şi <strong>de</strong>signul experimental;<br />
o Activităţile aferente obiectivului Management cunoştinţe au permis:<br />
stabilirea următoarelor principii şi clasificatori pentru acestea: Propoziţii,<br />
ipoteze; Presupunerile ce trebuiesc făcute; I<strong>de</strong>ntificarea variabilei<br />
(variabilelor) <strong>de</strong>pen<strong>de</strong>nte (sunt datele <strong>de</strong> ieşire, rezultate); I<strong>de</strong>ntificarea<br />
variabilelor in<strong>de</strong>pen<strong>de</strong>nte (sunt datele <strong>de</strong> intrare care luate împreună<br />
formează spaţiul experimental); Care din variabilele in<strong>de</strong>pen<strong>de</strong>nte pot fi<br />
controlate; Caracterul populaţiei; Talia populaţiei; Costul şi resursele<br />
necesare (umane, materiale, etc.) pentru observare; Obiectivele propuse;<br />
Tipul studiului; Modalităţile <strong>de</strong> alegere a obiectului <strong>de</strong> studiu; Timpul<br />
necesar; Resursele financiare şi umane implicate; Procedura folosită; Accesul<br />
la date; Designul experimentului (Analiză factorială completă - Fisher,<br />
metodă ortogonală - Taguchi, etc);<br />
3
obţinerea surselor <strong>de</strong> date care pot şi au fost folosite ulterior drept sursă<br />
primară <strong>de</strong> informaţie în ceea ce priveşte structura şi proprietăţile compuşilor<br />
chimici în asociere cu <strong>de</strong>numirea şi activităţile biologice ale acestora:<br />
• Cambridge Structural Database<br />
o www.ccdc.cam.ac.uk/products/csd/;<br />
• Protein Data Bank<br />
o www.pdb.org/;<br />
• Visual Molecular Dynamics<br />
o www.ks.uiuc.edu/Research/vmd/;<br />
• Molecular Mo<strong>de</strong>ling DataBase<br />
o http://130.14.29.110/Structure/MMDB/mmdb.shtml;<br />
• PubChem Compounds<br />
o www.ncbi.nlm.nih.gov/pccompound;<br />
• PubChem Substance<br />
o www.ncbi.nlm.nih.gov/sites/entrez?db=pcsubstance<br />
i<strong>de</strong>ntificarea meto<strong>de</strong>lor <strong>de</strong> analiză în specificul Chimie matematică cu<br />
referire directă la fundamentele ştiinţifice ale acestui domeniu <strong>de</strong> preocupări -<br />
structura chimică ca un graf matematic, analiza structurii <strong>de</strong>pletizate <strong>de</strong><br />
atomii <strong>de</strong> hidrogen, graful molecular şi proprietăţi matematice stabilite pe<br />
baza acestuia, aplicaţiile topologiei moleculare în clasificarea şi<br />
caracterizarea compuşilor chimici;<br />
i<strong>de</strong>ntificarea meto<strong>de</strong>lor <strong>de</strong> analiză în specificul Chimie cuantică cu referire<br />
directă la mecanica funcţiilor orbitale, mo<strong>de</strong>lele <strong>de</strong> aproximare, diferitele<br />
nivele <strong>de</strong> teorie a aproximării stării staţionare pentru atomii cu mai mulţi<br />
electroni şi pentru moleculele cu mai mulţi atomi;<br />
i<strong>de</strong>ntificarea meto<strong>de</strong>lor <strong>de</strong> analiză în specificul Chimie medicală cu referire<br />
directă la relaţiile naturale care se stabilesc între structura şi proprietăţile<br />
substanţelor şi compuşilor chimici, modalităţile <strong>de</strong> observare şi experiment<br />
asupra acestor relaţii, şi informaţiile pe care relaţiile stabilite le aduc în<br />
caracterizarea compuşilor, proprietăţilor şi activităţilor cuprinse în relaţii;<br />
÷ Management resurse materiale<br />
o Pornind <strong>de</strong> la o serie <strong>de</strong> principii cum sunt costul achiziţiei, eficienţa în utilizare<br />
corelată cu costul <strong>de</strong> întreţinere şi importanţă a rezultatelor obţinute din exploatare,<br />
toate acestea în relaţie directă cu sfera <strong>de</strong> aplicabilitate în tematica proiectului s-au<br />
stabilit şi achiziţionat o serie <strong>de</strong> echipamente;<br />
o Echipamentele achiziţionate şi rolul acestora în <strong>de</strong>rularea proiectului a fost:<br />
Fluorometru - pentru analize în soluţie;<br />
Spectrofotometru - pentru analize <strong>de</strong> soli<strong>de</strong>;<br />
Staţii meteo - pentru monitorizarea condiţiilor <strong>de</strong> experimentare şi a<br />
parametrilor <strong>de</strong> mediu;<br />
Calculatoare tip Laptop - pentru a fi folosite împreună cu spectrofotometrul<br />
(care este portabil) la analize "in situ";<br />
Panouri fotovoltaice, acumulatori, regulator <strong>de</strong> încărcare, afişaj regulator,<br />
invertor - cu ajutorul cărora s-a realizat un sistem energetic portabil autonom<br />
- pentru a fi folosit să se efectueze acele analize chimice instrumentale la care<br />
accesul la alte surse <strong>de</strong> tensiune nu este posibil (analiza "in situ" <strong>de</strong> soluri<br />
contaminate cu poluanţi chimici);<br />
Sisteme <strong>de</strong> măsură şi transmisie a datelor (senzori <strong>de</strong> umiditate şi<br />
temperatură, repetitoare şi antene <strong>de</strong> transmisie);<br />
Calculatoare tip server (pentru gestiunea bazelor <strong>de</strong> date) şi tip staţie (pentru<br />
analiza datelor);<br />
Cărţi în problematica algoritmilor genetici - i<strong>de</strong>ntificată drept soluţie <strong>de</strong><br />
4
abordare integrată în căutarea relaţiilor structură-activitate;<br />
÷ Management informaţie<br />
o În <strong>de</strong>zvoltarea "top-down" (<strong>de</strong> sus în jos) Managementul informaţiei este următorul<br />
nivel <strong>de</strong> analiză şi a referit informaţiile acumulate prin parcurgerea activităţilor<br />
specifice atingerii obiectivelor <strong>de</strong> Actualizare documentare, Management cunoştinţe<br />
şi Management resurse materiale;<br />
o Dacă Managementul cunoştinţelor sub eticheta cunoştinţe a referit piese complexe <strong>de</strong><br />
informaţie <strong>de</strong> naturi diferite (<strong>de</strong> la modalitatea <strong>de</strong> experimentare şi colectare a datelor<br />
la tipul <strong>de</strong> date obţinute) managementul informaţiei referă informaţii cu structură<br />
bine <strong>de</strong>finită (activitate biologică <strong>de</strong> interes, clasă <strong>de</strong> compuşi chimici cu potenţă<br />
biologică, structură la nivel topologic, structură la nivel geometric, <strong>de</strong>scriptori<br />
moleculari, ecuaţii structură-activitate, analiză statistică; finalitatea managementului<br />
informaţiei a fost structura tabelelor ce stochează cunoştinţele şi rezultatele<br />
cercetării;<br />
÷ Partea experimentală<br />
o Faza imediat următoare <strong>de</strong>finirii structurii tabelelor ce stochează cunoştinţele şi<br />
rezultatele cercetării are ca obiect realizarea aplicaţiilor care să permită operarea cu<br />
acestea; în fapt această fază se constituie într-un întreg ciclu <strong>de</strong> viaţă - creare şi<br />
utilizare <strong>de</strong> aplicaţii care operează cu cunoştinţele şi rezultatele cercetării;<br />
o O serie <strong>de</strong> activităţi au fost <strong>de</strong>rulate pentru a atinge acest obiectiv; a fost ales un set<br />
<strong>de</strong> date "şcoală" - suficient <strong>de</strong> simple pentru a permite <strong>de</strong>zvoltarea primei generaţii a<br />
aplicaţiilor astfel încât crearea şi utilizarea acestor informaţii să se facă în timpi<br />
rezonabili <strong>de</strong> calcul şi în acelaşi timp suficient <strong>de</strong> complexe pentru ca elementele<br />
esenţiale aşteptate <strong>de</strong> la aceste aplicaţii să se regăsească în structura naturală a<br />
datelor analizate; în acest sens a fost ales drept set <strong>de</strong> date "şcoală" un set <strong>de</strong> 31 <strong>de</strong><br />
aminoacizi având ca proprietate observată punctul <strong>de</strong> topire; a fost parcurs un ciclu<br />
<strong>de</strong> viaţă în <strong>de</strong>zvoltarea aplicaţiilor care operează cu cunoştinţele şi rezultatele<br />
cercetării - proiectare, realizare, testare, modificare - ciclu <strong>de</strong> viaţă care a avut ca<br />
finalitate aplicaţii pentru obţinerea (procesarea) şi apoi stocarea cunoştinţelor<br />
cercetării, aplicaţii pentru obţinerea (procesarea) şi apoi stocarea rezultatelor<br />
cercetării, aplicaţii pentru analiza <strong>de</strong> validitate a rezultatelor cercetării; aplicaţii<br />
pentru interogarea şi vizualizarea cunoştinţelor şi rezultatelor cercetării; o altă<br />
componentă a părţii experimentale a constituit-o colectarea şi validarea pentru<br />
diferite seturi <strong>de</strong> compuşi chimici <strong>de</strong> interes a informaţiei medicale <strong>de</strong> natură<br />
terapeutică, folosind în acest sens sursele <strong>de</strong> date i<strong>de</strong>ntificate, literatura <strong>de</strong><br />
specialitate colectată şi aparatura experimentală achiziţionată;<br />
÷ Integrarea cunoştinţelor<br />
o Cunoştinţele <strong>de</strong> natură chimică cuprinzând aspectul structurii topologice (şi<br />
informaţiile aferente în specificul chimie matematică), aspectul structurii geometrice<br />
(şi informaţiile aferente în specificul chimie cuantică) cu cunoştinţele <strong>de</strong> natură<br />
medicală (cuprinzând aspectul potenţei biologice ale unui set <strong>de</strong> compuşi <strong>de</strong> interes)<br />
se integrează prin intermediul relaţiilor care se obţin între structura şi activitatea<br />
compuşilor;<br />
o Obţinerea <strong>de</strong> relaţii structură-activitate pe o serie <strong>de</strong> compuşi şi analiza <strong>de</strong> <strong>de</strong>taliu a<br />
efectului pe care îl au diferite opţiuni <strong>de</strong> căutare a relaţiei optimale asupra evoluţiei<br />
către obiectivul <strong>de</strong> optimizare a relaţiei structură-activitate au asigurat atingerea<br />
obiectivului <strong>de</strong> integrare a cunoştinţelor;<br />
÷ "Drug Design"<br />
o Seturile <strong>de</strong> compuşi chimici selectate, colectate şi validate în partea experimentală au<br />
constituit materialul cercetării pentru atingerea obiectivului "drug <strong>de</strong>sign";<br />
o Au fost raţionalizate prin aplicarea procedurilor QSAR şi colectarea informaţiei<br />
implicând elaborarea mo<strong>de</strong>lelor moleculare şi construirea librăriilor <strong>de</strong> compuşi<br />
5
chimici virtuali un număr <strong>de</strong> 12 seturi <strong>de</strong> compuşi chimici <strong>de</strong> interes ce posedă<br />
potenţă biologică - în total peste 1000 <strong>de</strong> compuşi chimici, rezultatul raţionalizării<br />
aflându-se stocat în baza <strong>de</strong> date MDFV construită în acest sens (are 21.5 Gb la data<br />
<strong>de</strong> 26 Sept 2010);<br />
÷ Realizarea spaţiului virtual<br />
o Spaţiul virtual <strong>de</strong> la chimia matematică la chimia cuantică şi la chimia medicală<br />
oferă soluţii pe întreg parcursul traseului <strong>de</strong> la structura compuşilor chimici la<br />
potenţa biologică a acestora şi la relaţia care se stabileşte între acestea;<br />
o Spaţiul virtual realizat cuprin<strong>de</strong>:<br />
Bazele <strong>de</strong> date MDF şi MDFV - stocate pe un server FreeBSD cu suport<br />
MySQL Server din intranet (IP: 172.27.211.4) fiind distinctă <strong>de</strong> restul<br />
aplicaţiilor, soluţie <strong>de</strong> stocare aleasă pentru o serie <strong>de</strong> motive, dintre care<br />
<strong>de</strong>scongestionarea reţelei, separarea spaţiului <strong>de</strong> stocare <strong>de</strong> unităţile <strong>de</strong><br />
procesare, securitatea şi protecţia <strong>de</strong> exterior (Internet), nefiind necesar<br />
accesul "<strong>de</strong> la distanţă" la acestea;<br />
Programele <strong>de</strong> calcul MDF şi MDFV - aplicaţii PHP stocate şi executate <strong>de</strong><br />
pe un server FreeBSD cu suport MySQL Client din intranet (IP:<br />
172.27.211.5) a căror misiune este calcularea familiei <strong>de</strong> <strong>de</strong>scriptori şi astfel<br />
realizarea bazei <strong>de</strong> cunoştinţe aferentă unui set <strong>de</strong> compuşi pentru care se<br />
posedă o proprietate sau activitate biologică <strong>de</strong> interes; aceeaşi sumă <strong>de</strong><br />
motive ca în cazul bazelor <strong>de</strong> date a făcut ca aceste aplicaţii să fie stocate şi<br />
executate în intranet;<br />
Programele <strong>de</strong> analiză (analiza <strong>de</strong> regresie simplă, multiplă, multiplă perechi,<br />
programul evolutiv) preiau datele din baza <strong>de</strong> date în raport cu specificaţiile<br />
<strong>de</strong> intrare - set, proprietate, tip <strong>de</strong> regresie căutată - şi sunt aplicaţii clientserver<br />
implementate în limbajul FreePascal şi compilate sub formă <strong>de</strong> binare<br />
executabile sub platformă Windows, efectuează căutarea relaţiilor structurăactivitate<br />
folosind algoritmi <strong>de</strong> căutare <strong>de</strong> la cei clasici <strong>de</strong> tipul "fiecare cu<br />
fiecare", la generaţii hibri<strong>de</strong> <strong>de</strong> tipul "fiecare cu fiecare în perechi <strong>de</strong> fiecare"<br />
şi până la generaţii euristice din care face parte algoritmul genetic<br />
implementat; oricare din aceste aplicaţii se execută pe orice calculator pe care<br />
este instalat MS Windows care este conectat la reţeaua intranet şi imediat<br />
obţinute relaţiile structură-activitate sunt salvate prin intermediul conexiunii<br />
pe server în baza <strong>de</strong> date MDF sau MDFV după caz; aceste aplicaţii sunt<br />
aplicaţii consumatoare <strong>de</strong> timp (o analiză poate dura două săptămâni) şi <strong>de</strong><br />
resurse (o analiză poate consuma până la 2G <strong>de</strong> memorie internă), motiv<br />
pentru care soluţia <strong>de</strong> implementare a fost aleasă FreePascal, codul generat<br />
fiind cod binar optimizat (pe 3 nivele <strong>de</strong> optimizare <strong>de</strong> cod) iar execuţia fiind<br />
aproape <strong>de</strong> maxim posibil în ceea ce priveşte viteza <strong>de</strong> execuţie;<br />
Programele <strong>de</strong> validare statistică (http://l.aca<strong>de</strong>micdirect.org/Statistics) şi <strong>de</strong><br />
interogare a rezultatelor (http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs) sunt<br />
stocate pe un calculator accesibil pe Internet (IP: 193.226.7.203) care se<br />
conectează prin intermediul porţii (IP: 193.226.7.211) la reţeaua intranet<br />
(172.27.211.1) şi apoi la bazele <strong>de</strong> date MDF şi MDFV, au ca scop analiza şi<br />
prezentarea rezultatelor;<br />
÷ Valorificarea şi transferul cercetării<br />
o Finalitatea proiectului "De la chimia matematică la chimia cuantică şi la chimia<br />
medicală" o reprezintă transferul cercetării către acele domenii din care şi către care<br />
se îndreaptă;<br />
o O serie <strong>de</strong> aplicaţii având ca scop valorificarea şi transferul cercetării către "Drug<br />
Design" au fost create; astfel:<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDFV/?set=sulfon18&pdb=s001<br />
6
• cu acces parţial restricţionat; necesită instalarea aplicaţiei<br />
"MDLChime" - versiunea 2.6 disponibilă gratuit (căutare după<br />
"MDLChime26SP7.exe"); permite vizualizarea tridimensională a<br />
structurii moleculare folosind doar Internet Explorer (v. figura <strong>de</strong> mai<br />
jos);<br />
http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs/MDF_SARs/k_browse_or_quer<br />
y.php?database=MDFSARs<br />
• cu acces liber; oferă mo<strong>de</strong>lul structură-activitate în abordarea MDF,<br />
ecuaţia <strong>de</strong> regresie (secvenţa "Browse") şi analiza acesteia (secvenţa<br />
"Query");<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDFV/?set=sulfon18&property=<br />
logKI&id=1&lori=<strong>de</strong>scriptive_statistics<br />
• cu acces parţial restricţionat; oferă mo<strong>de</strong>lul structură-activitate în<br />
abordarea MDFV, ecuaţia <strong>de</strong> regresie şi analiza <strong>de</strong>scriptivă a acesteia;<br />
7
3. Activităţi şi rezultate<br />
÷ 2007A1. Planificarea activităţilor experimentale; <strong>de</strong>rularea experimentelor <strong>de</strong>monstrative (<strong>de</strong><br />
testare a meto<strong>de</strong>lor <strong>de</strong> analiză)<br />
÷ 2007A2. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri)<br />
şi dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />
÷ 2007A3. Selectare (abstracts), colectare (full text) informaţii private (pay per view), din<br />
publicaţii Elsevier & Springer<br />
÷ 2007A4. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri)<br />
şi dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />
÷ 2007A5. Selectare (abstracts), colectare (full text) informaţii private (pay per view), din<br />
publicaţii Taylor&Francis & Wiley&Sons<br />
÷ 2007A6. I<strong>de</strong>ntificarea surselor <strong>de</strong> date şi metodologiilor <strong>de</strong> colectare (eşantionare, criterii <strong>de</strong><br />
inclu<strong>de</strong>re şi exclu<strong>de</strong>re în studiu), şi <strong>de</strong> experimentare<br />
÷ 2008A1. I<strong>de</strong>ntificarea meto<strong>de</strong>lor <strong>de</strong> analiză<br />
÷ 2008A2. Analiza rezultatelor obţinute şi interpretarea rezultatelor<br />
÷ 2008A3. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri)<br />
şi dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />
÷ 2008A4. Stabilirea necesarelor <strong>de</strong> materiale şi consumabile, i<strong>de</strong>ntificarea furnizorilor şi<br />
condiţiilor <strong>de</strong> procurare, întocmirea documentaţiilor <strong>de</strong> procurare, <strong>de</strong>rularea licitaţiilor pentru<br />
achiziţii<br />
÷ 2008A5. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri)<br />
şi dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />
÷ 2008A6. Planificarea activităţilor experimentale; <strong>de</strong>rularea experimentelor <strong>de</strong>monstrative (<strong>de</strong><br />
testare a meto<strong>de</strong>lor <strong>de</strong> analiză)<br />
÷ 2008A7. Proiectarea şi crearea bazelor <strong>de</strong> date pentru managementul cercetării şi a rezultatelor<br />
cercetării<br />
÷ 2008A8. Completarea bazelor <strong>de</strong> date cu cunoştinţele provenite din documentare şi actualizare<br />
documentare (O1/2007) şi respectiv managementul cunoştinţelor (O2/2007)<br />
÷ 2008A9. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri)<br />
şi dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />
÷ 2009A1. Crearea aplicaţiilor pentru interogarea bazei <strong>de</strong> date pentru managementul cercetării<br />
÷ 2009A2. Construirea mo<strong>de</strong>lelor moleculare (chimie cuantică)<br />
÷ 2009A3. Colectarea informaţiei medicale <strong>de</strong> activitate terapeutică (chimie medicală)<br />
÷ 2009A4. Construirea mo<strong>de</strong>lelor Structură - Activitate folosind instrumentele specifice<br />
<strong>de</strong>zvoltate<br />
÷ 2009A5. Obţinerea relaţiilor (semi)Cantitative Structură-Activitate, sQSARs<br />
÷ 2009A6. Validarea mo<strong>de</strong>lelor (TvT - Training versus Test, cv-loo - cross validation leave-oneout,<br />
CCA - Correlated Correlations Analysis)<br />
÷ 2010A1. Aplicarea procedurilor QSAR şi colectarea informaţiei<br />
÷ 2010A2. Construirea librăriilor <strong>de</strong> compuşi chimici virtuali (chimie combinatorială)<br />
÷ 2010A3. Interogarea bazelor <strong>de</strong> date internaţionale (Cambridge SDb, Protein Db, Visual Mol.<br />
Dyn., MMDB - Mol. Mod. Db, PubChem Comp., PubChem Subst.), colectare informaţii,<br />
elaborarea mo<strong>de</strong>lelor moleculare compuşi virtuali (chimie computaţională)<br />
÷ 2010A4. Obţinerea (Q)SRR, (Q)SPR, (Q)PAR, şi (Q)AAR (chimie farmaceutică)<br />
÷ 2010A5. Construirea bazei <strong>de</strong> date cu cunoştinţe Compus chimic - Mo<strong>de</strong>l cuantic 3D -<br />
Descriptori moleculari - Proprietăţi fizico-bio-chimice - Activităţi terapeutice<br />
÷ 2010A6. Proiectarea portalului web, Implementarea algoritmilor <strong>de</strong> interogare, Publicarea<br />
portalului web<br />
8
2007A1. Planificarea activităţilor experimentale; <strong>de</strong>rularea experimentelor <strong>de</strong>monstrative (<strong>de</strong><br />
testare a meto<strong>de</strong>lor <strong>de</strong> analiză)<br />
Activităţile experimentale planificate au fost:<br />
÷ Testarea meto<strong>de</strong>lor <strong>de</strong> regresie simplă<br />
÷ Testarea meto<strong>de</strong>i <strong>de</strong> regresie multiplă<br />
÷ Testarea meto<strong>de</strong>i <strong>de</strong> i<strong>de</strong>ntificare a <strong>de</strong>pen<strong>de</strong>nţei liniare<br />
÷ Testarea meto<strong>de</strong>i <strong>de</strong> predicţie bazată pe regresie<br />
Testarea meto<strong>de</strong>lor <strong>de</strong> regresie simplă<br />
Au fost implementate module online pentru analiza <strong>de</strong> regresie simplă capitalizând cunoştinţele<br />
dintr-o serie <strong>de</strong> studii anterior <strong>de</strong>rulate având ca subiect formularea <strong>de</strong> mo<strong>de</strong>le (Sârbu & Jäntschi,<br />
1998; Naşcu & others, 1999; Jäntschi, 2002-FSD1; Jäntschi, 2002-ASSP), şi verificarea mo<strong>de</strong>lelor<br />
într-o serie <strong>de</strong> studii <strong>de</strong> regresie (Jäntschi, 2002-TRPI; Jäntschi, 2002-ACRA; Jäntschi & Diu<strong>de</strong>a,<br />
2003-DM1; Stoenoiu & others, 2007-CMST; Tăut & others, 2007-MMCP; Jäntschi & Bolboacă,<br />
2007-JLRR) care au avut ca finalitate elaborarea mo<strong>de</strong>lelor <strong>de</strong> calcul în versiunea "release" a<br />
aplicaţiilor <strong>de</strong> regresie <strong>de</strong>zvoltate. Aceste module sunt înglobate în mai multe aplicaţii <strong>de</strong>zvoltate,<br />
una dintre acestea fiind disponibilă la adresa:<br />
http://l.aca<strong>de</strong>micdirect.org/Statistics/regression_mo<strong>de</strong>ls/.<br />
Datele următoare au fost folosite pentru testarea meto<strong>de</strong>lor <strong>de</strong> regresie simplă:<br />
Valorile numerice reprezentate în graficul <strong>de</strong> mai sus sunt:<br />
Nr X Y 7 1.16 0.71 14 1.44 0.8 21 1.61 0.82 28 1.97 0.95<br />
1 0.72 0.46 8 1.22 0.75 15 1.44 0.85 22 1.69 0.82 29 2.02 0.95<br />
2 0.92 0.61 9 1.27 0.73 16 1.46 0.81 23 1.8 0.85 30 2.11 1<br />
3 1 0.62 10 1.28 0.74 17 1.51 0.77 24 1.86 0.96 31 2.28 0.83<br />
4 1 0.65 11 1.33 0.8 18 1.57 0.9 25 1.91 0.96 32 2.91 0.93<br />
5 1.02 0.63 12 1.34 0.75 19 1.58 0.79 26 1.95 1<br />
6 1.14 0.68 13 1.42 0.79 20 1.58 0.87 27 1.97 0.82<br />
Următorul tabel centralizează rezultatele obţinute la testarea meto<strong>de</strong>lor <strong>de</strong> regresie simplă:<br />
Nr Metoda Varianta Ecuaţia Formula <strong>de</strong> calcul Analiza <strong>de</strong> regresie<br />
1 liniară 1 Y=aX a = M(Y)/M(X) a = 0.517<br />
MSE = 0.146<br />
MSE 2 = 0.0213<br />
r = 0.833<br />
r 2 = 0.694<br />
(Y-aX) 2 2 liniară 2 Y=aX = min a = 0.495<br />
MSE = 0.142<br />
MSE 2 = 0.0201<br />
r = 0.833<br />
r 2 (X-Y/a)<br />
= 0.694<br />
2 3 liniară 3 Y=aX = min a = 0.511<br />
9
MSE = 0.144<br />
MSE 2 = 0.0207<br />
r = 0.833<br />
r 2 a = √M(Y<br />
= 0.694<br />
2 )/M(X 2 4 liniară 4 Y=aX ) a = 0.503<br />
MSE = 0.142<br />
MSE 2 = 0.0202<br />
r = 0.833<br />
r 2 = 0.694<br />
(aX/b-Y/b+1) 2<br />
5 liniară 5 Y=aX+b = a = 0.580<br />
min<br />
b = 0.149<br />
MSE = 0.078<br />
MSE 2 = 0.0061<br />
r = 0.833<br />
r 2 = 0.694<br />
(Y-aX-b) 2 6 liniară 6 Y=aX+b = min a = 0.445<br />
b = 0.229<br />
MSE = 0.068<br />
MSE 2 = 0.0047<br />
r = 0.833<br />
r 2 = 0.694<br />
(X-Y/a+b/a) 2 7 liniară 7 Y=aX+b = min a = 0.289<br />
b = 14.198<br />
MSE = 22.34<br />
MSE 2 = 449<br />
r = 0.833<br />
r 2 = 0.694<br />
a = √M(Y 2 )/M(X 2 8 liniară 8 Y=aX+b ) a = 0.374<br />
b= M(Y)-aM(X) b = 0.275<br />
MSE = 0.071<br />
MSE 2 = 0.0051<br />
r = 0.833<br />
r 2 = 0.694<br />
9 hiperbolică 1 (X+a)(Y+b)-c=0 a, b şi c după a = -1336<br />
formulele <strong>de</strong> mai jos b = 1410<br />
c = -1112<br />
MSE = 0.378<br />
MSE 2 = 0.1425<br />
r = 0.833<br />
r 2 = 0.694<br />
C(X,Y) = M(XY) −M(X)M(Y) , c = ab + aM(Y) + bM(X) + M(XY)<br />
2 2<br />
2<br />
M(XY)C(X,XY) − M(X )C(Y,XY) + M(X)M(Y) ( M(XY ) −M(X<br />
Y) )<br />
a =<br />
2 2<br />
M(Y )C(X,X) − M(XY)C(X,Y) + M(X)M(Y) M(XY) −M(X<br />
)<br />
b =<br />
( )<br />
( 2 )<br />
( )<br />
2 2<br />
M(XY)C(Y,XY) − M(Y )C(X,XY) + M(X)M(Y) M(X Y) −M(XY<br />
)<br />
2 2<br />
M(Y )C(X,X) − M(XY)C(X,Y) + M(X)M(Y) M(XY) −M(X<br />
)<br />
Y=a+bX -1<br />
(X(Y-a)-b) 2 = min<br />
10 hiperbolică 2 a = 0.855<br />
b = -0.038<br />
MSE = 0.119<br />
MSE 2 = 0.0142<br />
r = 0.923<br />
10
2 Y<br />
= 0.852<br />
-1 =a+bX -1<br />
(Y -1 -a-bX -1 ) 2 11 hiperbolică 3 = min a = -24.37<br />
b = 40.237<br />
MSE = 0.766<br />
MSE 2 = 0.586<br />
r = -0.781<br />
r 2 = 0.610<br />
Testarea meto<strong>de</strong>i <strong>de</strong> regresie multiplă<br />
Au fost implementate module online pentru analiza <strong>de</strong> regresie multiplă capitalizând cunoştinţele<br />
dintr-o serie <strong>de</strong> studii anterior <strong>de</strong>rulate având ca subiect verificarea mo<strong>de</strong>lelor într-o serie <strong>de</strong> studii<br />
<strong>de</strong> regresie (Jäntschi & Pică, 2003-CASS; Pică & Jäntschi, 2003-CSC1; Pică & Jäntschi, 2003-<br />
CSC2) şi formularea <strong>de</strong> rutine automate <strong>de</strong> calcul (Jäntschi, 2004-DCS), şi care au avut ca finalitate<br />
elaborarea mo<strong>de</strong>lelor <strong>de</strong> calcul în versiunea "release" a aplicaţiilor <strong>de</strong> regresie <strong>de</strong>zvoltate. Aceste<br />
module sunt înglobate în mai multe aplicaţii <strong>de</strong>zvoltate, una dintre acestea fiind disponibilă la<br />
adresa: http://l.aca<strong>de</strong>micdirect.ro/Statistics/multi_regression/.<br />
Datele următoare au fost folosite pentru testarea meto<strong>de</strong>lor <strong>de</strong> regresie multiplă:<br />
1<br />
Valorile numerice reprezentate în graficul <strong>de</strong> mai sus sunt:<br />
Mol ISDmsHt lADrtHg Y<br />
PCB001 151.28 -2.4129 0.0997<br />
PCB002 150.54 -2.4752 0.1544<br />
PCB003 150.89 -2.4799 0.1937<br />
PCB004 147.93 -2.5878 0.2245<br />
PCB005 148.27 -2.6449 0.2785<br />
PCB006 146.92 -2.6610 0.2709<br />
PCB007 147.28 -2.6499 0.2566<br />
PCB008 147.40 -2.6659 0.2783<br />
PCB009 146.92 -2.6638 0.257<br />
PCB010 147.93 -2.5976 0.2243<br />
PCB011 146.28 -2.7289 0.3238<br />
PCB012 147.99 -2.7018 0.3298<br />
PCB013 146.55 -2.7348 0.3315<br />
0<br />
-3.40<br />
-2.40<br />
11<br />
150<br />
135<br />
120<br />
PCB014 146.17 -2.7028 0.2373<br />
PCB015 146.95 -2.7398 0.3387<br />
PCB016 144.84 -2.8090 0.3625<br />
PCB017 143.95 -2.8148 0.3398<br />
PCB018 143.92 -2.8046 0.3378<br />
PCB019 144.45 -2.7588 0.3045<br />
PCB020 143.94 -2.8881 0.417<br />
PCB021 145.59 -2.8521 0.4135<br />
PCB022 144.33 -2.8943 0.4267<br />
PCB023 144.26 -2.8423 0.377<br />
PCB024 144.98 -2.7928 0.3508<br />
PCB025 142.85 -2.8941 0.3937<br />
PCB026 143.03 -2.8787 0.3911<br />
PCB027 143.20 -2.8355 0.3521
PCB028 143.38 -2.8993 0.4031<br />
PCB029 144.72 -2.8430 0.382<br />
PCB030 143.55 -2.8075 0.3165<br />
PCB031 143.43 -2.8846 0.4094<br />
PCB032 143.81 -2.8378 0.3636<br />
PCB033 144.41 -2.8783 0.4163<br />
PCB034 142.48 -2.8821 0.3782<br />
PCB035 143.67 -2.9513 0.4738<br />
PCB036 141.95 -2.9517 0.4375<br />
PCB037 143.98 -2.9575 0.4858<br />
PCB038 144.95 -2.9018 0.5102<br />
PCB039 142.13 -2.9587 0.4488<br />
PCB040 141.79 -3.0255 0.5102<br />
PCB041 142.20 -3.0078 0.499<br />
PCB042 140.81 -3.0324 0.487<br />
PCB043 140.74 -3.0015 0.4587<br />
PCB044 140.86 -3.0208 0.4832<br />
PCB045 141.71 -2.9477 0.4334<br />
PCB046 141.30 -2.9745 0.445<br />
PCB047 139.96 -3.0381 0.4639<br />
PCB048 141.30 -3.0027 0.4651<br />
PCB049 139.89 -3.0274 0.461<br />
PCB050 140.38 -2.9636 0.4007<br />
PCB051 140.51 -2.9777 0.4242<br />
PCB052 139.93 -3.0156 0.4557<br />
PCB053 140.35 -2.9670 0.4187<br />
PCB054 141.12 -2.9114 0.38<br />
PCB055 141.20 -3.0914 0.5562<br />
PCB056 141.37 -3.1016 0.5676<br />
PCB057 139.95 -3.0800 0.5515<br />
PCB058 139.53 -3.1049 0.5267<br />
PCB059 140.56 -3.0287 0.486<br />
PCB060 141.20 -3.0914 0.5676<br />
PCB061 142.89 -3.0272 0.5331<br />
PCB062 142.20 -2.9831 0.4685<br />
PCB063 140.25 -3.0872 0.529<br />
PCB064 141.08 -3.0320 0.4999<br />
PCB065 142.20 -2.9716 0.4671<br />
PCB066 140.33 -3.1075 0.5447<br />
PCB067 140.32 -3.0814 0.5214<br />
PCB068 138.35 -3.1119 0.504<br />
PCB069 139.06 -3.0453 0.451<br />
PCB070 140.46 -3.0913 0.5407<br />
PCB071 140.74 -3.0447 0.4989<br />
PCB072 138.61 -3.0945 0.4984<br />
PCB073 138.69 -3.0486 0.4554<br />
PCB074 140.76 -3.0875 0.5341<br />
PCB075 139.70 -3.0475 0.4643<br />
PCB076 141.30 -3.0730 0.5408<br />
PCB077 141.04 -3.1696 0.6295<br />
12<br />
PCB078 140.67 -3.1465 0.6024<br />
PCB079 139.28 -3.1702 0.5894<br />
PCB080 137.65 -3.1697 0.5464<br />
PCB081 140.89 -3.1536 0.6149<br />
PCB082 139.09 -3.2205 0.6453<br />
PCB083 137.72 -3.2131 0.6029<br />
PCB084 138.58 -3.1580 0.5744<br />
PCB085 138.15 -3.2273 0.6224<br />
PCB086 139.42 -3.1790 0.6105<br />
PCB087 138.16 -3.2153 0.6175<br />
PCB088 138.96 -3.1307 0.5486<br />
PCB089 138.70 -3.1661 0.5779<br />
PCB090 136.66 -3.2207 0.5814<br />
PCB091 137.71 -3.1622 0.5549<br />
PCB092 136.78 -3.2077 0.5742<br />
PCB093 138.85 -3.1224 0.5437<br />
PCB094 137.12 -3.1594 0.5331<br />
PCB095 137.63 -3.1503 0.5464<br />
PCB096 138.30 -3.0959 0.5057<br />
PCB097 138.19 -3.2151 0.61<br />
PCB098 137.18 -3.1758 0.5415<br />
PCB099 137.26 -3.2215 0.588<br />
PCB100 136.43 -3.1787 0.5212<br />
PCB101 137.26 -3.2094 0.5816<br />
PCB102 137.78 -3.1579 0.5431<br />
PCB103 136.24 -3.1675 0.5142<br />
PCB104 137.08 -3.1084 0.4757<br />
PCB105 138.61 -3.3010 0.7049<br />
PCB106 138.53 -3.2612 0.668<br />
PCB107 137.32 -3.2890 0.6628<br />
PCB108 136.74 -3.3048 0.6626<br />
PCB109 137.73 -3.2154 0.6016<br />
PCB110 138.04 -3.2333 0.6314<br />
PCB111 135.57 -3.2916 0.6183<br />
PCB112 137.81 -3.2023 0.5986<br />
PCB113 136.08 -3.2367 0.5862<br />
PCB114 138.87 -3.2683 0.6828<br />
PCB115 138.28 -3.2186 0.6171<br />
PCB116 140.69 -3.1448 0.6132<br />
PCB117 138.24 -3.2065 0.615<br />
PCB118 137.73 -3.2900 0.6693<br />
PCB119 136.58 -3.2505 0.5968<br />
PCB120 135.85 -3.2936 0.6256<br />
PCB121 134.49 -3.2550 0.5518<br />
PCB122 138.29 -3.2921 0.6871<br />
PCB123 137.16 -3.2988 0.6658<br />
PCB124 137.38 -3.2808 0.6584<br />
PCB125 137.56 -3.2324 0.6142<br />
PCB126 137.98 -3.3609 0.7512<br />
PCB127 136.31 -3.3607 0.7078
PCB128 136.38 -3.4116 0.7761<br />
PCB129 136.34 -3.3870 0.7501<br />
PCB130 134.97 -3.4039 0.7184<br />
PCB131 135.78 -3.3375 0.6853<br />
PCB132 135.93 -3.3453 0.7035<br />
PCB133 133.67 -3.3952 0.6871<br />
PCB134 135.77 -3.3282 0.6796<br />
PCB135 134.43 -3.3376 0.6563<br />
PCB136 135.51 -3.2748 0.6257<br />
PCB137 135.48 -3.4055 0.7329<br />
PCB138 135.48 -3.4055 0.7403<br />
PCB139 134.95 -3.3413 0.6707<br />
PCB140 134.57 -3.3634 0.6707<br />
PCB141 135.40 -3.3811 0.72<br />
PCB142 137.38 -3.2892 0.6848<br />
PCB143 135.84 -3.3307 0.6789<br />
PCB144 134.83 -3.3291 0.6563<br />
PCB145 135.58 -3.2721 0.6149<br />
PCB146 134.06 -3.3977 0.6955<br />
PCB147 134.81 -3.3329 0.6608<br />
PCB148 132.95 -3.3566 0.6243<br />
PCB149 135.00 -3.3367 0.6672<br />
PCB150 134.21 -3.2887 0.5969<br />
PCB151 134.81 -3.3196 0.6499<br />
PCB152 135.38 -3.2630 0.6062<br />
PCB153 134.57 -3.3990 0.7036<br />
PCB154 133.65 -3.3544 0.6349<br />
PCB155 133.03 -3.3014 0.5666<br />
PCB156 135.88 -3.4662 0.8105<br />
PCB157 135.48 -3.4879 0.8184<br />
PCB158 135.19 -3.4161 0.7429<br />
PCB159 134.09 -3.4692 0.7655<br />
PCB160 136.25 -3.3722 0.7396<br />
PCB161 133.20 -3.4200 0.6968<br />
PCB162 134.27 -3.4743 0.7737<br />
PCB163 135.23 -3.4027 0.7396<br />
PCB164 134.89 -3.4161 0.7399<br />
PCB165 133.36 -3.4053 0.692<br />
PCB166 136.72 -3.3762 0.7572<br />
PCB167 134.60 -3.4758 0.7814<br />
PCB168 133.35 -3.4347 0.7068<br />
PCB169 134.95 -3.5475 0.8625<br />
PCB170 133.57 -3.5738 0.874<br />
PCB171 133.12 -3.5207 0.8089<br />
PCB172 132.24 -3.5650 0.8278<br />
PCB173 134.24 -3.4918 0.8152<br />
PCB174 133.10 -3.5046 0.7965<br />
PCB175 131.58 -3.5130 0.7611<br />
PCB176 132.74 -3.4468 0.7305<br />
PCB177 133.06 -3.5114 0.8031<br />
13<br />
PCB178 131.64 -3.5024 0.7537<br />
PCB179 132.62 -3.4369 0.7205<br />
PCB180 132.66 -3.5670 0.8362<br />
PCB181 133.32 -3.4960 0.7968<br />
PCB182 131.66 -3.5238 0.7653<br />
PCB183 132.19 -3.5115 0.772<br />
PCB184 131.49 -3.4607 0.7016<br />
PCB185 133.28 -3.4826 0.7848<br />
PCB186 133.94 -3.4240 0.7416<br />
PCB187 132.13 -3.5020 0.7654<br />
PCB188 131.25 -3.4517 0.692<br />
PCB189 132.78 -3.6479 0.9142<br />
PCB190 133.66 -3.5688 0.874<br />
PCB191 132.00 -3.5952 0.8447<br />
PCB192 131.75 -3.5718 0.8269<br />
PCB193 132.12 -3.5803 0.8397<br />
PCB194 130.80 -3.7308 0.962<br />
PCB195 131.52 -3.6711 0.9321<br />
PCB196 130.24 -3.6759 0.8938<br />
PCB197 129.97 -3.6147 0.8293<br />
PCB198 130.07 -3.6621 0.8845<br />
PCB199 131.14 -3.5940 0.8494<br />
PCB200 129.81 -3.6048 0.8197<br />
PCB201 130.07 -3.6621 0.8875<br />
PCB202 129.77 -3.5937 0.8089<br />
PCB203 130.59 -3.6610 0.8938<br />
PCB204 129.80 -3.6087 0.8217<br />
PCB205 130.50 -3.7430 0.9678<br />
PCB206 128.67 -3.8212 1.0103<br />
PCB207 128.32 -3.7579 0.9423<br />
PCB208 128.24 -3.7470 0.932<br />
PCB209 126.70 -3.8963 1.0496
Analiza <strong>de</strong> corelaţie pentru toate grupurile cu coeficient <strong>de</strong> corelaţie r > 0.95 a setului <strong>de</strong> date din<br />
tabelul <strong>de</strong> mai sus este redată în continuare:<br />
ISDmsHt lADrtHg Y Equation Residue Correlation<br />
1 1 0 +ISDmsHt*1.00lADrtHg*1.69*10<br />
0.12 0.97138<br />
1 =+1.92*10 2
ISDmsHt lADrtHg Y Equation Residue Correlation<br />
1 1 0 -ISDmsHt*5.90*10 -2 +lADrtHg*1.00=-<br />
1.13*10 1<br />
0.30 0.97138<br />
15
ISDmsHt lADrtHg Y Equation Residue Correlation<br />
0 1 1 +lADrtHg*1.00+Y*1.54=-2.28 0.21 0.98650<br />
16
ISDmsHt lADrtHg Y Equation Residue Correlation<br />
0 1 1 +lADrtHg*0.64+Y*1.00=-1.47 0.70 0.98650<br />
17
ISDmsHt lADrtHg Y Equation Residue Correlation<br />
1 1 1 +ISDmsHt*1.00-lADrtHg*4.05*10 1 3.94*10 -2 0.99704<br />
-Y*3.82*10 1 =+2.44*10 2<br />
18
ISDmsHt lADrtHg Y Equation Residue Correlation<br />
1 1 1 -ISDmsHt*2.46*10 -2 +lADrtHg*1.00 4.17*10 -2 0.99947<br />
+Y*0.94=-6.04<br />
19
ISDmsHt lADrtHg Y Equation Residue Correlation<br />
1 1 1 -ISDmsHt*2.61*10 -2 +lADrtHg*1.05 0.22 0.99851<br />
+Y*1.00=-6.40<br />
Testarea meto<strong>de</strong>i <strong>de</strong> i<strong>de</strong>ntificare a mo<strong>de</strong>lului <strong>de</strong> <strong>de</strong>pen<strong>de</strong>nţă<br />
Au fost implementate module online pentru analiza <strong>de</strong> mo<strong>de</strong>l capitalizând cunoştinţele dintr-o serie<br />
<strong>de</strong> studii anterior <strong>de</strong>rulate având ca subiect diferite modalităţi <strong>de</strong> implementare a analizei <strong>de</strong> mo<strong>de</strong>l<br />
(Jäntschi & Zaharieva-Stoyanova, 2003-MLPM), utilizarea în analiza <strong>de</strong> mo<strong>de</strong>l a diferitelor<br />
măsurabile ale asocierii (Jäntschi & Bolboacă, 2006-PSKC) şi care au avut ca finalitate elaborarea<br />
mo<strong>de</strong>lelor <strong>de</strong> calcul în versiunea "release" a aplicaţiilor <strong>de</strong> regresie <strong>de</strong>zvoltate. Aceste module sunt<br />
înglobate în mai multe aplicaţii <strong>de</strong>zvoltate, una dintre acestea fiind disponibilă la adresa:<br />
http://l.aca<strong>de</strong>micdirect.ro/Statistics/multi_regression/<br />
De asemenea, această analiză a adus cunoştinţe noi capitalizate într-o serie <strong>de</strong> publicaţii având ca<br />
subiect i<strong>de</strong>ntificarea mo<strong>de</strong>lului având la dispoziţie o serie <strong>de</strong> alternative (Jäntschi & others, 2007-<br />
NTCP; Jäntschi & Bolboacă, 2010-REBP), modalităţile <strong>de</strong> estimare a parametrilor <strong>de</strong> mo<strong>de</strong>l<br />
(Jäntschi, 2009-DF1), utilizarea unei serii <strong>de</strong> măsuri a asocierii între observaţii şi mo<strong>de</strong>l în analiza<br />
mo<strong>de</strong>lului (Jäntschi & Bolboacă, 2009-DF2), elaborarea algoritmilor <strong>de</strong> analiză <strong>de</strong> mo<strong>de</strong>l în ipoteza<br />
distribuţie normală a erorii <strong>de</strong> observare (Bolboacă & Jäntschi, 2009-DF3) şi aplicaţii ale acestora<br />
(Bălan & others, 2010-ATSC; Jäntschi & Bolboacă, 2010-REBP).<br />
20
Tabelul următor prezintă sintetic testarea meto<strong>de</strong>lor <strong>de</strong> analiză a mo<strong>de</strong>lului <strong>de</strong> <strong>de</strong>pen<strong>de</strong>nţă:<br />
Experimente <strong>de</strong>monstrative pentru testarea meto<strong>de</strong>i <strong>de</strong> i<strong>de</strong>ntificare a <strong>de</strong>pen<strong>de</strong>nţei liniare<br />
Coeficient<br />
<strong>de</strong> corelaţie<br />
Definiţie Formule <strong>de</strong> calcul<br />
Coeficient<br />
<strong>de</strong> corelaţie<br />
Masură a intensităţii şi<br />
direcţiei relatiei lineare a<br />
rPr<br />
s = ∑ (Ym−i−Y m)(Yest−i−Y est)<br />
2 2<br />
( ∑(Ym−i−Y m) )( ∑(Yest−i−Y<br />
est)<br />
)<br />
Pearson două variabile cantitative; un<strong>de</strong> Ym-i sunt valorile măsurate, iar Y m<br />
este valoarea medie masurată;<br />
Coeficient<br />
<strong>de</strong> corelaţie<br />
Spearman<br />
Coeficient<br />
<strong>de</strong> corelaţie<br />
Spearman-<br />
Masură (neparametrică) a<br />
corelaţiei între două<br />
variabile (care nu sunt<br />
neaparat cantitative) <strong>de</strong>spre<br />
a căror distribuţii <strong>de</strong><br />
frecvenţe nu se face nici o<br />
asumpţie;<br />
r<br />
r<br />
Spm<br />
=<br />
∑<br />
∑ ∑<br />
(R −R )(R −R<br />
)<br />
Y Ym Yest<br />
m−i Yest−i<br />
2 2<br />
( (RY −R Ym) )( (R Ye<br />
)<br />
m i Y −R )<br />
− est−i st<br />
un<strong>de</strong> RYm-i este rangul activităţii<br />
măsurate pe componenta i , iar R Yest−<br />
i<br />
este media activitaţiilor estimate;<br />
2<br />
6∑ D<br />
rSpm = 1− 2<br />
n(n −1)<br />
un<strong>de</strong> D = RYm-1 - RYest-1 (diferenţa<br />
oricăror două ranguri);<br />
n = volumul eşantionului<br />
Masură (neparametrică) a corelaţiei între două variabile semicantitative;<br />
∑ mi − m esti − est ∑(RY<br />
−R Ym)(R Yest<br />
mi Y −R<br />
)<br />
− esti −<br />
∑ ∑ ∑ ∑ st<br />
(Y −Y )(Y −Y<br />
)<br />
= ⋅<br />
sQ<br />
2 2 2<br />
2<br />
Pearson ( (Ymi − −Y m) )( (Yesti − −Y est) ) ( (RY −R Ym)<br />
)( (R e )<br />
mi Y −R<br />
Y )<br />
− esti −<br />
Coeficient<br />
<strong>de</strong> corelaţie<br />
Kendall-tau<br />
Coeficient<br />
<strong>de</strong> corelaţie<br />
Gamma<br />
Masură (neparametrică) a<br />
corelaţiei între două<br />
variabile ordinale;<br />
- exista 3 coeficienţi <strong>de</strong><br />
corelaţie Kendall: tau-a, taub<br />
şi tau-c<br />
Masură a asocierii între<br />
două variabile, care conţin<br />
valori lipsă;<br />
τKen,a = (C-D)/[n(n-1)/2]<br />
τKen,b=(C-D)/√[(n(n-1)/2-t)(n(n-1)/2-u)]<br />
τKen,c = 2(C-D)/n 2<br />
un<strong>de</strong><br />
C = numărul <strong>de</strong> perechi concordante;<br />
D = numărul <strong>de</strong> perechi disconcordante;<br />
E = numărul<strong>de</strong> perechi egale;<br />
Γ = (C-D)/(C+D),<br />
un<strong>de</strong><br />
C = numărul perechi concordante<br />
(perechile (Ym-j; Yest-j) si (Ym-i; Yest-i)<br />
sunt concordante dacă diferenţele Ym-j -<br />
Ym-i şi Yest-j - Yest-i au acelaşi semn);<br />
D = numărul perechi disconcordante<br />
(dacă diferenţele Ym-j - Ym-i şi Yest-j -<br />
Yest-i au semne diferite)<br />
1.a Interpretarea coeficientului <strong>de</strong> corelaţie Pearson:<br />
÷ -1 ≤ rPrs ≤ 1;<br />
÷ rPrs ≥ 0.80 indica o legatură puternică <strong>de</strong> directă proporţionalitate între cele două variabile după<br />
cum rPrs≤0.5 indică o corelaţie slabă între variabile;<br />
÷ coeficientul <strong>de</strong> <strong>de</strong>terminare rPrs 2 oferă informaţii <strong>de</strong>spre procentul în care variaţia variabilei<br />
21
<strong>de</strong>pen<strong>de</strong>nte se datorează relaţiei lineare;<br />
1.b. Semnificaţia testului:<br />
Testul Stu<strong>de</strong>nt poate fi utilizat pentru a <strong>de</strong>termina dacă valoarea coeficientului <strong>de</strong> corelaţie<br />
este semnificativă statistic, cu nivelul <strong>de</strong> semnificaţie <strong>de</strong> 0.01( sau 0.05);<br />
÷ Ipoteza nulă H0: rPrs = 0 (nu există corelaţie între variabile)<br />
÷ Ipoteza alternativă H1: rPrs 0 (nu există corelaţie între variabile)<br />
Dacă pentru pentru un nivel <strong>de</strong> semnificaţie <strong>de</strong> 0.01, p-value asociat lui tPrs,df este mai mic<br />
<strong>de</strong>cât 0.01 înseamnă că se respinge ipoteza nulă, adică acceptăm ipoteza alternativă. Există corelaţie<br />
între variabilele studiate.<br />
Formula folosită pentru calculul parametrului testului Stu<strong>de</strong>nt este:<br />
t = n − 2 ⋅<br />
2<br />
r<br />
2<br />
1−<br />
r<br />
Formula folosită pentru calculul parametrului testului Fisher este:<br />
2 ( n − 2)<br />
⋅ r<br />
F = 2<br />
1−<br />
r<br />
1.c. Rezultate:<br />
Datele studiate au fost:<br />
id d_IP d_IR d_Cr d_RSD d_Volum<br />
1 0 0 4.9 0 0<br />
2 0 0 5.81 0 0<br />
3 1.46 0.81 4.69 4.1 114<br />
4 1.69 0.82 4.31 4.58 126<br />
5 1.97 0.82 4.77 5.11 139<br />
27 0.72 0.46 6.6 1.85 150<br />
28 0.92 0.61 3.29 2.58 157<br />
29 1 0.65 1.75 2.8 164<br />
30 1.02 0.63 1.75 2.67 160<br />
31 1.14 0.68 1.4 2.74 201<br />
53 0 0 0 0 0<br />
54 0 0 1.5 0 0<br />
55 1 0.69 1.89 2.77 187<br />
56 1.2 0.69 1.61 3.24 133<br />
57 1.27 0.7 1.75 3.33 160<br />
79 0.97 0.61 5.49 2.57 160<br />
80 0.97 0.6 2.81 2.47 137<br />
81 0.88 0.58 2.61 2.39 146<br />
82 0.82 0.57 2.27 2.31 156<br />
83 0.79 0.55 1.98 2.23 167<br />
Matricea valorilor coeficientului <strong>de</strong> corelaţie:<br />
R(XX) d_IP d_IR D_Cr d_RSD d_Volum<br />
D_IP 1 0.9529 0.0929 0.9968 0.7273<br />
D_IR 1 0.0024 0.9578 0.8749<br />
D_Cr 1 0.0928 -0.1078<br />
D_RSD<br />
1 0.7234<br />
D_Volum<br />
Matricea valorilor parametrului testului Stu<strong>de</strong>nt:<br />
1<br />
t(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />
d_IP INF 9.1911 0.0366 37.3643 2.6448<br />
d_IR INF 0 9.7784 5.0474<br />
d_Cr INF 0.0365 0.0493<br />
22
d_RSD INF 2.6057<br />
d_Volum<br />
Matricea probabilitaţiilor (p-value):<br />
INF<br />
pt(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />
D_IP 0 3.22E-08 0.9712 1.64E-18 0.0165<br />
D_IR 0 1 1.26E-08 8.38E-05<br />
d_Cr 0 0.9713 0.9612<br />
d_RSD 0 0.0179<br />
d_Volum<br />
Valorile lui p-value colorate în albastru sunt semnificative (
81 0.88 0.58 2.61 2.39 146<br />
82 0.82 0.57 2.27 2.31 156<br />
83 0.79 0.55 1.98<br />
Matricea valorilor coeficientului <strong>de</strong> corelaţie:<br />
2.23 167<br />
ρ(XX) d_IP d_IR D_Cr d_RSD d_Volum<br />
d_IP 1 0.9965 0.742 0.9958 0.8395<br />
d_IR<br />
1 0.7462 0.9985 0.8461<br />
d_Cr 1 0.7455 0.7047<br />
d_RSD<br />
1 0.842<br />
d_Volum<br />
Matricea valorilor parametrului testului Stu<strong>de</strong>nt:<br />
1<br />
t(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />
d_IP INF 35.4911 2.7981 32.6577 4.2139<br />
d_IR INF 2.8444 53.8965 4.3495<br />
d_Cr INF 2.8362 2.4278<br />
d_RSD INF 4.2657<br />
d_Volum<br />
Matricea probabilitatiilor (p-value):<br />
INF<br />
pt(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />
d_IP 0 4.08E-18 0.0119 1.79E-17 5.22E-04<br />
d_IR 0 0.0108 2.37E-21 3.86E-04<br />
d_Cr 0 0.011 0.0259<br />
d_RSD<br />
0 4.65E-04<br />
d_Volum<br />
0<br />
Valorile lui p-value colorate în albastru sunt semnificative (
30 1.02 0.63 1.75 2.67 160<br />
31 1.14 0.68 1.4 2.74 201<br />
53 0 0 0 0 0<br />
54 0 0 1.5 0 0<br />
55 1 0.69 1.89 2.77 187<br />
56 1.2 0.69 1.61 3.24 133<br />
57 1.27 0.7 1.75 3.33 160<br />
79 0.97 0.61 5.49 2.57 160<br />
80 0.97 0.6 2.81 2.47 137<br />
81 0.88 0.58 2.61 2.39 146<br />
82 0.82 0.57 2.27 2.31 156<br />
83 0.79 0.55 1.98 2.23 167<br />
Matricea valorilor coeficientului <strong>de</strong> corelaţie Spearman semi-cantitativ:<br />
λ(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />
d_IP 1 0.9744 0.2626 0.9963 0.7814<br />
d_IR 1 0.0423 0.9779 0.8604<br />
d_Cr 1 0.263 0.2756<br />
d_RSD<br />
1 0.7805<br />
d_Volum<br />
Matricea valorilor parametrului testului Stu<strong>de</strong>nt:<br />
1<br />
t(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />
d_IP INF 12.8365 0.2932 34.7766 3.2709<br />
d_IR INF 0.0076 13.8793 4.6713<br />
d_Cr INF 0.2941 0.3232<br />
d_RSD INF 3.2588<br />
d_Volum INF<br />
Matricea probabilitaţiilor (p-value):<br />
pt(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />
d_IP 0 1.69E-10 0.772 5.86E-18 4.25E-03<br />
d_IR 0 0.994 4.69E-11 1.90E-04<br />
d_Cr 0 0.7721 0.7502<br />
d_RSD<br />
0 4.36E-03<br />
d_Volum<br />
0<br />
Valorile lui p-value colorate în albastru sunt semnificative (
un<strong>de</strong> variaţia este dată <strong>de</strong> formula:<br />
s 2<br />
τ<br />
Z<br />
τ<br />
Ken , a<br />
Ken,<br />
a<br />
n<br />
=<br />
C − D<br />
=<br />
s<br />
2<br />
τ<br />
Ken , a<br />
( n −1)(<br />
n + 5)<br />
Coeficientul <strong>de</strong> corelaţie Kendall tau-b:<br />
÷ Ipoteza nulă H0: τKen,b = 0 (nu există corelaţie)<br />
÷ Ipoteza alternativă H1: τKen,b 0 (există corelaţie)<br />
Formula folosită pentru calculul parametrului testului Z în cazul coeficientului <strong>de</strong> corelaţie Kendall<br />
tau-b este:<br />
C − D<br />
Z<br />
τ<br />
Ken,<br />
b<br />
=<br />
un<strong>de</strong> variaţia este dată <strong>de</strong> formula<br />
Tied(<br />
X)<br />
Tied(<br />
Y)<br />
⎛<br />
⎞<br />
⎜ ∑ ni<br />
( ni<br />
−1)(<br />
ni<br />
+ 5)<br />
+ ∑ mi<br />
( mi<br />
−1)(<br />
mi<br />
+ 5)<br />
⎟<br />
2 2<br />
s s<br />
⎜ i=<br />
1<br />
i=<br />
1<br />
⎟<br />
τ =<br />
Ken , b τ −<br />
+<br />
Ken , a ⎜<br />
18<br />
⎟<br />
⎜<br />
⎟<br />
⎝<br />
⎠<br />
Tied(<br />
X)<br />
Tied(<br />
Y)<br />
Tied(<br />
X)<br />
Tied(<br />
Y)<br />
ni<br />
( )( ) ( )( )<br />
( ni<br />
−1)(<br />
ni<br />
− 2)<br />
mi<br />
( mi<br />
−1)(<br />
mi<br />
− 2)<br />
∑ ni<br />
ni<br />
−1<br />
ni<br />
+ 5 ∑ mi<br />
mi<br />
−1<br />
mi<br />
+ 5 ∑<br />
∑<br />
i=<br />
1<br />
i=<br />
1<br />
i=<br />
1 9<br />
i=<br />
1 9<br />
+<br />
+<br />
2n(<br />
n −1)<br />
9n(<br />
n −1)(<br />
n − 2)<br />
Coeficientul <strong>de</strong> corelaţie Kendall tau-c:<br />
÷ Ipoteza nulă H0: τKen,c = 0 (nu există corelaţie)<br />
÷ Ipoteza alternativă H1: τKen,c 0 (există corelaţie)<br />
4.c. Rezultate:<br />
Matricea valorilor coeficientului <strong>de</strong> corelaţie Kendall tau-a:<br />
d_IP d_IR d_Cr d_RSD d_Volum<br />
d_IP 1 0.9 0.0474 0.8947 0.2368<br />
d_IR 1 0.0105 0.9316 0.2632<br />
d_Cr 1 0.0158 0.2053<br />
d_RSD 1 0.2368<br />
d_Volum<br />
Matricea valorilor parametrului testului Z:<br />
1<br />
Z(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />
d_IP INF 5.548 -0.292 5.5155 1.46<br />
d_IR INF -0.0649 5.7426 1.6222<br />
d_Cr INF -0.0973 -1.2653<br />
d_RSD INF 1.46<br />
d_Volum<br />
Matricea probabilităţiilor (p-value):<br />
INF<br />
pZ(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />
d_IP 0 2.89E-08 1.2297 3.48E-08 0.1443<br />
d_IR 0 1.0517 9.32E-09 0.1048<br />
d_Cr 0 1.0775 1.7942<br />
d_RSD 0 0.1443<br />
d_Volum<br />
0<br />
Valorile lui p-value colorate in albastru sunt semnificative (
Matricea valorilor coeficientului <strong>de</strong> corelaţie Kendall tau-b:<br />
τb(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />
d_IP 1 0.9293 0.0481 0.9239 0.2446<br />
d_IR 1 0.0107 0.962 0.2717<br />
d_Cr 1 0.016 0.2086<br />
d_RSD 1 0.2446<br />
d_Volum<br />
Matricea valorilor parametrului testului Z:<br />
1<br />
Z(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />
d_IP INF 5.5987 -0.2933 5.566 1.4733<br />
d_IR INF -0.0652 5.7951 1.637<br />
d_Cr INF -0.0978 -1.2711<br />
d_RSD INF 1.4733<br />
d_Volum<br />
Matricea probabilităţiilor (p-value):<br />
INF<br />
pZ(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />
d_IP 0 2.16E-08 1.2307 2.61E-08 0.1407<br />
d_IR 0 1.052 6.83E-09 0.1016<br />
d_Cr 0 1.0779 1.7963<br />
d_RSD 0 0.1407<br />
d_Volum<br />
Matricea valorilor coeficientului <strong>de</strong> corelaţie Kendall tau-b:<br />
0<br />
τc(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />
d_IP 1 0.855 0.045 0.85 0.225<br />
d_IR 1 0.01 0.885 0.25<br />
d_Cr 1 0.015 0.195<br />
d_RSD 1 0.225<br />
d_Volum<br />
Matricea valorilor parametrului testului Z:<br />
1<br />
Z(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />
d_IP INF 5.3188 -0.2787 5.2877 1.3997<br />
d_IR INF -0.0619 5.5054 1.5552<br />
d_Cr INF -0.0929 -1.2076<br />
d_RSD INF 1.3997<br />
d_Volum<br />
Matricea probabilităţiilor (p-value):<br />
INF<br />
pZ(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />
d_IP 0 1.05E-07 1.2195 1.24E-07 0.1616<br />
d_IR 0 1.0494 3.68E-08 0.1199<br />
d_Cr 0 1.074 1.7728<br />
d_RSD 0 0.1616<br />
d_Volum<br />
0<br />
Valorile lui p-value colorate în albastru sunt semnificative (
d_RSD YES NO<br />
d_Volum YES<br />
2007A2. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi<br />
dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />
S-a participat pentru dobândire <strong>de</strong> competenţe complementare la Accelrys Science Forum<br />
2007 <strong>de</strong>sfăşurat la Cambridge în perioada 12-13 noiembrie 2007.<br />
Forumul a cuprins două secţiuni <strong>de</strong> prezentări ştiinţifice ale celor mai recente realizări ale<br />
companiei americane Accelrys şi colaboratorilor acesteia.<br />
Firma multinaţională Accelrys este profilată pe producerea <strong>de</strong> soft specializat şi <strong>de</strong>dicat<br />
pentru aplicaţii biomedicale şi farmaceutice (acesta fiind unul din publicurile ţintă ale sale) şi<br />
aplicaţii chimice şi <strong>de</strong> ştiinţa materialelor (acesta fiind cel <strong>de</strong>-al doilea public ţintă al său).<br />
Prima secţiune <strong>de</strong> prezentări ştiinţifice a cuprins cele mai recente realizări şi provocări în<br />
domeniul aplicaţiilor biomedicale şi farmaceutice.<br />
A doua secţiune <strong>de</strong> prezentări ştiinţifice a cuprins cele mai recente realizări şi provocări în<br />
domeniul aplicaţiilor chimice şi <strong>de</strong> ştiinţa materialelor.<br />
În cadrul forumului au fost cuprinse şi două secţiuni hands-on, aceasta însemnând instruire<br />
pe care reprezentanţii companiei au oferit-o participanţilor cu aplicaţiile soft <strong>de</strong>zvoltate <strong>de</strong> aceştia.<br />
În continuare sunt discutate prezentările susţinute.<br />
Secţiunea <strong>de</strong> aplicaţii biomedicale şi farmaceutice<br />
█ Gareth WILDEN (Department of medicinal chemistry, AstraZeneca R & D Charnwood,<br />
Loughborough, Leicestershire, UK) a susţinut prezentarea "GA: PP Using Pipeline Pilot as a<br />
Genetic Algorithm" în care după o scurtă prezentare a ceea ce a fost <strong>de</strong>zvoltat anterior, şi anume:<br />
÷ Procesul <strong>de</strong> <strong>de</strong>sign al librăriei;<br />
÷ Enumerarea completă a librăriei;<br />
÷ Obţinerea scorului compuşilor bazat pe violaţiile <strong>de</strong> tip Lipinski (numai compuşii cu cel mai<br />
mare scor - cea mai mare abatere - sunt eliminaţi în acest stadiu<br />
÷ Analiza vecinătăţii <strong>de</strong> vârfuri versus banca <strong>de</strong> compuşi<br />
÷ Filtrarea chimică<br />
÷ hERG, AMES, Solubilitate, Metabolit reactiv (filtrare şi sistem <strong>de</strong> atenţionare)<br />
÷ Gruparea pe categorii bazată pe amprente (alegerea iterativă din categorii până când numărul<br />
necesar <strong>de</strong> compuşi este selectat; compuşii cu cel mai mic scor sunt selectaţi primii)<br />
a prezentat problematica actuală şi soluţiile care în perspectiva autorului se profilează şi anume:<br />
÷ Problema ridicată <strong>de</strong> chimie: Cum se poate inclu<strong>de</strong> acoperirea farmacoforă în analiza<br />
diversităţii<br />
÷ Existenţa şi accesibilitatea locală a amprentelor structurale (metoda <strong>de</strong> clasificare prin<br />
excluziune sferică pentru a obţine avantajul amprentării structurale <strong>de</strong> acest tip, cu validare<br />
internă corectă<br />
÷ Dezvoltarea proce<strong>de</strong>elor <strong>de</strong> amprentare internă a farmacoforilor (în relaţie directă cu utilizarea<br />
aceleiaşi meto<strong>de</strong> <strong>de</strong> clasificare ca mai sus)<br />
÷ Cum adăugarea a încă unei amprente <strong>de</strong> farmacofor aduce o acoperire suplimentară<br />
█ Darren FAYNE, Tim JAMES, Andrew KNOX, Giorgio CARTA, David G. LLOYD (Molecular<br />
Design Group, School of Biochemistry and Immunology, Trinity College Dublin, Irlanda) au<br />
susţinut prezentarea High-throughput virtual screening drug discovery, în care după o scurtă<br />
prezentare a stadiului cunoaşterii, şi anume:<br />
÷ Diagrama <strong>de</strong> lucru în Drug Design - Faza I - Crearea mo<strong>de</strong>lului <strong>de</strong> receptor<br />
÷ Diagrama <strong>de</strong> lucru în Drug Design - Faza II - Evaluarea protocolului <strong>de</strong> examinare şi evaluare<br />
sistematică pentru i<strong>de</strong>ntificare substanţelor şi atributelor nedorite<br />
÷ Diagrama <strong>de</strong> lucru în Drug Design - Faza III - Aplicaţii ale protocolului <strong>de</strong> examinare şi<br />
28
evaluare sistematică pentru i<strong>de</strong>ntificare substanţelor şi atributelor nedorite<br />
÷ Paradigma complexităţii în Drug Design (spaţiul director - dimensiune <strong>de</strong> ordinul zecilor;<br />
spaţiul optimizat/virtual - dimensiune <strong>de</strong> ordinul zecilor <strong>de</strong> mii; spaţiul protocolului <strong>de</strong><br />
examinare şi evaluare sistematică - dimensiune <strong>de</strong> ordinul milioanelor; spaţiul <strong>de</strong>tectării chimice<br />
- dimensiune <strong>de</strong> ordinul zecilor <strong>de</strong> miliar<strong>de</strong>; spaţiul chimiei medicinale - dimensiune <strong>de</strong> ordinul<br />
10 60 )<br />
prezentarea şi-a concentrat atenţia asupra problematicii actuale şi a soluţiilor propuse:<br />
÷ Încre<strong>de</strong>rea în bazele <strong>de</strong> date pentru ER (adică setul <strong>de</strong> date Bissantz)<br />
÷ Rezultatele obţinute din andocare<br />
÷ Construcţia unui bun set <strong>de</strong> învăţare<br />
÷ Efectul SMILES: Conformeri<br />
÷ Funcţiile <strong>de</strong> scor şi ce sunt acestea<br />
÷ Studiu <strong>de</strong> caz la îmbogăţirea valorilor pentru funcţii <strong>de</strong> scor<br />
÷ Soluţii ale cercetării şi producerea unei noi funcţii <strong>de</strong> scor<br />
÷ Crearea unor noi instrumente pentru <strong>de</strong>sign molecular - fFLASH (al firmei IBM)<br />
÷ Protocoale <strong>de</strong> fixare rigidă<br />
÷ Protocoale în linie <strong>de</strong> aşteptare/procesare - librării şi pre-procesare<br />
÷ Conformeri, andocare şi atribuire <strong>de</strong> scor<br />
Discuţia a continuat cu prezentarea componentelor sistemului în <strong>de</strong>taliu şi anume:<br />
÷ Corina (modul ce poate fi executat pe o maşină in<strong>de</strong>pen<strong>de</strong>ntă)<br />
÷ Diagrama <strong>de</strong> reţea şi curgerea proceselor<br />
÷ Omega (manipulator configurabil şi noduri <strong>de</strong> execuţie)<br />
÷ Andocare şi atribuire <strong>de</strong> scor - modulul FRED (şi legătura acestuia cu date <strong>de</strong> analiză <strong>de</strong> raze X<br />
stocate în fişiere Brookhaven PDB; andocare ghidată)<br />
÷ Analiza şi interpretarea rezultatelor<br />
÷ Modulul HITS (modulul predictiv)<br />
÷ Distribuirea lucrului în sistem<br />
÷ Concluzii obţinute din <strong>de</strong>rularea exeprimentului prezentat<br />
█ Tim CLARK (Centre of Computational Chemistry, Friedrich-Alexan<strong>de</strong>r University, Erlangen,<br />
Nürnberg, Germania, Centre for Molecular Design, University of Portsmouth, Portsmouth, UK, şi<br />
Editor-in-Chief, Journal of Molecular Mo<strong>de</strong>ling, Springer, Germania) a susţinut prezentarea<br />
Surface-Based in silico Techniques, în care după o scurtă prezentare a participanţilor la proiectul<br />
prezentat:<br />
÷ Centre of Computational Chemistry, Friedrich-Alexan<strong>de</strong>r University, Erlangen, Nürnberg,<br />
Germania<br />
÷ Centre for Molecular Design, University of Portsmouth, Portsmouth, UK<br />
÷ Department of Computer Science, University of Aber<strong>de</strong>en, Aber<strong>de</strong>en, UK<br />
÷ Cepos InSilico Ltd, Erlangen, Germania<br />
a meto<strong>de</strong>lor folosite:<br />
÷ AM1 (Austin Mo<strong>de</strong>l 1)<br />
÷ Molecular Electrostatics (în legătură directă cu metoda MNDO)<br />
÷ B3LYP/6-31G(d)<br />
÷ MP2/6-31G(d)<br />
a trecut la prezentarea <strong>de</strong> ansamblu:<br />
÷ Proprietăţi locale (potenţial electrostatic molecular, interacţii cu probe, formă, proprietăţi<br />
<strong>de</strong>rivate din orbitali)<br />
÷ Descriptori pentru QSAR (eliminarea tuturor <strong>de</strong>scriptorilor specifici pentru atom/substructură;<br />
pot <strong>de</strong>scriptorii statistici bazaţi pe proprietăţi locale să performeze la fel <strong>de</strong> bine?)<br />
÷ QSAR convenţional (puncte <strong>de</strong> fierbere pentru N = 5453 molecule - !)<br />
÷ Mo<strong>de</strong>le integrale pe suprafeţe<br />
29
÷ Energii libere <strong>de</strong> hidratare (în mediu neutru)<br />
÷ CypScore<br />
÷ Mo<strong>de</strong>le bazate pe ParaSurf - proprietăţi atomice <strong>de</strong> suprafaţă<br />
÷ Setul <strong>de</strong> validare public<br />
÷ Setul <strong>de</strong> validare internă<br />
÷ Extensii armonice sferice<br />
÷ Descrierea suprafeţei<br />
÷ Potenţialul electrostatic molecular<br />
÷ Aliniamentul rapid ParaFit<br />
█ Peter HAYNES (Materials and Physics Department, Imperial College London) a susţinut<br />
prezentarea Linear-scaling Density-functional Theory for Life Sciences al cărui subiect principal a<br />
fost realizarea şi utilizarea aplicaţiei ONETEP. Codul ONETEP a fost construit pentru a efectua<br />
calcule <strong>de</strong> scară largă înalt eficiente cu aceeaşi acurateţe ca meto<strong>de</strong>le tradiţionale bazate pe primul<br />
principiu. Prezentarea a fost orientată către ilustrarea facilităţilor codului ONETEP care îl fac în<br />
special foarte potrivit pentru studiul sistemelor biologice, ilustrate <strong>de</strong> studiul inhibiţiei kinazelor<br />
<strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> ciclină.<br />
█ C. M. Venkatchalam (Cercetător, Accelrys) a susţinut prezentarea A Rational Approach to<br />
Receptor-flexible Docking: Method and Validation Results. În prezentare s-a susţinut că evi<strong>de</strong>nţa<br />
experimentală arată că structurile proteice adoptă o conformaţie variată când liganzi diferiţi sunt<br />
legaţi <strong>de</strong> acestea. În opinia prezentatorului, metoda <strong>de</strong> investigare <strong>de</strong> înaltă rezoluţie în general<br />
implică o singură structură <strong>de</strong> receptor cu o largă varietate <strong>de</strong> liganzi. De asemenea, oricum,<br />
flexibilitatea proteinelor poate juca un rol vital în mecanismul <strong>de</strong> andocare al ligandului. Echipa <strong>de</strong><br />
<strong>cercetare</strong> coordonată <strong>de</strong> prezentator a observat utilizând Discovery Studio (produs soft<br />
comercializat <strong>de</strong> Accelrys) o metodă automată pentru andocarea liganzilor când flexibilitatea<br />
ligandului şi a lanţului proteic sunt ambele luate în consi<strong>de</strong>rare. Rezultatele andocării liganzilor<br />
pentru câteva sisteme proteice au fost obţinute şi investigate. Metoda prezentată are avantajul că<br />
poate fi uşor extinsă pentru a consi<strong>de</strong>ra schimbările ciclice <strong>de</strong> conformaţie.<br />
Secţiunea <strong>de</strong> aplicaţii <strong>de</strong> chimie şi ştiinţa materialelor<br />
█ James ELLIOTT (Materials Mo<strong>de</strong>lling Group, Department of Engineering, University of<br />
Cambridge) a susţinut prezentarea A Semi-Empirical Molecular Orbital Study of Fullerene-<br />
Encapsulated Mo-S/Mo-O Nanoclusters în care problematica încapsulării <strong>de</strong> atomi şi ioni metalici<br />
în structura nanofulerenelor a fost investigată cu ajutorul mo<strong>de</strong>lării moleculare. Aglomerările <strong>de</strong><br />
metale tranziţionale nanoscopice sunt folosite pe scară largă în creşterea catalitică a nanotuburilor<br />
<strong>de</strong> carbon (CNTs) sintetizate utilizând procesul <strong>de</strong> <strong>de</strong>punere chimică din vapori (CVD). Este<br />
cunoscut că adiţia oxigenului la calcogenii grei cum este sulful <strong>de</strong>opotrivă produce creşterea ratei <strong>de</strong><br />
<strong>de</strong>punere a CNT şi promovează <strong>de</strong>punerea selectivă a straturilor simple şi duble <strong>de</strong> CNTs. Grupul<br />
coordonat <strong>de</strong> prezentator au raportat rezultate <strong>de</strong> calcul semi-empiric <strong>de</strong> orbitali moleculari<br />
(utilizând Materials Studio şi VAMP - produse <strong>de</strong> firma Accelrys) ale aglomerărilor <strong>de</strong> Mo-S şi<br />
Mo-O, care <strong>de</strong>monstrează schimbările care au loc în structura electronică şi sunt cauzate <strong>de</strong> aditivii<br />
folosiţi.<br />
█ Andrei GUSEV (Researcher, MatSim GmbH Zürich şi Professor, Department of Materials, Swiss<br />
Fe<strong>de</strong>ral Institute of Technology Zürich) a susţinut prezentarea Finite Element Approaches to<br />
Mesoscopic Materials Mo<strong>de</strong>lling al cărui subiect l-a constituit utilizarea meto<strong>de</strong>i elementului finit în<br />
mo<strong>de</strong>larea nanomaterialelor. Astfel, simulările <strong>de</strong> dinamică moleculară prezic că transportul gazelor<br />
în interiorul nanotuburilor <strong>de</strong> carbon (CNT) este cu câteva ordine <strong>de</strong> mărime mai rapidă <strong>de</strong>cât în<br />
orice alt maretial cunoscut. Grupul <strong>de</strong> <strong>cercetare</strong> coordonat <strong>de</strong> prezentator a utilizat tehnologia<br />
elementului finit oferită <strong>de</strong> platforma PLAMYRA/GRIDDER pentru a estima performanţa <strong>de</strong><br />
permeabilitate a membranelor matriciale mixte CNT/polimer. Colectivul <strong>de</strong> <strong>cercetare</strong> a <strong>de</strong>monstrat<br />
că astfel <strong>de</strong> membrane pot într-un mod favorabil să combine performanţa <strong>de</strong> flux ridicat a<br />
nanotuburilor cu selectivitatea intrinsecă a matricilor polimerice.<br />
█ Sam FRENCH (Senior Scientist, Johnson Matthey) a susţinut prezentarea Mo<strong>de</strong>lling Reactions at<br />
the Active Sites of Chiral Ruthenium Catalysts using Density Functional Theory. Scurta secţiune<br />
30
introductivă în subiectul prezentării a cuprins subiecte <strong>de</strong> actualitate <strong>de</strong>spre cataliză şi tehnologii<br />
chirale. Astfel, selectivitatea este un factor cheie <strong>de</strong> succes pe piaţa tehnologiilor <strong>de</strong> catalişti chirali.<br />
Înţelegerea proceselor fundamentale care apar când un reactiv interacţionează cu un sit simplu şi<br />
omogen <strong>de</strong> catalizator, în situl activ şi în absenţa acestuia, este <strong>de</strong>ci esenţial pentru <strong>de</strong>signul raţional<br />
al noilor catalişti. Catalizatorii <strong>de</strong> hidrogenare bazaţi pe ruteniu asimetrici au făcut parte dintr-un<br />
proiect <strong>de</strong> <strong>cercetare</strong> colaborativă al grupului reprezentat <strong>de</strong> prezentator [(S)-XyIBINAP-RuH2-<br />
(S,S)-DPEN], primul <strong>de</strong>scoperit <strong>de</strong> Noyori [Ryoji NOYORY, Asymmetric catalysis: Science and<br />
opportunities (nobel lecture), Angewandte Chemie - International Edition, 41(12), p. 2008-2022,<br />
2002], [Ryoji NOYORY, T. Ohkuma, Asymmetric catalysis by architectural and functional<br />
molecular engineering: Practical chemo- and stereoselective hydrogenation of ketones, Angewandte<br />
Chemie - International Edition, 40(1), p. 40-73, 2001] şi [Masato KITAMURA, Masaki<br />
TSUKAMOTO, Yuhki BESSHO, Masahiro YOSHIMURA, Uwe KOBS, Michael WIDHALM,<br />
Ryoji NOYORY, Mechanism of asymmetric hydrogenation of α-(acylamino)acrylic esters<br />
catalyzed by BINAP-ruthenium(II) diacetate, Journal of the American Chemical Society, 124(23),<br />
p. 6649-6667, 2002] este studiat ca patent sau mo<strong>de</strong>l prototip pentru o serie <strong>de</strong> catalizatori <strong>de</strong><br />
hidrogenare eficienţi, printre aceştia numărându-se catalizatori bazaţi pe familiile <strong>de</strong> liganzi P-Phos,<br />
PhanePhos, şi ParaPhos [Antonio ZANOTTI-GEROSA, William HEMS, Michelle GROARKE,<br />
Fred HANCOCK, Ruthenium-catalysed asymmetric reduction of ketones, Platinum Metals Review,<br />
49(4), p. 158-165, 2005].<br />
█ Asen ASENOV (Device Mo<strong>de</strong>lling Group, Department of Electronics and Electrical<br />
Engineering, Glasgow University) a susţinut prezentarea (care în opinia noastră a fost dintre cele<br />
mai valoroase prezentări) Simulation of Atomic Scale Effects in Nano-CMOS Devices. Fluctuaţiile<br />
parametrilor intrinseci asociate cu discretizarea sarcinii şi atomicitatea materiei sunt acum unii<br />
dintre factorii majori <strong>de</strong> limitare a scalei, a integrării şi a reducerii tensiunii aplicate şi puterii<br />
consumate. Profesorul Asenov a prezentat cele mai noi <strong>de</strong>scoperiri în simularea fluctuaţiilor <strong>de</strong><br />
variabilitate la scală atomică în componentele nano CMOS utilizând tehnicile <strong>de</strong> difuzie <strong>de</strong> drift<br />
(DD), Monte Carlo (MC) şi transport cuantic (QT). A discutat <strong>de</strong> asemenea necesitatea unei legături<br />
strânse între aceste componente şi mo<strong>de</strong>larea materialelor. Secţiunea introductivă a prezentării a<br />
cuprins:<br />
÷ Continuarea scenariului More Moore<br />
÷ Viitoarele MOSFET-uri sunt componentele la scară atomică<br />
÷ Discretizarea sarcinii şi materiei introduce variabilitate<br />
÷ Variabilitatea <strong>de</strong>vine o durere <strong>de</strong> cap majoră<br />
÷ Variabilitatea <strong>de</strong>ja şi-a arătat efectele adverse<br />
Prezentarea a continuat cu expunerea surselor <strong>de</strong> variabilitate:<br />
÷ Dopanţi întâmplători discreţi<br />
÷ Linii <strong>de</strong> separaţie iregulate<br />
÷ Iregularităţi ale interfeţelor<br />
÷ Margini formate din grăunţe <strong>de</strong> polisilicon<br />
÷ Morfologia pentru к înalt<br />
Secţiunea aplicativă a prezentării a cuprins tehnicile <strong>de</strong> simulare:<br />
÷ Corecţii ale soluţiilor cuantice pentru electroni şi goluri utilizând DG<br />
÷ IPF combinate în MOSFET-uri conglomerate<br />
÷ Sarcina suplimentară în conglomeratele MOSFET<br />
÷ Investigarea impurităţilor folosind Ab-initio în ansambluri Monte Carlo<br />
÷ Simularea IPF necesită simulări statistice tridimensionale<br />
÷ Rugozitatea interfeţei în simulările bidimensionale NEGF<br />
÷ Rugozitatea interfeţei în simulările tridimensionale NEGF<br />
÷ Dopanţi întâmplători în simulările bidimensionale NEGF<br />
÷ Dopanţi întâmplători în simulările tridimensionale NEGF<br />
Legătura între <strong>de</strong>signul componentelor nano şi mo<strong>de</strong>larea materialelor a cuprins următoarele<br />
31
subiecte <strong>de</strong> interes:<br />
÷ Impactul regiunii tranziţionale Si/SiO2 în calculele <strong>de</strong> străpungere a porţii<br />
÷ Incluziunea <strong>de</strong> stive-poartă cu к înalt<br />
÷ Variabilitatea conductibilităţii la tunelarea porţii<br />
÷ Structura <strong>de</strong> bandă în componentele UTB<br />
÷ Analiza rugozităţii în ansambluri Monte-Carlo folosind metoda Ab-initio<br />
Secţiunea <strong>de</strong> final a prezentării a cuprins cele mai importante concluzii <strong>de</strong>sprinse din provocările cu<br />
care se confruntă acum tehnologia nanocomponentelor semiconductoare:<br />
÷ Tranzistorii CMOS se apropie <strong>de</strong> ordinul <strong>de</strong> mărime atomic<br />
÷ Simularea necesită rezoluţie la scară atomică<br />
÷ Efectele <strong>de</strong> la scară atomică implică o variabilitate sporită<br />
÷ Legătura cu primele principii ale simulării materialelor <strong>de</strong>vin obligatorii<br />
█ Stephen TODD (Product Manager, Accelrys) a susţinut prezentarea Future Developments in<br />
Materials Studio 4.2 în conjuncţie cu prezentarea <strong>de</strong> ansamblu a produsului Materials Studio oferit<br />
<strong>de</strong> firma Accelrys, cu marcarea noilor funcţionalităţi introduse cu ajutorul limbajului <strong>de</strong> scriptare<br />
MaterialsScript, prin intermediul noii interfeţe Gaussian şi Adsorption Locator şi în contextul celor<br />
mai noi <strong>de</strong>scoperiri ale Nanotechnology Consortium. Prezentarea a început prin expunerea<br />
proiectelor <strong>de</strong> <strong>cercetare</strong> în care în prezent firma Accelrys este implicată:<br />
÷ Materials Visualizer (segregarea volumelor atomice, performanţă în utilizarea memoriei)<br />
÷ Simulări (editarea câmpurilor <strong>de</strong> forţe, dinamica moleculară fin divizată, proiectul GULP)<br />
÷ Mezoscala (<strong>de</strong>zvoltarea instrumentelor suport pentru îmbunătăţirea instrumentelor la mezoscală,<br />
analiză, utilitate)<br />
÷ Mecanica cuantică şi cataliza: CASTEP<br />
÷ Mecanica cuantică şi cataliza: DMol<br />
÷ Mecanica cuantică şi cataliza: VAMP<br />
÷ Mecanica cuantică şi cataliza: Guassian® UI<br />
÷ Mecanica cuantică şi cataliza: adsorbţia<br />
÷ Mecanica cuantică şi cataliza: ONETEP<br />
÷ Mecanica cuantică şi cataliza: QMERA<br />
÷ Nanotechnology Consortium<br />
÷ Discovery Studio<br />
█ Patricia GESTOSO-SOUTO (Senior Scientist, Accelrys) a susţinut prezentarea New Science in<br />
Contact Research Services: Case Studies, SIG’s and Recent Initiatives cu accent pe cercetări pentru<br />
surse <strong>de</strong> energie alternativă şi mo<strong>de</strong>larea ţesutului pielii umane. Prezentarea s-a concentrat pe<br />
următoarele subiecte cheie:<br />
÷ Activităţi specifice ale serviciilor <strong>de</strong> contractare a cercetării<br />
÷ Studiu <strong>de</strong> caz: Îmbunătăţirea formulărilor pentru industria cosmetică<br />
÷ Actualităţi pentru grupuri speciale <strong>de</strong> interes (polimeri pentru celule <strong>de</strong> energie, polimeri<br />
industriali, (noi) polimeri compoziţi avansaţi)<br />
÷ Alte iniţiative recente (cercetări <strong>de</strong> energie alternativă, mo<strong>de</strong>larea ţesutului pielii umane)<br />
█ Richard GILBERT (Principal Scientist, e2v Biosensors), autor a 15 patente şi 25 lucrări evaluate<br />
prin procedura peer-review (incluzând câteva articole în Nature şi în Analytical Chemistry and<br />
Biochemistry) a susţinut prezentarea Versatile Biosensor Labels (în opinia noastră fiind una dintre<br />
cele mai valoroase prezentări). În ultimele două <strong>de</strong>cenii biosenzorii şi-au mărit impactul în ştiinţele<br />
vieţii şi piaţa <strong>de</strong> echipamente medicale, şi încep a fi utilizaţi ca instrumente <strong>de</strong> <strong>cercetare</strong> primare în<br />
multe laboratoare. Biosenzorii sunt componente care utilizează reacţiile chimice şi biologice pentru<br />
a <strong>de</strong>tecta analiţi în probă, în mod tipic monitorizând nivelul unor proteine sau acizi nucleici specifici<br />
în lichi<strong>de</strong> biologice cum sunt sângele sau extractele celulare. Sunt o multitudine <strong>de</strong> tehnologii <strong>de</strong><br />
<strong>de</strong>tecţie biosenzorială, fiecare dintre ele aducând după sine proprile sale beneficii şi restricţii, şi care<br />
sunt uzual cerute <strong>de</strong> <strong>de</strong>zvoltarea unor sisteme specifice <strong>de</strong> i<strong>de</strong>ntificare chimică pentru a face cea mai<br />
bună utilizare a tehnologiilor senzoriale. Autorul prezentării a susţinut că utilizarea lui Materials<br />
32
Studio (al companiei Accelrys) a permis companiei pe care o reprezintă e2v să <strong>de</strong>zvolte o chimie<br />
i<strong>de</strong>ntificativă generică care poate fi aplicată la o varietate <strong>de</strong> tehnici <strong>de</strong> <strong>de</strong>tecţie. De usa singură,<br />
interfaţa <strong>de</strong> lucru pentru i<strong>de</strong>ntificare chimică a fost <strong>de</strong>zvoltată şi este compatibilă cu tehnologiile<br />
senzoriale dintre cele mai diverse, cum sunt electrochimia, fluorescenţa, chemiluminescenţa,<br />
electroluminescenţa şi spectroscopia Raman, dar oricum se adresează tuturor principalelor tipuri <strong>de</strong><br />
<strong>de</strong>tecţie din uzul curent.<br />
2007A3. Selectare (abstracts), colectare (full text) informaţii private (pay per view), din publicaţii<br />
Elsevier & Springer<br />
S-au selectat un număr <strong>de</strong> 11 lucrări <strong>de</strong> interes al căror conţinut reprezentativ pentru proiect<br />
este redat în continuare.<br />
÷ Lucrare: Quantitative structure-property relationship study of n-octanol-water partition<br />
coefficients of some of diverse drugs using multiple linear regression<br />
÷ Autori: Jahanbakhsh Ghasemi, Saadi Saaidpour<br />
÷ Sursa: Analytica Chimica Acta, 2007, Volum 604(2), p. 99-106<br />
÷ Rezumat:<br />
A quantitative structure-property relationship (QSPR) study was performed to <strong>de</strong>velop mo<strong>de</strong>ls<br />
those relate the structures of 150 drug organic compounds to their n-octanol-water partition<br />
coefficients (log Po/w). Molecular <strong>de</strong>scriptors <strong>de</strong>rived solely from 3D structures of the molecular<br />
drugs. A genetic algorithm was also applied as a variable selection tool in QSPR analysis. The<br />
mo<strong>de</strong>ls were constructed using 110 molecules as training set, and predictive ability tested using<br />
40 compounds. Mo<strong>de</strong>ling of log Po/w of these compounds as a function of the theoretically<br />
<strong>de</strong>rived <strong>de</strong>scriptors was established by multiple linear regression(MLR). Four <strong>de</strong>scriptors for<br />
these compounds molecular volume (MV) (geometrical), hydrophilic–lipophilic balance (HLB)<br />
(constitutional), hydrogen bond forming ability (HB) (electronic) and polar surface area (PSA)<br />
(electrostatic) are taken as inputs for the mo<strong>de</strong>l.<br />
The use of <strong>de</strong>scriptors calculated only from molecular structure eliminates the need for<br />
experimental <strong>de</strong>termination of properties for use in the correlation and allows for the estimationof<br />
log Po/w for molecules not yet synthesized. Application of the <strong>de</strong>veloped mo<strong>de</strong>l to a testing set<br />
of 40 drug organic compounds <strong>de</strong>monstrates that the mo<strong>de</strong>l is reliable with good predictive<br />
accuracy and simple formulation. The prediction results are in good agreement with the<br />
experimental value. The root mean square error of prediction (RMSEP) and square correlation<br />
coefficient (R 2 ) for MLR mo<strong>de</strong>l were 0.22 and 0.99 for the prediction set log Po/w.<br />
÷ Detalii <strong>de</strong> interes:<br />
The aim of this work is the <strong>de</strong>velopment, using theoretical molecular <strong>de</strong>scriptors, and the proposal<br />
of externally validated general QSPR mo<strong>de</strong>ls for the prediction of log Po/w for a wi<strong>de</strong> and<br />
heterogeneous set of drug organic compounds. The great advantage of theoretical <strong>de</strong>scriptors is<br />
that they can be calculated homogeneously by <strong>de</strong>.ned software for all chemicals, even those not<br />
yet synthesized, the only need being a hypothesized chemical structure. The results indicate that<br />
the GA is a very effective variable selection approach for QSPR analysis. Multiple linear<br />
regressions (MLR) have been used for structure–property relationship analysis for a set of 150<br />
drug compounds. The results obtained from this study indicate that four <strong>de</strong>scriptors, molecular<br />
volume (MV), hydrophilic–lipophilic balance (HLB), hydrogen bond forming ability (HB) and<br />
polar surface area (PSA), play an important role on the n-octanol/water partition coef.cients of<br />
drug structures. Predictive QSPR mo<strong>de</strong>l which is based on molecular <strong>de</strong>scriptors is proposed in<br />
this study to correlate the log Po/w of drug compounds. Application of the <strong>de</strong>veloped mo<strong>de</strong>l to a<br />
testing set of 40 compounds <strong>de</strong>monstrates that the new mo<strong>de</strong>l is reliable with good predictive<br />
accuracy and simple formulation.Since the QSPR was <strong>de</strong>veloped on the basis of theoretical<br />
molecular <strong>de</strong>scriptors calculated exclusively from molecular structure, the proposed mo<strong>de</strong>l could<br />
potentially provi<strong>de</strong> useful information about the log Po/w of drug compounds. Thisprocedure<br />
33
allowed us to achieve a precise and relatively fast method for <strong>de</strong>termination of log Po/w of<br />
different series of drug compounds and to predict with suf.cient accuracy the log Po/w of new drug<br />
<strong>de</strong>rivatives.<br />
÷ Lucrare: A multiple linear regression and partial least squares study of flavonoid compounds<br />
with anti-HIV activity<br />
÷ Autori: C. N. Alves, J. C. Pinheiro, A. J. Camargo, M. M. C. Ferreira, R. A. F. Romero, A. B. F.<br />
da Silva<br />
÷ Sursa: Journal of Molecular Structure: THEOCHEM, 2001,Volum 541(1-3), p. 81-88<br />
÷ Rezumat:<br />
The molecular orbital semi-empirical method PM3 was employed to calculate a set of molecular<br />
properties (variables or <strong>de</strong>scriptors) of 21 flavonoid compounds with anti-HIV activity. The<br />
correlation between biological activity and structural properties was obtained by using the<br />
multiple linear regression and partial least squares methods. The mo<strong>de</strong>l obtained showed not only<br />
statistical significance but also predictive ability. The significant molecular <strong>de</strong>scriptors related to<br />
the compounds with anti-HIV activity were: electronegativity (χ) and the charges on atoms C3<br />
and C7 (Q3 and Q7, respectively). These variables led to a physical explanation of electronic<br />
molecular property contributions to HIV inhibitory potency.<br />
÷ Detalii <strong>de</strong> interes:<br />
Significant regression equations were obtained by multiple linear regression and partial least<br />
squares methods for 20 flavonoid compounds according to their anti-HIV activity. The best<br />
regression equation obtained was based on the following <strong>de</strong>scriptors: electronegativity (χ) and<br />
atomic charges on atoms C3 and C7 (Q3 and Q7, respectively). The mo<strong>de</strong>l obtained showed not<br />
only statistical significance but also predictive ability and revealed that higher values for χ<br />
combined with high positive charges on C7 and high negative charges on C3 lead to an<br />
increasing of the anti-HIV activity. These variables allowed a physical explanation of electronic<br />
molecular properties contributing to HIV inhibitory potency as the electronic character relates<br />
directly to the electron distribution of interacting molecules at the active site.<br />
A comparison of the performance between the MLR and PLS mo<strong>de</strong>ls showed the PLS have<br />
substantially better predictive capability than the MLR mo<strong>de</strong>l, even thought their correlation<br />
coefficients are comparable. This indicates clearly that the correlation coefficient by itself is not a<br />
good parameter for testing the mo<strong>de</strong>l performance. Also, it has been shown that PLS is an<br />
excellent tool for those cases where the <strong>de</strong>scriptors are by any means correlated.<br />
÷ Lucrare: A faster algorithm for ridge regression of reduced rank data<br />
÷ Autori: Douglas M. Hawkins, Xiangrong Yin<br />
÷ Sursa: Computational Statistics & Data Analysis 40 (2002), p. 253 - 262<br />
÷ Rezumat:<br />
Regression data sets typically have many more cases than variables, but this is not always the<br />
case. Some current problems in chemometrics-for example fitting quantitative structure activity<br />
relationships-may involve fitting linear mo<strong>de</strong>ls to data sets in which the number of predictors far<br />
exceeds the number of cases. Ridge regression is an approach that has some theoretical foundation<br />
and has performed well in comparison with alternatives such as PLS and subset regression. Direct<br />
implementation of the regression formulation leads to a O(np 2 +p 3 ) calculation, which is<br />
substantial if p is large. We show that ridge regression may be performed in a O(np 2 )<br />
computation-a potentially large saving when p is larger than n. The algorithm lends itself to the<br />
use of case weights, to robust boun<strong>de</strong>d influence fitting, and cross-validation. The method is<br />
illustrated with a chemometric data set with 255 predictors, but only 18 cases, a ratio not unusual<br />
in QSAR problems.<br />
÷ Detalii <strong>de</strong> interes:<br />
The residuals from the ridge regression have variance (1−hi)σ2, and so internally stu<strong>de</strong>ntized<br />
residuals can be computed in the usual way from the ridge residuals, leverages, and setting up the<br />
ridge regression with weights leads to a number of possibilities.<br />
34
Setting the weights equal to 1 gives a conventional ridge regression. If the residuals from this<br />
regression show signs of heteroscedasticity, then the regression may be repeated with weights to<br />
correct it.<br />
This framework also allows for fitting M-estimates of the regression function, and/or for<br />
boun<strong>de</strong>d-influence regressions. For either of these purposes, the case weights wi are recomputed<br />
iteratively, with cases whose leverage, whose absolute residual, or whose influence is ‘large’<br />
being downweighted. In either of these applications, there may be some interplay between the<br />
ridge constant and the weights.<br />
÷ Lucrare: Smallest confi<strong>de</strong>nce intervals for one binomial proportion<br />
÷ Autor: Weizhen Wang<br />
÷ Sursa: Journal of Statistical Planning and Inference, 2006, Volum 136(12), p. 4293-4306<br />
÷ Rezumat:<br />
We specify three classes of one-si<strong>de</strong>d and two-si<strong>de</strong>d 1−α confi<strong>de</strong>nce intervals with certain<br />
monotonicity and symmetry on the confi<strong>de</strong>nce limits for the probability of success, the parameter<br />
in a binomial distribution. For each class of one-si<strong>de</strong>d confi<strong>de</strong>nce intervals the smallest interval, in<br />
the sense of the set inclusion, is obtained based on the direct analysis of coverage probability<br />
functions. A simple sufficient and necessary condition for the existence of the smallest two-si<strong>de</strong>d<br />
confi<strong>de</strong>nce interval is provi<strong>de</strong>d and the smallest interval is <strong>de</strong>rived if it exists. Thus the proposed<br />
intervals are uniformly most accurate, and have the uniformly minimum expected length as well.<br />
÷ Detalii <strong>de</strong> interes:<br />
In this paper, we use the set inclusion to <strong>de</strong>ci<strong>de</strong> whether one interval is superior than another.For<br />
the one-si<strong>de</strong>d interval, the solution is final since the smallest interval always exists and cannot be<br />
improved any further. Therefore, the Clopper–Pearson method in<strong>de</strong>ed yields the best one-si<strong>de</strong>d<br />
interval. For the two-si<strong>de</strong>d interval we provi<strong>de</strong> a precise condition un<strong>de</strong>r which the smallest<br />
interval exists for one proportion. This condition is of more theoretical interest because the<br />
smallest interval exists only when n or α is quite small. The nonexistence, however, may explain<br />
why statisticians after several <strong>de</strong>ca<strong>de</strong>s still cannot reach an agreement about which is the “best”<br />
interval. The Crow (1956) interval is equal to the Blyth and Still (1983) interval if the smallest<br />
interval exists and they are typically different otherwise. Nevertheless, it seems reasonable using<br />
the set inclusion to <strong>de</strong>fine a “better” interval, especially for one-si<strong>de</strong>d intervals. A much more<br />
interesting problem for the future research is how to construct the smallest interval when there<br />
exist nuisance parameters.<br />
÷ Lucrare: Fast computation of cross-validated properties in full linear leave-many-out procedures<br />
÷ Autor: Emili Besalú<br />
÷ Sursa: Journal of Mathematical Chemistry, Vol. 29, No. 3, 2001<br />
÷ Rezumat:<br />
A general theorem which allows the fast and direct computation of predicted properties in a full<br />
multiple linear leave-many-out procedure is <strong>de</strong>monstrated by induction. The result allows the<br />
<strong>de</strong>scription of a general algorithm which only requires a single multiple linear regression<br />
calculation. From the data generated by this fitting, in a full leave-n-out procedure involving a set<br />
of m objects, the resolution of linear systems of equations of dimension n×n suffices to obtain all<br />
the sets of cross-validated properties.<br />
÷ Detalii <strong>de</strong> interes:<br />
General algorithm and explicit expressions for particular cases. From the previous results, a<br />
practical and fast way to obtain predictions coming from a full linear LnO procedure is envisaged.<br />
The general algorithm to be followed is systematic and very simple:<br />
1. Given the matrix X, compute the predictions matrix H in equation<br />
H = {hij} = X[X T X] -1 X T<br />
2. Given the vector y, compute the coefficient vector c in equation<br />
C = [X T X] -1 X T y<br />
3. Obtain the vector of fitted data y_ using equation<br />
35
y' = (y1', y2', …, ym') = Xc = Hy<br />
4. Fix n, the number of leaving molecules.<br />
5. Loop over all the molecular subsets M(n). For every subset:<br />
5.1. Solve the linear system<br />
5.2. Keep the predicted values.<br />
In QSAR studies it is very common to search for an optimal set of representative <strong>de</strong>scriptors. The<br />
algorithm <strong>de</strong>scribed in previous section can be conceived as to be a tool which gives a statistic, rcv<br />
attached to a set of them, those <strong>de</strong>fining the matrix X. It is obvious that the algorithm can be<br />
repeated as many times as sets of <strong>de</strong>scriptors are tested in a QSAR project. Hence, the whole<br />
procedure furnishes a new method for selecting the best set of <strong>de</strong>scriptors according to the criteria<br />
of maximization of the value rcv. This will be presumably the most immediate utility of the<br />
LnOT. In this case, in or<strong>de</strong>r to speed up the process, it is not only recommen<strong>de</strong>d to implement the<br />
practical expressions outlined in previous section but also not to perform the gaussian fitting<br />
<strong>de</strong>scribed above. It is faster to obtain the correlation coefficients directly from the set of arithmetic<br />
mean values attached to every series of molecular cross-validated values.<br />
The leave-n-out theorem has been <strong>de</strong>monstrated.and as a consequence, general and explicit<br />
expressions attached to full linear leave-many-out cross-validation processes have been given. The<br />
formulation will allow to easily construct computer co<strong>de</strong>s oriented to be applied to QSAR<br />
problems and other fields.<br />
÷ Lucrare: A partial least squares regression study with antioxidant flavonoid compounds<br />
÷ Autori: Karen C. Weber, Kathia M. Honorio, Aline T. Bruni, Adriano D. Andricopulo, Alberico<br />
B. F. da Silva<br />
÷ Sursa: Structural Chemistry, 2006, Volum 17(3), p. 307-313<br />
÷ Rezumat:<br />
The quantitative structure-activity relationship of a set of 19 flavonoid compounds presenting<br />
antioxidant activity was studied by means of PLS (Partial Least Squares) regression. The<br />
optimization of the structures and calculation of electronic properties were done by using<br />
thesemiempirical method AM1. A reliable mo<strong>de</strong>l (r 2 =0.806 and q 2 =0.730) was obtained and<br />
from this mo<strong>de</strong>l it was possible to consi<strong>de</strong>r some aspects of the structure of the flavonoid<br />
compounds studied that are related with their free radical scavenging ability. The quality of the<br />
PLS mo<strong>de</strong>l obtained in this work indicates that it can be used in or<strong>de</strong>r to <strong>de</strong>sign new flavonoid<br />
compounds that present ability to scavenge free radicals.<br />
÷ Detalii <strong>de</strong> interes:<br />
From Table 5 we can see that the samples are very well fitted, as the residuals of prediction are<br />
very small (0.02–0.04). This constitutes a strong indication that the mo<strong>de</strong>l is reliable since it<br />
consistently predicted the TEAC values of the test set.Through the validation tests applied in the<br />
mo<strong>de</strong>l we can suggest that it can be used for un<strong>de</strong>rstanding and predicting the antioxidant activity<br />
of new flavonoid compounds before their synthesis and tests against free radicals. Furthermore,<br />
the use of a multivariate methodology to build a regression mo<strong>de</strong>l allows us to <strong>de</strong>al with various<br />
features of flavonoid compounds that can be related to their reactivity with free radicals,<br />
especially the influence of substitutents that are not hydroxyls, what constitutes a more complete<br />
<strong>de</strong>scription of the problem than taking into account only the number or the presence of hydroxyl<br />
groups at certain positions.<br />
36
÷ Lucrare: Quantitative structure-activity relationship (QSAR) studies of quinolone antibacterials<br />
against M. fortuitum and M.smegmatis using theoretical molecular <strong>de</strong>scriptors<br />
÷ Autori: Manish C. Bagchi, Denise Mills, Subhash C. Basak<br />
÷ Sursa: Journal of Molecular Mo<strong>de</strong>ling, 2007, Volume 13 (1), 2007<br />
÷ Rezumat:<br />
The inci<strong>de</strong>nce of tuberculosis infections that are resistant to conventional drug therapy has risen<br />
steadily in the last <strong>de</strong>ca<strong>de</strong>. Several of the quinolone antibacterials have been examined as<br />
inhibitors of M. tuberculosis infection as well as other mycobacterial infections. However, not<br />
much has been done to examine specific structure–activity relationships of the quinolone<br />
antibacterials against mycobacteria. The present paper <strong>de</strong>scribes quantitative structure–activity<br />
relationship mo<strong>de</strong>ling for a series of antimycobacterial compounds. Most of the antimycobacterial<br />
compounds do not have sufficient physicochemical data, and thus predictive methods based on<br />
experimental data are of limited use in this situation. Hence, there is a need for the <strong>de</strong>velopment of<br />
quantitative structure–activity relationship (QSAR) mo<strong>de</strong>ls utilizing theoretical molecular<br />
<strong>de</strong>scriptors that can be calculated directly from molecular structures. Descriptors associated with<br />
chemical structures of N-1 and C-7 substituted quinolone <strong>de</strong>rivatives as well as 8-substituted<br />
quinolone <strong>de</strong>rivatives with good antimycobacterial activities against M. fortuitum and M.<br />
smegmatis have been evaluated. Ridge regression (RR), Principal component regression (PCR),<br />
and partial least squares (PLS) regression were used, comparatively, to <strong>de</strong>velop predictive mo<strong>de</strong>ls<br />
for antibacterial activity, based on the activities of the above compounds. The in<strong>de</strong>pen<strong>de</strong>nt<br />
variables inclu<strong>de</strong> topostructural, topochemical and 3-D geometrical indices, which were used in a<br />
hierarchical fashion in the mo<strong>de</strong>l-<strong>de</strong>velopment process. The predictive ability of the mo<strong>de</strong>ls was<br />
assessed by the cross-validated R 2 . Comparison of the relative effectiveness of the various classes<br />
of molecular <strong>de</strong>scriptors in the regression mo<strong>de</strong>ls shows that the easily calculable topological<br />
indices explain most of the variance in the data.<br />
÷ Detalii <strong>de</strong> interes:<br />
Prior to mo<strong>de</strong>l <strong>de</strong>velopment, the activity values were scaled by natural logarithm as their values<br />
differed by many or<strong>de</strong>rs of magnitu<strong>de</strong>. Conventional ordinary least squares (OLS) regression<br />
cannot be used when the number of molecular <strong>de</strong>scriptors exceeds the number of observations<br />
37
[25]. In this<br />
situation, three alternative linear regression methods may be consi<strong>de</strong>red, these are a) Ridge<br />
Regression(RR), b) Principal Component Regression(PCR) and c) Partial Least Squares(PLS).<br />
These three methods are also very useful even when the in<strong>de</strong>pen<strong>de</strong>nt variables are highly<br />
correlated. In the ridge regression method, <strong>de</strong>scriptors are transformed into principal components<br />
(PCs). All of the principal components are used in the regression, but they are first shrunk<br />
differentially according to their eigenvalues and a ridging constant. In the principal components<br />
regression, the <strong>de</strong>scriptors are transformed into principal components after which a subset of the<br />
PCs is used in an ordinary least square regression. Partial least squares also uses a set of linear<br />
combinations of the <strong>de</strong>scriptors but, in this approach, the <strong>de</strong>pen<strong>de</strong>nt variable is also consi<strong>de</strong>red in<br />
this step. Each of these methods makes use of the entire available pool of in<strong>de</strong>pen<strong>de</strong>nt variables as<br />
opposed to selecting a subset, which introduces bias and may result in the elimination of important<br />
parameters from the study. Formal comparisons have consistently shown subsetting to be less<br />
effective than alternative methods, such as these, that retain all of the in<strong>de</strong>pen<strong>de</strong>nt variables and<br />
use other approaches to <strong>de</strong>al with the rank <strong>de</strong>ficiency [26]. Statistical theory suggests that RR is<br />
the best of the three methods and this has been generally borne out in multiple comparative studies<br />
[26–28]. As such, the RR mo<strong>de</strong>ls <strong>de</strong>veloped in the current study are analyzed in more <strong>de</strong>tail than<br />
the PCR and PLS mo<strong>de</strong>ls. The RR vector of regression coefficients, b, is given by b = (X T X+kI) -<br />
1 X T Y, where X is the matrix of <strong>de</strong>scriptors, Y is the vector of observed activities, I is an i<strong>de</strong>ntity<br />
matrix, and k is a nonnegative constant known as the “ridge” constant.<br />
÷ Lucrare: Multivariate analysis of experimental and computational <strong>de</strong>scriptors of molecular<br />
lipophilicity<br />
÷ Autori: Raimund Mannholda, Gabriele Crucianib, Karl Drossc, Roelof Rekkerd<br />
÷ Sursa: Journal of Computer-Ai<strong>de</strong>d Molecular Design, Volume 12, Number 6, 1998, p. 573-<br />
581(9).<br />
÷ Rezumat:<br />
Two experimental (log P, RMw) and 17 calculation <strong>de</strong>scriptors for molecular lipophilicity<br />
(fragmental, atom-based for based on molecular properties) were investigated by multivariate<br />
analysis for a database of 159 compounds including both simple structures as well as more<br />
complex drug molecules. Principal component analysis (PCA) of the entire database exhibits a<br />
clustering of chemical groups; preciseness of clustering corresponds to chemical similarity. Thus,<br />
diversity searching in databases might effectively be performed by PCA on the basis of<br />
calculatedlog P. The comparative validity check of experimental and computational procedures by<br />
regression analysis and PCA was performed with a chemically balanced, reduced data set (n D 55)<br />
representing 11 chemical groups with 5 members each. Regression of experimental <strong>de</strong>scriptors<br />
(log Poct versus RMw) proves that chromatographic data, obtained un<strong>de</strong>r well-<strong>de</strong>fined<br />
experimental conditions, can be used as valid substitutes for log P. Regression of calculated versus<br />
experimental lipophilicity data shows a superiority of fragmental over atom-based methods and<br />
approaches based on molecular properties, as indicated by correlation coefficients, slopes and<br />
intercepts. Inaddition, PCA revealed that fragmental methods (Rekker-type, KOWWIN, KLOGP)<br />
sense the compound ranking in log P data to almost the same extent as experimental approaches.<br />
For atom-based procedures and CLOGP, both the comparability of absolute values and the<br />
sensing of the compound ranking in the database are slightly less. This trend is more pronounced<br />
for the methods based on molecular properties, with the exception of BLOGP.<br />
÷ Detalii <strong>de</strong> interes:<br />
Validity check of calculation methods by regression analysis and PCA. Regression analysis of<br />
calculated versus experimental data shows that in general fragmental methods are superior to<br />
atom-based and 3D-related approaches. These results are in accord with our earlier analysis with a<br />
smaller dataset [35]. A limited applicability is often attributed to fragmental methods due to<br />
missing fragment values. This is true for CLOGP and Rekker-type methods, but not for<br />
KOWWIN. Information obtained by PCA on the same dataset, in general parallels the regression<br />
data, but unravels more precisely the comparability in absolute values and the reflection of<br />
38
compound ranking in the database. Accordingly, the ranking of calculation methods observed in<br />
regression analysis is confirmed, exceptional behaviour of CLOGP and BLOGP, however, is only<br />
<strong>de</strong>tected by PCA.<br />
2007A4. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi<br />
dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />
În a doua fază a dobândirii <strong>de</strong> competenţe complementare prin participări la manifestări ştiinţifice /<br />
stagii <strong>de</strong> documentare-<strong>cercetare</strong> s-a planificat pentru perioada 6-14 <strong>de</strong>cembrie participarea la<br />
următoarele:<br />
÷ University of Oxford, Computational Biology Reseach Group, cursul <strong>de</strong> instruire intitulat<br />
"Introduction to Bioinformatics at CBRG", 7 <strong>de</strong>cembrie 2007<br />
÷ Dublin Molecular Medicine Centre, cursul <strong>de</strong> instruire intitulat "DMMC Course: Techniques<br />
and Strategies in Molecular Medicine", 10-13 <strong>de</strong>cembrie 2007<br />
÷ Trinity College Dublin, Centre for Synthesis & Chemical Biology, simpozionul intitulat "Recent<br />
Advances in Synthesis and Chemical Biology VI", 14 <strong>de</strong>cembrie 2007<br />
Programul evenimentelor planificate este redat în tabelul <strong>de</strong> mai jos:<br />
"Introduction to Bioinformatics at CBRG", 7 <strong>de</strong>cembrie 2007<br />
This course is inten<strong>de</strong>d for new users and/or anyone not familiar with using their molbiol account<br />
for bioinformatics analysis. It will be held in the Medical Sciences Teaching Centre (behind the<br />
Dunn School of Pathology on South Parks Road).<br />
The day-long course is <strong>de</strong>signed to be run in two sessions:<br />
The first session will introduce you to the many bioinformatics analysis tools that are now<br />
available on this web site. The course will also introduce you to EMBOSS Explorer - a suite of<br />
bioinformatics software inten<strong>de</strong>d largely as a replacement for GCG. You will be shown how to<br />
carry out some basic bioinformatics analyses - for example:<br />
access the databases on our servers to retrieve sequence files<br />
examine sequence file formats<br />
run restriction analysis software<br />
carry out sequence alignments and produce publishable images of the aligned sequences<br />
search databases using BLAST<br />
It will also introduce you to other more specialised tools - BASE and MASCOT - that will allow<br />
you to analyse your microarray and proteomics data respectively.<br />
Second session: Some of the bioinformatics tools are only available on our Unix servers and the<br />
second session will introduce the Unix computing facilities available via your molbiol account.<br />
We will show you how to connect to the CBRG Unix machines and introduce you to the Unix<br />
environment in general.<br />
You will be introduced to some of the features of the programs from the morning session that are<br />
not available via the web. There will be a brief introduction to the Sta<strong>de</strong>n package of software<br />
used for the analysis of dna sequencing chromatograms.<br />
The course is not inten<strong>de</strong>d to be a comprehensive gui<strong>de</strong> to all the bioinformatics packages<br />
available at the CBRG. Instead it is <strong>de</strong>signed to show you the kind of analysis software that is<br />
available to you via your account. It should ensure that you also know where to look to find<br />
similar software on the CBRG web site and on orac and to find help with any of the software on<br />
the system.<br />
"DMMC Course: Techniques and Strategies in Molecular Medicine", 10-13 <strong>de</strong>cembrie 2007<br />
This course, running over four mornings, is <strong>de</strong>signed to give bioscientists and clinicians a broad<br />
overview of research techniques and their application. Basic molecular biology laboratory<br />
experience is assumed, but you should not need prior knowledge of the techniques covered in the<br />
course.<br />
This course, running over four mornings, is <strong>de</strong>signed to give bioscientists and clinicians a broad<br />
39
overview of research techniques and their application. Basic molecular biology laboratory<br />
experience is assumed, but you should not need prior knowledge of the techniques covered in the<br />
course.<br />
The objective for postgraduate teaching is to give stu<strong>de</strong>nts a broad basic knowledge of bioscience<br />
research techniques and technologies, including those not currently used in their own<br />
project/laboratory that may be of future use. We recommend that postgraduate stu<strong>de</strong>nts attend the<br />
whole course (DMMC Course Attendance Certificates are only provi<strong>de</strong>d for complete<br />
attendance).<br />
Follow the links below to read an abstract of each lecture, together with supplementary reading in<br />
some cases.<br />
ANALYSING GENES (Mon 10 Dec; 0930-1300)<br />
Session Chair: Dr Ross McManus, TCD<br />
0930 RNA Detection and quantitation Dr Shane Duggan, TCD<br />
The protein components of the cell are <strong>de</strong>rived by numerous processes indirectly interpreted from a genetic element<br />
known as the “gene” which is co<strong>de</strong>d in the cellular DNA. This element is interpreted by the cell in a process called<br />
“transcription” where the genetic co<strong>de</strong> for a particular gene is converted into a molecular co<strong>de</strong> known as messenger<br />
RNA (mRNA). This mRNA molecule can now be utilised in the creation of a new protein via the translation process.<br />
In this lecture the nature and analysis of Ribonucleic acid (RNA) in biological systems will be explored. The<br />
un<strong>de</strong>rstanding of this has allowed the laboratory scientist to interrogate and explore gene expression as it may relate to<br />
diseases or cell signalling. Extraction and quantitation of good quality RNA will be discussed as they are the first step<br />
in any investigation of gene expression. Standard techniques in common use such as Northern blotting and cycle<br />
limited RT-PCR shall also be <strong>de</strong>scribed as well as more mo<strong>de</strong>rn techniques such as real time RT-PCR analysis. This<br />
lecture will allow the interpretation of published literature utilising these techniques and introduce the steps involved<br />
in performing RNA related techniques in your laboratory.<br />
1015 Differential gene expression: overview of relevant methods Prof William Gallagher, UCD<br />
This lecture will summarise the main approaches used to <strong>de</strong>termine alterations in gene expression at the RNA level.<br />
Emphasis will be placed in this context on global approaches that attempt to map differences in the transcriptome, i.e.<br />
entire complement of transcripts in a cell. Methodologies that will be addressed inclu<strong>de</strong> differential display,<br />
subtractive hybridization, high-throughput sequencing (ESTs and SAGE), and DNA microarray technologies. Key<br />
examples from the literature will be utilised to illustrate examples of investigators applying these technologies to<br />
un<strong>de</strong>rstand biological phenomena, with a focus on disease-related processes. An indication of the relevant<br />
infrastructure and expertise to carry out this work within the DMMC will be presented.<br />
Review articles<br />
Lennon, G. G. (2000). High-throughput gene expression analysis for drug discovery. Drug Discovery Today, 5, 59-<br />
66.<br />
Schulze, A. and Downward, J. (2001). Navigating gene expression using microarrays – a technology review. Nature<br />
Cell Biology, 3, E190-E195.<br />
1100 Coffee/Tea<br />
1130 Mutation <strong>de</strong>tection, SNP analysis and genetic linkage Prof Denis Shields, UCD<br />
Different strategies are required to i<strong>de</strong>ntify rare and common genetic variants un<strong>de</strong>rlying both rare and common<br />
diseases. For common genetic variants, there is now a very rich dataset of i<strong>de</strong>ntified common single nucleoti<strong>de</strong><br />
polymorphisms (SNPs). These can be investigated in disease groups (compared to controls) in candidate genes, or by<br />
whole genome association analysis. Analysis of these genes requires careful attention to the patterns of association of<br />
SNPs that are chromosomally adjacent (in linkage disequilibrium). Linkage analysis (tracking in families the disease<br />
co-inheritance with wi<strong>de</strong>ly spaced gene markers) is the traditional approach of choice for rare mutations that have<br />
strong phenotypic effects. High throughput sequencing of candidate regions (and in future whole genomes) are<br />
accelerating the rate of data accumulation.<br />
1215 Mo<strong>de</strong>l organisms Dr Breandán Kennedy, UCD<br />
The goal of this lecture is to discuss animal mo<strong>de</strong>ls that are routinely applied to biomedical research. The advantages<br />
of using Drosophila (fly), Xenopus (frog), Danio (zebrafish), Gallus (chicken) and Mus Musculus (mouse) as mo<strong>de</strong>l<br />
organisms will be <strong>de</strong>scribed. The life-cycle, generation time, embryo <strong>de</strong>velopment and amenability of these<br />
organisms to genetic manipulation will be discussed. An emphasis will be placed on <strong>de</strong>scribing mutagenesis screens.<br />
This technique, in which the genes in the genome are randomly inactivated, has been extensively applied to the<br />
fly/fish mo<strong>de</strong>ls and has accelerated our un<strong>de</strong>rstanding of gene function (functional genomics).<br />
MANIPULATING GENES (Tue 11 Dec; 0930-1300)<br />
Session Chair: Dr Ross McManus, TCD<br />
0930 DNA cloning strategies Dr Ross McManus, TCD<br />
Even in the post genome era, DNA cloning is essential to the manipulation and stable propagation of genetic material.<br />
This talk will cover the basic aspects of DNA cloning, ranging from the anatomy of cloning vectors to the choice of<br />
40
vectors based on the cloning strategy employed. The strategy employed will <strong>de</strong>pend on the overall objectives of the<br />
project and the nature of the starting information or material available. Thus different choices and approaches would<br />
be employed for a sequencing project compared with a genome mapping project or production of RNA or protein. I<br />
will discuss a number of basic and specialised cloning strategies to illustrate some of the options and possibilities<br />
available.<br />
1015 RNA interference Dr Jane Farrar, TCD<br />
1100 Coffee/Tea<br />
1130 Transgenics and knockouts Dr Derek Brazil, UCD<br />
This lecture will provi<strong>de</strong> a broad overview of the strategies used to generate both transgenic and knockout mice,<br />
starting from the generation of the DNA constructs using cDNAs or genomic DNA, and proceeding through<br />
embryonic stem cell biology, to aggregation and chimeric mouse generation. Details on genotyping of transgenic<br />
animals, as well as phenotype characterization will be discussed. Specific examples such as the IRS-2 knockout will<br />
be cited.<br />
1215 Molecular therapies - false hope or the future of medicine? Dr Ruth Foley, TCD<br />
Molecular medicine has allowed the i<strong>de</strong>ntification of new targets and new approaches to treat human disease. The<br />
lecture will focus on some of these strategies, including targeting signal transduction pathways, use of monoclonal<br />
antibody based approaches and the numerous gene therapy strategies that are currently being evaluated. An overview<br />
of the different methodologies will be presented and the current situation on the clinical application of these<br />
approaches will be consi<strong>de</strong>red. Focusing particularly on cancer therapies as a mo<strong>de</strong>l system, the advances and<br />
challenges of the different approaches will be presented and discussed.<br />
PROTEINS (Wed 12 Dec; 0930-1300)<br />
Session Chair: Dr Niamh Moran, RCSI<br />
0930 Protein expression and purification<br />
Dr Henry Windle, TCD<br />
This lecture will cover the basics of protein expression and purification. Emphasis will be placed on alternative<br />
strategies and issues that should be consi<strong>de</strong>red prior to selection of specific expression systems and purification<br />
strategies. As protein purification methodologies are generally well <strong>de</strong>scribed and accessible, only a brief overview of<br />
these will be given but with emphasis on common problems that can arise, particularly for those about to attempt<br />
purification for the first time. The following books from The Practical Approach series by IRL Press are an invaluable<br />
aid with <strong>de</strong>tailed and reliable protocols: Protein Purification Applications; Protein Purification Methods (2001, Editor<br />
Simon Roe).<br />
Gallus (chicken) and Mus Musculus (mouse) as mo<strong>de</strong>l organisms will be <strong>de</strong>scribed. The life-cycle, generation time,<br />
embryo <strong>de</strong>velopment and amenability of these organisms to genetic manipulation will be discussed. An emphasis will<br />
be placed on <strong>de</strong>scribing mutagenesis screens. This technique, in which the genes in the genome are randomly<br />
inactivated, has been extensively applied to the fly/fish mo<strong>de</strong>ls and has accelerated our un<strong>de</strong>rstanding of gene<br />
function (functional genomics).<br />
1015 Determining protein: protein interactions in biology Dr Niamh Moran, RCSI<br />
During the past two <strong>de</strong>ca<strong>de</strong>s, mass spectrometry has become a major technique for the i<strong>de</strong>ntification, characterisation<br />
and quantification of biological molecules and bioactive drugs. In particular, the impact of mass spectrometry on<br />
proteomics and metabolomics has been phenomenal.<br />
This lecture will outline some of the applications of mass spectrometry in mo<strong>de</strong>rn life sciences and introduce course<br />
participants to basic vocabulary and concepts in biological mass spectrometry.<br />
1100 Coffee/Tea<br />
1130 Introduction to Mass Spectrometry<br />
Dr Achim Treumann, RCSI<br />
During the past two <strong>de</strong>ca<strong>de</strong>s, mass spectrometry has become a major technique for the i<strong>de</strong>ntification, characterisation<br />
and quantification of biological molecules and bioactive drugs. In particular, the impact of mass spectrometry on<br />
proteomics and metabolomics has been phenomenal.<br />
This lecture will outline some of the applications of mass spectrometry in mo<strong>de</strong>rn life sciences and introduce course<br />
participants to basic vocabulary and concepts in biological mass spectrometry.<br />
1215 Proteomic technologies Prof Steve Pennington, UCD<br />
CELLS & TISSUES (Thu 13 Dec; 0930-1300)<br />
Session Chair: Dr William Watson, UCD<br />
0930 Immuno<strong>de</strong>tection methods on cell and tissue extracts Dr Leonie Young, RCSI<br />
The use of antibodies to <strong>de</strong>tect and characterise proteins has been well established. With the <strong>de</strong>velopment of high<br />
through-put techniques such as tissue microarrays (TMA), a real challenge now exists to <strong>de</strong>termine the cellular<br />
location, level of expression and the function of these i<strong>de</strong>ntified proteins. In this lecture, principles fundamental to<br />
immuno<strong>de</strong>tection will be outlined. Common pitfalls and measures to avoid these will be discussed. Applications of<br />
immuno<strong>de</strong>tection in a mo<strong>de</strong>rn molecular context will be illustrated, including: western blotting, ELISA,<br />
immunohistochemistry/ immunofluorescence, tissue microarrays, co-immunprecipitation, Electromobility shift<br />
41
assays, chromatin immunoprecipitation (ChIP) and antibody arrays.<br />
1015 Cell imaging and sorting - flow cytometry<br />
Dr William Watson, UCD<br />
Flow cytometry is a method for quantitating components or structural features of cells, primarily by optical means.<br />
Although it makes measurements on one cell at a time, it can process thousands of cells in a few seconds. Since cell<br />
types can be distinguished by quantitating structural features, flow cytometry can be used to count prokaryotic or<br />
eukaryotic cells of different types in complex mixtures.<br />
1100 Coffee/Tea<br />
1130 High Content Analysis of nanoparticle/cell interactions Dr Yuri Volkov, TCD<br />
Fluorescent organic tags have represented one of the major tools in the arsenal of researchers working in the<br />
biomedical sciences for more that two <strong>de</strong>ca<strong>de</strong>s. The progress in <strong>de</strong>velopment of new fast and efficient research and<br />
diagnostic methods is largely <strong>de</strong>pen<strong>de</strong>nt on the availability of fluorescent probes with <strong>de</strong>sired cell receptor- and<br />
organelle specificity and optimised experimental protocols for their utilization.<br />
A unique opportunity to generate a wi<strong>de</strong> spectrum of such probes suitable for applications in living cells is offered by<br />
semiconductor quantum dots (QDs). As fluorescent probes QDs have several advantages over organic dyes, including<br />
wi<strong>de</strong> absorption profiles, tunable emission spectra, and superior photostability. QDs have been shown to readily<br />
distribute across animal cells, tissues and organs. Today, QDs with different physico-chemical properties and<br />
functionalities are readily available worldwi<strong>de</strong>. However, further exploitation of QDs in biomedical studies has been<br />
hin<strong>de</strong>red by the absence of a<strong>de</strong>quate technological platforms capable of performing multi-parametric quantitative<br />
analysis of individual responses in specific cell types.<br />
Recent years have witnessed a rapid progress in the <strong>de</strong>velopment of novel methods permitting high-resolution<br />
visualisation of cell receptor dynamics and intracellular biochemical processes utilizing fluorescent probes. Among<br />
these, high content screening (HCS) technology allows to perform analysis of molecular interactions in individual<br />
cells and their populations at the sub-cellular level un<strong>de</strong>r physiological conditions. This technology not only facilitates<br />
<strong>de</strong>velopment of a better un<strong>de</strong>rstanding of the true functionality of target molecules in the living cells, but it can also<br />
promote <strong>de</strong>signing of highly informative screens for novel therapeutic drugs, including inhibitors at small molecule<br />
and gene therapy level applicable in inflammation and cancer.<br />
Here we will discuss the data <strong>de</strong>monstrating the influence of such factors as QDs size, charge and selective<br />
functionalisation on their membrane and subcellular localisation specificity and present an overview of advantages<br />
and hurdles on the way of merging nanotechnology and high content cell analysis.<br />
1215 Laser Capture Microdissection and in situ hybridisation Dr Orla Sheils, TCD<br />
Laser Capture Microdissection is a method for procuring pure cells from specific microscopic regions of tissue<br />
sections. Un<strong>de</strong>r the microscope, tissues are heterogeneous complicated structures with hundreds of different cell types<br />
locked in morphologic units. In disease pathologies, the diseased cells of interest are surroun<strong>de</strong>d by these<br />
heterogeneous tissue elements. Laser Capture Microdissection constitutes an essential upstream technology to<br />
molecular analysis methods studying evolving disease lesions in actual tissue.<br />
In Situ Hybridization techniques allow the <strong>de</strong>monstration of specific nucleic acid sequences within their cellular<br />
environment. A logical extension of early in situ hybridization (ISH) techniques, which exploited the ability to label<br />
DNA with high-energy fluorophores, is FISH. This technique is now applied in an increasing number of molecular<br />
diagnostic areas, including karyotype analysis, gene mapping, disease diagnosis, and therapeutic targeting.<br />
Course Instructors<br />
Dr Derek Brazil (UCD Conway Institute of Biomolecular & Biomedical Research)<br />
Dr Shane Duggan (Institute of Molecular Medicine & TCD)<br />
Dr Jane Farrar (TCIN & TCD)<br />
Dr Ruth Foley (Institute of Molecular Medicine, TCD)<br />
Prof William Gallagher (UCD Conway Institute of Biomolecular & Biomedical Research)<br />
Prof Dr Breandán Kennedy (UCD Conway Institute of Biomolecular & Biomedical Research)<br />
Prof Mark Lawler (Institute of Molecular Medicine, St James's Hospital & TCD)<br />
Dr Ross McManus (Institute of Molecular Medicine, St James's Hospital & TCD)<br />
Dr Niamh Moran (Institute of Biopharmaceutical Sciences, RCSI)<br />
Prof Steve Pennington (UCD Conway Institute of Biomolecular & Biomedical Research)<br />
Dr Orla Sheils (Institute of Molecular Medicine, TCD)<br />
Denis Shields (UCD Conway Institute of Biomolecular & Biomedical Research)<br />
Dr Achim Treumann (Institute of Biopharmaceutical Sciences, RCSI)<br />
Dr Yuri Volkov (Institute of Molecular Medicine, St James's Hospital & TCD)<br />
Dr William Watson (UCD Conway Institute of Biomolecular & Biomedical Research)<br />
Dr Henry Windle (Institute of Molecular Medicine, St James's Hospital & TCD)<br />
Dr Leonie Young (Royal College of Surgeons in Ireland & Beaumont Hospital)<br />
42
"Recent Advances in Synthesis and Chemical Biology VI", 14 <strong>de</strong>cembrie 2007<br />
8.45am Opening session<br />
Introductory remarks: Professor Thorri Gunnlaugsson<br />
Speaker: Professor John Hegarty, Provost, TCD<br />
9.00am-10.00am Chairperson: Professor Paul Murphy<br />
Professor Peter Seeberger<br />
‘From Microreactors to a Malaria Vaccine’<br />
10.00am-11.00am Chairperson: Professor Kevin Nolan<br />
Professor Thomas Carell<br />
‘Synthestic and Crystallographic studies of Tanskription and Replication through DNA<br />
lesions’<br />
11.00am-11.30am Coffee/Tea Break<br />
11.30am-12.30pm Chairperson: Dr Donal O’Shea<br />
GLAXOSMITHKLINE LECTURE<br />
Professor Michael J. Krische<br />
‘Formation of C-C Bonds via Catalytic Hydrogenation and Transfer Hydrogenation’<br />
12.30pm-1.15pm Lunch Break<br />
1.15pm-2.15pm Chairperson: Professor Mathias Senge<br />
ELI LILLY LECTURE<br />
Professor Chris Schofield<br />
‘The Chemistry of Oxygen Sensing’<br />
2.15pm-3.15pm Poster Session. Coffee/Tea Break<br />
3.15pm-4.15pm Chairperson: Professor John M. Kelly<br />
INSTITUT DE RECHERCHES SERVIER LECTURE<br />
Professor Andreé Kirsch - De Mesmaeker<br />
‘Ru(II) complexes un<strong>de</strong>r illumination. Can they be used in Chemical Biology?’<br />
4.15pm-5.15pm Chairperson: Dr Marc Devocelle<br />
Professor Mark Bradley<br />
‘Interfacing Combinatorial Chemistry with Microarrays’<br />
5.15pm Closing Remarks followed by half-hour Wine Reception<br />
Professor Pat Guiry<br />
2007A5. Selectare (abstracts), colectare (full text) informaţii private (pay per view), din publicaţii<br />
Taylor&Francis & Wiley&Sons<br />
S-au selectat o serie <strong>de</strong> articole reprezentative pentru domeniul <strong>de</strong> <strong>cercetare</strong> specific proiectului.<br />
Articolele selectate sunt redate în continuare:<br />
Nr Articol<br />
1 Inhibition of 7-ethoxycoumarin O-<strong>de</strong>ethylase activity in rat liver microsomes by naturally<br />
occurring flavonoids: structure-activity relationships<br />
Author: Ja-Young Moon Dong-Wook Lee Ki-Hyun Park<br />
DOI: 10.1080/004982598239623<br />
Publication Frequency: 12 issues per year<br />
Published in: Xenobiotica, Volume 28, Issue 2 February 1998 , pages 117 - 125<br />
Subjects: Pharmacology; Toxicology;<br />
Formats available: PDF (English)<br />
Abstract<br />
1. The inhibitory effects of several naturally occurring flavonoids and related compounds<br />
oncytochrome P450-<strong>de</strong>pen<strong>de</strong>nt 7-ethoxycoumarin O-<strong>de</strong>ethylase(ECOD) and the structure-activity<br />
relationships were studied in liver microsomes from rats treated with 3-methylcholanthrene (MC).<br />
2. All the flavonoids (flavone, apigenin, chrysin, flavonol, fisetin, kaempferol, morin, myrisetin,<br />
43
quercetin, flavanone, hesperetin and naringenin) studied inhibited microsomal ECOD activity in the<br />
following or<strong>de</strong>r: flavones > flavonols > flavanones, were mixed type inhibitors and had Ki in the<br />
range of 0·17-4·5 μM. (±)-Catechin had no effect. 3. The double bond between C2 and C3 of the C<br />
ring, the keto group and hydroxyl group of this ring in the flavonoids seem to play major roles in<br />
inhibiting the ECOD activity. 4. The hydroxyl groups in the C5 and C7 positions of A ring in the<br />
flavone and the hydroxyl group in the C3 position of C ring in the flavonol classes, respectively,<br />
were important factors for the inhibition of the enzyme. 5. In a series of 3, 5, 7-trihydroxyflavones,<br />
the hydroxyl group at the C4 in the B ring was also an important factor for the inhibition of ECOD<br />
activity, but hydroxyl groups in other positions of the B ring had little effect on the inhibition. 6.<br />
We conclu<strong>de</strong> that all the flavonoids studied inhibit ECOD activity by interfering with the binding of<br />
substrate to the active site and other site(s) of the enzyme and that their structural differences lead to<br />
different binding affinities at the active site and possibly to binding at other site(s) of the enzyme<br />
for the flavonoids.<br />
Nr Articol<br />
2 Structure-antioxidant Activity Relationships of Flavonoids: A Re-examination<br />
Authors: M. Manuela Silva a; Marta R. Santos a; Gonçalo Caroço a; Rui Rocha a; Gonçalo<br />
Justino a; Lur<strong>de</strong>s Mira<br />
Affiliation: a Departamento <strong>de</strong> Química e Bioquímica, Faculda<strong>de</strong> <strong>de</strong> Ciências da Universida<strong>de</strong> <strong>de</strong><br />
Lisboa, 1749-016 Lisboa, Portugal.<br />
DOI: 10.1080/1071576021000016472<br />
Publication Frequency: 12 issues per year<br />
Published in: Free Radical Research, Volume 36, Issue 11 2002 , pages 1219 - 1227<br />
Subjects: Cell Biology; Molecular Biology;<br />
Number of References: 45<br />
Formats available: PDF (English)<br />
Abstract<br />
The antioxidant and prooxidant activities of flavonoids belonging to several classes were studied to<br />
establish their structure-activity relationships against different oxidants. Special attention was paid<br />
to the flavonoids quercetin (flavone), taxifolin (flavanone) and catechin (flavanol), which possess<br />
different basic structures but the same hydroxylation pattern (3,5,7,3',4'-OH). It was found that<br />
these three flavonoids exhibited comparable antioxidant activities against different oxidants leading<br />
to the conclusion that the presence of ortho -catechol group (3',4'-OH) in the B-ring is <strong>de</strong>terminant<br />
for a high antioxidant capacity. The flavone kaempferol (3,5,7,4'-OH), however, in spite of bearing<br />
no catechol group, also presents a high antioxidant activity against some oxidants. This fact can be<br />
attributed to the presence of both 2,3-double bond and the 3-hydroxyl group, meaning that the basic<br />
structure of flavonoids becomes important when the antioxidant activity of B-ring is small.<br />
Keywords: Flavonoids; Antioxidant; Free Radicals; Structure-activity Relationships<br />
Nr Articol<br />
3 Fuzzy structure-activity relationships<br />
Author: B. T. Luke<br />
Affiliation: a SAIC-Fre<strong>de</strong>rick, Inc., Advanced Biomedical Computing Center, NCI Fre<strong>de</strong>rick,<br />
P.O. Box B, Fre<strong>de</strong>rick, MD 21702, USA.<br />
DOI: 10.1080/1062936021000058773<br />
Publication Frequency: 8 issues per year<br />
Published in: SAR and QSAR in Environmental Research, Volume 14, Issue 1 2003 , pages 41 - 57<br />
Subjects: Applied & Industrial Chemistry; Chemistry; Environmental & Ecological Toxicology;<br />
Environmental Sciences; History & Philosophy of Mathematics;<br />
Abstract<br />
While quantitative structure-activity relationships attempt to predict the numerical value of the<br />
activities, it is found that statistically good predictors do not always do a good job of qualitatively<br />
<strong>de</strong>termining the activity. This study shows how Fuzzy classifiers can be used to generate Fuzzy<br />
structure-activity relationships which can more accurately <strong>de</strong>termine whether or not a compound<br />
44
will be highly inactive, mo<strong>de</strong>rately inactive or active, or highly active. Four examples of these<br />
classifiers are presented and applied to a well-studied activity dataset.<br />
Keywords: Fuzzy Classifiers; Fuzzy Structure-activity Relationship; Selwood Data; K Nearest<br />
Neighbor (KNN)<br />
Nr Articol<br />
4 Medicinal Chemistry and Chemical Biology of New Generation Taxane Antitumor Agents<br />
Authors: Iwao Ojima a; Raphaël Geney a; Ioana Maria Ungureanu a; Dansu Li a<br />
Affiliation: a Chemistry Department, State University of New York at Stony Brook, Stony Brook,<br />
NY 11794-3400, USA.<br />
DOI: 10.1080/15216540212658<br />
Publication Frequency: 12 issues per year<br />
Published in: IUBMB Life, Volume 53, Issue 4 & 5 April 2002 , pages 269 - 274<br />
Subjects: Cell Biology; Molecular Biology;<br />
Abstract<br />
P-glycoprotein (P-GP)-based multidrug resistance (MDR) and un<strong>de</strong>sirable si<strong>de</strong> effects are<br />
significant drawbacks to the clinical use of paclitaxel and docetaxel. Extensive SAR studies of<br />
taxanes in these laboratories led to the discovery of new generation taxanes that are highly active<br />
against not only drug-sensitive but also drug-resistant human cancer cell lines as well as tumor<br />
xenografts in mice. One of these second generation taxanes, SB-T-110131 (IDN5109), exhibited<br />
excellent pharmacological profile in the preclinical studies and has been selected for clinical<br />
<strong>de</strong>velopment (re-co<strong>de</strong>d as Bay 59-8862), which is currently in the phase II clinical trials. Bay 59-<br />
8862 is orally active with high bioavailability, showing excellent activity against a variety of drugresistant<br />
tumors. "Advanced second generation taxanes" show essentially no difference in<br />
cytotoxicity against drug-resistant and drug-sensitive cell lines, virtually overcoming MDR.<br />
Photoaffinity labeling of P-GP using photoreactive radiolabeled paclitaxel analogs has disclosed the<br />
paclitaxel-binding domain of P-GP. Highly efficient taxane-based MDR reversal agents (TRAs)<br />
have also been <strong>de</strong>veloped, which can recover the cytotoxicity of paclitaxel to practically the original<br />
level against paclitaxel-resistant MDR expressing cancer cells. Highly promising results have<br />
emerged from the study of taxane-monoclonal antibody (MAb) immunoconjugates, which have<br />
been proved to specifically <strong>de</strong>liver extremely cytotoxic agents to tumor in an animal mo<strong>de</strong>l.<br />
Keywords: Anticancer Agent; Immunoconjugate; Multidrug Resistance; P-glycoprotein;<br />
Photoaffinity Label; Taxane; Tumor-activated Prodrug<br />
Nr Articol<br />
5 Quantum chemistry of macromolecular shape<br />
Author: Paul G. Mezey<br />
DOI: 10.1080/014423597230226<br />
Publication Frequency: 4 issues per year<br />
Published in: International Reviews in Physical Chemistry, Volume 16, Issue 3 July 1997 , pages<br />
361 - 388<br />
Subjects: Chemical Physics; Physical Chemistry;<br />
Abstract<br />
Some of the new <strong>de</strong>velopments in the quantum-chemical study of macromolecular shapes are<br />
reviewed, with special emphasis on the additive fuzzy electron <strong>de</strong>nsity fragmentation methods and<br />
on the algebraic-topological shape group analysis of global and local shape features of fuzzy threedimensional<br />
bodies of electron <strong>de</strong>nsities of macromolecules. Earlier applications of these methods<br />
to actual macromolecules are reviewed, including studies on the anticancer drug taxol, the proteins<br />
bovine insulin and HIV protease, and other macromolecules. The results of test calculations<br />
establishing the accuracy of these methods are also reviewed. The spherically weighted affine<br />
transformation technique is <strong>de</strong>scribed and proposed for the <strong>de</strong>formation of electron <strong>de</strong>nsities<br />
approximating the changes occurring in small conformational displacements of atomic nuclei in<br />
macromolecules.<br />
Nr Articol<br />
45
6 Hexagonoidal Partitioning and Quasi-Single Bonds in Benzenoid Hydrocarbons<br />
Authors: Tetsuo Morikawa a; Susumu Narita b; Ivan Gutman c<br />
Affiliations: a Department of Chemistry, Joetsu University of Education, Joetsu, Japan<br />
b Faculty of Textile Science and Technology, Shinshu University, Nagano, Japan<br />
c Faculty of Science, University of Kragujevac, Kragujevac, Serbia and Montenegro<br />
DOI: 10.1080/10406630490277489<br />
Publication Frequency: 5 issues per year<br />
Published in: Polycyclic Aromatic Compounds, Volume 24, Issue 1 January 2004 , pages 75 - 82<br />
Subjects: Analytical Chemistry; Astrophysics; Chemical Spectroscopy; Organic Chemistry;<br />
Thermodynamics & Kinetic Theory;<br />
Abstract<br />
The concept of fully benzenoid hydrocarbons (molecular graphs; FBHs) is generalized. Each fullhexagon<br />
unit (aromatic sextet) in a FBH is replaced with a larger "hexagon-shaped" unit (subgraph;<br />
e.g., naphthalene, pyrene, coronene, or ovalene units). Such a molecular species may be called a<br />
"fully hexagonoid" hydrocarbon (FHHs). The Pauling bond or<strong>de</strong>r calculation suggests that a bond<br />
(edge) which interlinks one hexagon-shaped unit with another in the bottom of bays of FHH is<br />
quasi-single, if the two units are connected by more than two bonds. As a consequence, the<br />
hexagon-shaped units are <strong>de</strong>localized locally in the hexagonoidal (graph-theoretical) partitioning.<br />
Keywords: arenoidal partitioning; fully benzenoid; fully hexagonoid; molecular <strong>de</strong>sign; Pauling<br />
bond or<strong>de</strong>r<br />
Nr Articol<br />
7 Novel matrix invariants for characterization of changes of proteomics maps<br />
Authors: M. Randi a; J. Zupan a; M. Novi a; B. D. Gute b; S. C. Basak b<br />
Affiliations: a National Institute of Chemistry, 1001 Ljubljana, Slovenia.<br />
b Natural Resources Research Institute, University of Minnesota at Duluth, 5013 Miller Trunk<br />
Hwy. Duluth, MN 55811, USA.<br />
DOI: 10.1080/1062936021000043436<br />
Publication Frequency: 8 issues per year<br />
Published in: SAR and QSAR in Environmental Research, Volume 13, Issue 7 & 8 2002 , pages<br />
689 - 703<br />
Subjects: Applied & Industrial Chemistry; Chemistry; Environmental & Ecological Toxicology;<br />
Environmental Sciences; History & Philosophy of Mathematics;<br />
Abstract<br />
Previous studies on mathematical characterization of proteomics maps by sets of map invariants<br />
were based on the construction of a set of distance-related matrices obtained by matrix<br />
multiplication of a single matrix by itself. Here we consi<strong>de</strong>r an alternative characterization of<br />
proteomics maps based on a set of matrices characterizing local features of an embed<strong>de</strong>d zigzag<br />
curve over the map. It is shown that novel invariants can well characterize proteomics maps.<br />
Advantages of the novel approach are discussed.<br />
Keywords: Eigenvalue Reduction; Graph Spectra; Local Matrices; Matrix Invariants; Proteomics<br />
Maps; Quantitative Proteomics<br />
Nr Articol<br />
8 Reactivity profiles of ligands of mammalian retinoic acid receptors: a preliminary COREPA<br />
analysis<br />
Authors: G. T. Ankley a; O. G. Mekenyan b; V. B. Kamenska b; P. K. Schmie<strong>de</strong>r a; S. P.<br />
Bradbury a<br />
Affiliations: a U.S. Environmental Protection Agency, National Health and Environmental Effects<br />
Research Laboratory, Mid-Continent Ecology Division, 6201 Congdon Boulevard, Duluth, MN<br />
55804 USA.<br />
b Laboratory of Mathematical Chemistry, Department of Physical Chemistry, Bourgas University<br />
"Prof. As. Zlatarov", 118010 Bourgas, Bulgaria.<br />
DOI: 10.1080/10629360290002839<br />
46
Publication Frequency: 8 issues per year<br />
Published in: SAR and QSAR in Environmental Research, Volume 13, Issue 2 2002 , pages 365 -<br />
377<br />
Subjects: Applied & Industrial Chemistry; Chemistry; Environmental & Ecological Toxicology;<br />
Environmental Sciences; History & Philosophy of Mathematics;<br />
Abstract<br />
Retinoic acid and associated <strong>de</strong>rivatives comprise a class of endogenous hormones that bind to and<br />
activate different families of retinoic acid receptors (RARs, RXRs), and control many aspects of<br />
vertebrate <strong>de</strong>velopment. I<strong>de</strong>ntification of potential RAR and RXR ligands is of interest both from a<br />
pharmaceutical and toxicological perspective. The recently <strong>de</strong>veloped COREPA (COmmon<br />
REactivity PAttern) algorithm was used to establish reactivity profiles for a limited data set of<br />
retinoid receptor ligands in terms of activation of three RARs ( , , ) and an RXR ( ).<br />
Conformational analysis of a training set of retinoids and related analogues in terms of<br />
thermodynamic stability of conformers and rotational barriers showed that these chemicals tend to<br />
be quite flexible. This flexibility, and the observation that relatively small energy differences<br />
between conformers can result in significant variations in electronic structure, highlighted the<br />
necessity of consi<strong>de</strong>ring all energetically reasonable conformers in <strong>de</strong>fining common reactivity<br />
profiles. The <strong>de</strong>rived reactivity patterns for three different subclasses of the RAR ( , , ) were<br />
similar in terms of their global electrophilicity (nucleophilicity) and steric parameters. However, the<br />
profile of active chemicals with respect to interaction with the RXR- differed qualitatively from<br />
that of the RARs. Variations in reactivity profiles for the RAR versus RXR families would be<br />
consistent with established differences in their affinity for endogenous retinoids, likely reflecting<br />
functional differences in the receptors.<br />
Keywords: Retinoid; Receptor; Transactivation; Mo<strong>de</strong>l<br />
Nr Articol<br />
9 Quantitative molecular similarity analysis (QMSA) methods for property estimation: a<br />
comparison of property-based, arbitrary, and tailored similarity spaces<br />
Authors: S. C. Basak a; B. D. Gute a; D. Mills a<br />
Affiliation: a Natural Resources Research Institute, University of Minnesota at Duluth, 5013<br />
Miller Trunk Hwy., Duluth, MN 55811, USA.<br />
DOI: 10.1080/1062936021000043463<br />
Publication Frequency: 8 issues per year<br />
Published in: SAR and QSAR in Environmental Research, Volume 13, Issue 7 & 8 2002 , pages<br />
727 - 742<br />
Subjects: Applied & Industrial Chemistry; Chemistry; Environmental & Ecological Toxicology;<br />
Environmental Sciences; History & Philosophy of Mathematics;<br />
Abstract<br />
Three classes of arbitrary quantitative molecular similarity analysis (QMSA) methods have been<br />
computed using atom pairs, topological indices, and physicochemical properties. Tailored QMSA<br />
mo<strong>de</strong>ls have been <strong>de</strong>veloped using a selected number of TIs chosen by ridge regression. The<br />
methods have been applied to the K -nearest neighbor based estimation of log P of two sets of<br />
chemicals. Results show that the property-based and tailored QMSA methods are superior to the<br />
arbitrary similarity methods in estimating log P of both sets of chemicals<br />
Keywords: Quantitative Molecular Similarity Analysis (QMSA); Arbitrary Qmsa Method; Tailored<br />
Qmsa Method; Atom Pairs; Topological Indices; Physicochemical Properties<br />
Nr Articol<br />
10 Quantitative structure-metabolism relationships (QSMR) using computational chemistry:<br />
pattern recognition analysis and statistical prediction of phase II conjugation reactions of<br />
substituted benzoic acids in the rat<br />
Author: B. C. Cupid<br />
DOI: 10.1080/004982599238795<br />
Publication Frequency: 12 issues per year<br />
47
Published in: Xenobiotica, Volume 29, Issue 1 January 1999 , pages 27 - 42<br />
Subjects: Pharmacology; Toxicology;<br />
Abstract<br />
1. Quantitative relationships between molecular physico-chemical properties of 22 substituted<br />
benzoic acids and the extent of excretion of their metabolites in rat urine have been investigated<br />
using computational chemistry and multivariate statistics. 2. A data set of 34 theoretically <strong>de</strong>rived<br />
physico-chemical <strong>de</strong>scriptors calculated was used to classify the benzoic acids according to their<br />
predominant urinary metabolic fate. 3. Quantitative structure-metabolism relationships were<br />
obtained by linear regression using combinations of physico-chemical <strong>de</strong>scriptors allowing the<br />
prediction of % urinary excretion of glycine (r=0.73) and glucuroni<strong>de</strong> conjugates (r=0.82) and %<br />
urinary excretion of the parent compound (r=0.91).<br />
Nr Articol<br />
11 Mo<strong>de</strong>lling mutagenicity using properties calculated by computational chemistry<br />
Authors: D. J. Livingstone; R. Greenwood a; R. Rees b; M. D. Smith b<br />
Affiliations: a School of Biological Sciences, University of Portsmouth, Portsmouth, Hants, PO1<br />
2DY, UK.<br />
b Department of Genetic Toxicology, SmithKline Beecham Pharmaceuticals, The Frythe, Welwyn,<br />
Hertfordshire, UK.<br />
DOI: 10.1080/10629360290002064<br />
Publication Frequency: 8 issues per year<br />
Published in: SAR and QSAR in Environmental Research, Volume 13, Issue 1 2002 , pages 21 - 33<br />
Subjects: Applied & Industrial Chemistry; Chemistry; Environmental & Ecological Toxicology;<br />
Environmental Sciences; History & Philosophy of Mathematics;<br />
Abstract<br />
The recent advances in combinatorial chemistry and high throughput screening technologies have<br />
led to an explosion in the numbers of possible therapeutic candidates being produced at the early<br />
stages of drug discovery. This rapid increase in the number of chemicals to be classified results in a<br />
greater need for alternative methods for the prediction of toxicity. Most QSAR mo<strong>de</strong>ls for<br />
mutagenicity have been constructed for congeneric series. The prediction requirements of the<br />
pharmaceutical industry, however, cover quite diverse chemical structures. This paper reports a<br />
study of mutagenicity data for a diverse set of 90 compounds. Good discriminant mo<strong>de</strong>ls have been<br />
built for this data set using properties calculated by the techniques of computational chemistry.<br />
Jack-knifed (leave one out) predictions for these mo<strong>de</strong>ls are of the or<strong>de</strong>r of 85%.<br />
Keywords: Discriminant Analysis; Eva Descriptor; Variable Selection; Ames Test; Jack-knife<br />
Predictions; Qsar<br />
Nr Articol<br />
12 Computational mo<strong>de</strong>lling of low-energy electron-induced DNA damage by early physical and<br />
chemical events<br />
Authors: H. NIKJOO; P. O'NEILL; D. T. GOODHEAD; M. TERRISSOL<br />
DOI: 10.1080/095530097143798<br />
Publication Frequency: 12 issues per year<br />
Published in: International Journal of Radiation Biology, Volume 71, Issue 5 May 1997 , pages 467<br />
- 483<br />
Subjects: Nuclear Medicine; Radiation Oncology;<br />
Abstract<br />
Mo<strong>de</strong>lling and calculations are presented as a first step towards mechanistic interpretation and<br />
prediction of radiation effects based on the spectrum of initial DNA damage produced by low<br />
energy electrons (100eV-4.5keV) that can be compared with experimental information. Relative<br />
yields of single and clustered strand breaks are presented in terms of complexity and source of<br />
damage, either by direct energy <strong>de</strong>position or by reaction of OH radicals, and <strong>de</strong>pen<strong>de</strong>nce on the<br />
activation probability of OH radicals and the amount of energy required to give a single strand<br />
break (ssb). Data show that the majority of interactions in DNA do not lead to damage in the form<br />
48
of strand breaks and when they do occur, they are most frequently simple ssb. However, for doublestrand<br />
breaks (dsb), a high proportion (30%) are of more complex forms, even without consi<strong>de</strong>ring<br />
additional complexity from base damage. The greater contribution is from direct interactions in the<br />
DNA but reactions of OH radicals add substantially to this, both in terms of the total number of<br />
breaks and in increasing the complexity within a cluster. It has been shown that the lengths of<br />
damaged segments of DNA from individual electron tracks tend to be short, indicating that<br />
consequent <strong>de</strong>letion length (simply by loss of a fragment between nearby dsb) would be short, very<br />
seldom exceeding a few tens of base pairs.<br />
Nr Articol<br />
13 p-Do<strong>de</strong>cylaminophenol <strong>de</strong>rived from the synthetic retinoid, fenretini<strong>de</strong>: Antitumor efficacy in<br />
vitro and in vivo against human prostate cancer and mechanism of action<br />
International Journal of Cancer<br />
Volume 122, Issue 3, Date: 1 February 2008, Pages: 689-698<br />
Noriko Takahashi, Yusuke Watanabe, Yoshie Maitani, Takayasu Yamauchi, Kimio Higashiyama,<br />
Toshihiro Ohba<br />
Fun<strong>de</strong>d by:<br />
The Ministry of Education, Culture, Sports, Science and Technology, Japan and the Open Research<br />
Center Project<br />
Keywords<br />
aminophenol • anticancer • retinoid • prostate cancer • apoptosis<br />
Abstract<br />
Fenretini<strong>de</strong>, N-(4-hydroxyphenyl)retinami<strong>de</strong> (4-HPR) is an aminophenol-containing synthetic<br />
retinoid <strong>de</strong>rivative of all-trans-retinoic acid, which is a potent chemopreventive and antiproliferative<br />
agent against various cancers. Clinical studies of 4-HPR have shown si<strong>de</strong> effects consisting of night<br />
blindness and ocular toxicity. To maintain potent anticancer activity without si<strong>de</strong> effects, pdo<strong>de</strong>cylaminophenol<br />
(p-DDAP) was <strong>de</strong>signed based on structure-activity relationships of 4-HPR. In<br />
our study, we investigate whether p-DDAP shows anticancer activity against human prostate cancer<br />
cell line PC-3 when compared with 4-HPR. p-DDAP inhibited PC-3 cell growth progressively from<br />
low to high concentration in a dose-<strong>de</strong>pen<strong>de</strong>nt manner. p-DDAP was the most potent<br />
antiproliferative agent in vitro among 6 p-alkylaminophenols and 3 4-hydroxyphenyl analogs<br />
examined including 4-HPR. Cells treated with p-DDAP were shown to un<strong>de</strong>rgo apoptosis, based on<br />
con<strong>de</strong>nsation nuclei, cytofluorimetric analysis, propidium iodi<strong>de</strong> staining and the expression of bcl-<br />
2 and caspase 3. p-DDAP arrested the S phase of the cell cycle, while 4-HPR arrested the G0/G1<br />
phase. In addition, both the i.v. and i.p. administration of p-DDAP suppressed tumor growth in PC-<br />
3-implanted mice in vivo. p-DDAP showed no effects on blood retinol concentrations, in contrast to<br />
reductions after 4-HPR administration. These results indicate that p-DDAP exhibits excellent<br />
anticancer efficacy against hormonal in<strong>de</strong>pen<strong>de</strong>nt prostate cancer in vitro and in vivo, and it may<br />
have great potential for clinical use in the treatment of prostate cancer with reduced si<strong>de</strong> effects.<br />
Nr Articol<br />
14 Lipoxygenase inhibitors: A comparative QSAR study review and evaluation of new QSARs<br />
Medicinal Research Reviews<br />
Volume 28, Issue 1, Date: January 2008, Pages: 39-117<br />
Eleni Pontiki, Dimitra Hadjipavlou-Litina<br />
Keywords<br />
QSAR • LOX inhibitors • lipophilicity • steric factors • electronic effects<br />
Abstract<br />
This paper contains a quantitative structure activity relationship (QSAR) study for lipoxygenase<br />
(LO) inhibitors. It reveals that in almost all cases, the clog P parameter plays an important part in<br />
the QSARs (linear or bilinear mo<strong>de</strong>l). In some cases the steric factors such as the overall molar<br />
refractivity (CMR) or the substituents molar refractivity (MR) (linear or parabola) are important.<br />
Electronic effects are comparatively unimportant. The study shows that log P as calculated from the<br />
Clog P program is suitable for this form of QSAR study.<br />
49
Nr Articol<br />
15 A neural network approach to prediction of glass transition temperature of polymers<br />
International Journal of Intelligent Systems<br />
Volume 23, Issue 1, Date: January 2008, Pages: 22-32<br />
Xi Chen, Les Sztan<strong>de</strong>ra, Hugh M. Cartwright<br />
Abstract<br />
Polymeric materials are finding increasing application in commercial optical communication<br />
systems. Taking advantage of techniques from the field of artificial intelligence, the goal of our<br />
research is to construct systems that can computationally <strong>de</strong>sign polymer formulations, including<br />
polymer optical fibers, with specified <strong>de</strong>sirable consumer characteristics. Through the use of an<br />
extensive structure - property correlation database, properties of polymers can be predicted by an<br />
artificial network and the structure of novel polymers with <strong>de</strong>sired properties can be optimized by a<br />
genetic algorithm. In this paper, we are focusing on one of the parameters, glass transition<br />
temperature (Tg) that influences a <strong>de</strong>sired outcome in polymer optical fibers. Performance of such<br />
fibers can be optimized by engineering a polymer to exhibit a lower refractive in<strong>de</strong>x and Tg. This<br />
paper compares and discusses a neural network mo<strong>de</strong>l and a linear mo<strong>de</strong>l that have been <strong>de</strong>veloped<br />
to correlate Tg and repeating units of polymers. A neural network and multiple linear regression<br />
analysis were used in the study. A set of <strong>de</strong>scriptors, chosen based on previous studies on the<br />
relations between Tg and polymer structure, were used to <strong>de</strong>scribe the structure of repeating units,<br />
individual bond energies, and intermolecular forces, especially hydrogen bonding, which is the<br />
strongest intermolecular force and exerts the greatest influence on Tg compared with other<br />
intermolecular interactions. A comprehensive neural network mo<strong>de</strong>l with 28 <strong>de</strong>scriptors was<br />
<strong>de</strong>veloped to predict Tg values of 6 randomly selected polymers from a database containing 71<br />
polymers. The network was trained with the remaining 65 polymers and had a typical training root<br />
mean square error of 17 K (R2 = 0.95) and prediction average error of 17 K (R2 = 0.85). A linear<br />
regression mo<strong>de</strong>l <strong>de</strong>veloped for comparison had an average error of 30 K (R2 = 0.88).<br />
Nr Articol<br />
16 Investigation of DNA-binding properties of organic molecules using quantitative structureactivity<br />
relationship (QSAR) mo<strong>de</strong>ls<br />
Journal of Pharmaceutical Sciences<br />
Volume 97, Issue 1, Date: January 2008, Pages: 88-110<br />
Rajeshwar P. Verma, Corwin Hansch<br />
Keywords<br />
DNA • QSAR • log P • cancer • computer ai<strong>de</strong>d drug <strong>de</strong>sign<br />
Abstract<br />
Due to the great potential of DNA as a receptor, many classes of synthetic and naturally occurring<br />
molecules exert their anticancer activities through DNA-binding. In the field of antitumor DNAbinding<br />
agents, a number of acridine and anthracycline <strong>de</strong>rivatives are in the market as<br />
chemotherapeutic agents. However, the clinical application of such classes of compounds has<br />
encountered problems such as multi-drug resistance and secondary and/or collateral effects. Thus,<br />
there has been increasing interest in discovering and <strong>de</strong>veloping small molecules that are capable of<br />
DNA-binding, which will be expected to be used either in place of or in conjunction with, the<br />
existing compounds. The interest in the application of the QSAR paradigm has steadily increased in<br />
recent <strong>de</strong>ca<strong>de</strong>s and we hope it may be useful in the <strong>de</strong>sign and <strong>de</strong>velopment of DNA-binding<br />
molecules as new anticancer agents. In the present review, an attempt has been ma<strong>de</strong> to un<strong>de</strong>rstand<br />
the DNA-binding properties of different compound series and discussed using 27 QSAR mo<strong>de</strong>ls,<br />
which reveal a number of interesting points. The most important <strong>de</strong>terminants for the activity in<br />
these mo<strong>de</strong>ls are Hammett electronic (and +), hydrophobic, molar refractivity, and Sterimol width<br />
parameters.<br />
Nr Articol<br />
17 Design, synthesis and evaluation of pepti<strong>de</strong> inhibitors of Mycobacterium tuberculosis<br />
50
ibonucleoti<strong>de</strong> reductase<br />
Journal of Pepti<strong>de</strong> Science<br />
Volume 13, Issue 12, Date: December 2007, Pages: 822-832<br />
Johanna Nurbo, Annette K. Roos, Daniel Muthas, Erik Wahlström, Daniel J. Ericsson, Torbjörn<br />
Lundstedt, Torsten Unge, An<strong>de</strong>rs Karlén<br />
Fun<strong>de</strong>d by:<br />
Swedish Foundation for Strategic Research<br />
Swedish Research Council<br />
EU Sixth Framework Program; Grant Number: NM4TB CT:018 923<br />
Keywords<br />
Mycobacterium tuberculosis • ribonucleoti<strong>de</strong> reductase • pepti<strong>de</strong> inhibitors • alanine scan •<br />
statistical molecular <strong>de</strong>sign • structure activity relationships • FHDoE<br />
Abstract<br />
Mycobacterium tuberculosis ribonucleoti<strong>de</strong> reductase (RNR) is a potential target for new<br />
antitubercular drugs. Herein we <strong>de</strong>scribe the synthesis and evaluation of pepti<strong>de</strong> inhibitors of RNR<br />
<strong>de</strong>rived from the C-terminus of the small subunit of M. tuberculosis RNR. An N-terminal<br />
truncation, an alanine scan and a novel statistical molecular <strong>de</strong>sign (SMD) approach based on the<br />
heptapepti<strong>de</strong> Ac-Glu-Asp-Asp-Asp-Trp-Asp-Phe-OH were applied in this study. The alanine scan<br />
showed that Trp5 and Phe7 were important for inhibitory potency. A quantitative structure<br />
relationship (QSAR) mo<strong>de</strong>l was <strong>de</strong>veloped based on the synthesized pepti<strong>de</strong>s which showed that a<br />
negative charge in positions 2, 3, and 6 is beneficial for inhibitory potency. Finally, in position 5 the<br />
mo<strong>de</strong>l coefficients indicate that there is room for a larger si<strong>de</strong> chain, as compared to Trp5.<br />
Nr Articol<br />
18 Docking without docking: ISEARCH - prediction of interactions using known interfaces<br />
Proteins: Structure, Function, and Bioinformatics<br />
Volume 69, Issue 4, Date: December 2007, Pages: 839-844<br />
Stefan Günther, Patrick May, Andreas Hoppe, Cornelius Frömmel, Robert Preissner<br />
Keywords<br />
prediction of interaction • interfaces • superposition • knowledge-based<br />
Abstract<br />
The increasing number of solved protein structures provi<strong>de</strong>s a solid number of interfaces, if proteinprotein<br />
interactions, domain-domain contacts, and contacts between biological units are taken into<br />
account. An interface library gives us the opportunity to i<strong>de</strong>ntify surface regions on a target<br />
molecule that are similar by local structure and residue composition. If both unbound components<br />
of a possible protein complex exhibit structural similarities to a known interface, the unbound<br />
structures can be superposed onto the known interfaces. The approach is accompanied by two<br />
mathematical problems. Protein surfaces have to be quickly screened by thousands of patches, and<br />
similarity has to be evaluated by a suitable scoring scheme. The used algorithm (NeedleHaystack)<br />
i<strong>de</strong>ntifies similar patches within minutes. Structurally related sites are recognized even if only parts<br />
of the template patches are structurally related to the interface region. A successful prediction of the<br />
protein complex <strong>de</strong>pends on a suitable template of the library. However, the performed tests<br />
indicate that interaction sites are i<strong>de</strong>ntified even if the similarity is very low. The approach<br />
complements existing ab initio methods and provi<strong>de</strong>s valuable results on standard benchmark sets.<br />
Nr Articol<br />
19 First-principles, structure-based trans<strong>de</strong>rmal transport mo<strong>de</strong>l to evaluate lipid partition and<br />
diffusion coefficients of hydrophobic permeants solely from stratum corneum permeation<br />
experiments<br />
Journal of Pharmaceutical Sciences<br />
Volume 96, Issue 12, Date: December 2007, Pages: 3236-3251<br />
Joseph Kushner IV, William Deen, Daniel Blankschtein, Robert Langer<br />
Keywords<br />
trans<strong>de</strong>rmal drug <strong>de</strong>livery • permeability • mathematical mo<strong>de</strong>l • drug transport • percutaneous •<br />
51
skin • membrane transport • passive diffusion/transport<br />
Abstract<br />
To account for the effect of branched, parallel transport pathways in the intercellular domain of the<br />
stratum corneum (SC) on the passive trans<strong>de</strong>rmal transport of hydrophobic permeants, we have<br />
<strong>de</strong>veloped, from first-principles, a new theoretical mo<strong>de</strong>l - the Two-Tortuosity Mo<strong>de</strong>l. This new<br />
mo<strong>de</strong>l requires two tortuosity factors to account for: (1) the effective diffusion path length, and (2)<br />
the total volume of the branched, parallel transport pathways present in the SC intercellular domain,<br />
both of which may be evaluated from known values of the SC structure. After validating the Two-<br />
Tortuosity mo<strong>de</strong>l with simulated SC diffusion experiments in FEMLAB (a finite element software<br />
package), the vehicle-bilayer partition coefficient, Kb, and the lipid bilayer diffusion coefficient,<br />
Db, in untreated human SC were evaluated using this new mo<strong>de</strong>l for two hydrophobic permeants,<br />
naphthol (Kb = 225 ± 42, Db = 1.7 × 10-7 ± 0.3 × 10-7 cm2/s) and testosterone (Kb = 92 ± 29, Db<br />
= 1.9 × 10-8 ± 0.5 × 10-8 cm2/s). The results presented in this paper <strong>de</strong>monstrate that this new<br />
method to evaluate Kb and Db is comparable to, and simpler than, previous methods, in which SC<br />
permeation experiments were combined with octanol-water partition experiments, or with SC solute<br />
release experiments, to evaluate Kb and Db.<br />
Nr Articol<br />
20 Relationship between basicity and nucleophilicity<br />
Journal of Physical Organic Chemistry<br />
Volume 20, Issue 12, Date: December 2007, Pages: 1050-1057<br />
Paula Jaramillo, Patricia Pérez, Patricio Fuentealba<br />
Fun<strong>de</strong>d by:<br />
Fon<strong>de</strong>cyt; Grant Number: 1060961, 1050294<br />
Universidad Andres Bello; Grant Number: DI-28-06/I<br />
Millennium Nucleus for Applied Quantum Mechanics and Computational Chemistry; Grant<br />
Number: P02-004-F<br />
Keywords<br />
nucleophilicity in<strong>de</strong>x • nucleophiles • basicity • proton affinity • reactivity • HSAB principle • acidbase<br />
reaction • endothermic reactions<br />
Abstract<br />
The empirical concepts of basicity and nucleophilicity are related but not strictly proportional.<br />
Hence, the aim of this study is to help in elucidating the range where both concepts are directly<br />
proportional. To do this, the relationship between a recently introduced nucleophilicity in<strong>de</strong>x and<br />
the proton affinity (PA) of several families of bases has been studied. A good correlation between<br />
the PA and the nucleophilicity in<strong>de</strong>x using HF and HCN as electrophilic partner has been found.<br />
Our studies show that the correlation exists only when the interaction is soft-soft in character and<br />
for strong bases with weak acids. However, the relationship is not only valid for exothermic<br />
reactions as it has been previously postulated but also for endothermic reactions.<br />
Nr Articol<br />
21 Information theoretical measures to analyze trajectories in rational molecular <strong>de</strong>sign<br />
Journal of Computational Chemistry<br />
Volume 28, Issue 16, Date: December 2007, Pages: 2576-2580<br />
K. Hamacher<br />
Keywords<br />
molecular dynamics • molecular biophysics • data analysis • computational chemistry • rational<br />
<strong>de</strong>sign • pharmacology<br />
Abstract<br />
We <strong>de</strong>velop a new methodology to analyze molecular dynamics trajectories and other time series<br />
data from simulation runs. This methodology is based on an information measure of the difference<br />
between distributions of various data extract from such simulations. The method is fast as it only<br />
involves the numerical integration/summation of the distributions in one dimension while avoiding<br />
sampling issues at the same time. The method is most suitable for applications in which different<br />
52
scenarios are to be compared, e.g. to gui<strong>de</strong> rational molecular <strong>de</strong>sign. We show the power of the<br />
proposed method in an application of rational drug <strong>de</strong>sign by reduced mo<strong>de</strong>l computations on the<br />
BH3 motif in the apoptosis inducing BCL2 protein family.<br />
Nr Articol<br />
22 A novel semi-empirical topological <strong>de</strong>scriptor Nt and the application to study on QSPR/QSAR<br />
Journal of Computational Chemistry<br />
Volume 28, Issue 15, Date: 30 November 2007, Pages: 2413-2423<br />
Congyi Zhou, Changming Nie, Shan Li, Zhonghai Li<br />
Fun<strong>de</strong>d by:<br />
The Natural Science Foundation of Hunan Province; Grant Number: 03JJY3024<br />
The Technology Innovation Plans of the Economy Commission of Hunan Province; Grant<br />
Number: [2005]283<br />
Keywords<br />
equilibrium electronegativity • organic compounds • QSPR/QSAR • topological <strong>de</strong>scriptor Nt<br />
Abstract<br />
A novel semi-empirical topological <strong>de</strong>scriptor Nt was proposed by revising the traditional distance<br />
matrix based on the equilibrium electronegativity and the relative bond length. Nt can not only<br />
efficiently distinguish structures of organic compounds containing multiple bonds and/or<br />
heteroatoms, but also possess good applications of QSPR/QSAR (quantitative structureproperty/activity<br />
relationships) to a large diverse set of compounds, which are alkanes, alkenes,<br />
alkynes, al<strong>de</strong>hy<strong>de</strong>s, ketones, thiols, and alkoxy silicon chlori<strong>de</strong>s with all the correlation coefficients<br />
of the mo<strong>de</strong>ls over 0.99. The LOO CV (leave-one-out cross-validation) method was used to testify<br />
the stability and predictive ability of the mo<strong>de</strong>ls. The validation results verify the good stability and<br />
predictive ability of the mo<strong>de</strong>ls employing the cross-validation parameters: RCV, SEPCV and SCV,<br />
which <strong>de</strong>monstrate the wi<strong>de</strong> potential of the Nt <strong>de</strong>scriptor for applications to QSPR/ QSAR.<br />
Nr Articol<br />
23 Analysis of System Structure-Function Relationships<br />
ChemMedChem<br />
Volume 2, Issue 12, Date: December 10, 2007, Pages: 1774-1782<br />
Anton F. Fliri, William T. Loging, Robert A. Volkmann<br />
Keywords<br />
biospectra • cellular response • drug <strong>de</strong>sign • proteins • structure-function relationships<br />
Abstract<br />
Preclinical pharmacology studies conducted with experimental medicines currently focus on<br />
assessments of drug effects attributed to a drug's putative mechanism of action. The high failure rate<br />
of medicines in clinical trials, however, un<strong>de</strong>rscores that the information gathered from these<br />
studies is insufficient for forecasting drug effect profiles actually observed in patients. Improving<br />
drug effect predictions and increasing success rates of new medicines in clinical trials are some of<br />
the key challenges currently faced by the pharmaceutical industry. Addressing these challenges<br />
requires <strong>de</strong>velopment of new methods for capturing and comparing system-wi<strong>de</strong> structure-effect<br />
information for medicines at the cellular and organism levels. The current investigation <strong>de</strong>scribes a<br />
strategy for moving in this direction by using six different <strong>de</strong>scriptor sets for examining the<br />
relationship between molecular structure and broad effect information of 1064 medicines at the<br />
cellular and the organism level. To compare broad drug effect information between different<br />
medicines, information spectra for each of the 1064 medicines were created, and the similarity<br />
between information spectra was <strong>de</strong>termined through hierarchical clustering. The structure-effect<br />
relationships ascertained through these comparisons indicate that information spectra similarity<br />
obtained through preclinical ligand binding experiments using a mo<strong>de</strong>l proteome provi<strong>de</strong> useful<br />
estimates for the broad drug effect profiles of these 1064 medicines in organisms. This premise is<br />
illustrated using the ligand binding profiles of selected medicines in the dataset as biomarkers for<br />
forecasting system-wi<strong>de</strong> effect observations of medicines that were not inclu<strong>de</strong>d in the incipient<br />
1064-medicine analysis.<br />
53
Nr Articol<br />
24 Synthesis, Antimicrobial and Antineoplastic Activities for Agelasine and Agelasimine Analogs<br />
with a -Cyclocitral Derived Substituent<br />
Archiv <strong>de</strong>r Pharmazie<br />
Volume 340, Issue 12, Date: December 2007, Pages: 625-634<br />
Ágnes Proszenyák, Colin Charnock, Erik Hedner, Rolf Larsson, Lars Bohlin, Lise-Lotte Gun<strong>de</strong>rsen<br />
Fun<strong>de</strong>d by:<br />
The Norwegian Research Council; KOSK program; Grant Number: 165765/V30<br />
The Swedish Research for Environment, Agricultural Science and Spatial Planning<br />
Keywords<br />
Agelasimine • Agelasine • Anti-cancer activity • Antimicrobial activity • -Cyclocitral<br />
Abstract<br />
Agelasines and agelasimines are antimicrobial and cytotoxic purine <strong>de</strong>rivatives isolated from<br />
marine sponges (Agelas sp.). We have synthesized structurally simplified analogs of these natural<br />
products starting from -cyclocitral. The novel compounds were found to be strong inhibitors of a<br />
wi<strong>de</strong> variety of pathogenic microorganisms (incl. Mycobacterium tuberculosis) as well as cancer<br />
cell lines. The biological activities were generally in the same range as those previously found for<br />
the structurally more complex agelasines and agelasimines isolated in small amounts from natural<br />
sources. We also report for the first time that agelasine and agelasimine analogs inhibit growth of<br />
protozoa (Acanthamoeba castellanii and Acanthamoeba polyphaga). Acanthamoeba keratitis is an<br />
increasingly common and severe corneal infection, closely associated with contact lens wear.<br />
Nr Articol<br />
25 Synthesis and Anticancer Activity of (R,S)-9-(2,3-Dihydro-1,4-Benzoxathiin-3-ylmethyl)-9H-<br />
Purines<br />
ChemMedChem<br />
Early View<br />
Mónica Díaz-Gavilán, Ana Conejo-García, Olga Cruz-López, María C. Núñez, Duane Choquesillo-<br />
Lazarte, Josefa M. González-Pérez, Fernando Rodríguez-Serrano, Juan A. Marchal, Antonia<br />
Aránega, Miguel A. Gallo, Antonio Espinosa, Joaquín M. Campos<br />
Fun<strong>de</strong>d by:<br />
European Commission; Grant Number: MERG-CT-2005-030616<br />
Instituto <strong>de</strong> Salud Carlos III; Grant Number: PI041206<br />
Consejería <strong>de</strong> Innovación, Ciencia y Empresa of the Junta <strong>de</strong> Andalucía; Grant Number: 00636<br />
Keywords<br />
antitumor compounds • benzoxathiines • microwave • mitsunobu reaction • nitrogen heterocycles<br />
Abstract<br />
A series of eleven 2- and 6-substituted (R,S)-9-(2,3-dihydro-1,4-benzoxathiin-3-ylmethyl)-9Hpurine<br />
<strong>de</strong>rivatives was obtained by applying a standard Mitsunobu protocol that led to a sixmembered<br />
ring contraction from (R,S)-3,4-dihydro-2H-1,5-benzoxathiepin-3-ol via an episulfonium<br />
intermediate. The signal ~=151 ppm, which corresponds to the C4 carbon atom, is unequivocal<br />
proof of the N9 regioisomer. The potential of the target molecules as anticancer agents is reflected<br />
in their activity against the MCF-7 cancer cell line. The most active compounds have IC50 values<br />
of (6.18±1.70) and (8.97±0.83) M. The results indicate that the anticancer activity for the most<br />
active compounds is correlated with their capacity to induce apoptosis.<br />
Nr Articol<br />
26 Design, Synthesis, and Pharmacological Evaluation of Mefloquine-Based Ligands as Novel<br />
Antituberculosis Agents<br />
ChemMedChem<br />
Volume 2, Issue 11, Date: November 12, 2007, Pages: 1624-1630<br />
Jialin Mao, Yuehong Wang, Baojie Wan, Alan P. Kozikowski, Scott G. Franzblau<br />
Keywords<br />
54
hydrazones • ligand-based drug <strong>de</strong>sign • mefloquine • structure-activity relationships • tuberculosis<br />
Abstract<br />
Tuberculosis (TB) is presently regar<strong>de</strong>d as one of the most dangerous infective diseases worldwi<strong>de</strong><br />
and one of the major AIDS-associated infections. To shorten the current treatment regimen, there is<br />
an urgent need to i<strong>de</strong>ntify new anti-TB agents which are active against both replicating TB (R-TB)<br />
and nonreplicating TB (NRP-TB). Mefloquine, a well-known antimalarial drug was found to<br />
possess reasonable activity against NRP-TB, and accordingly, 30 new analogues were synthesized<br />
and evaluated for their anti-TB activity against Mycobacterium tuberculosis H37Rv. As the target<br />
of mefloquine in Mycobacterium tuberculosis remains unknown, we resorted to modifying<br />
mefloquine in a variety of chemically convenient ways, which led us in turn to the active hydrazone<br />
10 a. Further modifications of 10 a led to compound 7 f, with an improved anti-TB<br />
activity/selectivity profile with both less cytotoxicity and less predicted CNS si<strong>de</strong> effects compared<br />
with mefloquine. The clear structure-activity relationships (SARs) <strong>de</strong>rived from this study should<br />
facilitate our ultimate goal of i<strong>de</strong>ntifying improved anti-TB agents.<br />
Nr Articol<br />
27 Complexity in Mo<strong>de</strong>ling and Un<strong>de</strong>rstanding Protonation States: Computational Titration of<br />
HIV-1-Protease-Inhibitor Complexes<br />
Chemistry & Biodiversity<br />
Volume 4, Issue 11, Date: November 2007, Pages: 2564-2577<br />
Ashutosh Tripathi, Micaela Fornabaio, Francesca Spyrakis, Andrea Mozzarelli, Pietro Cozzini,<br />
Glen E. Kellogg<br />
Keywords<br />
Hydropathic analysis • Free energy • Molecular mo<strong>de</strong>ling • Isocrystallographic mo<strong>de</strong>ls • HINT<br />
Force field • HIV • Computational titration • Proteinligand complex<br />
Abstract<br />
The computational-titration (CT) algorithm based on the natural Hydropathic INTeractions (HINT)<br />
force field is <strong>de</strong>scribed. The HINT software mo<strong>de</strong>l is an empirical, non-Newtonian force field<br />
<strong>de</strong>rived from experimentally measured partition coefficients for solvent transfer between octanol<br />
and H2O (log Po/w). The CT algorithm allows the i<strong>de</strong>ntification, mo<strong>de</strong>ling, and optimization of<br />
multiple protonation states of residues and ligand functional groups at the protein-ligand active site.<br />
The importance of taking into account pH and ionization states of residues, which strongly affect<br />
the process of ligand binding, for correctly predicting binding free energies is discussed. The<br />
application of the CT protocol to a set of six cyclic inhibitors in their complexes with HIV-1<br />
protease is presented, and the advance of HINT as a virtual-screening tool is outlined.<br />
Nr Articol<br />
28 Structure-Activity Relationships for a Family of Benzothiophene Selective Estrogen Receptor<br />
Modulators Including Raloxifene and Arzoxifene<br />
ChemMedChem<br />
Volume 2, Issue 10, Date: October 8, 2007, Pages: 1520-1526<br />
Cassia R. Overk, Kuan-Wei Peng, Rezene T. Asghodom, Irida Kastrati, Daniel D. Lantvit, Zhihui<br />
Qin, Jonna Frasor, Judy L. Bolton, Gregory R. J. Thatcher<br />
Keywords<br />
cancer • chemoprevention • estradiol • estrogen receptor • hormone replacement therapy • SERM<br />
Abstract<br />
The search for the i<strong>de</strong>al selective estrogen receptor modulator (SERM) as a substitute for hormone<br />
replacement therapy (HRT) or use in cancer chemoprevention has focused on optimization of<br />
estrogen receptor (ER) ligand binding. Based on the clinical and preclinical benzothiophene<br />
SERMs, raloxifene and arzoxifene, a family of SERMs has been <strong>de</strong>veloped to modulate activity and<br />
oxidative lability. Antiestrogenic potency measured in human endometrial and breast cancer cells,<br />
and ER ligand binding data were correlated and seen to provi<strong>de</strong> a gui<strong>de</strong> to SERM <strong>de</strong>sign only when<br />
viewed in toto. The in vitro studies were exten<strong>de</strong>d to the juvenile rat mo<strong>de</strong>l, in which the <strong>de</strong>sired<br />
antiestrogenic profile and putative cardiovascular benefits of SERMs were observed.<br />
55
2007A6. I<strong>de</strong>ntificarea surselor <strong>de</strong> date şi metodologiilor <strong>de</strong> colectare (eşantionare, criterii <strong>de</strong><br />
inclu<strong>de</strong>re şi exclu<strong>de</strong>re în studiu), şi <strong>de</strong> experimentare<br />
Derularea activităţii a fost asigurată <strong>de</strong> preocupările şi rezultatele anterioare ale colectivului <strong>de</strong><br />
<strong>cercetare</strong> în ceea ce priveşte formularea <strong>de</strong> măsuri şi măsurabile pentru eşantionare şi volumul<br />
necesar al eşantionului pentru a da o anumită semnificaţie statistică rezultatului studiului (Bolboacă<br />
& Jäntschi, 2007-CRRF), cum datele trebuie înregistrate în ve<strong>de</strong>rea analizei (Bolboacă & others,<br />
2008-RRAS).<br />
O serie <strong>de</strong> filtre s-au dovedit utile în i<strong>de</strong>ntificarea surselor <strong>de</strong> date şi au fost folosite pentru<br />
inclu<strong>de</strong>rea în studiu, acestea bazându-se pe analiza <strong>de</strong> similaritate (Bolboacă & Jäntschi, 2007-<br />
SAHZ; Bolboacă & Jäntschi, 2007-MCSC).<br />
Problematica <strong>de</strong>signului experimental a ocupat un segment important al studiului, referind <strong>de</strong> la<br />
metodologia <strong>de</strong> prelevare a observaţiilor (Jäntschi & Bolboacă, 2007-HADR), la alegerea potrivită a<br />
scalei <strong>de</strong> reprezentare a observaţiilor (Bolboacă & Jäntschi, 2007-AAHS) la proiectarea<br />
experimentului (Bolboacă & Jäntschi, 2007-DoE) şi analiza <strong>de</strong> varianţă asociată acestuia (Bolboacă<br />
& others, 2009-AoV) şi la ipotezele cu privire la distribuţia erorii experimentale (Jäntschi &<br />
Bolboacă, 2009-OvO), acestea din urmă reprezentând rezultate noi obţinute din <strong>cercetare</strong>a<br />
<strong>de</strong>sfăşurată în cadrul proiectului.<br />
Tehnica experimentului se bazează pe noţiunea <strong>de</strong> observaţie. Experimentele sunt întot<strong>de</strong>auna<br />
empirice şi cu toate acestea uneori doar măsurătorile nu formează un experiment.<br />
Experimentele implică mai mult stabilirea unui anumit nivel <strong>de</strong> control şi manipularea unuia sau a<br />
mai multor factori <strong>de</strong> interes <strong>de</strong>cât stabirirea cauzei şi efectului.<br />
Definiţia din dicţionar a experimentului este aceea <strong>de</strong> a <strong>de</strong>termina eficacitatea unui lucru neîncercat<br />
anterior sau aceea <strong>de</strong> e examina validitatea unei ipoteze sau <strong>de</strong> a <strong>de</strong>monstra un a<strong>de</strong>văr cunoscut.<br />
Prima etapă în formularea unui experiment este <strong>de</strong>finirea câtorva termeni, cum ar fi:<br />
÷ Propoziţii, ipoteze<br />
÷ Presupunerile ce trebuiesc făcute (ele <strong>de</strong>termină scopul şi i<strong>de</strong>ntifică domeniile care nu pot fi<br />
investigate);<br />
÷ I<strong>de</strong>ntificarea variabilei (variabilelor) <strong>de</strong>pen<strong>de</strong>nte (sunt datele <strong>de</strong> ieşire, rezultate);<br />
÷ I<strong>de</strong>ntificarea variabilelor in<strong>de</strong>pen<strong>de</strong>nte (sunt datele <strong>de</strong> intrare care luate împreună formează<br />
spaţiul experimental);<br />
÷ Care din variabilele in<strong>de</strong>pen<strong>de</strong>nte pot fi controlate;<br />
În general, statisticianul nu studiază un caracter al populaţiei pe întreaga mulţime <strong>de</strong> elemente, din<br />
mai multe motive, dintre care menţionăm următoarele:<br />
÷ Talia populaţiei poate fi foarte mare sau chiar infinită ceea ce face imposibilă o “observare”<br />
exhaustivă a întregii populaţii;<br />
÷ Eşantioanele pot fi studiate mai rapid <strong>de</strong>cât populaţiile;<br />
÷ Studiul caracterului pe întreaga populaţie este frecvent imposibil, <strong>de</strong>oarece poate distruge<br />
populaţia.<br />
÷ În anumite situaţii nu se mai pot obţine informaţii <strong>de</strong>cât <strong>de</strong>spre o parte a populaţiei.<br />
÷ Rezultatele observaţiilor pe eşantioane a<strong>de</strong>sea sunt mai precise <strong>de</strong>cât rezultatele bazate pe<br />
observarea populaţiei în totalitate, <strong>de</strong>oarece la nivelul unui eşantion se controlează mai uşor<br />
procesul şi tehnicile <strong>de</strong> observare, acestea menţinându-se cu un efort mai mic în standar<strong>de</strong>le <strong>de</strong><br />
eroare acceptate.<br />
÷ Costul şi resursele necesare (umane, materiale, etc.) pentru observarea exhaustivă a unei<br />
populaţii pot <strong>de</strong> asemenea să fie un motiv pentru utilizarea eşantioanelor.<br />
Acestea sunt câteva raţiuni pentru care o populaţie este studiată cu ajutorul unei submulţimi a ei <strong>de</strong><br />
talie mai mică care să permită un studiu exhaustiv al ei.<br />
Un bun eşantion trebuie să constituie o imagine a<strong>de</strong>cvată şi fi<strong>de</strong>lă a întregii populaţii pentru care se<br />
doreşte studierea unui caracter. În caz contrar, se spune că eşantionul este nereprezentativ, sau cu<br />
"bias". Alegerea eşantionului şi culegerea datelor constituie partea cea mai laborioasă. Modalitatea<br />
<strong>de</strong> alegere a eşantionului, principiile <strong>de</strong> eşantinare, criteriile <strong>de</strong> inclu<strong>de</strong>re şi exclu<strong>de</strong>re precum şi<br />
56
modalitatea <strong>de</strong> culegere, colectare şi stocare a datelor trebuie să se regăsescă în protocolul<br />
cercetării. În scopul extrapolării rezultatelor la întreaga populaţie din cadrul căreia eşantionul a fost<br />
creat (obiectiv al statisticii inductive), acesta (adică eşantionul) trebuie să în<strong>de</strong>plienască anumite<br />
criterii (trebuie să fie reprezentativ). Pentru a obţine reprezentativitatea un eşantion trebuie să<br />
în<strong>de</strong>plinească următoarele condiţii:<br />
÷ Reprezentativitatea prin taliei: condiţie <strong>de</strong> ordin cantitativ. Volumul eşantionului trebuie să fie<br />
suficient <strong>de</strong> mare raportat la populaţia din care s-a extras.<br />
÷ Reprezentativitatea prin caracteristici: condiţie <strong>de</strong> ordin calitativ. Eşantionul trebuie extras<br />
aleator din populaţie pentru a cuprin<strong>de</strong> în mod proporţional totate caractericile popualţiei din<br />
care face parte.<br />
Cel mai bun mijloc <strong>de</strong> a asigura că un eşantion va permite inferenţe corecte este utilizarea<br />
meto<strong>de</strong>lor <strong>de</strong> eşantioanare probabilistică în obţinerea eşantionului. Această metodă, pentru fiecare<br />
subiect al populaţiei este cunoscută probabilitatea (şansa) <strong>de</strong> a fi inclus în eşantion.<br />
Patru meto<strong>de</strong> <strong>de</strong> eşantionare sunt folosite pentru a obţine eşantioane probabiliste:<br />
÷ eşantionarea simplu randomizată<br />
÷ eşantionarea sistematică<br />
÷ eşantionarea stratificată<br />
÷ eşantionarea cluster.<br />
Eşantionarea simplă randomizată este o selecţie formată din subiecţi extraşi la întâmplare din<br />
populaţia statistică. Fiecare subiect are aceiaşi şansă <strong>de</strong> a fi inclus în eşantion.<br />
Astfel pentru obţinerea unui eşantion aleator se poate utiliza o metodă <strong>de</strong> randomizare bazată pe<br />
proce<strong>de</strong>e <strong>de</strong> generare <strong>de</strong> numere aleatoare (<strong>de</strong> exemplu, funcţiile RAND sau RANDBETWEEN din<br />
Microsoft EXCEL). Prin această metodă, fiecare element al populaţiei primeşte un număr <strong>de</strong><br />
i<strong>de</strong>ntificare. Pentur eşantionare este dipsonibilă o listă <strong>de</strong> numere <strong>de</strong> i<strong>de</strong>ntificare numită structură <strong>de</strong><br />
eşantionare.<br />
Eşantionarea sistematică inclu<strong>de</strong> tot al k-lea element din populaţie în eşantion. Numărul k se obţine<br />
împărţind talia populaţiei la talia dorită a eşantionului.<br />
Eşantionarea sistematică nu este indicat să fie folosită atunci când în structura <strong>de</strong> eşantionare ar<br />
putea apare o periodicitate.<br />
Există şi alte meto<strong>de</strong> <strong>de</strong> meto<strong>de</strong> <strong>de</strong> eşantionare mai complexe, cum ar fi, <strong>de</strong> exemplu, eşantionarea<br />
stratificată. Pentru aceasta, se împarte populaţia în mai multe subgrupe relevante numite straturi şi<br />
se constituie eşantionul prin extrageri aleatoare din straturi. Fiecare strat trebuie să fie reprezentat în<br />
eşantion în funcţie <strong>de</strong> importanţa sa în populaţie.<br />
Eşantionarea cluster. Un eşantion aleator <strong>de</strong> clusteri se obţine printr-un proce<strong>de</strong>u în două etape.<br />
Într-o primă etapă se împarte populaţia în clusteri şi ulterior se selectează aleator o submulţime <strong>de</strong><br />
clusteri. În mod obişnuit alegerea clusterilor se bazează pe criterii geografice, iar acest proce<strong>de</strong>u<br />
este utilizat frecvent în studiile epi<strong>de</strong>miologice.<br />
Eşantionarea nonprobabilistă este aceia în care nu este cunoscută probabilitatea ca o entitate din<br />
populaţie să fie selectată. Eşantioanele obţinute în acest mod au frecvent bias <strong>de</strong> selecţie.<br />
Asignarea aleatoare. În anumite studii experimentale, prima dată, pe baza unor criterii subiecţii<br />
sunt selectaţi pentru a fi incluşi în studiu. Apoi fiecăruia dintre aceşti subiecţi trebuie să li se<br />
atribuie un anumit tratament. Dacă această atribuire a tratamentului este aleatoare atunci proce<strong>de</strong>ul<br />
se numeşte atribuire aleatoare. Acest proce<strong>de</strong>u <strong>de</strong> asignare aleatoare are ca scop ca grupurile ce<br />
primesc diferite tratamente să fie cât mai asemănător posibil.<br />
Populaţia ţintă şi populaţia <strong>de</strong> disponibilă. În anumite studii, subiecţii incluşi în eşantionul <strong>de</strong><br />
studiu nu aparţin întot<strong>de</strong>auna populaţiei pentru care cercetătorul doreşte să generalizeze concluziile<br />
studiului. În locul acestei populaţii, numită populaţie ţintă, cercetătorul utilizează frecvent o<br />
populaţie <strong>de</strong> subiecţi disponibili care verifică anumite condiţii impuse. Această populaţie din care<br />
<strong>de</strong> fapt este prelevat eşantionul (sau eşantioanele) se numeşte populaţia disponibilă. Pentru a face<br />
inferenţe relativ la populaţia ţintă pe baza populaţiei disponibile, aceasta din urmă trebuie să fie<br />
reprezentativă pentru populaţia ţintă (cele mai importante caracteristici au aceiaşi distribuţie în<br />
populaţia ţinţă şi în populaţia disponibilă).<br />
57
In anumite tipuri <strong>de</strong> studii sunt necesare cel puţin două eşantioane. Aceste eşantioane pot fi extrase<br />
sau prelevate din populaţia ţintă în două feluri: <strong>de</strong>pen<strong>de</strong>nt sau in<strong>de</strong>pen<strong>de</strong>nt.<br />
In cazul eşantioanelor in<strong>de</strong>pen<strong>de</strong>nte:<br />
÷ prelevarea unuia nu influenţează prelevarea celuilalt,<br />
÷ nu au, în general, acelaşi număr <strong>de</strong> unităţi.<br />
Un caz al eşantioanelor <strong>de</strong>pen<strong>de</strong>nte este cel implicând două eşantioane, care se spune că sunt<br />
eşantioane <strong>de</strong> observaţii perechi dacă au aceiaşi talie şi unităţile unui eşantion sunt în corespon<strong>de</strong>nţă<br />
bijectivă cu unităţile celuilalt eşantion.<br />
În domeniul medical, <strong>de</strong> exemplu, datele statistice au diverse provenienţe. Un prim tip este cel al<br />
datelor obţinute din măsurători, care rezultă pe baza unor <strong>de</strong>terminări cantitative ale unor<br />
proprietăţi susceptibile să varieze, în principiu <strong>de</strong> o manieră continuă, cum ar fi, spre exemplu,<br />
înălţimea, greutatea, presiunea sangvină, glicemia.<br />
Alte date statistice rezultă din enumerare, operaţie care furnizează în mod necesar date întregi.<br />
Aceste date <strong>de</strong> enumerare se obţin <strong>de</strong> regulă ca fiind numărul <strong>de</strong> indivizi care în<strong>de</strong>plinesc o anumită<br />
caracteristică, regula fiind stabilită în urma unor operaţii <strong>de</strong> clasificare după criterii bine stabilite.<br />
Rezultatele datelor <strong>de</strong> enumerare se exprimă frecvent sub forma <strong>de</strong> procente: rata <strong>de</strong> piese care<br />
în<strong>de</strong>plinesc condiţiile calitative necesare vânzării a fost <strong>de</strong> 65,5%.<br />
O altă categorie <strong>de</strong> date sunt datele <strong>de</strong> înseriere (ordinale sau <strong>de</strong> ordonare), care reprezintă poziţia<br />
unor obiecte "clasament" stabilit după anumite criterii. Datele <strong>de</strong> ordonare sunt frecvent utilizate,<br />
cum este <strong>de</strong> exemplu pentru <strong>de</strong>scriera calităţii unui produs.<br />
Clasificarea statistică a datelor<br />
Clasificarea statistică a datelor poate fi realizată ţinând seama <strong>de</strong> scalele <strong>de</strong> măsură utilizate. Astfel<br />
se disting următoarele scale <strong>de</strong> măsură:<br />
÷ Scala nominală este o scală pentru măsurarea variabilelor calitative ce pot lua un număr finit <strong>de</strong><br />
valori. Scala nominală nu admite nici o proprietate aritmetică şi nici ordonarea valorilor.<br />
Datele evaluate după o scală nominală sunt numite observaţii calitative, <strong>de</strong>oarece ele <strong>de</strong>scriu o<br />
calitate a unui obiect studiat. Unele dintre aceste scale au doar două valori şi atunci observaţiile sunt<br />
binare.<br />
÷ Scala ordinală este o scală utilizată în cazul variabilelor care pot lua valori într-o mulţime<br />
discretă finită <strong>de</strong> valori. Nu au nici o proprietate aritmetică. Permite o ordonare a valorilor.<br />
÷ Scala interval este o scală utilizată în cazul variabilelor cantitative continue (ce pot lua valori<br />
într-un interval) şi pentru care diferenţa între două valori ale scalei are sens.<br />
÷ Scala <strong>de</strong> tip raţie sau raport este utilizată în cazul variabilelor cantitative continue pentru care<br />
atât diferenţa cât şi câtul a oricăror două valori <strong>de</strong> pe scală au sens. Această scală are un zero<br />
absolut. Nu acceptă valori negative.<br />
Culegerea datelor<br />
Culegerea datelor se realizează în funcţie <strong>de</strong>:<br />
÷ obiectivele propuse<br />
÷ tipul studiului<br />
÷ modalităţile <strong>de</strong> alegere a subiecţilor<br />
÷ timpul disponibil<br />
÷ resursele financiare şi umane disponibile<br />
÷ procedura folosită<br />
÷ accesul la date.<br />
În funcţie <strong>de</strong> populaţia cuprinsă în studiu culegerea datelor poate fi:<br />
÷ Exhaustivă - cuprinzând toţi subiecţii populaţiei ţintă. Din consi<strong>de</strong>rente financiare (costuri foarte<br />
ridicate, echipă numeroasă necesară pentru culegerea datelor) şi/sau economice (distrugerea<br />
populaţiei <strong>de</strong> interes) culegerea exhaustivă a datelor este practic imposibilă.<br />
÷ Prin eşantionare - alegând din populaţia ţintă sau din populaţia disponibilă un grup <strong>de</strong> subiecţi -<br />
eşantionul. Pentru caracteristicile eşantionului reprezentativ vezi textul anterior.<br />
În funcţie <strong>de</strong> durata culegerii datelor poate fi:<br />
58
÷ Transversală: studierea unui eşantion la un moment X <strong>de</strong>terminat în timp şi/sau spaţiu.<br />
÷ Longitudinală: studierea unui eşantion într-un interval <strong>de</strong> timp prestabilit. În culegerea <strong>de</strong> date<br />
<strong>de</strong> tip longitudinal în funcţie <strong>de</strong> accesul la date culegerea poate fi:<br />
o Retrospectiv: din înregistrările anterioare (acolo un<strong>de</strong> este posibil), <strong>de</strong> la un moment<br />
M la un moment N (un<strong>de</strong> M este posterior momentului N şi anterior momentului în<br />
care protocolul <strong>de</strong> <strong>cercetare</strong> a fost stabilit).<br />
o Prospectiv: <strong>cercetare</strong> sistematică a datelor care se vor întâmpla <strong>de</strong> la un moment Y la<br />
un moment Z (un<strong>de</strong> momentul Y este anterior momentului Z şi posterior momentului<br />
în care protocolul <strong>de</strong> <strong>cercetare</strong> a fost stabilit)<br />
Design-ul experimentului<br />
I<strong>de</strong>ea <strong>de</strong> <strong>de</strong>sign al experimentului a fost introdusă <strong>de</strong> Fisher în 1920 care a <strong>de</strong>monstrat utilitatea<br />
acestui concept în domeniul agriculturii, analizând problema <strong>de</strong> optimizare a recoltelor tinând cont<br />
<strong>de</strong> diverşi factori (apă, ploaie, soare, condiţii <strong>de</strong> sol). În 1986, Taguchi a continuat i<strong>de</strong>a <strong>de</strong> <strong>de</strong>sign<br />
experimental, prin împartirea problemelor <strong>de</strong> optimizare în două categorii:<br />
÷ Probleme statice (problemele în care există câţiva factori <strong>de</strong> control ce <strong>de</strong>cid valoarea dorită a<br />
funcţiei). Meto<strong>de</strong> folosite în astfel <strong>de</strong> probleme sunt:<br />
o Aproximarea Smaller-the-Better este folosită când:<br />
Valorea i<strong>de</strong>ală pentru toate caracteristicile nedorite este zero<br />
Valoarea i<strong>de</strong>ală este finită şi este <strong>de</strong>finit maximul sau minimul ei<br />
o Aproximarea Nominal-the-Best este folosită când este aăteptată o anumită valoare şi nu<br />
se doreşte nici maximul nici minimul;<br />
o Aproximarea Larger-the-Better are la bază un mo<strong>de</strong>l care cuprin<strong>de</strong> trei etape:<br />
proiectarea sistemului<br />
proiectarea parametrilor<br />
proiectarea toleranţelor.<br />
În metoda Taguchi etapa <strong>de</strong> proiectare a sistemului, parametrilor şi a toleranţelor se face în<br />
aşa fel încât să se obţină un proiect ROBUST, adică insensibil, pe cât posibil, la variaţii normale<br />
ale mediului produsului.<br />
În acest scop, Taguchi a introdus noţiunea <strong>de</strong> parametri critici <strong>de</strong> proiectare pentru acei<br />
parametri a căror variaţie influenţează foarte mult calitatea / funcţionalitatea produsului. În<br />
principiu, aceşti parametri trebuie controlaţi în proiect prin toleranţe foarte strânse, în timp ce restul<br />
parametrilor trebuie lăsaţi cu toleranţe relaxate pentru a scă<strong>de</strong>a costurile.<br />
Taguchi propune abordarea problematicii prin 2 instrumente:<br />
o Elaborarea funcţiei obiectiv pe baza unuia din mo<strong>de</strong>lele <strong>de</strong> mai sus<br />
o Tehnica experimentelor (metoda matricelor ortogonale)<br />
Metoda şirurilor ortogonale este o metodă <strong>de</strong> optimizare a proceselor industriale, care<br />
asemenea altor tehnici <strong>de</strong> optimizare are ca şi obiective:<br />
o Profit maxim<br />
o Configuraţie cât mai bună a maşinilor<br />
o Alocare optimă a materialelor<br />
o Alocare optimă a forţelor <strong>de</strong> muncă în timp minim<br />
Metoda Taguchi constă în următoarele etape:<br />
o i<strong>de</strong>ntificarea factorilor controlabili şi necontrolabili<br />
o conceperea tabelelor <strong>de</strong> testare, separat pentru factorii controlabili şi cei necontrolabili<br />
o construirea matricei ortogonale a experimentelor prin combinarea tabelelor <strong>de</strong> testare pe<br />
orizontală şi pe verticală<br />
o efectuarea experimentelor ce corespund fiecărei căsuţe din matricea ortogonală, pe<br />
orizontală în tabloul factorilor controlabili şi pe verticală în tabloul factorilor<br />
necontrolabili<br />
o calculul raportului semnal / zgomot pentru fiecare linie a matricei ortogonale.<br />
÷ Probleme dinamice (există un parametru <strong>de</strong> intrare care <strong>de</strong>ci<strong>de</strong> rezultatul):<br />
o Senzitivitatea pantei: panta trebuie să aiba o valoare dată (<strong>de</strong> obicei 1) când funcţia<br />
59
ezultat este:<br />
O caracteristică nedorită (poate fi tratată ca o problemă <strong>de</strong> tip Smaller-the-Better)<br />
O caracteristică dorită (poate fi tratată ca o problemă <strong>de</strong> tip Larger-the-Better)<br />
o Linearitatea (Larger-the-Better): este folosită când caracteristicile dinamice trebuie sa<br />
aibă proporţionalitate între intrare şi rezultat.<br />
De fapt obiectivul optimizării procesului <strong>de</strong> prelucrare ar fi: calitate maximă-pier<strong>de</strong>ri minimeproductivitate<br />
maximă. Pentru <strong>de</strong>terminarea celor mai bune valori ale parametrilor implicaţi in<br />
procesul <strong>de</strong> prelucrare, se poate utiliza analiza factorială.<br />
În opoziţie cu analiza factorială, aproximarea lui Taguchi reduce numărul <strong>de</strong> experimente la un<br />
mo<strong>de</strong>l rezonabil în termeni <strong>de</strong> cost şi timp, prin folosirea şirurilor ortogonale. Ea este utilizată în<br />
domenii diferite ca: fizică, chimie, ştiinţe agricole, statistică, management şi afaceri, medicină.<br />
Alegerea şirurilor ortogonale potrivite pentru problema studiată este principala dificultate a<br />
aproximării lui Taguchi. În literatura <strong>de</strong> specialitate sunt cunoscute multe şiruri ortogonale însă nu a<br />
fost găsită o schemă completă care să conţină toate şirurile ortogonale corespunzătoare chiar şi<br />
unui număr mic <strong>de</strong> experimente.<br />
Lista cu şirurile ortogonale frecvent utilizate este:<br />
Experimente Scheme<br />
2 3<br />
4<br />
2 7<br />
8<br />
9<br />
16<br />
18<br />
2 5<br />
2 3<br />
3 4<br />
3 3<br />
4 5<br />
2 15<br />
2 1 ×3 7<br />
2 2 ×3 6<br />
3 7<br />
2 1 ×3 6<br />
2 1 ×3 4<br />
2 1 ×3 3<br />
3 3<br />
27<br />
Şirurile ortogonale pot fi clasificate astfel:<br />
÷ şiruri ortogonale cu nivel fix (toţi factorii au acelaşi număr <strong>de</strong> nivele)<br />
÷ şiruri ortogonale cu nivel mixt (factorii au număr diferit <strong>de</strong> nivele)<br />
Problema <strong>de</strong> studiu<br />
Fiind dat un numar n <strong>de</strong> experimente, care este numărul maxim <strong>de</strong> variabile şi care este numărul <strong>de</strong><br />
nivele pentru fiecare variabilă astfel încât să obţinem un şir ortogonal?<br />
S-au <strong>de</strong>terminat şirurile ortogonale pentru un numar <strong>de</strong> 4, 6, 8, 9, 10, 12, 14, 15, şi 16 <strong>de</strong><br />
experimente. Numărul <strong>de</strong> factori şi numărul <strong>de</strong> nivele corespunzător pentru fiecare sunt prezentaţi<br />
în tabelul <strong>de</strong> mai jos:<br />
nexp nf L1 ∑MF1 L2 ∑MF2 L3 ∑MF3 nexp nf L1 ∑MF1 L2 ∑MF2 L3 ∑MF3<br />
4 3 4 2 2 1 12 5 12 1 2 4<br />
2 3 6 5<br />
6 3 6 1 3 2 4 2 3 2 2 1<br />
3 3 4 1 3 2 2 2<br />
2 1 3 2 3 1 2 4<br />
8 7 4 4 2 3 4 12 4<br />
4 2 2 5 3 12 1 6 2<br />
2 7 14 6 7 5 2 1<br />
6 8 3 4 2 2 1 5 14 1 7 4<br />
60
9<br />
10<br />
12<br />
8 1 4 3 2 2 15 8 5 4 3 4<br />
8 1 4 1 2 4 7 5 5 3 2<br />
4 6 15 1 3 6<br />
5 8 3 2 2 5 2 3 5<br />
8 2 2 3 5 1 3 6<br />
8 1 4 3 2 1<br />
3 7<br />
8 1 2 4 6 15 1 5 5<br />
4 8 4 5 6<br />
5 3 5<br />
5 3 3 3<br />
4 9 4 16 15 2 15<br />
9 2 3 2 14 4 1 2 13<br />
9 1 3 3 13 8 1 2 12<br />
6 10 1 5 5<br />
4 2 2 11<br />
3 5 2 2 1 12 16 1 2 11<br />
11 2 11 10 16 1 8 1 2 8<br />
10 4 1 2 9 9 4 9<br />
9 4 2 2 7<br />
4 3 2 6<br />
7 4 4 2 3 7 8 7<br />
4 3 2 4 5 16 5<br />
3 7<br />
16 2 2 3<br />
6 4 6<br />
4 3 3 1 2 2<br />
4 2 3 1 2 3<br />
3 4 2 2<br />
3 3 2 3<br />
61<br />
nexp = numărul <strong>de</strong> experimente<br />
nf = numarul maxim <strong>de</strong> factori<br />
Li = niveluri associate cu factorul <strong>de</strong> ordinul i<br />
∑MFi = numărul maxim <strong>de</strong> factori pentru un nivel<br />
specificat<br />
Programarea lineară poate fi utilizată la construcţia şirurilor cu nivel fix în timp ce pentru<br />
construcţia şirurilor cu nivel mixt s-a folosit metoda înlocuirii. Analiza şirurilor ortogonale arată că<br />
un nou factor poate fi construit pe baza combinaţiei lineare a doi factori existenţi. Aşadar, un factor<br />
ce este in<strong>de</strong>pen<strong>de</strong>nt <strong>de</strong> ceilalţi factori din şirurile ortogonale verifică relaţia:<br />
(10)x·A + B, (100)x·A + (10)x·B + C,<br />
un<strong>de</strong> x reprezintă numărul <strong>de</strong> nivele, A, B şi C sunt elementele unui vector ca valorile ca modulo x<br />
(<strong>de</strong> la zero la nE - 1, nE = număr experimente.<br />
Rezultate:<br />
Pentru L8 s-au obţinut şirurile ortogonal din tabelul următor:<br />
Factor(Nivele)<br />
L8(2 7 ) A(2) B(2) C(2) D(2) E(2) F(2) G(2)<br />
1 0 1 1 1 0 0 0<br />
2 1 1 1 0 1 1 0<br />
3 0 1 0 0 1 0 1<br />
4 1 1 0 1 0 1 1<br />
5 0 0 1 0 0 1 1<br />
6 1 0 1 1 1 0 1<br />
7 0 0 0 1 1 1 0<br />
8 1 0 0 0 0 0 0<br />
Şirul ortogonal L8 (4 1 ×2 5 ) s-a obţinut ca o combinaţie lineară a factorilor A şi B:<br />
Factor(Nivele)<br />
L8 (4 1 ×2 5 ) Y(2) C(2) D(2) E(2) F(2) G(2)<br />
1 1 1 1 0 0 0<br />
2 3 1 0 1 1 0<br />
3 1 0 0 1 0 1<br />
4 3 0 1 0 1 1
5 0 1 0 0 1 1<br />
6 2 1 1 1 0 1<br />
7 0 0 1 1 1 0<br />
8 2 0 0 0 0 0<br />
Şirul ortogonal L8 (4 2 ×2 3 ) s-a obţinut prin combinaţia lineară a factorilor C şi D:<br />
L8 (4 Factor(Nivele)<br />
2 ×2 3 )<br />
Y(4) Z(4) E(4) F(4) G(4)<br />
1 1 3 0 0 0<br />
2 3 2 1 1 0<br />
3 1 0 1 0 1<br />
4 3 1 0 1 1<br />
5 0 2 0 1 1<br />
6 2 3 1 0 1<br />
7 0 1 1 1 0<br />
8 2 0 0 0 0<br />
Şirul ortogonal L8 (8 1 ×2 4 ) s-a obţinut prin combinaţia lineară a factorilor A, B şi C.<br />
Factor(Level)<br />
L8 (8 1 ×2 4 )<br />
Q(8) D(2) E(2) F(2) G(2)<br />
1 3 1 0 0 0<br />
2 7 0 1 1 0<br />
3 2 0 1 0 1<br />
4 6 1 0 1 1<br />
5 1 0 0 1 1<br />
6 5 1 1 0 1<br />
7 0 1 1 1 0<br />
8 4 0 0 0 0<br />
Deşi noii factori pot fi obţinuţi ca o combinaţie lineară nu se poate găsi numărul maxim al tuturor<br />
combinaţiilor posibile.<br />
De exemplu metoda propusă i<strong>de</strong>ntifică un număr <strong>de</strong> 12 scheme ca fiind numărul maxim <strong>de</strong> şiruri<br />
ortogonal pentru L8:<br />
• Şapte factori: 4 4 ×2 3 , 4 2 ×2 5 , 2 7<br />
• Saşe factori: 8 3 ×4 2 ×2 1 , 8 1 ×4 3 ×2 2 , 8 1 ×4 1 ×2 4 , 4 6<br />
• Cinci factor: 8 3 ×2 2 , 8 2 ×2 3 , 8 1 ×4 3 ×2, 8 1 ×2 4<br />
• Patru factori: 8 4<br />
Analog s-au obţinut celelalte şiruri ortogonale. În continuare se redau şirurile ortogonale obţinute:<br />
L4 Factori (nivele)<br />
4 2 ×2 1 A(4) B(4) C(2)<br />
1 0 2 0<br />
2 1 0 1<br />
3 2 3 1<br />
4 3 1 0<br />
L4 Factori (nivele)<br />
2 3 A(2) B(2) C(2)<br />
1 0 1 0<br />
2 1 1 1<br />
3 0 0 1<br />
4 1 0 0<br />
L6 Factori (nivele)<br />
6 1 ×3 2 A(6) B(3) C(3)<br />
1 0 1 0<br />
62
2 1 1 2<br />
3 2 0 1<br />
4 3 2 2<br />
5 4 2 0<br />
6 5 0 1<br />
3<br />
Factori (nivele)<br />
3<br />
A(3) B(3) C(3)<br />
1 0 1 1<br />
2 1 0 2<br />
3 2 2 2<br />
4 0 1 1<br />
5 1 2 0<br />
6 2 0 0<br />
3<br />
Factori (nivele)<br />
2 ×2 1<br />
A(3) B(3) C(2)<br />
1 1 1 0<br />
2 1 1 1<br />
3 2 0 0<br />
4 2 2 1<br />
5 0 2 0<br />
6 0 0 1<br />
L9 Factori (nivele)<br />
3 5 A(3) B(3) C(3) D(3) E(3)<br />
1 0 0 0 0 0<br />
2 0 0 2 2 1<br />
3 0 2 0 2 2<br />
4 1 1 2 0 2<br />
5 1 2 1 0 1<br />
6 1 2 2 1 0<br />
7 2 0 1 1 2<br />
8 2 1 0 1 1<br />
9 2 1 1 2 0<br />
L9 Factor (levels)<br />
9 4 A(9) B(9) C(9) D(9)<br />
1 0 0 7 5<br />
2 1 8 0 4<br />
3 2 1 1 1<br />
4 3 7 8 6<br />
5 4 6 6 0<br />
6 5 5 3 7<br />
7 6 2 2 8<br />
8 7 4 5 3<br />
9 8 3 4 2<br />
L9 Factori (nivele)<br />
9 2 ×3 2 A(9) B(9) C(3) D(3)<br />
1 0 1 1 0<br />
2 1 2 0 2<br />
3 2 4 2 1<br />
4 3 7 2 2<br />
5 4 8 1 1<br />
63
6 5 6 0 0<br />
7 6 5 1 0<br />
8 7 3 0 2<br />
9 8 0 2 1<br />
L9 Factori (nivele)<br />
9 1 ×3 3 A(9) B(3) C(3) D(3)<br />
1 0 1 1 1<br />
2 1 1 0 0<br />
3 2 0 2 2<br />
4 3 1 0 2<br />
5 4 2 2 1<br />
6 5 2 1 0<br />
7 6 0 2 0<br />
8 7 2 1 2<br />
9 8 0 0 1<br />
L10 Factori (nivele)<br />
10 1 ×5 5 A(10) B(5) C(5) D(5) E(5) F(5)<br />
1 0 0 0 0 2 2<br />
2 1 0 4 4 2 2<br />
3 2 4 4 1 0 3<br />
4 3 4 0 3 1 0<br />
5 4 3 1 4 3 4<br />
6 5 3 3 0 4 1<br />
7 6 2 3 2 4 1<br />
8 7 2 1 2 3 4<br />
9 8 1 2 3 1 0<br />
10 9 1 2 1 0 3<br />
L10 Factori (nivele)<br />
5 2 ×2 1 A(5) B(5) C(2)<br />
1 0 0 1<br />
2 1 0 0<br />
3 2 1 1<br />
4 3 1 0<br />
5 4 2 1<br />
6 0 4 0<br />
7 1 4 1<br />
8 2 3 0<br />
9 3 3 1<br />
10 4 2 0<br />
L12<br />
Factori (nivele)<br />
2 11 A(2) B(2) C(2) D(2) E(2) F(2) G(2) H(2) I(2) J(2) K(2)<br />
1 0 1 1 1 1 1 0 0 0 0 0<br />
2 1 1 1 1 0 0 1 1 1 0 0<br />
3 0 1 1 0 0 0 1 0 0 1 1<br />
4 1 1 0 1 1 0 0 1 0 1 1<br />
5 0 1 0 0 0 1 0 1 1 1 0<br />
6 1 1 0 0 1 1 1 0 1 0 1<br />
7 0 0 1 0 1 0 0 1 1 0 1<br />
8 1 0 1 1 0 1 0 0 1 1 1<br />
9 0 0 0 1 1 0 1 0 1 1 0<br />
64
10 1 0 1 0 1 1 1 1 0 1 0<br />
11 0 0 0 1 0 1 1 1 0 0 1<br />
12 1 0 0 0 0 0 0 0 0 0 0<br />
L12<br />
Factori (nivele)<br />
4 1 ×2 9 A(4) B(2) C(2) D(2) E(2) F(2) G(2) H(2) I(2) J(2)<br />
1 0 0 1 1 1 1 1 0 0 0<br />
2 0 1 1 1 1 0 0 1 1 1<br />
3 3 0 1 1 0 0 0 1 0 0<br />
4 3 1 1 0 1 1 0 0 1 0<br />
5 1 0 1 0 0 0 1 0 1 1<br />
6 2 1 1 0 0 1 1 1 0 1<br />
7 2 0 0 1 0 1 0 0 1 1<br />
8 3 1 0 1 1 0 1 0 0 1<br />
9 1 0 0 0 1 1 0 1 0 1<br />
10 1 1 0 1 0 1 1 1 1 0<br />
11 2 0 0 0 1 0 1 1 1 0<br />
12 0 1 0 0 0 0 0 0 0 0<br />
L12<br />
Factori (nivele)<br />
4 2 ×2 7 A(4) B(4) C(2) D(2) E(2) F(2) G(2) H(2) I(2)<br />
1 0 0 0 1 1 1 1 1 0<br />
2 1 1 1 1 1 1 0 0 1<br />
3 2 2 0 1 1 0 0 0 1<br />
4 2 3 1 1 0 1 1 0 0<br />
5 1 3 0 1 0 0 0 1 0<br />
6 3 0 1 1 0 0 1 1 1<br />
7 3 1 0 0 1 0 1 0 0<br />
8 3 2 1 0 1 1 0 1 0<br />
9 1 2 0 0 0 1 1 0 1<br />
10 0 3 1 0 1 0 1 1 1<br />
11 2 1 0 0 0 1 0 1 1<br />
12 0 0 1 0 0 0 0 0 0<br />
L12<br />
Factori (nivele)<br />
4 4 ×2 3 A(4) B(4) C(4) D(4) E(2) F(2) G(2)<br />
1 1 1 1 2 0 1 1<br />
2 1 1 1 2 1 1 1<br />
3 0 2 2 0 0 1 1<br />
4 1 2 3 3 1 1 0<br />
5 3 0 2 1 0 1 0<br />
6 3 3 0 1 1 1 0<br />
7 3 2 0 2 0 0 1<br />
8 2 0 2 3 1 0 1<br />
9 0 3 1 3 0 0 0<br />
10 2 3 3 0 1 0 1<br />
11 2 1 3 1 0 0 0<br />
12 0 0 0 0 1 0 0<br />
L12<br />
Factori (nivele)<br />
4 3 ×2 4 A(4) B(4) C(4) D(2) E(2) F(2) G(2)<br />
1 1 1 0 0 1 1 1<br />
2 1 1 3 1 1 1 1<br />
3 0 2 1 0 1 1 0<br />
65
4 2 0 2 1 1 0 1<br />
5 3 2 1 0 1 0 0<br />
6 2 3 2 1 1 0 0<br />
7 3 0 3 0 0 1 0<br />
8 3 3 0 1 0 1 1<br />
9 0 3 3 0 0 0 1<br />
10 1 2 2 1 0 1 0<br />
11 2 1 1 0 0 0 1<br />
12 0 0 0 1 0 0 0<br />
L12<br />
Factori (nivele)<br />
3 7 A(3) B(3) C(3) D(3) E(3) F(3) G(3)<br />
1 0 1 1 1 1 1 0<br />
2 1 1 1 1 0 2 1<br />
3 2 1 1 1 1 1 2<br />
4 0 0 0 0 2 2 2<br />
5 1 1 1 1 2 0 1<br />
6 2 0 2 2 1 1 2<br />
7 0 0 2 2 1 1 0<br />
8 1 2 0 2 0 2 1<br />
9 2 2 2 0 2 2 0<br />
10 0 2 2 0 0 0 2<br />
11 1 2 0 2 2 0 1<br />
12 2 0 0 0 0 0 0<br />
L12<br />
Factori (nivele)<br />
3 4 ×2 2 A(3) B(3) C(3) D(3) E(2) F(2)<br />
1 1 1 1 1 0 1<br />
2 1 1 1 1 1 1<br />
3 1 1 1 0 0 1<br />
4 1 1 1 0 1 1<br />
5 0 0 2 2 0 1<br />
6 2 2 0 2 1 1<br />
7 0 2 0 1 0 0<br />
8 0 2 2 2 1 0<br />
9 2 0 0 2 0 0<br />
10 2 0 2 1 1 0<br />
11 2 2 2 0 0 0<br />
12 0 0 0 0 1 0<br />
L12<br />
Factori (nivele)<br />
3 3 ×2 3 A(3) B(3) C(3) D(2) E(2) F(2)<br />
1 1 1 1 0 1 1<br />
2 1 1 0 1 1 1<br />
3 0 0 2 0 1 1<br />
4 1 1 1 1 1 0<br />
5 1 1 0 0 1 0<br />
6 2 2 2 1 1 0<br />
7 2 2 0 0 0 1<br />
8 0 2 1 1 0 1<br />
9 0 2 2 0 0 0<br />
10 2 0 2 1 0 1<br />
11 2 0 1 0 0 0<br />
66
12 0 0 0 1 0 0<br />
L12 Factori (nivele)<br />
4 3 ×3 1 ×2 2 A(4) B(4) C(4) D(3) E(2) F(2)<br />
1 1 1 1 1 0 1<br />
2 1 1 1 1 1 1<br />
3 1 0 2 2 0 1<br />
4 0 3 2 2 1 1<br />
5 3 2 0 0 0 1<br />
6 3 2 3 0 1 1<br />
7 0 3 3 0 0 0<br />
8 2 2 1 1 1 0<br />
9 2 0 3 1 0 0<br />
10 3 1 2 2 1 0<br />
11 2 3 0 2 0 0<br />
12 0 0 0 0 1 0<br />
L12<br />
Factori (nivele)<br />
4 2 ×3 1 ×2 3 A(4) B(4) C(3) D(2) E(2) F(2)<br />
1 1 1 1 0 1 1<br />
2 1 1 2 1 1 1<br />
3 0 2 0 0 1 1<br />
4 1 2 1 1 1 0<br />
5 3 0 2 0 1 0<br />
6 3 3 0 1 1 0<br />
7 3 2 0 0 0 1<br />
8 2 0 1 1 0 1<br />
9 0 3 2 0 0 0<br />
10 2 3 2 1 0 1<br />
11 2 1 1 0 0 0<br />
12 0 0 0 1 0 0<br />
L12 Factori (nivele)<br />
4 6 A(4) B(4) C(4) D(4) E(4) F(4)<br />
1 0 0 0 0 0 2<br />
2 1 0 0 3 3 0<br />
3 2 0 3 0 3 1<br />
4 3 1 1 3 1 3<br />
5 0 1 3 3 0 2<br />
6 1 3 0 1 3 3<br />
7 2 1 3 1 2 2<br />
8 3 2 1 0 0 1<br />
9 0 3 2 1 2 1<br />
10 1 3 2 2 1 0<br />
11 2 2 2 2 2 3<br />
12 3 2 1 2 1 0<br />
L12 Factori (nivele)<br />
12 1 ×2 4 A(12) B(2) C(2) D(2) E(2)<br />
1 0 1 1 1 0<br />
2 1 1 0 0 1<br />
3 2 0 1 0 0<br />
4 3 0 0 1 0<br />
5 4 0 0 1 1<br />
67
6 5 1 0 0 1<br />
7 6 0 1 0 1<br />
8 7 0 1 1 1<br />
9 8 1 1 0 0<br />
10 9 1 0 1 0<br />
11 10 1 1 1 1<br />
12 11 0 0 0 0<br />
L12 Factori (nivele)<br />
6 5 A(6) B(6) C(6) D(6) E(6)<br />
1 0 0 0 0 3<br />
2 1 0 5 5 0<br />
3 2 1 0 5 4<br />
4 3 1 5 0 2<br />
5 4 2 4 1 5<br />
6 5 2 2 4 3<br />
7 0 5 4 2 4<br />
8 1 5 1 2 0<br />
9 2 4 3 4 5<br />
10 3 4 3 3 1<br />
11 4 3 2 3 2<br />
12 5 3 1 1 1<br />
L12 Factori (nivele)<br />
4 2 ×3 2 ×2 1 A(4) B(4) C(3) D(3) E(2)<br />
1 1 1 0 1 1<br />
2 1 1 1 1 1<br />
3 1 2 2 1 0<br />
4 0 2 0 0 1<br />
5 3 0 1 1 0<br />
6 3 2 2 0 1<br />
7 3 3 0 0 0<br />
8 0 3 1 2 0<br />
9 2 3 2 2 1<br />
10 2 1 0 2 0<br />
11 2 0 1 2 1<br />
12 0 0 2 0 0<br />
L12 Factori (nivele)<br />
4 1 ×3 2 ×2 2 A(4) B(3) C(3) D(2) E(2)<br />
1 1 1 1 0 1<br />
2 2 1 1 1 1<br />
3 1 1 1 0 1<br />
4 2 1 1 1 1<br />
5 3 0 0 0 1<br />
6 0 2 2 1 1<br />
7 1 0 2 0 0<br />
8 2 0 2 1 0<br />
9 0 2 0 0 0<br />
10 3 2 0 1 0<br />
11 3 2 2 0 0<br />
12 0 0 0 1 0<br />
L12<br />
Factori (nivele)<br />
68
3 1 ×2 4 A(3) B(2) C(2) D(2) E(2)<br />
1 1 0 1 1 1<br />
2 1 1 1 1 1<br />
3 0 0 1 1 0<br />
4 0 1 1 0 1<br />
5 2 0 1 0 0<br />
6 2 1 1 0 0<br />
7 1 0 0 1 0<br />
8 2 1 0 1 1<br />
9 0 0 0 0 1<br />
10 1 1 0 1 0<br />
11 2 0 0 0 1<br />
12 0 1 0 0 0<br />
L12 Factori (nivele)<br />
12 4 A(12) B(12) C(12) D(12)<br />
1 0 0 0 0<br />
2 1 1 10 11<br />
3 2 11 1 10<br />
4 3 10 11 1<br />
5 4 9 2 7<br />
6 5 2 9 6<br />
7 6 8 7 5<br />
8 7 7 8 2<br />
9 8 6 5 4<br />
10 9 5 6 8<br />
11 10 3 4 9<br />
12 11 4 3 3<br />
L12 Factori (nivele)<br />
12 1 ×6 2 A(12) B(6) C(6)<br />
1 0 1 1<br />
2 1 1 1<br />
3 2 0 5<br />
4 3 4 5<br />
5 4 5 2<br />
6 5 5 0<br />
7 6 4 2<br />
8 7 3 3<br />
9 8 3 4<br />
10 9 2 4<br />
11 10 2 3<br />
12 11 0 0<br />
L14 Factori (nivele)<br />
7 5 ×2 1 B(7) C(7) D(7) E(7) F(7) A(2)<br />
1 0 0 0 0 5 0<br />
2 0 0 6 4 1 1<br />
3 1 6 0 6 0 0<br />
4 1 6 1 2 5 1<br />
5 2 1 4 5 2 0<br />
6 2 5 5 0 2 1<br />
7 3 5 6 1 3 0<br />
69
8 3 4 4 6 4 1<br />
9 4 4 5 3 6 0<br />
10 4 1 2 5 6 1<br />
11 5 2 3 2 1 0<br />
12 5 3 2 3 3 1<br />
13 6 3 3 4 4 0<br />
14 6 2 1 1 0 1<br />
L14 Factori (nivele)<br />
14 1 ×7 4 A(14) B(7) C(7) D(7) E(7)<br />
1 0 0 0 0 0<br />
2 1 0 5 5 6<br />
3 2 6 0 6 4<br />
4 3 1 5 4 3<br />
5 4 6 1 0 6<br />
6 5 5 6 1 4<br />
7 6 5 6 3 1<br />
8 7 4 3 6 0<br />
9 8 3 4 1 1<br />
10 9 4 4 3 2<br />
11 10 3 1 5 2<br />
12 11 1 2 4 5<br />
13 12 2 3 2 5<br />
14 13 2 2 2 3<br />
L15<br />
Factori (nivele)<br />
5 4 ×3 3 A(5) B(5) C(5) D(5) E(3) F(3) G(3) H(3)<br />
1 0 0 0 0 0 0 0 1<br />
2 1 0 0 2 2 2 2 0<br />
3 2 0 4 3 0 1 2 2<br />
4 3 1 4 3 1 0 0 0<br />
5 4 1 0 4 2 0 1 2<br />
6 0 1 4 2 2 2 1 1<br />
7 1 4 1 4 1 2 0 2<br />
8 2 2 3 1 1 1 0 2<br />
9 3 2 1 3 0 2 1 1<br />
10 4 2 3 1 1 1 2 1<br />
11 0 4 2 4 0 0 2 0<br />
12 1 4 2 0 2 0 2 2<br />
13 2 3 3 2 2 1 0 0<br />
14 3 3 2 0 0 2 1 1<br />
15 4 3 1 1 1 1 1 0<br />
L15<br />
Factori (nivele)<br />
15 1 ×3 6 A(15) B(3) C(3) D(3) E(3) F(3) G(3)<br />
1 0 0 0 0 0 1 1<br />
2 1 0 0 2 1 0 1<br />
3 2 0 2 0 2 2 1<br />
4 3 2 2 2 0 2 0<br />
5 4 2 2 0 1 1 2<br />
6 5 2 0 2 2 1 0<br />
7 6 2 1 1 0 0 2<br />
8 7 2 0 1 2 2 2<br />
70
9 8 0 2 2 2 1 1<br />
10 9 1 2 1 1 0 0<br />
11 10 1 1 1 0 1 1<br />
12 11 1 1 1 2 0 2<br />
13 12 1 1 0 1 0 0<br />
14 13 1 0 0 1 2 0<br />
15 14 0 1 2 0 2 2<br />
L15<br />
Factori (nivele)<br />
5 5 ×3 2 A(5) B(5) C(5) D(5) E(5) F(3) G(3)<br />
1 0 0 0 0 0 0 0<br />
2 1 0 0 2 3 2 2<br />
3 2 0 4 3 4 0 1<br />
4 3 1 4 3 0 2 0<br />
5 4 1 0 4 4 1 0<br />
6 0 1 4 2 3 1 2<br />
7 1 4 1 4 2 1 1<br />
8 2 2 3 1 1 2 1<br />
9 3 2 1 3 0 2 2<br />
10 4 2 3 1 1 0 2<br />
11 0 4 2 4 1 0 1<br />
12 1 4 2 0 4 2 1<br />
13 2 3 3 2 2 1 0<br />
14 3 3 2 0 3 1 0<br />
15 4 3 1 1 2 0 2<br />
L15<br />
Factori (nivele)<br />
5 2 ×3 5 A(5) B(5) C(3) D(3) E(3) F(3) G(3)<br />
1 0 0 0 0 0 0 0<br />
2 1 0 0 0 2 2 2<br />
3 2 0 2 2 0 0 2<br />
4 3 1 0 2 1 1 2<br />
5 4 1 2 0 0 2 0<br />
6 0 1 2 2 2 2 0<br />
7 1 4 0 2 0 1 1<br />
8 2 2 2 1 2 0 1<br />
9 3 2 1 2 1 1 0<br />
10 4 2 1 1 1 2 2<br />
11 0 4 2 0 1 1 2<br />
12 1 4 1 1 0 2 1<br />
13 2 3 1 1 2 0 1<br />
14 3 3 0 1 2 1 0<br />
15 4 3 1 0 1 0 1<br />
L15<br />
Factori (nivele)<br />
5 1 ×3 6 A(5) B(3) C(3) D(3) E(3) F(3) G(3)<br />
1 0 0 0 0 0 0 0<br />
2 1 0 0 2 2 1 1<br />
3 2 0 0 0 2 2 2<br />
4 3 0 2 2 0 0 2<br />
5 4 0 2 0 0 2 0<br />
6 0 1 2 2 1 2 1<br />
7 1 1 2 1 2 0 0<br />
71
8 2 1 2 0 2 1 2<br />
9 3 1 0 2 0 1 2<br />
10 4 1 1 2 2 1 0<br />
11 0 2 1 1 0 2 1<br />
12 1 2 1 1 1 0 1<br />
13 2 2 1 1 1 2 1<br />
14 3 2 1 0 1 0 2<br />
15 4 2 0 1 1 1 0<br />
L15<br />
Factori (nivele)<br />
3 7 A(3) B(3) C(3) D(3) E(3) F(3) G(3)<br />
1 0 0 0 0 0 0 1<br />
2 1 0 0 0 2 2 0<br />
3 2 0 0 2 0 1 2<br />
4 0 0 2 2 0 2 1<br />
5 1 0 2 0 2 0 1<br />
6 2 1 0 2 2 0 1<br />
7 0 1 2 2 2 0 2<br />
8 1 1 1 2 1 2 0<br />
9 2 1 2 0 1 2 2<br />
10 0 2 0 1 2 2 2<br />
11 1 2 1 0 0 1 2<br />
12 2 1 2 1 1 1 0<br />
13 0 2 1 1 1 1 0<br />
14 1 2 1 1 0 0 0<br />
15 2 2 1 1 1 1 1<br />
L15 Factori (nivele)<br />
15 1 ×5 5 A(15) B(5) C(5) D(5) E(5) F(5)<br />
1 0 0 0 0 0 0<br />
2 1 0 4 3 3 3<br />
3 2 0 2 3 3 4<br />
4 3 4 0 4 2 1<br />
5 4 4 0 1 4 3<br />
6 5 4 4 0 0 4<br />
7 6 3 4 0 3 0<br />
8 7 3 3 3 2 2<br />
9 8 3 2 4 1 2<br />
10 9 2 3 4 2 0<br />
11 10 2 2 1 4 1<br />
12 11 2 1 2 0 4<br />
13 12 1 3 2 1 1<br />
14 13 1 1 2 1 2<br />
15 14 1 1 1 4 3<br />
L15 Factori (nivele)<br />
5 6 A(5) B(5) C(5) D(5) E(5) F(5)<br />
1 0 0 0 0 0 0<br />
2 1 0 0 4 3 2<br />
3 2 0 4 0 4 3<br />
4 3 1 4 0 0 3<br />
5 4 1 0 2 4 4<br />
6 0 1 4 4 3 2<br />
72
7 1 4 1 1 2 4<br />
8 2 2 3 4 1 1<br />
9 3 2 1 3 0 3<br />
10 4 2 3 3 1 1<br />
11 0 4 2 2 1 4<br />
12 1 4 2 1 4 0<br />
13 2 3 3 3 2 2<br />
14 3 3 2 1 3 0<br />
15 4 3 1 2 2 1<br />
L15 Factori (nivele)<br />
5 3 ×3 3 A(5) B(5) C(5) D(3) E(3) F(3)<br />
1 0 0 0 0 0 0<br />
2 1 0 0 2 2 2<br />
3 2 0 4 0 0 2<br />
4 3 1 4 0 2 0<br />
5 4 1 0 2 1 0<br />
6 0 1 4 2 2 1<br />
7 1 4 1 0 2 0<br />
8 2 2 3 2 0 1<br />
9 3 2 1 0 1 2<br />
10 4 2 3 1 2 1<br />
11 0 4 2 1 1 2<br />
12 1 4 2 1 1 1<br />
13 2 3 3 2 0 0<br />
14 3 3 2 1 0 1<br />
15 4 3 1 1 1 2<br />
L16<br />
Factori (nivele)<br />
2 15 A(2) B(2) C(2) D(2) E(2) F(2) G(2) H(2) I(2) J(2) K(2) L(2) M(2) N(2) O(2)<br />
1 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0<br />
2 1 1 1 1 1 0 0 0 1 1 1 1 0 0 0<br />
3 0 1 1 1 0 0 0 0 1 0 0 0 1 1 1<br />
4 1 1 1 0 0 1 1 0 0 1 1 0 1 1 0<br />
5 0 1 0 0 1 1 0 0 0 1 0 1 1 0 1<br />
6 1 1 0 1 0 1 0 1 0 0 1 1 0 1 1<br />
7 0 1 0 0 0 0 1 1 1 1 1 0 0 0 1<br />
8 1 1 0 0 1 0 1 1 1 0 0 1 1 1 0<br />
9 0 0 1 0 1 0 1 0 0 0 1 1 0 1 1<br />
10 1 0 1 1 0 0 1 1 0 1 0 1 1 0 1<br />
11 0 0 1 0 0 1 0 1 1 1 0 1 0 1 0<br />
12 1 0 1 0 1 1 0 1 1 0 1 0 1 0 1<br />
13 0 0 0 1 1 0 0 1 0 1 1 0 1 1 0<br />
14 1 0 0 1 1 1 1 0 1 1 0 0 0 1 1<br />
15 0 0 0 1 0 1 1 0 1 0 1 1 1 0 0<br />
16 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0<br />
L16<br />
Factori (nivele)<br />
4 1 ×2 13 A(4) B(2) C(2) D(2) E(2) F(2) G(2) H(2) I(2) J(2) K(2) L(2) M(2) N(2)<br />
1 0 0 0 0 0 0 0 0 0 0 0 0 0 0<br />
2 1 0 0 0 0 0 0 1 1 1 1 1 1 1<br />
3 2 0 0 0 1 1 1 0 0 0 1 1 1 1<br />
4 3 0 0 0 1 1 1 1 1 1 0 0 0 0<br />
73
5 0 0 1 1 0 1 1 0 1 1 0 0 1 1<br />
6 1 0 1 1 0 1 1 1 0 0 1 1 0 0<br />
7 2 0 1 1 1 0 0 0 1 1 1 1 0 0<br />
8 3 0 1 1 1 0 0 1 0 0 0 0 1 1<br />
9 0 1 0 1 1 0 1 1 0 1 0 1 0 1<br />
10 1 1 0 1 1 0 1 0 1 0 1 0 1 0<br />
11 2 1 0 1 0 1 0 1 0 1 1 0 1 0<br />
12 3 1 0 1 0 1 0 0 1 0 0 1 0 1<br />
13 0 1 1 0 1 1 0 1 1 0 0 1 1 0<br />
14 1 1 1 0 1 1 0 0 0 1 1 0 0 1<br />
15 2 1 1 0 0 0 1 1 1 0 1 0 0 1<br />
16 3 1 1 0 0 0 1 0 0 1 0 1 1 0<br />
L16<br />
Factori (nivele)<br />
8 1 ×2 12 A(8) B(2) C(2) D(2) E(2) F(2) G(2) H(2) I(2) J(2) K(2) L(2) M(2)<br />
1 0 0 0 0 0 0 0 0 0 0 0 0 0<br />
2 1 0 0 0 0 0 1 1 1 1 1 1 1<br />
3 2 0 0 1 1 1 0 0 0 1 1 1 1<br />
4 3 0 0 1 1 1 1 1 1 0 0 0 0<br />
5 4 0 1 0 1 1 0 1 1 0 0 1 1<br />
6 5 0 1 0 1 1 1 0 0 1 1 0 0<br />
7 6 0 1 1 0 0 0 1 1 1 1 0 0<br />
8 7 0 1 1 0 0 1 0 0 0 0 1 1<br />
9 0 1 1 1 0 1 1 0 1 0 1 0 1<br />
10 1 1 1 1 0 1 0 1 0 1 0 1 0<br />
11 2 1 1 0 1 0 1 0 1 1 0 1 0<br />
12 3 1 1 0 1 0 0 1 0 0 1 0 1<br />
13 4 1 0 1 1 0 1 1 0 0 1 1 0<br />
14 5 1 0 1 1 0 0 0 1 1 0 0 1<br />
15 6 1 0 0 0 1 1 1 0 1 0 0 1<br />
16 7 1 0 0 0 1 0 0 1 0 1 1 0<br />
L16<br />
Factori (nivele)<br />
4 2 ×2 11 A(4) B(4) C(2) D(2) E(2) F(2) G(2) H(2) I(2) J(2) K(2) L(2) M(2)<br />
1 0 0 0 0 0 0 0 0 0 0 0 0 0<br />
2 1 0 0 0 0 0 1 1 1 1 1 1 1<br />
3 2 0 0 1 1 1 0 0 0 1 1 1 1<br />
4 3 0 0 1 1 1 1 1 1 0 0 0 0<br />
5 0 1 1 0 1 1 0 1 1 0 0 1 1<br />
6 1 1 1 0 1 1 1 0 0 1 1 0 0<br />
7 2 1 1 1 0 0 0 1 1 1 1 0 0<br />
8 3 1 1 1 0 0 1 0 0 0 0 1 1<br />
9 0 2 1 1 0 1 1 0 1 0 1 0 1<br />
10 1 2 1 1 0 1 0 1 0 1 0 1 0<br />
11 2 2 1 0 1 0 1 0 1 1 0 1 0<br />
12 3 2 1 0 1 0 0 1 0 0 1 0 1<br />
13 0 3 0 1 1 0 1 1 0 0 1 1 0<br />
14 1 3 0 1 1 0 0 0 1 1 0 0 1<br />
15 2 3 0 0 0 1 1 1 0 1 0 0 1<br />
16 3 3 0 0 0 1 0 0 1 0 1 1 0<br />
L16<br />
Factori (nivele)<br />
16×2 11 A(16) B(2) C(2) D(2) E(2) F(2) G(2) H(2) I(2) J(2) K(2) L(2)<br />
74
1 0 0 0 0 0 0 0 0 0 0 0 0<br />
2 1 0 0 0 0 1 1 1 1 1 1 1<br />
3 2 0 1 1 1 0 0 0 1 1 1 1<br />
4 3 0 1 1 1 1 1 1 0 0 0 0<br />
5 4 1 0 1 1 0 1 1 0 0 1 1<br />
6 5 1 0 1 1 1 0 0 1 1 0 0<br />
7 6 1 1 0 0 0 1 1 1 1 0 0<br />
8 7 1 1 0 0 1 0 0 0 0 1 1<br />
9 8 1 1 0 1 1 0 1 0 1 0 1<br />
10 9 1 1 0 1 0 1 0 1 0 1 0<br />
11 10 1 0 1 0 1 0 1 1 0 1 0<br />
12 11 1 0 1 0 0 1 0 0 1 0 1<br />
13 12 0 1 1 0 1 1 0 0 1 1 0<br />
14 13 0 1 1 0 0 0 1 1 0 0 1<br />
15 14 0 0 0 1 1 1 0 1 0 0 1<br />
16 15 0 0 0 1 0 0 1 0 1 1 0<br />
L16<br />
Factori (nivele)<br />
16×8×2 8 A(16) B(8) C(2) D(2) E(2) F(2) G(2) H(2) I(2) J(2)<br />
1 0 0 0 0 0 0 0 0 0 0<br />
2 1 0 0 0 1 1 1 1 1 1<br />
3 2 1 0 1 0 0 0 1 1 1<br />
4 3 1 1 1 1 1 1 0 0 0<br />
5 4 2 1 1 0 1 1 0 1 1<br />
6 5 2 1 1 1 0 0 1 0 0<br />
7 6 3 1 0 1 0 1 1 0 1<br />
8 7 3 1 0 0 1 0 0 1 0<br />
9 8 7 0 0 0 1 1 1 0 0<br />
10 9 7 1 0 1 0 0 0 1 1<br />
11 10 6 0 1 1 0 1 0 1 0<br />
12 11 6 1 1 0 1 0 1 0 1<br />
13 12 5 0 1 1 1 0 1 1 0<br />
14 13 5 0 1 0 0 1 0 0 1<br />
15 14 4 0 0 1 1 0 0 0 1<br />
16 15 4 1 0 0 0 1 1 1 0<br />
L16<br />
Factori (nivele)<br />
4 9 A(4) B(4) C(4) D(4) E(4) F(4) G(4) H(4) I(4)<br />
1 0 0 0 0 0 0 0 2 2<br />
2 1 0 0 0 3 2 3 0 2<br />
3 2 0 0 3 2 3 1 3 0<br />
4 3 0 3 2 0 0 1 1 0<br />
5 0 1 3 2 0 3 3 2 3<br />
6 1 1 3 1 3 0 3 3 1<br />
7 2 1 3 1 1 3 1 0 2<br />
8 3 1 2 2 3 1 1 2 3<br />
9 0 2 2 3 2 1 0 0 2<br />
10 1 2 2 1 3 3 0 1 0<br />
11 2 2 0 3 0 2 3 1 1<br />
12 3 2 1 2 2 1 2 2 3<br />
13 0 3 1 3 2 0 2 1 1<br />
14 1 3 2 0 1 2 2 3 0<br />
75
15 2 3 1 1 1 2 0 3 3<br />
16 3 3 1 0 1 1 2 0 1<br />
L16<br />
Factori (nivele)<br />
4 3 ×2 6 A(4) B(4) C(4) D(2) E(2) F(2) G(2) H(2) I(2)<br />
1 0 0 0 0 0 0 0 0 0<br />
2 1 0 0 0 1 1 1 1 1<br />
3 2 0 3 0 0 0 0 1 1<br />
4 3 0 2 1 0 1 1 0 1<br />
5 0 1 2 1 1 0 1 1 0<br />
6 1 1 1 1 0 1 0 1 0<br />
7 2 1 1 1 1 0 1 0 1<br />
8 3 1 2 1 1 0 0 0 0<br />
9 0 2 3 1 1 1 0 1 1<br />
10 1 2 1 0 1 1 1 0 0<br />
11 2 2 3 0 1 1 0 0 0<br />
12 3 2 2 0 0 1 1 1 0<br />
13 0 3 3 0 0 0 1 0 1<br />
14 1 3 0 1 0 1 0 0 1<br />
15 2 3 1 1 0 0 1 1 0<br />
16 3 3 0 0 1 0 0 1 1<br />
L16<br />
Factori (nivele)<br />
8 7 A(8) B(8) C(8) D(8) E(8) F(8) G(8)<br />
1 0 0 0 0 0 0 3<br />
2 1 0 0 7 7 7 4<br />
3 2 1 7 0 7 4 5<br />
4 3 1 7 7 0 5 3<br />
5 4 2 6 1 5 4 1<br />
6 5 2 6 6 1 2 4<br />
7 6 3 1 6 4 1 6<br />
8 7 3 3 5 5 2 0<br />
9 0 7 5 5 4 0 2<br />
10 1 7 3 4 3 5 7<br />
11 2 6 5 4 6 3 2<br />
12 3 6 1 3 3 6 1<br />
13 4 5 4 3 2 3 7<br />
14 5 5 2 2 1 6 0<br />
15 6 4 4 1 2 7 6<br />
16 7 4 2 2 6 1 5<br />
L16 Factori (nivele)<br />
16 5 A(16) B(16) C(16) D(16) E(16)<br />
1 0 0 0 0 0<br />
2 1 1 13 9 14<br />
3 2 2 12 13 8<br />
4 3 15 1 1 15<br />
5 4 14 2 15 3<br />
6 5 13 15 2 1<br />
7 6 12 14 8 7<br />
8 7 11 3 14 10<br />
9 8 10 11 11 2<br />
10 9 3 4 12 12<br />
76
11 10 9 9 4 11<br />
12 11 8 10 3 13<br />
13 12 7 7 7 9<br />
14 13 4 8 6 5<br />
15 14 6 5 10 4<br />
16 15 5 6 5 6<br />
L16 Factori (nivele)<br />
16 2 ×2 3 A(16) B(16) C(2) D(2) E(2)<br />
1 0 0 0 0 0<br />
2 1 13 0 1 1<br />
3 2 12 1 0 1<br />
4 3 1 0 1 1<br />
5 4 2 1 0 0<br />
6 5 15 0 1 0<br />
â7 6 14 1 0 0<br />
8 7 3 1 1 1<br />
9 8 11 1 0 1<br />
10 9 4 1 1 0<br />
11 10 9 1 1 0<br />
12 11 10 0 1 0<br />
13 12 7 0 0 1<br />
14 13 8 0 0 1<br />
15 14 5 1 1 1<br />
16 15 6 0 0 0<br />
În comparaţie cu şirurile orthogonale cunoscute, şirurile ortogonale rezultate au avantajul că<br />
permit investigarea unui mare număr <strong>de</strong> factori cu nivele diferite. Având o listă cu toate mulţimile<br />
posibile <strong>de</strong> şiruri ortogonale pentru un număr dat <strong>de</strong> experimente, <strong>de</strong>sign-ul experimental poate fi<br />
imbunătăţit sau simplificat. O optimizare bună a <strong>de</strong>signului unui experiment poate fi obţinută<br />
folosind unu număr mare <strong>de</strong> nivele si un număr mic <strong>de</strong> experimente. Trebuie menţionat că prin<br />
algoritmul testat odată ce numărul <strong>de</strong> experimente creşte, timpul pentru generarea numărului maxim<br />
<strong>de</strong> şiruri ortogonale creşte şi el.<br />
În <strong>de</strong>finirea populaţiilor statistice, care intervin în diferite studii trebuie stabilite cu claritate:<br />
÷ criteriile <strong>de</strong> inclu<strong>de</strong>re (condiţiile în care o entitate este un element al populaţiei)<br />
÷ criteriile <strong>de</strong> exclu<strong>de</strong>re (condiţiile în care o entitate nu aparţine populaţiei).<br />
2008A1. I<strong>de</strong>ntificarea meto<strong>de</strong>lor <strong>de</strong> analiză<br />
O serie <strong>de</strong> materiale tratând subiectul analizelor chimice şi instrumentale realizate în scopul<br />
i<strong>de</strong>ntificării proprietăţilor şi activităţilor substanţelor chimice cu activitate biologică şi potenţă<br />
farmaceutică (Jäntschi, 2002-CIA; Jäntschi, 2003-MTPS; Jäntschi, 2003-MME; Jäntschi, 2003-<br />
CIA; Jäntschi & Bolboacă, 2003-ACIA; Pică & others, 2004-ASOC; Pică & others, 2004-OCAS;<br />
Jäntschi, 2005-MTPS) şi în acelaşi timp <strong>de</strong>rularea activităţii a permis capitalizarea rezultatelor <strong>de</strong><br />
i<strong>de</strong>ntificare a meto<strong>de</strong>lor <strong>de</strong> analiză în două noi studii Cosma & others, 2008-IMCC; Suciu & others,<br />
2008-HMPP).<br />
Chimie Matematică<br />
Studiul sistematic prin instrumente specifice <strong>de</strong> chimie matematică a fost iniţiat <strong>de</strong> Crum-Brown şi<br />
Fraser în 1868 prin lucrarea [On the connection between chemical constitution and physiological action.<br />
Part 1. On the physiological action of the salts of the ammonium bases, <strong>de</strong>rived from Strychnia, Brucia,<br />
Thebia, Co<strong>de</strong>ia, Morphia, and Nicotia, Trans R Soc Edinb 25:151-203].<br />
Un pas important în domeniul chimie matematice s-a făcut prin introducerea noţiunii <strong>de</strong> graf <strong>de</strong><br />
77
către Sylvester în 1874 prin lucrarea [On an Application of the New Atomic Theory to the Graphical<br />
Representation of the Invariants and Covariants of Binary Quantics - With Three Appendices, Am J Math, 1,<br />
64-90] şi odată cu aceasta s-au <strong>de</strong>schis posibilităţile <strong>de</strong> explorare a topologiei moleculare. O serie <strong>de</strong><br />
monografii au revizuit şi complectat <strong>de</strong>-a lungul timpului conceptele <strong>de</strong> teoria grafurilor [(Harary,<br />
1969): Graph Theory, Addison - Wesley, Reading, MA], aplicaţiile grafurilor în chimie [(Kier şi Hall,<br />
1976): Molecular Connectivity in Chemistry and Drug Research, Acad Press, New York, NY], teoria<br />
grafurilor chimice [(Trinajstic, 1983): Chemical Graph Theory, CRC Press, Boca Raton, FL], şi ceea ce<br />
facem referire a fi topologia moleculară [(Diu<strong>de</strong>a şi alţii, 2001 & 2002): Molecular Topology, Nova,<br />
Hutington, NY]. Mo<strong>de</strong>lele matematice ale structurii chimice includ:<br />
÷ reprezentarea tridimensională (şi aici se face apel la Chimia Cuantică);<br />
÷ reprezentarea bidimensională (sub formă <strong>de</strong> formule structurale) numite grafuri moleculare;<br />
÷ reprezentarea sub formă <strong>de</strong> grafuri neorientate în care vârfurile sunt atomi şi legăturile sunt<br />
muchii;<br />
Teoria grafurilor aplicată în studiul structurilor moleculare reprezintă o ştiinţă interdisciplinară,<br />
numită teoria grafurilor chimice sau topologie moleculară. Prin utilizarea instrumentelor<br />
imprumutate din teoria grafurilor, teoria seturilor şi statistică se încearcă i<strong>de</strong>ntificarea facilităţilor<br />
structurale implicate în relaţiile structură-activitate. Partiţia proprietăţii moleculare şi recombinarea<br />
valorilor sale fragmentale prin mo<strong>de</strong>le aditive este unul dintre obiectivele principale. Caracterizarea<br />
topologică a structurilor chimice permite clasificarea moleculelor şi mo<strong>de</strong>larea structurilor<br />
necunoscute cu proprietăţi dorite.<br />
Noţiuni prealabile<br />
÷ Observaţie - o activitate ce consistă în recepţionarea cunoaşterii prin intermediul simţurilor sau<br />
al instrumentelor:<br />
o Observaţia presupune existenţa unui observator şi a unei observabile;<br />
o Recepţionarea cunoaşterii presupune abstractizarea rezultatului observaţiei;<br />
÷ Măsurare - o activitate ce presupune executarea a două operaţii: observarea şi înregistrarea<br />
rezultatelor observaţiei şi <strong>de</strong>pin<strong>de</strong> <strong>de</strong>:<br />
o natura obiectului (material) observat;<br />
o natura fenomenului (imaterial) observat;<br />
o <strong>de</strong> modalitatea <strong>de</strong> măsurare şi înregistrare a rezultatelor observaţiei.<br />
÷ Element (`e`): un obiect al unei observaţii sau al unei abstractizări;<br />
÷ Proprietate (`|(e)`): rezultatul unei operaţii <strong>de</strong> măsurare asupra unui element (`e`);<br />
÷ Mulţime (`S`): o colecţie <strong>de</strong> elemente (`e`) distincte (ordinea nu este relevantă);<br />
o Remarcă: <strong>de</strong> obicei o mulţime se constituie din elemente supuse observaţiei unei<br />
proprietăţi;<br />
÷ Mulţimea vidă (`∅`): o mulţime care nu conţine nici un element;<br />
÷ Valoare <strong>de</strong> a<strong>de</strong>văr - abstractizare binară (cu 2 valori posibile) a rezultatului unei observaţii:<br />
favorabile (`T` sau `0`) sau nefavorabile (`F` sau `1`);<br />
o Remarcă: valoarea <strong>de</strong> a<strong>de</strong>văr este o proprietate (|(e)=0 sau |(e)=1);<br />
÷ I<strong>de</strong>ntitatea logică (`≡`): exprimă faptul că rezultatul unei operaţii <strong>de</strong> măsurare asupra a două<br />
elemente este acelaşi;<br />
÷ Negaţia logică (¬): o operaţie care transformă o valoare <strong>de</strong> a<strong>de</strong>văr în contrariul său (¬0→1;<br />
¬1→0; ¬T→F; ¬F→T);<br />
÷ Apartenenţă (la o mulţime): proprietatea unui element <strong>de</strong> a face parte (∈) sau nu (∉) dintr-o<br />
mulţime;<br />
o Consecinţă:<br />
Apartenenţa unui element la o mulţime are o valoare <strong>de</strong> a<strong>de</strong>văr (`∈` ≡ `T` ≡ `0`;<br />
`∉` ≡ `F` ≡ `1`);<br />
÷ Submulţime (`⊆`): S1⊆S ⇔ [∀e∈S1 ⇒ e∈S]<br />
÷ Produs cartezian (`×`): S1×S2 = {(e1,e2) | e1∈S1 şi e2∈S2};<br />
÷ Relaţie binară (`2-r`): R ⊆ S1×S2;<br />
78
÷ Endorelaţie binară (`2-e-r`): R ⊆ S×S;<br />
÷ Proprietăţi ale endorelaţiilor binare:<br />
o Reflexivitate (`re`): R `re` ⇔ [∀e∈S ⇒ eRe];<br />
o Ireflexivitate (`ir`): R `ir` ⇔ [∀e∈S ⇒ ¬ eRe];<br />
o Coreflexivitate (`cr`): R `cr` ⇔ [∀e1,e2∈S | e1Re2 ⇒ e1≡e2];<br />
o Simetrie (`sy`): R `sy` ⇔ [∀e1,e2∈S | e1Re2 ⇒ e2Re1];<br />
o Antisimetrie (`ns`): R `ns` ⇔ [∀e1,e2∈S | e1Re2 şi e2Re1 ⇒ e1≡e2];<br />
o Asimetrie (`as`): R `as` ⇔ [∀e1,e2∈S | e1Re2 ⇒ ¬ e2Re1];<br />
o Tranzitivitate (`ts`): R `ts` ⇔ [∀e1,e2,e3∈S | e1Re2 şi e2Re3 ⇒ e1Re3];<br />
o Totală (`li`): R `li` ⇔ [∀e1,e2∈S ⇒ e1Re2 sau e2Re1];<br />
o Trihotomă (`tc`): R `tc` ⇔ [∀e1,e2∈S ⇒ !(e1Re2 sau e2Re1 sau e1≡e2)]; ! = exact una din<br />
o Euclidiană (`eu`): R `eu` ⇔ [∀e1,e2,e3∈S | e1Re2 şi e1Re3 ⇒ e2Re3];<br />
o Serială (`se`): R `se` ⇔ [∀e1∈S ∃s2∈S | e1Re2];<br />
o Echivalenţă (`eq`): R `eq` ⇔ R `re` şi R `sy` şi R `ts`;<br />
o Ordine parţială (`po`): R `po` ⇔ R `re` şi R `ns` şi R `ts`;<br />
o Ordine totală (`to`): R `to` ⇔ R `po` şi R `li`;<br />
o Bine ordonată (`wo`): R `wo` ⇔ R `to` şi ¬ R `se`;<br />
o R `sy` şi R `ts` şi R `se` ⇒ R `re`;<br />
÷ Exemple <strong>de</strong> relaţii binare:<br />
o Relaţia `=`:<br />
reflexivă: ∀e ⇒ e = e;<br />
coreflexivă: ∀e1,e2 | e1 = e2 ⇒ e1 ≡ e2;<br />
simetrică: ∀e1,e2 | e1 = e2 ⇒ e2 = e1;<br />
antisimetrică: ∀e1,e2 | e1 = e2 şi e2 = e1 ⇒ e1 ≡ e2;<br />
tranzitivă: ∀e1,e2,e3 | e1 = e2 şi e2 = e3 ⇒ e1 = e3;<br />
euclidiană: ∀e1,e2,e3 | e1 = e2 şi e1 = e3 ⇒ e2 = e3;<br />
echivalenţă: = `re`, `sy`, `ts`;<br />
o Relaţia `≤`:<br />
reflexivă: ∀e ⇒ e ≤ e;<br />
antisimetrică: ∀e1,e2 | e1 ≤ e2 şi e2 ≤ e1 ⇒ e1 ≡ e2;<br />
tranzitivă: ∀e1,e2,e3 | e1 ≤ e2 şi e2 ≤ e3 ⇒ e1 ≤ e3;<br />
totală: ∀e1,e2 ⇒ e1 ≤ e2 sau e2 ≤ e1;<br />
serială: ∀e1 ∃s2 | e1 ≤ e2;<br />
ordine parţială: ≤ `re`, `ns`, `ts`;<br />
ordine totală: ≤ `re`, `ns`, `ts`, `li`;<br />
o Relaţia `
simetrică: ∀e1,e2 | e1 ≠ e2 ⇒ e2 ≠ e1;<br />
o Relaţia `străbun al` şi `<strong>de</strong>scen<strong>de</strong>nt al`:<br />
tranzitivă: A `<strong>de</strong>scen<strong>de</strong>nt al` B şi B `<strong>de</strong>scen<strong>de</strong>nt al` C ⇒ A `<strong>de</strong>scen<strong>de</strong>nt al` C;<br />
o Relaţia distanţă euclidiană finită:<br />
reflexivă: ∀x ⇒ d(x,x)=0 < ∞;<br />
simetrică: ∀x,y ⇒ d(x,y) < ∞ ⇒ d(y,x) < ∞;<br />
tranzitivă: ∀x,y,z | d(x,y) < ∞ şi d(y,z) < ∞ ⇒ d(x,z) < ∞;<br />
euclidiană: ∀x,y,z | d(x,y) < ∞ şi d(x,z) < ∞ ⇒ d(y,z) < ∞;<br />
serială: ∀x ∃y=x | d(x,y)=d(x,x)=0 < ∞;<br />
echivalenţă: d(·,·) < ∞ `re`, `sy`, `ts`;<br />
o Relaţia funcţie <strong>de</strong>finită f:X→Y, y=f(x):<br />
serială: ∀x ∃y | y=f(x);<br />
valoare unică: ∀x,y1,y2 | f(x)=y1 şi f(x)=y2 ⇒ y1≡y2;<br />
injectivă ⇔ ∀x,y | x ≠ y ⇒ f(x) ≠ f(y);<br />
surjectivă ⇔ ∀y ∃x | y=f(x);<br />
bijectivă ⇔ injectivă şi surjectivă;<br />
÷ Funcţie <strong>de</strong> numărare: o funcţie bijectivă <strong>de</strong>finită pe o mulţime cu valori într-o submulţime a<br />
numerelor naturale;<br />
o Consecinţă: funcţia <strong>de</strong> numărare induce în codomeniu o relaţie <strong>de</strong> ordine totală;<br />
÷ Mulţime infinită: o mulţime pe care se poate <strong>de</strong>fini o funcţie <strong>de</strong> numărare şi orice funcţie <strong>de</strong><br />
numărare induce o relaţie <strong>de</strong> ordine totală;<br />
÷ Mulţime finită: o mulţime pe se poate <strong>de</strong>fini o funcţie <strong>de</strong> numărare, dar nu există nici o funcţie<br />
<strong>de</strong> numărare care induce relaţie <strong>de</strong> ordine totală;<br />
÷ Mulţime <strong>de</strong> puterea continuului: o mulţime pe care nu se poate <strong>de</strong>fini o funcţie <strong>de</strong> numărare;<br />
o Consecinţă: orice mulţime <strong>de</strong> puterea continuului (pe care nu se poate <strong>de</strong>fini o funcţie <strong>de</strong><br />
numărare) are acelaşi număr <strong>de</strong> elemente cu mulţimea funcţiilor {f: ℕ → {0,1}}, adică<br />
2 |ℕ| ; <strong>de</strong>monstraţia constă în construcţia unei funcţii bijective între mulţimea funcţiilor<br />
{f:ℕ→{0,1}} şi intervalul <strong>de</strong> numere reale [0,1) folosind exprimarea numerelor din<br />
intervalul [0,1) în baza <strong>de</strong> numeraţie 2 (r01=0.f1f2...);<br />
÷ Şir: o mulţime pe care s-a <strong>de</strong>finit o funcţie <strong>de</strong> numărare;<br />
÷ Şir parţial ordonat: şir în care elementele se află în relaţie <strong>de</strong> ordine parţială;<br />
÷ Şir total ordonat: şir în care elementele se află în relaţie <strong>de</strong> ordine totală;<br />
Noţiuni <strong>de</strong> bază<br />
Un graf G = G(V,E) este o pereche <strong>de</strong> două mulţimi, V - mulţime finită nevidă ale cărei elemente se<br />
numesc vârfuri (v∈V) şi E - mulţime <strong>de</strong> perechi <strong>de</strong> vârfuri (e∈E), care implementează o (endo-<br />
)relaţie binară pe mulţimea V. Două vârfuri vi,vj∈V se numesc adiacente dacă (vi,vj)∈E. Două<br />
perechi <strong>de</strong> vârfuri (vi1,vj1) şi (vi2,vj2) se numesc adiacente dacă au un vârf comun (i1 = i2 sau i1 = j2<br />
sau j1 = i1 sau j1 = j2).<br />
Următoarele remarci caracterizează grafurile chimice:<br />
÷ În general relaţia <strong>de</strong>finită <strong>de</strong> E este ireflexivă (pentru orice v∈V, (v,v)∉E);<br />
÷ Dacă relaţia <strong>de</strong>finită <strong>de</strong> E este simetrică (dacă (v1,v2)∈E atunci (v2,v1)∈E) atunci elementele lui<br />
E se numesc muchii, altfel se numesc arce;<br />
÷ Atunci când se face referinţă la un anume graf G, se notează V = V(G), E = E(G), |V| = N(G), şi<br />
|E| = Q(G); mărimile N(G) şi Q(G) permit transformarea grafului G prin izomorfisme <strong>de</strong><br />
numerotare în grafuri (relaţii bijective sau corespon<strong>de</strong>nţe 1 la 1) ale căror vârfuri sunt din<br />
mulţimea {1..N}; într-un astfel <strong>de</strong> izomorfism, vârfului vi∈V îi poate fi asociat numărul<br />
i∈{1..N} iar muchiei (vi,vj)∈E perechea <strong>de</strong> numere (i,j)∈{1..N}×{1..N};<br />
÷ Grafului G=(V,E) îi poate fi asociată o pereche <strong>de</strong> mulţimi <strong>de</strong> pon<strong>de</strong>ri WG=(WV,WE), în care<br />
fiecărui element v∈V îi corespun<strong>de</strong> un element wv∈WV (wv numit caracteristica vârfului v) şi<br />
în care fiecărui element e∈E îi corespun<strong>de</strong> un element we∈WE (we numit caracteristica<br />
80
muchiei e); pon<strong>de</strong>rile pentru vârfuri sunt asociate proprietăţilor atomice (cum sunt tipul<br />
atomului şi valenţa) în timp ce pon<strong>de</strong>rile pentru muchii sunt asociate proprietăţilor <strong>de</strong> legătură<br />
(cum sunt tipul legăturii şi lungimea).<br />
În tabelul următor sunt ilustrate câteva utilizări ale diferitelor tipuri <strong>de</strong> grafuri în teoria<br />
grafurilor chimice.<br />
Tabelul 1. Tipuri <strong>de</strong> grafuri chimice<br />
Graf, G Semnificaţie Tip Reprezentare (V,E) Utilizare<br />
Dacă vârfurile reprezintă orientat V={1, 2, 3} Grafuri <strong>de</strong><br />
sisteme chimice atunci nepon<strong>de</strong>rat E={(1,2), (2,1), reacţie<br />
graful reprezintă o reacţie<br />
cu preechilibru<br />
(2,3)}<br />
k2 k1 k3 Dacă vârfurile reprezintă<br />
sisteme chimice atunci<br />
orientat<br />
pon<strong>de</strong>rat<br />
V={1, 2, 3}<br />
E={(1,2), (2,1),<br />
Grafuri <strong>de</strong><br />
reacţie<br />
graful reprezintă o reacţie<br />
(1,3)}<br />
cu preechilibru<br />
VW={k2, k1, k3}<br />
N Cu N Graful reprezintă azanul <strong>de</strong> orientat V={1, 2, 3} Chimia<br />
cupru<br />
pon<strong>de</strong>rat E={(1,2), (3,2)} complecşilor<br />
WV={N, Cu, N} coordinativi<br />
Dacă vârfurile reprezintă neorientat V={1, 2, 3} Structuri<br />
atomi <strong>de</strong> carbon şi atomii <strong>de</strong> pon<strong>de</strong>rat E={(1,2), (2,1), alcătuite din<br />
hidrogen sunt neglijaţi,<br />
(2,3), (3,2)} atomi <strong>de</strong> acelaşi<br />
atunci graful reprezintă<br />
WE={1, 1, 2, 2} tip (uzual atomi<br />
propanona<br />
<strong>de</strong> carbon)<br />
Dacă vârfurile reprezintă neorientat V={1, 2, 3, 4} Structuri<br />
atomi <strong>de</strong> carbon şi atomii <strong>de</strong> nepon<strong>de</strong>rat E={(1,4), (4,1), alcătuite din<br />
hidrogen sunt neglijaţi,<br />
(2,4), (4,2), (3,4), atomi şi legături<br />
atunci graful reprezintă<br />
izobutanul<br />
(4,3)}<br />
<strong>de</strong> acelaşi tip<br />
N<br />
Dacă vârfurile nemarcate neorientat V={1, 2, 3} Structuri fără<br />
reprezintă atomi <strong>de</strong> carbon pon<strong>de</strong>rat E={(1,2), (2,1), legături<br />
şi atomii <strong>de</strong> hidrogen sunt<br />
(2,3), (3,2)} coordinative<br />
neglijaţi, atunci graful<br />
WV={N, C, C}<br />
reprezintă vinilamina<br />
WE={1, 1, 2, 2}<br />
Aşa cum se observă şi din tabelul <strong>de</strong> mai sus, două categorii <strong>de</strong> grafuri sunt <strong>de</strong> interes pentru<br />
topologia moleculară:<br />
÷ Grafurile neorientate şi nepon<strong>de</strong>rate, ce conferă maximă generalitate pentru studiul<br />
proprietăţilor graf-teoretice;<br />
÷ Grafurile neorientate şi pon<strong>de</strong>rate, ce conferă maximă specificitate pentru studiul grafurilor<br />
moleculare.<br />
Se uzează <strong>de</strong> o serie <strong>de</strong> noţiuni fundamentale <strong>de</strong> teoria grafurilor, redate în continuare:<br />
÷ Drum: v1...vk∈W(G) dacă (vi,vi+1)∈E pentru 1≤i
÷ Cale Hamiltoniană: v1...vN(G)∈H(G) dacă v1...vN(G)∈P(G);<br />
÷ Circuit Hamiltonian: v1...vN(G)v1∈HC(G) dacă v1...vN(G)∈H(G) şi (vN(G),v1)∈E(G);<br />
÷ Subgraf (≤): SG=SG(SV,SE)≤G(V,E)=G ⇔ SG graf, SV⊆V şi SE⊆E;<br />
÷ Graf complet: KN=({1..N},{(i,j),(j,i) | 1≤i
ale grafului; între numărul <strong>de</strong> feţe |F|, <strong>de</strong> vârfuri |V| şi muchii |E| se stabileşte relaţia Euler [Euler<br />
L. Solutio Problematis ad Geometriam Situs Pertinentis. Comment Acad Sci I Petropolitanae<br />
1736;8:128-140]: |V|-|E|+|F|=2; un graf este planar ⇔ nu există subgrafuri ale lui G homeomorfe<br />
cu K5 sau K3,3 (redate în figura <strong>de</strong> mai jos), rezultat stabilit <strong>de</strong> Kuratowski [Kuratowski K. Sur le<br />
Problème <strong>de</strong>s Courbes Gauches en Topologie. Fund Math 1930;15:271-283], dar care oricum nu ajută<br />
prea mult în practică, <strong>de</strong>oarece problema <strong>de</strong>terminării dacă H homeomorf al lui G este o<br />
problemă dificilă NP-completă (timpul necesar pentru a o rezolva creşte foarte repe<strong>de</strong> cu<br />
dimensiunea grafurilor); tabelul <strong>de</strong> mai jos redă transformarea unui graf astfel încât muchiile să<br />
nu se intersecteze:<br />
Tabelul 5. Exemplu <strong>de</strong> trasformare a unui graf la graf planar<br />
4 4 3<br />
5<br />
1 2<br />
Două transformări aplicate unui graf prezintă importanţă:<br />
÷ Graful linie: L(G)=(LV,LE) graf linie al lui G=(V,E) se obţine astfel:<br />
o i∈LV ⇔ ei∈E;<br />
o (i,j)∈LE ⇔ ei şi ej sunt adiacente.<br />
÷ Graful complementar: G=G(V,E) complementar lui G=G(V,E) ⇔ E=V×V\E.<br />
Tabelul următor prezintă cele două transformări aplicate unui graf:<br />
Tabelul 6. Exemplu <strong>de</strong> obţinere a grafului linie şi grafului complementar<br />
G L(G) G L(G)<br />
3<br />
Dacă dragul nu este complet, atunci numerotarea induce izomorfie (<strong>de</strong> numerotare). Două grafuri<br />
G1=G1(V,E) şi G2=G2(V,E) sunt izomorfe dacă există fiz astfel încât:<br />
÷ fiz:V(G1)→V(G2);<br />
÷ ∀v1∈V(G1) ∃! v2∈V(G2) a.î. v1=fiz(v2);<br />
÷ ∀v2∈V(G2), ∃! v1∈V(G1) a.î. v1=fiz(v2);<br />
÷ ∀(vi,vj)∈V(G1) ⇒ (fiz(vi),fiz(vj))∈V(G2);<br />
÷ ∀(vi,vj)∈V(G2) ⇒ (fiz -1 (vi),fiz -1 (vj))∈V(G1).<br />
În tabelul următor sunt redate două exemple <strong>de</strong> grafuri, primul în care numerotarea induce<br />
izomorfia <strong>de</strong> numerotare şi al doilea în care numerotarea nu induce izomorfie (cazul grafurilor<br />
complete), un<strong>de</strong> pentru simplitate s-au enumerat muchiile o singură dată:<br />
Tabelul 7. Două exemple <strong>de</strong> grafuri şi izomorfia <strong>de</strong> numerotare<br />
Caz Numerotare Reprezentare<br />
4<br />
2 1<br />
3 4<br />
3 V={1, 2, 3, 4}<br />
2 1<br />
E={(1,2), (2,3), (3,4), (2,4)}<br />
4 2<br />
1 3 1<br />
2 4 3 1 f1(1)=1; f1(2)=3; f1(3)=2/4; f1(4)=4/2;<br />
2<br />
2 4 1<br />
3 2<br />
3<br />
4 1 f2(1)=1; f2(2)=4; f2(3)=3/2; f2(4)=2/3;<br />
3 4<br />
1 2 1 2<br />
4 3 3 f3(1)=2; f3(2)=1; f3(3)=3/4; f3(4)=4/3;<br />
83<br />
5<br />
f 3<br />
1<br />
f 2<br />
f1<br />
2
4<br />
5<br />
6<br />
7<br />
8<br />
9<br />
10<br />
4<br />
1<br />
3 2<br />
4<br />
1<br />
3 2 f4(1)=2; f4(2)=3; f4(3)=4/1; f4(4)=1/4;<br />
1<br />
3<br />
4 2<br />
3<br />
1 4 2 f5(1)=2; f5(2)=4; f5(3)=1/3; f5(4)=3/1;<br />
4<br />
2<br />
1 3<br />
4<br />
2<br />
1 3 f6(1)=3; f6(2)=1; f6(3)=2/4; f6(4)=4/2;<br />
1<br />
4<br />
2 3<br />
4<br />
1 2 3 f7(1)=3; f7(2)=2; f7(3)=1/4; f7(4)=4/1;<br />
1<br />
2<br />
4 3<br />
1<br />
2<br />
4 3 f8(1)=3; f8(2)=4; f8(3)=1/2; f8(4)=2/1;<br />
2<br />
3<br />
1 4<br />
3<br />
2 1 4 f9(1)=4; f9(2)=1; f9(3)=3/2; f9(4)=2/3;<br />
3<br />
1<br />
2 4<br />
3<br />
1<br />
2 4 f10(1)=4; f10(2)=2; f10(3)=3/1; f10(4)=1/3;<br />
1 2<br />
3 4 3 4<br />
2 1 11 f11(1)=1; f11(2)=3; f11(3)=2/4; f11(4)=4/2;<br />
3<br />
2 1 3 2<br />
1 2 V={1, 2, 3}<br />
3<br />
1 E={(1,2), (1,3), (2,3)}<br />
- - -<br />
Analiza căilor şi ciclurilor în grafuri este <strong>de</strong> o importanţă <strong>de</strong>osebită pentru topologia moleculară.<br />
Astfel se folosesc următoarele noţiuni:<br />
÷ Lungime a unui drum: k | v1...vk∈W(G)<br />
÷ Distanţă: di,j=min{k | v1...vk∈P(G), v1=vi, vk=vj}<br />
÷ Detur: δi,j=max{k | v1...vk∈P(G), v1=vi, vk=vj}<br />
÷ Excentricitate: ecci=max{di,j}<br />
÷ Rază: r(G)=min{ecci}<br />
÷ Diametru: d(G)=max{ecci}<br />
÷ Căi distanţă: v1...vk∈D(G) ⇔ v1...vk∈P(G) şi d1,k=k-1<br />
÷ Căi <strong>de</strong>tur: v1...vk∈Δ(G) ⇔ v1...vk∈P(G) şi δ1,k=k-1<br />
Tabelul următor exemplifică noţiunile <strong>de</strong> mai sus pe un graf:<br />
Tabelul 8. Drum, distanţă, <strong>de</strong>tur, excentricitate, rază, diametru şi căi în grafuri<br />
1<br />
2 3 4 5<br />
6<br />
Drumuri Există o infinitate<br />
în graf<br />
Drumuri <strong>de</strong> De lungime 2:<br />
lungime dată ÷ 121; 131; 212; 232; 313; 323; 343; 434; 454; 464; 545; 565; 656; 646;<br />
÷ 123; 132; 134; 213; 231; 234; 312; 321; 345; 346; 431; 432; 456; 465; 543; 546;<br />
564; 654; 645; 643;<br />
Distanţă d1,2=1; d1,3=1; d1,4=2; d1,5=3; d1,6=3;<br />
d2,1=1; d2,3=1; d2,4=2; d2,5=3; d2,6=3;<br />
d3,1=1; d3,2=1; d3,4=1; d3,5=2; d3,6=2;<br />
d4,1=2; d4,2=2; d4,3=1; d4,5=1; d4,6=1;<br />
84
Detur<br />
d5,1=3; d5,2=3; d5,3=2; d5,4=1; d5,6=1;<br />
d6,1=3; d6,2=3; d6,3=2; d6,4=1; d6,5=1;<br />
δ1,2=2; δ1,3=2; δ1,4=3; δ1,5=5; δ1,6=5;<br />
δ2,1=2; δ2,3=2; δ2,4=3; δ2,5=5; δ2,6=5;<br />
δ3,1=2; δ3,2=2; δ3,4=1; δ3,5=3; δ3,6=3;<br />
δ4,1=3; δ4,2=3; δ4,3=1; δ4,5=2; δ4,6=2;<br />
δ5,1=5; δ5,2=5; δ5,3=3; δ5,4=2; δ5,6=2;<br />
δ6,1=5; δ6,2=5; δ6,3=3; δ6,4=2; δ6,5=2;<br />
Excentricitate ecc1=3; ecc2=3; ecc3=2; ecc4=2; ecc5=3; ecc6=3;<br />
Rază r=2;<br />
Diametru d=3;<br />
Căi 12; 123; 1234; 12345; 12346; 123456; 123465;<br />
13; 132; 134; 1345; 1346; 13456; 13465;<br />
21; 213; 2134; 21345; 213456; 213465;<br />
23; 231; 234; 2345; 2346; 23456; 23465;<br />
31; 32; 312; 321; 34; 345; 346; 3456; 3465;<br />
45; 46; 456; 465; 43; 431; 4312; 432; 4321;<br />
56; 564; 5643; 56431; 56432; 564312; 564321;<br />
65; 654; 6543; 65431; 65432; 654312; 654321;<br />
Căi terminale 123456; 123465; 132; 13456; 13465;<br />
213456; 213465; 231; 23456; 23465;<br />
312; 321; 3456; 3465;<br />
456; 465; 4321; 4312;<br />
564312; 564321; 54312; 54321; 546;<br />
645; 64312; 64321; 654312; 654321;<br />
Căi distanţă D1,2={12}; D1,3={13}; D1,4={134}; D1,5={1345}; D1,6={1346}<br />
D2,1={21}; D2,3={23}; D2,4={234}; D2,5={2345}; D2,6={2346}<br />
D3,1={31}; D3,2={32}; D3,4={34}; D3,5={345}; D3,6={346}<br />
D4,1={431}; D4,2={432}; D4,3={43}; D4,5={45}; D4,6={46}<br />
D5,1={5431}; D5,2={5432}; D5,3={543}; D5,4={54}; D5,6={56}<br />
D6,1={6431}; D6,2={6432}; D6,3={643}; D6,4={64}; D6,5={65}<br />
Căi <strong>de</strong>tur Δ1,2={132}; Δ1,3={123}; Δ1,4={1234}; Δ1,5={123465}; Δ1,6={123456}<br />
Δ2,1={231}; Δ2,3={213}; Δ2,4={2134}; Δ2,5={213465}; Δ2,6={213456}<br />
Δ3,1={321}; Δ3,2={312}; Δ3,4={34}; Δ3,5={3465}; Δ3,6={3456}<br />
Δ4,1={4321}; Δ4,2={4312}; Δ4,3={43}; Δ4,5={465}; Δ4,6={456}<br />
Δ5,1={564321}; Δ5,2={564312}; Δ5,3={5643}; Δ5,4={564}; Δ5,6={546}<br />
Δ6,1={654321}; Δ6,2={654312}; Δ6,3={6543}; Δ6,4={654}; Δ6,5={645}<br />
Matrici şi indici<br />
Se folosesc în studii matricile <strong>de</strong> Adiacenţă, Laplacian, Distanţă, Detur, Combinatoriale C(D,2),<br />
C(Δ,2), Wiener, Szeged, Căi, Hosoya, Cluj, Distanţă-Extinse, Detur-Extinse, Reciproce, Drum,<br />
Strat, Secvenţă, şi altele mai puţin frecvent.<br />
Molecula reprezentată în următorul tabel (Tabelul 9) este folosită pentru ilustrarea matricilor ce<br />
urmează:<br />
Tabelul 9. Graful molecular supus analizei folosind matrici<br />
1<br />
5<br />
2<br />
3<br />
4<br />
7<br />
6<br />
11<br />
8<br />
9<br />
10<br />
÷ Secvenţa căilor terminale<br />
o Şirul invariant al numărului <strong>de</strong> căi terminale: 0.0.0.8.12.6.8.8.8.8<br />
o Şirul invariant al lungimii căilor terminale: 0.0.0.32.60.36.56.64.72.80<br />
o Matricea <strong>de</strong> numărare a căilor terminale:<br />
85
PTDS 1 2345678910Σ Π<br />
1 0 00200022 0 642<br />
2 0 00100200 2 538<br />
3 0 00202000 0 420<br />
4 0 00100200 2 538<br />
5 0 00200022 0 642<br />
6 0 00040000 0 420<br />
7 0 00020040 0 642<br />
8 0 00020202 0 642<br />
9 0 00012000 2 537<br />
10 0 00012000 2 537<br />
11 0 00020202 0 642<br />
÷ Secvenţa tuturor căilor<br />
o Şirul invariant al numărului <strong>de</strong> căi: 12.15.19.23.22.18.16.12.8.4<br />
o Şirul invariant al lungimii căilor: 12.30.57.92.110.108.112.96.72.40<br />
o Matricea <strong>de</strong> numărare a căilor:<br />
PADS 1 2345678910Σ Π<br />
1 2 23544442 030157<br />
2 2 34434422 230157<br />
3 3 44422000 019 61<br />
4 2 34434422 230157<br />
5 2 23544442 030157<br />
6 3 44440000 019 59<br />
7 2 22464440 028142<br />
8 2 23454422 028142<br />
9 2 34443222 228142<br />
10 2 34443222 228142<br />
11 2 23454422 028142<br />
÷ Secvenţa căilor distanţă<br />
o Şirul invariant al numărului <strong>de</strong> căi distanţă: 12.15.14.10.8.4.0.0.0.0<br />
o Şirul invariant al lungimii căilor distanţă: 12.30.42.40.40.24.0.0.0.0<br />
o Matricea <strong>de</strong> numărare a căilor distanţă:<br />
PDDS 1 2345678910Σ Π<br />
1 2 21222000 011 39<br />
2 2 32220000 011 32<br />
3 3 42200000 011 25<br />
4 2 32220000 011 32<br />
5 2 21222000 011 39<br />
6 3 44000000 011 23<br />
7 2 22244000 016 64<br />
8 2 23220000 011 33<br />
9 2 34200000 011 28<br />
10 2 34200000 011 28<br />
11 2 23220000 011 33<br />
÷ Secvenţa căilor <strong>de</strong>tur<br />
o Şirul invariant al numărului <strong>de</strong> căi <strong>de</strong>tur: 1.0.11.15.10.2.4.8.8.4<br />
o Şirul invariant al lungimii căilor <strong>de</strong>tur: 1.0.33.60.50.12.28.64.72.40<br />
o Matricea <strong>de</strong> numărare a căilor <strong>de</strong>tur:<br />
PΔDS 1 2345678910Σ Π<br />
1 0 023002220 1166<br />
2 0 022100222 1173<br />
86
3 1 024220000 1145<br />
4 0 022100222 1173<br />
5 0 023002220 1166<br />
6 1 024400000 1143<br />
7 0 024204400 1692<br />
8 0 022300220 1163<br />
9 0 022210022 1168<br />
10 0 022210022 1168<br />
11 0 022300220 1163<br />
÷ Secvenţa distanţelor<br />
o Şirul invariant al distanţelor: 12.15.11.9.6.2.0.0.0.0<br />
o Şirul invariant al lungimii distanţelor: 12.30.33.36.30.12.0.0.0.0<br />
o Matricea <strong>de</strong> numărare a distanţelor:<br />
MDDS 1 2345678910Σ Π<br />
1 2 212210000 1033<br />
2 2 322100000 1027<br />
3 3 421000000 1021<br />
4 2 322100000 1027<br />
5 2 212210000 1033<br />
6 3 430000000 1020<br />
7 2 211220000 1035<br />
8 2 222200000 1030<br />
9 2 332000000 1025<br />
10 2 332000000 1025<br />
11 2 222200000 1030<br />
÷ Secvenţa <strong>de</strong>tururilor<br />
o Şirul invariant al <strong>de</strong>tururilor: 1.0.8.14.10.2.2.6.8.4<br />
o Şirul invariant al lungimii <strong>de</strong>tururilor: 1.0.24.56.50.12.14.48.72.40<br />
o Matricea <strong>de</strong> numărare a <strong>de</strong>tururilor:<br />
MΔDS 1 2345678910Σ Π<br />
1 0 023001220 1059<br />
2 0 022100122 1065<br />
3 1 023220000 1041<br />
4 0 022100122 1065<br />
5 0 023001220 1059<br />
6 1 014400000 1040<br />
7 0 013202200 1055<br />
8 0 012300220 1060<br />
9 0 012210022 1065<br />
10 0 012210022 1065<br />
11 0 012300220 1060<br />
÷ Adiacenţe:<br />
o Σ(·): 12;<br />
o Σ(·) 2 : 12;<br />
o ΣA(·): 12;<br />
o ΣA(·) 2 : 12;<br />
o Matricea:<br />
Ad 1 234567891011Σ<br />
1 0 10010000 0 0 2<br />
2 1 01000000 0 0 2<br />
3 0 10101000 0 0 3<br />
87
÷ Distanţe:<br />
o Σ(·): 153;<br />
o Σ(·) 2 : 537;<br />
o ΣA(·): 12;<br />
o ΣA(·) 2 : 12;<br />
o Matricea:<br />
4 0 01010000 0 0 2<br />
5 1 00100000 0 0 2<br />
6 0 01000001 1 0 3<br />
7 0 00000010 0 1 2<br />
8 0 00000101 0 0 2<br />
9 0 00001010 0 0 2<br />
10 0 00001000 0 1 2<br />
11 0 00000100 1 0 2<br />
Σ 2 23223222 2 224<br />
Di 1 2 3 4 5 6 7 8 9 10 11 Σ<br />
1 0 1 2 2 1 3 6 5 4 4 5 33<br />
2 1 0 1 2 2 2 5 4 3 3 4 27<br />
3 2 1 0 1 2 1 4 3 2 2 3 21<br />
4 2 2 1 0 1 2 5 4 3 3 4 27<br />
5 1 2 2 1 0 3 6 5 4 4 5 33<br />
6 3 2 1 2 3 0 3 2 1 1 2 20<br />
7 6 5 4 5 6 3 0 1 2 2 1 35<br />
8 5 4 3 4 5 2 1 0 1 3 2 30<br />
9 4 3 2 3 4 1 2 1 0 2 3 25<br />
10 4 3 2 3 4 1 2 3 2 0 1 25<br />
11 5 4 3 4 5 2 1 2 3 1 0 30<br />
Σ 33 27 21 27 33 20 35 30 25 25 30 306<br />
÷ Reciproce <strong>de</strong> Distanţe:<br />
o Σ(·): 26.95;<br />
o Σ(·) 2 : 17.8302(7);<br />
o ΣA(·): 12;<br />
o ΣA(·) 2 : 12;<br />
o Matricea:<br />
RDi 1 2 3 4 5 6 7 8 9 10 11 Σ<br />
1 0.000 1.000 0.500 0.500 1.000 0.333 0.167 0.200 0.250 0.250 0.200 4.400<br />
2 1.000 0.000 1.000 0.500 0.500 0.500 0.200 0.250 0.333 0.333 0.250 4.867<br />
3 0.500 1.000 0.000 1.000 0.500 1.000 0.250 0.333 0.500 0.500 0.333 5.917<br />
4 0.500 0.500 1.000 0.000 1.000 0.500 0.200 0.250 0.333 0.333 0.250 4.867<br />
5 1.000 0.500 0.500 1.000 0.000 0.333 0.167 0.200 0.250 0.250 0.200 4.400<br />
6 0.333 0.500 1.000 0.500 0.333 0.000 0.333 0.500 1.000 1.000 0.500 6.000<br />
7 0.167 0.200 0.250 0.200 0.167 0.333 0.000 1.000 0.500 0.500 1.000 4.317<br />
8 0.200 0.250 0.333 0.250 0.200 0.500 1.000 0.000 1.000 0.333 0.500 4.567<br />
9 0.250 0.333 0.500 0.333 0.250 1.000 0.500 1.000 0.000 0.500 0.333 5.000<br />
10 0.250 0.333 0.500 0.333 0.250 1.000 0.500 0.333 0.500 0.000 1.000 5.000<br />
11 0.200 0.250 0.333 0.250 0.200 0.500 1.000 0.500 0.333 1.000 0.000 4.567<br />
Σ 4.400 4.867 5.917 4.867 4.400 6.000 4.317 4.567 5.000 5.000 4.567 53.900<br />
÷ Detururi:<br />
o Σ(·): 317;<br />
o Σ(·) 2 : 2149;<br />
o ΣA(·): 51;<br />
88
o ΣA(·) 2 : 231;<br />
o Matricea:<br />
De 1 2 3 4 5 6 7 8 9 10 11 Σ<br />
1 0 4 3 3 4 4 7 8 9 9 8 59<br />
2 4 0 4 3 3 5 8 9 10 10 9 65<br />
3 3 4 0 4 3 1 4 5 6 6 5 41<br />
4 3 3 4 0 4 5 8 9 10 10 9 65<br />
5 4 3 3 4 0 4 7 8 9 9 8 59<br />
6 4 5 1 5 4 0 3 4 5 5 4 40<br />
7 7 8 4 8 7 3 0 5 4 4 5 55<br />
8 8 9 5 9 8 4 5 0 5 3 4 60<br />
9 9 10 6 10 9 5 4 5 0 4 3 65<br />
10 9 10 6 10 9 5 4 3 4 0 5 65<br />
11 8 9 5 9 8 4 5 4 3 5 0 60<br />
Σ 59 65 41 65 59 40 55 60 65 65 60 634<br />
÷ Reciproce <strong>de</strong> Detururi:<br />
o Σ(·): 11.8246031746;<br />
o Σ(·) 2 : 3.4927762031;<br />
o ΣA(·): 3.45;<br />
o ΣA(·) 2 : 1.5525;<br />
o Matricea:<br />
RDe 1 2 3 4 5 6 7 8 9 10 11 Σ<br />
1 0.000 0.250 0.333 0.333 0.250 0.250 0.143 0.125 0.111 0.111 0.125 2.032<br />
2 0.250 0.000 0.250 0.333 0.333 0.200 0.125 0.111 0.100 0.100 0.111 1.914<br />
3 0.333 0.250 0.000 0.250 0.333 1.000 0.250 0.200 0.167 0.167 0.200 3.150<br />
4 0.333 0.333 0.250 0.000 0.250 0.200 0.125 0.111 0.100 0.100 0.111 1.914<br />
5 0.250 0.333 0.333 0.250 0.000 0.250 0.143 0.125 0.111 0.111 0.125 2.032<br />
6 0.250 0.200 1.000 0.200 0.250 0.000 0.333 0.250 0.200 0.200 0.250 3.133<br />
7 0.143 0.125 0.250 0.125 0.143 0.333 0.000 0.200 0.250 0.250 0.200 2.019<br />
8 0.125 0.111 0.200 0.111 0.125 0.250 0.200 0.000 0.200 0.333 0.250 1.906<br />
9 0.111 0.100 0.167 0.100 0.111 0.200 0.250 0.200 0.000 0.250 0.333 1.822<br />
10 0.111 0.100 0.167 0.100 0.111 0.200 0.250 0.333 0.250 0.000 0.200 1.822<br />
11 0.125 0.111 0.200 0.111 0.125 0.250 0.200 0.250 0.333 0.200 0.000 1.906<br />
Σ 2.032 1.914 3.150 1.914 2.032 3.133 2.019 1.906 1.822 1.822 1.906 23.649<br />
÷ Matricea Cluj pe Distanţe, CJD:<br />
o Definiţie: CJDi,j = max|CJDSi,j|; {k}∈CJDSi,j ⇔ d(G)k,i
(5, 1) [5, 1] {4, 5}<br />
(1, 6) [1, 2, 3, 6] {1, 5}<br />
(6, 1) [6, 3, 2, 1] {6, 7, 8, 9, 10, 11}<br />
(1, 7) [1, 2, 3, 6, 9, 8, 7] {1, 4, 5}<br />
(1, 7) [1, 2, 3, 6, 10, 11, 7] {1, 4, 5}<br />
(7, 1) [7, 8, 9, 6, 3, 2, 1] {7, 10, 11}<br />
(7, 1) [7, 11, 10, 6, 3, 2, 1] {7, 8, 9}<br />
(1, 8) [1, 2, 3, 6, 9, 8] {1, 4, 5}<br />
(8, 1) [8, 9, 6, 3, 2, 1] {7, 8, 10, 11}<br />
(1, 9) [1, 2, 3, 6, 9] {1, 4, 5}<br />
(9, 1) [9, 6, 3, 2, 1] {7, 8, 9, 10, 11}<br />
(1, 10) [1, 2, 3, 6, 10] {1, 4, 5}<br />
(10, 1) [10, 6, 3, 2, 1] {7, 8, 9, 10, 11}<br />
(1, 11) [1, 2, 3, 6, 10, 11] {1, 4, 5}<br />
(11, 1) [11, 10, 6, 3, 2, 1] {7, 8, 9, 11}<br />
(2, 3) [2, 3] {1, 2}<br />
(3, 2) [3, 2] {3, 4, 6, 7, 8, 9, 10, 11}<br />
(2, 4) [2, 3, 4] {1, 2}<br />
(4, 2) [4, 3, 2] {4, 5}<br />
(2, 5) [2, 1, 5] {2, 3, 6, 7, 8, 9, 10, 11}<br />
(5, 2) [5, 1, 2] {4, 5}<br />
(2, 6) [2, 3, 6] {1, 2, 5}<br />
(6, 2) [6, 3, 2] {6, 7, 8, 9, 10, 11}<br />
(2, 7) [2, 3, 6, 9, 8, 7] {1, 2, 4, 5}<br />
(2, 7) [2, 3, 6, 10, 11, 7] {1, 2, 4, 5}<br />
(7, 2) [7, 8, 9, 6, 3, 2] {7, 10, 11}<br />
(7, 2) [7, 11, 10, 6, 3, 2] {7, 8, 9}<br />
(2, 8) [2, 3, 6, 9, 8] {1, 2, 4, 5}<br />
(8, 2) [8, 9, 6, 3, 2] {7, 8, 11}<br />
(2, 9) [2, 3, 6, 9] {1, 2, 4, 5}<br />
(9, 2) [9, 6, 3, 2] {7, 8, 9, 10, 11}<br />
(2, 10) [2, 3, 6, 10] {1, 2, 4, 5}<br />
(10, 2) [10, 6, 3, 2] {7, 8, 9, 10, 11}<br />
(2, 11) [2, 3, 6, 10, 11] {1, 2, 4, 5}<br />
(11, 2) [11, 10, 6, 3, 2] {7, 8, 11}<br />
(3, 4) [3, 4] {2, 3, 6, 7, 8, 9, 10, 11}<br />
(4, 3) [4, 3] {4, 5}<br />
(3, 5) [3, 4, 5] {2, 3, 6, 7, 8, 9, 10, 11}<br />
(5, 3) [5, 4, 3] {1, 5}<br />
(3, 6) [3, 6] {1, 2, 3, 4, 5}<br />
(6, 3) [6, 3] {6, 7, 8, 9, 10, 11}<br />
(3, 7) [3, 6, 10, 11, 7] {1, 2, 3, 4, 5}<br />
(3, 7) [3, 6, 9, 8, 7] {1, 2, 3, 4, 5}<br />
(7, 3) [7, 8, 9, 6, 3] {7, 11}<br />
(7, 3) [7, 11, 10, 6, 3] {7, 8}<br />
(3, 8) [3, 6, 9, 8] {1, 2, 3, 4, 5}<br />
(8, 3) [8, 9, 6, 3] {7, 8, 11}<br />
(3, 9) [3, 6, 9] {1, 2, 3, 4, 5}<br />
(9, 3) [9, 6, 3] {7, 8, 9}<br />
(3, 10) [3, 6, 10] {1, 2, 3, 4, 5}<br />
90
(10, 3) [10, 6, 3] {7, 10, 11}<br />
(3, 11) [3, 6, 10, 11] {1, 2, 3, 4, 5}<br />
(11, 3) [11, 10, 6, 3] {7, 8, 11}<br />
(4, 5) [4, 5] {3, 4, 6, 7, 8, 9, 10, 11}<br />
(5, 4) [5, 4] {1, 5}<br />
(4, 6) [4, 3, 6] {1, 4, 5}<br />
(6, 4) [6, 3, 4] {6, 7, 8, 9, 10, 11}<br />
(4, 7) [4, 3, 6, 9, 8, 7] {1, 2, 4, 5}<br />
(4, 7) [4, 3, 6, 10, 11, 7] {1, 2, 4, 5}<br />
(7, 4) [7, 8, 9, 6, 3, 4] {7, 10, 11}<br />
(7, 4) [7, 11, 10, 6, 3, 4] {7, 8, 9}<br />
(4, 8) [4, 3, 6, 9, 8] {1, 2, 4, 5}<br />
(8, 4) [8, 9, 6, 3, 4] {7, 8, 11}<br />
(4, 9) [4, 3, 6, 9] {1, 2, 4, 5}<br />
(9, 4) [9, 6, 3, 4] {7, 8, 9, 10, 11}<br />
(4, 10) [4, 3, 6, 10] {1, 2, 4, 5}<br />
(10, 4) [10, 6, 3, 4] {7, 8, 9, 10, 11}<br />
(4, 11) [4, 3, 6, 10, 11] {1, 2, 4, 5}<br />
(11, 4) [11, 10, 6, 3, 4] {7, 8, 11}<br />
(5, 6) [5, 4, 3, 6] {1, 5}<br />
(6, 5) [6, 3, 4, 5] {6, 7, 8, 9, 10, 11}<br />
(5, 7) [5, 4, 3, 6, 9, 8, 7] {1, 2, 5}<br />
(5, 7) [5, 4, 3, 6, 10, 11, 7] {1, 2, 5}<br />
(7, 5) [7, 8, 9, 6, 3, 4, 5] {7, 10, 11}<br />
(7, 5) [7, 11, 10, 6, 3, 4, 5] {7, 8, 9}<br />
(5, 8) [5, 4, 3, 6, 9, 8] {1, 2, 5}<br />
(8, 5) [8, 9, 6, 3, 4, 5] {7, 8, 10, 11}<br />
(5, 9) [5, 4, 3, 6, 9] {1, 2, 5}<br />
(9, 5) [9, 6, 3, 4, 5] {7, 8, 9, 10, 11}<br />
(5, 10) [5, 4, 3, 6, 10] {1, 2, 5}<br />
(10, 5) [10, 6, 3, 4, 5] {7, 8, 9, 10, 11}<br />
(5, 11) [5, 4, 3, 6, 10, 11] {1, 2, 5}<br />
(11, 5) [11, 10, 6, 3, 4, 5] {7, 8, 9, 11}<br />
(6, 7) [6, 10, 11, 7] {1, 2, 3, 4, 5, 6, 9}<br />
(6, 7) [6, 9, 8, 7] {1, 2, 3, 4, 5, 6, 10}<br />
(7, 6) [7, 8, 9, 6] {7, 11}<br />
(7, 6) [7, 11, 10, 6] {7, 8}<br />
(6, 8) [6, 9, 8] {1, 2, 3, 4, 5, 6, 10}<br />
(8, 6) [8, 9, 6] {7, 8}<br />
(6, 9) [6, 9] {1, 2, 3, 4, 5, 6, 10, 11}<br />
(9, 6) [9, 6] {7, 8, 9}<br />
(6, 10) [6, 10] {1, 2, 3, 4, 5, 6, 8, 9}<br />
(10, 6) [10, 6] {7, 10, 11}<br />
(6, 11) [6, 10, 11] {1, 2, 3, 4, 5, 6, 9}<br />
(11, 6) [11, 10, 6] {7, 11}<br />
(7, 8) [7, 8] {7, 10, 11}<br />
(8, 7) [8, 7] {1, 2, 3, 4, 5, 6, 8, 9}<br />
(7, 9) [7, 8, 9] {7, 11}<br />
(9, 7) [9, 8, 7] {1, 2, 3, 4, 5, 6, 9}<br />
(7, 10) [7, 11, 10] {7, 8}<br />
91
(10, 7) [10, 11, 7] {1, 2, 3, 4, 5, 6, 10}<br />
(7, 11) [7, 11] {7, 8, 9}<br />
(11, 7) [11, 7] {1, 2, 3, 4, 5, 6, 10, 11}<br />
(8, 9) [8, 9] {7, 8, 11}<br />
(9, 8) [9, 8] {1, 2, 3, 4, 5, 6, 9, 10}<br />
(8, 10) [8, 9, 6, 10] {7, 8}<br />
(8, 10) [8, 7, 11, 10] {8, 9}<br />
(10, 8) [10, 11, 7, 8] {1, 2, 3, 4, 5, 6, 10}<br />
(8, 11) [8, 7, 11] {8, 9}<br />
(11, 8) [11, 7, 8] {10, 11}<br />
(9, 10) [9, 6, 10] {8, 9}<br />
(10, 9) [10, 6, 9] {10, 11}<br />
(9, 11) [9, 8, 7, 11] {1, 2, 3, 4, 5, 6, 9}<br />
(11, 9) [11, 10, 6, 9] {7, 11}<br />
(11, 9) [11, 7, 8, 9] {10, 11}<br />
(10, 11) [10, 11] {1, 2, 3, 4, 5, 6, 9, 10}<br />
(11, 10) [11, 10] {7, 8, 11}<br />
o Σ(CJD): 229.5;<br />
o Σ(CJD) 2 : 824;<br />
o ΣA(CJD): 60.5;<br />
o ΣA(CJD) 2 : 242;<br />
o Matricea CJD:<br />
CJD 1 2 3 4 5 6 7 8 9 10 11 Σ<br />
1 0 2 2 2 2 2 3 3 3 3 3 25<br />
2 8 0 2 2 8 3 4 4 4 4 4 43<br />
3 8 8 0 8 8 5 5 5 5 5 5 62<br />
4 8 2 2 0 8 3 4 4 4 4 4 43<br />
5 2 2 2 2 0 2 3 3 3 3 3 25<br />
6 6 6 6 6 6 0 7 7 8 8 7 67<br />
7 3 3 2 3 3 2 0 3 2 2 3 26<br />
8 4 3 3 3 4 2 8 0 3 2 2 34<br />
9 5 5 3 5 5 3 7 8 0 2 7 50<br />
10 5 5 3 5 5 3 7 7 2 0 8 50<br />
11 4 3 3 3 4 2 8 2 2 3 0 34<br />
Σ 53 39 28 39 53 27 56 46 36 36 46 459<br />
o Σ(RCJD): 16.441(6);<br />
o Σ(RCJD) 2 : 4.45;<br />
o ΣA(RCJD): 3.308(3);<br />
o ΣA(RCJD) 2 : 0.78(3);<br />
o Matricea RCJD:<br />
RCJD 1 2 3 4 5 6 7 8 9 10 11 Σ<br />
1 0.000 0.500 0.500 0.500 0.500 0.500 0.333 0.333 0.333 0.333 0.333 4.167<br />
2 0.125 0.000 0.500 0.500 0.125 0.333 0.250 0.250 0.250 0.250 0.250 2.833<br />
3 0.125 0.125 0.000 0.125 0.125 0.200 0.200 0.200 0.200 0.200 0.200 1.700<br />
4 0.125 0.500 0.500 0.000 0.125 0.333 0.250 0.250 0.250 0.250 0.250 2.833<br />
5 0.500 0.500 0.500 0.500 0.000 0.500 0.333 0.333 0.333 0.333 0.333 4.167<br />
6 0.167 0.167 0.167 0.167 0.167 0.000 0.143 0.143 0.125 0.125 0.143 1.512<br />
7 0.333 0.333 0.500 0.333 0.333 0.500 0.000 0.333 0.500 0.500 0.333 4.000<br />
8 0.250 0.333 0.333 0.333 0.250 0.500 0.125 0.000 0.333 0.500 0.500 3.458<br />
9 0.200 0.200 0.333 0.200 0.200 0.333 0.143 0.125 0.000 0.500 0.143 2.377<br />
10 0.200 0.200 0.333 0.200 0.200 0.333 0.143 0.143 0.500 0.000 0.125 2.377<br />
92
11 0.250 0.333 0.333 0.333 0.250 0.500 0.125 0.500 0.500 0.333 0.000 3.458<br />
Σ 2.275 3.192 4.000 3.192 2.275 4.033 2.045 2.611 3.325 3.325 2.611 32.883<br />
÷ Matricea Cluj pe Detururi, CJΔ:<br />
o Definiţie: CJΔi,j = max|CJΔSi,j|; {k}∈CJΔSi,j ⇔ d(G)k,i
(2, 10) [2, 1, 5, 4, 3, 6, 9, 8, 7, 11, 10] {2}<br />
(10, 2) [10, 11, 7, 8, 9, 6, 3, 4, 5, 1, 2] {10}<br />
(2, 11) [2, 1, 5, 4, 3, 6, 9, 8, 7, 11] {2}<br />
(11, 2) [11, 7, 8, 9, 6, 3, 4, 5, 1, 2] {10, 11}<br />
(3, 4) [3, 2, 1, 5, 4] {3, 6, 7, 8, 9, 10, 11}<br />
(4, 3) [4, 5, 1, 2, 3] {4}<br />
(3, 5) [3, 2, 1, 5] {3, 6, 7, 8, 9, 10, 11}<br />
(5, 3) [5, 1, 2, 3] {5}<br />
(3, 6) [3, 6] {1, 2, 3, 4, 5}<br />
(6, 3) [6, 3] {6, 7, 8, 9, 10, 11}<br />
(3, 7) [3, 6, 10, 11, 7] {1, 2, 3, 4, 5}<br />
(3, 7) [3, 6, 9, 8, 7] {1, 2, 3, 4, 5}<br />
(7, 3) [7, 8, 9, 6, 3] {7, 11}<br />
(7, 3) [7, 11, 10, 6, 3] {7, 8}<br />
(3, 8) [3, 6, 10, 11, 7, 8] {1, 2, 3, 4, 5}<br />
(8, 3) [8, 7, 11, 10, 6, 3] {8, 9}<br />
(3, 9) [3, 6, 10, 11, 7, 8, 9] {1, 2, 3, 4, 5}<br />
(9, 3) [9, 8, 7, 11, 10, 6, 3] {9}<br />
(3, 10) [3, 6, 9, 8, 7, 11, 10] {1, 2, 3, 4, 5}<br />
(10, 3) [10, 11, 7, 8, 9, 6, 3] {10}<br />
(3, 11) [3, 6, 9, 8, 7, 11] {1, 2, 3, 4, 5}<br />
(11, 3) [11, 7, 8, 9, 6, 3] {10, 11}<br />
(4, 5) [4, 3, 2, 1, 5] {4}<br />
(5, 4) [5, 1, 2, 3, 4] {5}<br />
(4, 6) [4, 5, 1, 2, 3, 6] {4}<br />
(6, 4) [6, 3, 2, 1, 5, 4] {6, 7, 8, 9, 10, 11}<br />
(4, 7) [4, 5, 1, 2, 3, 6, 10, 11, 7] {4}<br />
(4, 7) [4, 5, 1, 2, 3, 6, 9, 8, 7] {4}<br />
(7, 4) [7, 8, 9, 6, 3, 2, 1, 5, 4] {7, 10, 11}<br />
(7, 4) [7, 11, 10, 6, 3, 2, 1, 5, 4] {7, 8, 9}<br />
(4, 8) [4, 5, 1, 2, 3, 6, 10, 11, 7, 8] {4}<br />
(8, 4) [8, 7, 11, 10, 6, 3, 2, 1, 5, 4] {8, 9}<br />
(4, 9) [4, 5, 1, 2, 3, 6, 10, 11, 7, 8, 9] {4}<br />
(9, 4) [9, 8, 7, 11, 10, 6, 3, 2, 1, 5, 4] {9}<br />
(4, 10) [4, 5, 1, 2, 3, 6, 9, 8, 7, 11, 10] {4}<br />
(10, 4) [10, 11, 7, 8, 9, 6, 3, 2, 1, 5, 4] {10}<br />
(4, 11) [4, 5, 1, 2, 3, 6, 9, 8, 7, 11] {4}<br />
(11, 4) [11, 7, 8, 9, 6, 3, 2, 1, 5, 4] {10, 11}<br />
(5, 6) [5, 1, 2, 3, 6] {4, 5}<br />
(6, 5) [6, 3, 2, 1, 5] {6, 7, 8, 9, 10, 11}<br />
(5, 7) [5, 1, 2, 3, 6, 10, 11, 7] {4, 5}<br />
(5, 7) [5, 1, 2, 3, 6, 9, 8, 7] {4, 5}<br />
(7, 5) [7, 8, 9, 6, 3, 2, 1, 5] {7, 10, 11}<br />
(7, 5) [7, 11, 10, 6, 3, 2, 1, 5] {7, 8, 9}<br />
(5, 8) [5, 1, 2, 3, 6, 10, 11, 7, 8] {4, 5}<br />
(8, 5) [8, 7, 11, 10, 6, 3, 2, 1, 5] {8, 9}<br />
(5, 9) [5, 1, 2, 3, 6, 10, 11, 7, 8, 9] {4, 5}<br />
(9, 5) [9, 8, 7, 11, 10, 6, 3, 2, 1, 5] {9}<br />
(5, 10) [5, 1, 2, 3, 6, 9, 8, 7, 11, 10] {4, 5}<br />
(10, 5) [10, 11, 7, 8, 9, 6, 3, 2, 1, 5] {10}<br />
94
(5, 11) [5, 1, 2, 3, 6, 9, 8, 7, 11] {4, 5}<br />
(11, 5) [11, 7, 8, 9, 6, 3, 2, 1, 5] {10, 11}<br />
(6, 7) [6, 10, 11, 7] {1, 2, 3, 4, 5, 6, 9}<br />
(6, 7) [6, 9, 8, 7] {1, 2, 3, 4, 5, 6, 10}<br />
(7, 6) [7, 8, 9, 6] {7, 11}<br />
(7, 6) [7, 11, 10, 6] {7, 8}<br />
(6, 8) [6, 10, 11, 7, 8] {1, 2, 3, 4, 5, 6}<br />
(8, 6) [8, 7, 11, 10, 6] {8}<br />
(6, 9) [6, 10, 11, 7, 8, 9] {1, 2, 3, 4, 5, 6}<br />
(9, 6) [9, 8, 7, 11, 10, 6] {9}<br />
(6, 10) [6, 9, 8, 7, 11, 10] {1, 2, 3, 4, 5, 6}<br />
(10, 6) [10, 11, 7, 8, 9, 6] {10}<br />
(6, 11) [6, 9, 8, 7, 11] {1, 2, 3, 4, 5, 6}<br />
(11, 6) [11, 7, 8, 9, 6] {11}<br />
(7, 8) [7, 11, 10, 6, 9, 8] {7}<br />
(8, 7) [8, 9, 6, 10, 11, 7] {8}<br />
(7, 9) [7, 11, 10, 6, 9] {7}<br />
(9, 7) [9, 6, 10, 11, 7] {9}<br />
(7, 10) [7, 8, 9, 6, 10] {7}<br />
(10, 7) [10, 6, 9, 8, 7] {10}<br />
(7, 11) [7, 8, 9, 6, 10, 11] {7}<br />
(11, 7) [11, 10, 6, 9, 8, 7] {11}<br />
(8, 9) [8, 7, 11, 10, 6, 9] {8}<br />
(9, 8) [9, 6, 10, 11, 7, 8] {9}<br />
(8, 10) [8, 9, 6, 10] {7, 8}<br />
(8, 10) [8, 7, 11, 10] {8, 9}<br />
(10, 8) [10, 11, 7, 8] {1, 2, 3, 4, 5, 6, 10}<br />
(8, 11) [8, 9, 6, 10, 11] {8}<br />
(11, 8) [11, 10, 6, 9, 8] {11}<br />
(9, 10) [9, 8, 7, 11, 10] {9}<br />
(10, 9) [10, 11, 7, 8, 9] {10}<br />
(9, 11) [9, 8, 7, 11] {1, 2, 3, 4, 5, 6, 9}<br />
(11, 9) [11, 10, 6, 9] {7, 11}<br />
(11, 9) [11, 7, 8, 9] {10, 11}<br />
(10, 11) [10, 6, 9, 8, 7, 11] {10}<br />
(11, 10) [11, 7, 8, 9, 6, 10] {11}<br />
o Σ(CJΔ): 127.5;<br />
o Σ(CJΔ) 2 : 268;<br />
o ΣA(CJΔ): 27.5;<br />
o ΣA(CJΔ) 2 : 63;<br />
o Matricea CJΔ:<br />
CJΔ 1 2 3 4 5 6 7 8 9 10 11 Σ<br />
1 0 1 1 1 1 2 2 2 2 2 2 16<br />
2 1 0 1 1 1 1 1 1 1 1 1 10<br />
3 7 7 0 7 7 5 5 5 5 5 5 58<br />
4 1 1 1 0 1 1 1 1 1 1 1 10<br />
5 1 1 1 1 0 2 2 2 2 2 2 16<br />
6 6 6 6 6 6 0 7 6 6 6 6 61<br />
7 3 3 2 3 3 2 0 1 1 1 1 20<br />
8 2 2 2 2 2 1 1 0 1 2 1 16<br />
9 1 1 1 1 1 1 1 1 0 1 7 16<br />
95
10 1 1 1 1 1 1 1 7 1 0 1 16<br />
11 2 2 2 2 2 1 1 1 2 1 0 16<br />
Σ 25 25 18 25 25 17 22 27 22 22 27 255<br />
o Σ(RCJΔ): 38.01(6);<br />
o Σ(RCJΔ) 2 : 26.6857;<br />
o ΣA(RCJΔ): 9.492857;<br />
o ΣA(RCJΔ) 2 : 7.6523809;<br />
o Matricea RCJΔ:<br />
RCJΔ 1 2 3 4 5 6 7 8 9 10 11 Σ<br />
1 0.000 1.000 1.000 1.000 1.000 0.500 0.500 0.500 0.500 0.500 0.500 7.000<br />
2 1.000 0.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 10.000<br />
3 0.143 0.143 0.000 0.143 0.143 0.200 0.200 0.200 0.200 0.200 0.200 1.771<br />
4 1.000 1.000 1.000 0.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 10.000<br />
5 1.000 1.000 1.000 1.000 0.000 0.500 0.500 0.500 0.500 0.500 0.500 7.000<br />
6 0.167 0.167 0.167 0.167 0.167 0.000 0.143 0.167 0.167 0.167 0.167 1.643<br />
7 0.333 0.333 0.500 0.333 0.333 0.500 0.000 1.000 1.000 1.000 1.000 6.333<br />
8 0.500 0.500 0.500 0.500 0.500 1.000 1.000 0.000 1.000 0.500 1.000 7.000<br />
9 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.000 1.000 0.143 9.143<br />
10 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.143 1.000 0.000 1.000 9.143<br />
11 0.500 0.500 0.500 0.500 0.500 1.000 1.000 1.000 0.500 1.000 0.000 7.000<br />
Σ 6.643 6.643 7.667 6.643 6.643 7.700 7.343 6.510 6.867 6.867 6.510 76.033<br />
÷ Matricea Cluj Fragmental pe Distanţe, CFD:<br />
o Definiţie: CFDi,j = max|CFDSi,j|; {k}∈CFDSi,j ⇔ d(Gp)k,i
(1, 11) [1, 2, 3, 6, 10, 11] {1, 4, 5}<br />
(11, 1) [11, 10, 6, 3, 2, 1] {7, 8, 9, 11}<br />
(2, 3) [2, 3] {1, 2}<br />
(3, 2) [3, 2] {3, 4, 6, 7, 8, 9, 10, 11}<br />
(2, 4) [2, 3, 4] {1, 2}<br />
(4, 2) [4, 3, 2] {4, 5}<br />
(2, 5) [2, 1, 5] {2, 3, 6, 7, 8, 9, 10, 11}<br />
(5, 2) [5, 1, 2] {4, 5}<br />
(2, 6) [2, 3, 6] {1, 2, 4, 5}<br />
(6, 2) [6, 3, 2] {6, 7, 8, 9, 10, 11}<br />
(2, 7) [2, 3, 6, 9, 8, 7] {1, 2, 4, 5}<br />
(7, 2) [7, 8, 9, 6, 3, 2] {7, 10, 11}<br />
(2, 7) [2, 3, 6, 10, 11, 7] {1, 2, 4, 5}<br />
(7, 2) [7, 11, 10, 6, 3, 2] {7, 8, 9}<br />
(2, 8) [2, 3, 6, 9, 8] {1, 2, 4, 5}<br />
(8, 2) [8, 9, 6, 3, 2] {7, 8, 10, 11}<br />
(2, 9) [2, 3, 6, 9] {1, 2, 4, 5}<br />
(9, 2) [9, 6, 3, 2] {7, 8, 9, 10, 11}<br />
(2, 10) [2, 3, 6, 10] {1, 2, 4, 5}<br />
(10, 2) [10, 6, 3, 2] {7, 8, 9, 10, 11}<br />
(2, 11) [2, 3, 6, 10, 11] {1, 2, 4, 5}<br />
(11, 2) [11, 10, 6, 3, 2] {7, 8, 9, 11}<br />
(3, 4) [3, 4] {2, 3, 6, 7, 8, 9, 10, 11}<br />
(4, 3) [4, 3] {4, 5}<br />
(3, 5) [3, 4, 5] {2, 3, 6, 7, 8, 9, 10, 11}<br />
(5, 3) [5, 4, 3] {1, 5}<br />
(3, 6) [3, 6] {1, 2, 3, 4, 5}<br />
(6, 3) [6, 3] {6, 7, 8, 9, 10, 11}<br />
(3, 7) [3, 6, 10, 11, 7] {1, 2, 3, 4, 5}<br />
(7, 3) [7, 11, 10, 6, 3] {7, 8, 9}<br />
(3, 7) [3, 6, 9, 8, 7] {1, 2, 3, 4, 5}<br />
(7, 3) [7, 8, 9, 6, 3] {7, 10, 11}<br />
(3, 8) [3, 6, 9, 8] {1, 2, 3, 4, 5}<br />
(8, 3) [8, 9, 6, 3] {7, 8, 10, 11}<br />
(3, 9) [3, 6, 9] {1, 2, 3, 4, 5}<br />
(9, 3) [9, 6, 3] {7, 8, 9, 10, 11}<br />
(3, 10) [3, 6, 10] {1, 2, 3, 4, 5}<br />
(10, 3) [10, 6, 3] {7, 8, 9, 10, 11}<br />
(3, 11) [3, 6, 10, 11] {1, 2, 3, 4, 5}<br />
(11, 3) [11, 10, 6, 3] {7, 8, 9, 11}<br />
(4, 5) [4, 5] {3, 4, 6, 7, 8, 9, 10, 11}<br />
(5, 4) [5, 4] {1, 5}<br />
(4, 6) [4, 3, 6] {1, 2, 4, 5}<br />
(6, 4) [6, 3, 4] {6, 7, 8, 9, 10, 11}<br />
(4, 7) [4, 3, 6, 9, 8, 7] {1, 2, 4, 5}<br />
(7, 4) [7, 8, 9, 6, 3, 4] {7, 10, 11}<br />
(4, 7) [4, 3, 6, 10, 11, 7] {1, 2, 4, 5}<br />
(7, 4) [7, 11, 10, 6, 3, 4] {7, 8, 9}<br />
(4, 8) [4, 3, 6, 9, 8] {1, 2, 4, 5}<br />
(8, 4) [8, 9, 6, 3, 4] {7, 8, 10, 11}<br />
97
(4, 9) [4, 3, 6, 9] {1, 2, 4, 5}<br />
(9, 4) [9, 6, 3, 4] {7, 8, 9, 10, 11}<br />
(4, 10) [4, 3, 6, 10] {1, 2, 4, 5}<br />
(10, 4) [10, 6, 3, 4] {7, 8, 9, 10, 11}<br />
(4, 11) [4, 3, 6, 10, 11] {1, 2, 4, 5}<br />
(11, 4) [11, 10, 6, 3, 4] {7, 8, 9, 11}<br />
(5, 6) [5, 4, 3, 6] {1, 2, 5}<br />
(6, 5) [6, 3, 4, 5] {6, 7, 8, 9, 10, 11}<br />
(5, 7) [5, 4, 3, 6, 9, 8, 7] {1, 2, 5}<br />
(7, 5) [7, 8, 9, 6, 3, 4, 5] {7, 10, 11}<br />
(5, 7) [5, 4, 3, 6, 10, 11, 7] {1, 2, 5}<br />
(7, 5) [7, 11, 10, 6, 3, 4, 5] {7, 8, 9}<br />
(5, 8) [5, 4, 3, 6, 9, 8] {1, 2, 5}<br />
(8, 5) [8, 9, 6, 3, 4, 5] {7, 8, 10, 11}<br />
(5, 9) [5, 4, 3, 6, 9] {1, 2, 5}<br />
(9, 5) [9, 6, 3, 4, 5] {7, 8, 9, 10, 11}<br />
(5, 10) [5, 4, 3, 6, 10] {1, 2, 5}<br />
(10, 5) [10, 6, 3, 4, 5] {7, 8, 9, 10, 11}<br />
(5, 11) [5, 4, 3, 6, 10, 11] {1, 2, 5}<br />
(11, 5) [11, 10, 6, 3, 4, 5] {7, 8, 9, 11}<br />
(6, 7) [6, 10, 11, 7] {1, 2, 3, 4, 5, 6, 9}<br />
(7, 6) [7, 11, 10, 6] {7, 8}<br />
(6, 7) [6, 9, 8, 7] {1, 2, 3, 4, 5, 6, 10}<br />
(7, 6) [7, 8, 9, 6] {7, 11}<br />
(6, 8) [6, 9, 8] {1, 2, 3, 4, 5, 6, 10}<br />
(8, 6) [8, 9, 6] {7, 8}<br />
(6, 9) [6, 9] {1, 2, 3, 4, 5, 6, 10, 11}<br />
(9, 6) [9, 6] {7, 8, 9}<br />
(6, 10) [6, 10] {1, 2, 3, 4, 5, 6, 8, 9}<br />
(10, 6) [10, 6] {7, 10, 11}<br />
(6, 11) [6, 10, 11] {1, 2, 3, 4, 5, 6, 9}<br />
(11, 6) [11, 10, 6] {7, 11}<br />
(7, 8) [7, 8] {7, 10, 11}<br />
(8, 7) [8, 7] {1, 2, 3, 4, 5, 6, 8, 9}<br />
(7, 9) [7, 8, 9] {7, 11}<br />
(9, 7) [9, 8, 7] {1, 2, 3, 4, 5, 6, 9}<br />
(7, 10) [7, 11, 10] {7, 8}<br />
(10, 7) [10, 11, 7] {1, 2, 3, 4, 5, 6, 10}<br />
(7, 11) [7, 11] {7, 8, 9}<br />
(11, 7) [11, 7] {1, 2, 3, 4, 5, 6, 10, 11}<br />
(8, 9) [8, 9] {7, 8, 11}<br />
(9, 8) [9, 8] {1, 2, 3, 4, 5, 6, 9, 10}<br />
(8, 10) [8, 9, 6, 10] {7, 8}<br />
(8, 10) [8, 7, 11, 10] {8, 9}<br />
(10, 8) [10, 11, 7, 8] {1, 2, 3, 4, 5, 6, 10}<br />
(8, 11) [8, 7, 11] {8, 9}<br />
(11, 8) [11, 7, 8] {10, 11}<br />
(9, 10) [9, 6, 10] {8, 9}<br />
(10, 9) [10, 6, 9] {10, 11}<br />
(11, 9) [11, 10, 6, 9] {7, 11}<br />
98
(9, 11) [9, 8, 7, 11] {1, 2, 3, 4, 5, 6, 9}<br />
(11, 9) [11, 7, 8, 9] {10, 11}<br />
(10, 11) [10, 11] {1, 2, 3, 4, 5, 6, 9, 10}<br />
(11, 10) [11, 10] {7, 8, 11}<br />
o Σ(CFD): 237;<br />
o Σ(CFD) 2 : 889;<br />
o ΣA(CFD): 60.5;<br />
o ΣA(CFD) 2 : 242;<br />
o Matricea CFD:<br />
CFD 1 2 3 4 5 6 7 8 9 10 11 Σ<br />
1 0 2 2 2 2 3 3 3 3 3 3 26<br />
2 8 0 2 2 8 4 4 4 4 4 4 44<br />
3 8 8 0 8 8 5 5 5 5 5 5 62<br />
4 8 2 2 0 8 4 4 4 4 4 4 44<br />
5 2 2 2 2 0 3 3 3 3 3 3 26<br />
6 6 6 6 6 6 0 7 7 8 8 7 67<br />
7 3 3 3 3 3 2 0 3 2 2 3 27<br />
8 4 4 4 4 4 2 8 0 3 2 2 37<br />
9 5 5 5 5 5 3 7 8 0 2 7 52<br />
10 5 5 5 5 5 3 7 7 2 0 8 52<br />
11 4 4 4 4 4 2 8 2 2 3 0 37<br />
Σ 53 41 35 41 53 31 56 46 36 36 46 474<br />
o Σ(RCFD): 15.725;<br />
o Σ(RCFD) 2 : 4.16(3);<br />
o ΣA(RCFD): 3.308(3);<br />
o ΣA(RCFD) 2 : 0.78(3);<br />
o Matricea RCFD:<br />
RCFD 1 2 3 4 5 6 7 8 9 10 11 Σ<br />
1 0.000 0.500 0.500 0.500 0.500 0.333 0.333 0.333 0.333 0.333 0.333 4.000<br />
2 0.125 0.000 0.500 0.500 0.125 0.250 0.250 0.250 0.250 0.250 0.250 2.750<br />
3 0.125 0.125 0.000 0.125 0.125 0.200 0.200 0.200 0.200 0.200 0.200 1.700<br />
4 0.125 0.500 0.500 0.000 0.125 0.250 0.250 0.250 0.250 0.250 0.250 2.750<br />
5 0.500 0.500 0.500 0.500 0.000 0.333 0.333 0.333 0.333 0.333 0.333 4.000<br />
6 0.167 0.167 0.167 0.167 0.167 0.000 0.143 0.143 0.125 0.125 0.143 1.512<br />
7 0.333 0.333 0.333 0.333 0.333 0.500 0.000 0.333 0.500 0.500 0.333 3.833<br />
8 0.250 0.250 0.250 0.250 0.250 0.500 0.125 0.000 0.333 0.500 0.500 3.208<br />
9 0.200 0.200 0.200 0.200 0.200 0.333 0.143 0.125 0.000 0.500 0.143 2.244<br />
10 0.200 0.200 0.200 0.200 0.200 0.333 0.143 0.143 0.500 0.000 0.125 2.244<br />
11 0.250 0.250 0.250 0.250 0.250 0.500 0.125 0.500 0.500 0.333 0.000 3.208<br />
Σ 2.275 3.025 3.400 3.025 2.275 3.533 2.045 2.611 3.325 3.325 2.611 31.450<br />
÷ Matricea Cluj Fragmental pe Detururi, CFΔ:<br />
o Definiţie: CFΔi,j = max|CFΔSi,j|; {k}∈CFΔSi,j ⇔ d(Gp)k,i
(1, 3) [1, 5, 4, 3] {1}<br />
(3, 1) [3, 4, 5, 1] {3, 6, 7, 8, 9, 10, 11}<br />
(1, 4) [1, 2, 3, 4] {1}<br />
(4, 1) [4, 3, 2, 1] {4}<br />
(1, 5) [1, 2, 3, 4, 5] {1}<br />
(5, 1) [5, 4, 3, 2, 1] {5}<br />
(1, 6) [1, 5, 4, 3, 6] {1, 2}<br />
(6, 1) [6, 3, 4, 5, 1] {6, 7, 8, 9, 10, 11}<br />
(1, 7) [1, 5, 4, 3, 6, 10, 11, 7] {1, 2}<br />
(7, 1) [7, 11, 10, 6, 3, 4, 5, 1] {7, 8, 9}<br />
(1, 7) [1, 5, 4, 3, 6, 9, 8, 7] {1, 2}<br />
(7, 1) [7, 8, 9, 6, 3, 4, 5, 1] {7, 10, 11}<br />
(1, 8) [1, 5, 4, 3, 6, 10, 11, 7, 8] {1, 2}<br />
(8, 1) [8, 7, 11, 10, 6, 3, 4, 5, 1] {8, 9}<br />
(1, 9) [1, 5, 4, 3, 6, 10, 11, 7, 8, 9] {1, 2}<br />
(9, 1) [9, 8, 7, 11, 10, 6, 3, 4, 5, 1] {9}<br />
(1, 10) [1, 5, 4, 3, 6, 9, 8, 7, 11, 10] {1, 2}<br />
(10, 1) [10, 11, 7, 8, 9, 6, 3, 4, 5, 1] {10}<br />
(1, 11) [1, 5, 4, 3, 6, 9, 8, 7, 11] {1, 2}<br />
(11, 1) [11, 7, 8, 9, 6, 3, 4, 5, 1] {10, 11}<br />
(2, 3) [2, 1, 5, 4, 3] {2}<br />
(3, 2) [3, 4, 5, 1, 2] {3, 6, 7, 8, 9, 10, 11}<br />
(2, 4) [2, 1, 5, 4] {2}<br />
(4, 2) [4, 5, 1, 2] {4}<br />
(2, 5) [2, 3, 4, 5] {2}<br />
(5, 2) [5, 4, 3, 2] {5}<br />
(2, 6) [2, 1, 5, 4, 3, 6] {2}<br />
(6, 2) [6, 3, 4, 5, 1, 2] {6, 7, 8, 9, 10, 11}<br />
(2, 7) [2, 1, 5, 4, 3, 6, 10, 11, 7] {2}<br />
(7, 2) [7, 11, 10, 6, 3, 4, 5, 1, 2] {7, 8, 9}<br />
(2, 7) [2, 1, 5, 4, 3, 6, 9, 8, 7] {2}<br />
(7, 2) [7, 8, 9, 6, 3, 4, 5, 1, 2] {7, 10, 11}<br />
(2, 8) [2, 1, 5, 4, 3, 6, 10, 11, 7, 8] {2}<br />
(8, 2) [8, 7, 11, 10, 6, 3, 4, 5, 1, 2] {8, 9}<br />
(2, 9) [2, 1, 5, 4, 3, 6, 10, 11, 7, 8, 9] {2}<br />
(9, 2) [9, 8, 7, 11, 10, 6, 3, 4, 5, 1, 2] {9}<br />
(2, 10) [2, 1, 5, 4, 3, 6, 9, 8, 7, 11, 10] {2}<br />
(10, 2) [10, 11, 7, 8, 9, 6, 3, 4, 5, 1, 2] {10}<br />
(2, 11) [2, 1, 5, 4, 3, 6, 9, 8, 7, 11] {2}<br />
(11, 2) [11, 7, 8, 9, 6, 3, 4, 5, 1, 2] {10, 11}<br />
(3, 4) [3, 2, 1, 5, 4] {3, 6, 7, 8, 9, 10, 11}<br />
(4, 3) [4, 5, 1, 2, 3] {4}<br />
(3, 5) [3, 2, 1, 5] {3, 6, 7, 8, 9, 10, 11}<br />
(5, 3) [5, 1, 2, 3] {5}<br />
(3, 6) [3, 6] {1, 2, 3, 4, 5}<br />
(6, 3) [6, 3] {6, 7, 8, 9, 10, 11}<br />
(3, 7) [3, 6, 10, 11, 7] {1, 2, 3, 4, 5}<br />
(7, 3) [7, 11, 10, 6, 3] {7, 8, 9}<br />
(3, 7) [3, 6, 9, 8, 7] {1, 2, 3, 4, 5}<br />
(7, 3) [7, 8, 9, 6, 3] {7, 10, 11}<br />
100
(3, 8) [3, 6, 10, 11, 7, 8] {1, 2, 3, 4, 5}<br />
(8, 3) [8, 7, 11, 10, 6, 3] {8, 9}<br />
(3, 9) [3, 6, 10, 11, 7, 8, 9] {1, 2, 3, 4, 5}<br />
(9, 3) [9, 8, 7, 11, 10, 6, 3] {9}<br />
(3, 10) [3, 6, 9, 8, 7, 11, 10] {1, 2, 3, 4, 5}<br />
(10, 3) [10, 11, 7, 8, 9, 6, 3] {10}<br />
(3, 11) [3, 6, 9, 8, 7, 11] {1, 2, 3, 4, 5}<br />
(11, 3) [11, 7, 8, 9, 6, 3] {10, 11}<br />
(4, 5) [4, 3, 2, 1, 5] {4}<br />
(5, 4) [5, 1, 2, 3, 4] {5}<br />
(4, 6) [4, 5, 1, 2, 3, 6] {4}<br />
(6, 4) [6, 3, 2, 1, 5, 4] {6, 7, 8, 9, 10, 11}<br />
(4, 7) [4, 5, 1, 2, 3, 6, 10, 11, 7] {4}<br />
(7, 4) [7, 11, 10, 6, 3, 2, 1, 5, 4] {7, 8, 9}<br />
(4, 7) [4, 5, 1, 2, 3, 6, 9, 8, 7] {4}<br />
(7, 4) [7, 8, 9, 6, 3, 2, 1, 5, 4] {7, 10, 11}<br />
(4, 8) [4, 5, 1, 2, 3, 6, 10, 11, 7, 8] {4}<br />
(8, 4) [8, 7, 11, 10, 6, 3, 2, 1, 5, 4] {8, 9}<br />
(4, 9) [4, 5, 1, 2, 3, 6, 10, 11, 7, 8, 9] {4}<br />
(9, 4) [9, 8, 7, 11, 10, 6, 3, 2, 1, 5, 4] {9}<br />
(4, 10) [4, 5, 1, 2, 3, 6, 9, 8, 7, 11, 10] {4}<br />
(10, 4) [10, 11, 7, 8, 9, 6, 3, 2, 1, 5, 4] {10}<br />
(4, 11) [4, 5, 1, 2, 3, 6, 9, 8, 7, 11] {4}<br />
(11, 4) [11, 7, 8, 9, 6, 3, 2, 1, 5, 4] {10, 11}<br />
(5, 6) [5, 1, 2, 3, 6] {4, 5}<br />
(6, 5) [6, 3, 2, 1, 5] {6, 7, 8, 9, 10, 11}<br />
(5, 7) [5, 1, 2, 3, 6, 10, 11, 7] {4, 5}<br />
(7, 5) [7, 11, 10, 6, 3, 2, 1, 5] {7, 8, 9}<br />
(5, 7) [5, 1, 2, 3, 6, 9, 8, 7] {4, 5}<br />
(7, 5) [7, 8, 9, 6, 3, 2, 1, 5] {7, 10, 11}<br />
(5, 8) [5, 1, 2, 3, 6, 10, 11, 7, 8] {4, 5}<br />
(8, 5) [8, 7, 11, 10, 6, 3, 2, 1, 5] {8, 9}<br />
(5, 9) [5, 1, 2, 3, 6, 10, 11, 7, 8, 9] {4, 5}<br />
(9, 5) [9, 8, 7, 11, 10, 6, 3, 2, 1, 5] {9}<br />
(5, 10) [5, 1, 2, 3, 6, 9, 8, 7, 11, 10] {4, 5}<br />
(10, 5) [10, 11, 7, 8, 9, 6, 3, 2, 1, 5] {10}<br />
(5, 11) [5, 1, 2, 3, 6, 9, 8, 7, 11] {4, 5}<br />
(11, 5) [11, 7, 8, 9, 6, 3, 2, 1, 5] {10, 11}<br />
(6, 7) [6, 10, 11, 7] {1, 2, 3, 4, 5, 6, 9}<br />
(7, 6) [7, 11, 10, 6] {7, 8}<br />
(6, 7) [6, 9, 8, 7] {1, 2, 3, 4, 5, 6, 10}<br />
(7, 6) [7, 8, 9, 6] {7, 11}<br />
(6, 8) [6, 10, 11, 7, 8] {1, 2, 3, 4, 5, 6}<br />
(8, 6) [8, 7, 11, 10, 6] {8}<br />
(6, 9) [6, 10, 11, 7, 8, 9] {1, 2, 3, 4, 5, 6}<br />
(9, 6) [9, 8, 7, 11, 10, 6] {9}<br />
(6, 10) [6, 9, 8, 7, 11, 10] {1, 2, 3, 4, 5, 6}<br />
(10, 6) [10, 11, 7, 8, 9, 6] {10}<br />
(6, 11) [6, 9, 8, 7, 11] {1, 2, 3, 4, 5, 6}<br />
(11, 6) [11, 7, 8, 9, 6] {11}<br />
101
(7, 8) [7, 11, 10, 6, 9, 8] {7}<br />
(8, 7) [8, 9, 6, 10, 11, 7] {8}<br />
(7, 9) [7, 11, 10, 6, 9] {7}<br />
(9, 7) [9, 6, 10, 11, 7] {9}<br />
(7, 10) [7, 8, 9, 6, 10] {7}<br />
(10, 7) [10, 6, 9, 8, 7] {10}<br />
(7, 11) [7, 8, 9, 6, 10, 11] {7}<br />
(11, 7) [11, 10, 6, 9, 8, 7] {11}<br />
(8, 9) [8, 7, 11, 10, 6, 9] {8}<br />
(9, 8) [9, 6, 10, 11, 7, 8] {9}<br />
(8, 10) [8, 9, 6, 10] {7, 8}<br />
(8, 10) [8, 7, 11, 10] {8, 9}<br />
(10, 8) [10, 11, 7, 8] {1, 2, 3, 4, 5, 6, 10}<br />
(8, 11) [8, 9, 6, 10, 11] {8}<br />
(11, 8) [11, 10, 6, 9, 8] {11}<br />
(9, 10) [9, 8, 7, 11, 10] {9}<br />
(10, 9) [10, 11, 7, 8, 9] {10}<br />
(11, 9) [11, 10, 6, 9] {7, 11}<br />
(9, 11) [9, 8, 7, 11] {1, 2, 3, 4, 5, 6, 9}<br />
(11, 9) [11, 7, 8, 9] {10, 11}<br />
(10, 11) [10, 6, 9, 8, 7, 11] {10}<br />
(11, 10) [11, 7, 8, 9, 6, 10] {11}<br />
o Σ(CFΔ): 128;<br />
o Σ(CFΔ) 2 : 273;<br />
o ΣA(CFΔ): 27.5;<br />
o ΣA(CFΔ) 2 : 63;<br />
o Matricea CFΔ:<br />
CFΔ 1 2 3 4 5 6 7 8 9 10 11 Σ<br />
1 0 1 1 1 1 2 2 2 2 2 2 16<br />
2 1 0 1 1 1 1 1 1 1 1 1 10<br />
3 7 7 0 7 7 5 5 5 5 5 5 58<br />
4 1 1 1 0 1 1 1 1 1 1 1 10<br />
5 1 1 1 1 0 2 2 2 2 2 2 16<br />
6 6 6 6 6 6 0 7 6 6 6 6 61<br />
7 3 3 3 3 3 2 0 1 1 1 1 21<br />
8 2 2 2 2 2 1 1 0 1 2 1 16<br />
9 1 1 1 1 1 1 1 1 0 1 7 16<br />
10 1 1 1 1 1 1 1 7 1 0 1 16<br />
11 2 2 2 2 2 1 1 1 2 1 0 16<br />
Σ 25 25 19 25 25 17 22 27 22 22 27 256<br />
o Σ(RCFΔ): 37.9(3);<br />
o Σ(RCFΔ) 2 : 26.6523809;<br />
o ΣA(RCFΔ): 9.492857;<br />
o ΣA(RCFΔ) 2 : 7.6523809;<br />
o Matricea RCFΔ:<br />
RCFΔ 1 2 3 4 5 6 7 8 9 10 11 Σ<br />
1 0.000 1.000 1.000 1.000 1.000 0.500 0.500 0.500 0.500 0.500 0.500 7.000<br />
2 1.000 0.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 10.000<br />
3 0.143 0.143 0.000 0.143 0.143 0.200 0.200 0.200 0.200 0.200 0.200 1.771<br />
4 1.000 1.000 1.000 0.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 10.000<br />
5 1.000 1.000 1.000 1.000 0.000 0.500 0.500 0.500 0.500 0.500 0.500 7.000<br />
102
6 0.167 0.167 0.167 0.167 0.167 0.000 0.143 0.167 0.167 0.167 0.167 1.643<br />
7 0.333 0.333 0.333 0.333 0.333 0.500 0.000 1.000 1.000 1.000 1.000 6.167<br />
8 0.500 0.500 0.500 0.500 0.500 1.000 1.000 0.000 1.000 0.500 1.000 7.000<br />
9 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.000 1.000 0.143 9.143<br />
10 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.143 1.000 0.000 1.000 9.143<br />
11 0.500 0.500 0.500 0.500 0.500 1.000 1.000 1.000 0.500 1.000 0.000 7.000<br />
Σ 6.643 6.643 7.500 6.643 6.643 7.700 7.343 6.510 6.867 6.867 6.510 75.867<br />
÷ Matricea Szeged pe Distanţe (SzD) şi Detururi (SzΔ):<br />
o Definiţie:<br />
÷ SzDi,j = |SzDSi,j|; SzDSi,j={k | d(G)k,i
(5,9) {1,2,4,5} {6,7,8,9,10,11} {1,2,3,4,5,6} {7,8,9,10,11}<br />
(6,9) {1,2,3,4,5,6,10,11} {7,8,9} {1,2,3,4,5,6,7,8} {9,10,11}<br />
(7,9) {7,11} {1,2,3,4,5,6,9} {1,2,3,4,5,6,7} {9,11}<br />
(8,9) {7,8,11} {1,2,3,4,5,6,9,10} {1,2,3,4,5,6,8,10} {7,9,11}<br />
(1,10) {1,2,4,5} {6,7,8,9,10,11} {1,2,3,4,5,6} {7,8,9,10,11}<br />
(2,10) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11}<br />
(3,10) {1,2,3,4,5} {7,10,11} {1,2,3,4,5,6} {8,9,10}<br />
(4,10) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11}<br />
(5,10) {1,2,4,5} {6,7,8,9,10,11} {1,2,3,4,5,6} {7,8,9,10,11}<br />
(6,10) {1,2,3,4,5,6,8,9} {7,10,11} {1,2,3,4,5,6,7,11} {8,9,10}<br />
(7,10) {7,8} {1,2,3,4,5,6,10} {1,2,3,4,5,6,7} {8,10}<br />
(8,10) {7,8,9} {1,2,3,4,5,6,10,11} {1,2,3,4,5,6,8,11} {7,9,10}<br />
(9,10) {8,9} {10,11} {9,11} {8,10}<br />
(1,11) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11}<br />
(2,11) {1,2,3,4,5} {7,8,10,11} {1,2,3,4,5} {6,7,8,9,10,11}<br />
(3,11) {1,2,3,4,5,6,9} {7,8,10,11} {1,2,3,4,5,6,7} {8,9,10,11}<br />
(4,11) {1,2,3,4,5} {7,8,10,11} {1,2,3,4,5} {6,7,8,9,10,11}<br />
(5,11) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11}<br />
(6,11) {1,2,3,4,5,6,9} {7,11} {1,2,3,4,5,6,7} {9,11}<br />
(7,11) {7,8,9} {1,2,3,4,5,6,10,11} {1,2,3,4,5,6,7,10} {8,9,11}<br />
(8,11) {8,9} {10,11} {8,10} {9,11}<br />
(9,11) {1,2,3,4,5,6,8,9} {7,10,11} {7,9,10} {1,2,3,4,5,6,8,11}<br />
(10,11) {1,2,3,4,5,6,9,10} {7,8,11} {7,8,10} {1,2,3,4,5,6,9,11}<br />
o Σ(SzD): 266.5;<br />
o Σ(SzD) 2 : 1154;<br />
o ΣA(SzD): 60.5;<br />
o ΣA(SzD) 2 : 242;<br />
o Matricea SzD:<br />
SzD 1 2 3 4 5 6 7 8 9 10 11 Σ<br />
1 0 2 2 2 2 3 5 5 4 4 5 34<br />
2 8 0 2 2 8 3 6 5 5 5 5 49<br />
3 8 8 0 8 8 5 6 7 5 5 7 67<br />
4 8 2 2 0 8 3 6 5 5 5 5 49<br />
5 2 2 2 2 0 3 5 5 4 4 5 34<br />
6 7 6 6 6 7 0 8 7 8 8 7 70<br />
7 5 5 3 5 5 3 0 3 2 2 3 36<br />
8 6 4 4 4 6 2 8 0 3 3 2 42<br />
9 6 6 3 6 6 3 7 8 0 2 8 55<br />
10 6 6 3 6 6 3 7 8 2 0 8 55<br />
11 6 4 4 4 6 2 8 2 3 3 0 42<br />
Σ 62 45 31 45 62 30 66 55 41 41 55 533<br />
o Σ(RSzD): 14.15059;<br />
o Σ(RSzD) 2 : 3.440714;<br />
o ΣA(RSzD): 3.308(3);<br />
o ΣA(RSzD) 2 : 0.78(3);<br />
o Matricea RSzD:<br />
RSzD 1 2 3 4 5 6 7 8 9 10 11 Σ<br />
1 0.000 0.500 0.500 0.500 0.500 0.333 0.200 0.200 0.250 0.250 0.200 3.433<br />
2 0.125 0.000 0.500 0.500 0.125 0.333 0.167 0.200 0.200 0.200 0.200 2.550<br />
3 0.125 0.125 0.000 0.125 0.125 0.200 0.167 0.143 0.200 0.200 0.143 1.552<br />
4 0.125 0.500 0.500 0.000 0.125 0.333 0.167 0.200 0.200 0.200 0.200 2.550<br />
104
5 0.500 0.500 0.500 0.500 0.000 0.333 0.200 0.200 0.250 0.250 0.200 3.433<br />
6 0.143 0.167 0.167 0.167 0.143 0.000 0.125 0.143 0.125 0.125 0.143 1.446<br />
7 0.200 0.200 0.333 0.200 0.200 0.333 0.000 0.333 0.500 0.500 0.333 3.133<br />
8 0.167 0.250 0.250 0.250 0.167 0.500 0.125 0.000 0.333 0.333 0.500 2.875<br />
9 0.167 0.167 0.333 0.167 0.167 0.333 0.143 0.125 0.000 0.500 0.125 2.226<br />
10 0.167 0.167 0.333 0.167 0.167 0.333 0.143 0.125 0.500 0.000 0.125 2.226<br />
11 0.167 0.250 0.250 0.250 0.167 0.500 0.125 0.500 0.333 0.333 0.000 2.875<br />
Σ 1.885 2.825 3.667 2.825 1.885 3.533 1.561 2.169 2.892 2.892 2.169 28.301<br />
o Σ(SzΔ): 270.5;<br />
o Σ(SzΔ) 2 : 1188;<br />
o ΣA(SzΔ): 60.5;<br />
o ΣA(SzΔ) 2 : 242;<br />
o Matricea SzΔ:<br />
SzΔ 1 2 3 4 5 6 7 8 9 10 11 Σ<br />
1 0 8 2 8 2 3 5 5 6 6 5 50<br />
2 2 0 2 2 2 3 4 5 5 5 5 35<br />
3 8 8 0 8 8 5 6 7 6 6 7 69<br />
4 2 2 2 0 2 3 4 5 5 5 5 35<br />
5 2 8 2 8 0 3 5 5 6 6 5 50<br />
6 7 7 6 7 7 0 8 7 8 8 7 72<br />
7 6 6 3 6 6 3 0 8 7 7 8 60<br />
8 5 6 4 6 5 2 3 0 8 8 2 49<br />
9 5 5 3 5 5 3 2 3 0 2 3 36<br />
10 5 5 3 5 5 3 2 3 2 0 3 36<br />
11 5 6 4 6 5 2 3 2 8 8 0 49<br />
Σ 47 61 31 61 47 30 42 50 61 61 50 541<br />
o Σ(RSzΔ): 13.9767857;<br />
o Σ(RSzΔ) 2 : 3.3592857;<br />
o ΣA(RSzΔ): 3.308(3);<br />
o ΣA(RSzΔ) 2 : 0.78(3);<br />
o Matricea RSzΔ:<br />
RSzΔ 1 2 3 4 5 6 7 8 9 10 11 Σ<br />
1 0.000 0.125 0.500 0.125 0.500 0.333 0.200 0.200 0.167 0.167 0.200 2.517<br />
2 0.500 0.000 0.500 0.500 0.500 0.333 0.250 0.200 0.200 0.200 0.200 3.383<br />
3 0.125 0.125 0.000 0.125 0.125 0.200 0.167 0.143 0.167 0.167 0.143 1.486<br />
4 0.500 0.500 0.500 0.000 0.500 0.333 0.250 0.200 0.200 0.200 0.200 3.383<br />
5 0.500 0.125 0.500 0.125 0.000 0.333 0.200 0.200 0.167 0.167 0.200 2.517<br />
6 0.143 0.143 0.167 0.143 0.143 0.000 0.125 0.143 0.125 0.125 0.143 1.399<br />
7 0.167 0.167 0.333 0.167 0.167 0.333 0.000 0.125 0.143 0.143 0.125 1.869<br />
8 0.200 0.167 0.250 0.167 0.200 0.500 0.333 0.000 0.125 0.125 0.500 2.567<br />
9 0.200 0.200 0.333 0.200 0.200 0.333 0.500 0.333 0.000 0.500 0.333 3.133<br />
10 0.200 0.200 0.333 0.200 0.200 0.333 0.500 0.333 0.500 0.000 0.333 3.133<br />
11 0.200 0.167 0.250 0.167 0.200 0.500 0.333 0.500 0.125 0.125 0.000 2.567<br />
Σ 2.735 1.918 3.667 1.918 2.735 3.533 2.858 2.377 1.918 1.918 2.377 27.954<br />
÷ Produsul Hadamard a două matrici H(·,·):<br />
o Definiţie: H(A,B)i,j=Ai,j·Bi,j;<br />
o Aplicaţii:<br />
Hadamard CJD CJΔ CFD CFΔ SzD SzΔ<br />
D H(D,CJD) H(D,CJΔ) H(D,CFD)H(D,CFΔ) H(D,SzD) H(D,SzΔ)<br />
Δ H(Δ,CJD) H(Δ,CJΔ) H(Δ,CFD) H(Δ,CFΔ) H(Δ,SzD) H(Δ,SzΔ)<br />
o Indici pe matricile Hadamard:<br />
105
H(·,·) Σ(·) Σ(·) 2 ΣA(·) ΣA(·) 2 Σ(1/(·)) Σ(1/(·)) 2 ΣA(1/(·)) 2 ΣA(1/(·)) 2<br />
H(D,CJD) 600 6954 60.5 242 7.971 1.315 3.308 0.783<br />
H(D,CJΔ) 347 2491 27.5 63 19.834 10.582 9.493 7.652<br />
H(D,CFD) 622 7616 60.5 242 7.717 1.278 3.308 0.783<br />
H(D,CFΔ) 349 2571 27.5 63 19.813 10.580 9.493 7.652<br />
H(D,SzD) 756 13048 60.5 242 7.389 1.250 3.308 0.783<br />
H(D,SzΔ) 769 13500 60.5 242 7.333 1.238 3.308 0.783<br />
H(Δ,CJD) 1292 32244 258.5 4718 3.574 0.255 0.896 0.075<br />
H(Δ,CJΔ) 653 6885 104.5 702 7.676 1.243 2.252 0.412<br />
H(Δ,CFD) 1338 35082 258.5 4718 3.437 0.244 0.896 0.075<br />
H(Δ,CFΔ) 655 6965 104.5 702 7.655 1.241 2.252 0.412<br />
H(Δ,SzD) 1564 51568 258.5 4718 3.189 0.224 0.896 0.075<br />
H(Δ,SzΔ) 1592 53560 258.5 4718 3.166 0.222 0.896 0.075<br />
÷ Produsul Schultz a două matrici S(·,A,·):<br />
o Definiţie: S(X,A,Y)i,j=X(A+Y);<br />
o Aplicaţii:<br />
Schultz CJD CJΔ CFD CFΔ SzD SzΔ<br />
A S(A,A,CJD) S(A,A,CJΔ) S(A,A,CFD) S(A,A,CFΔ) S(A,A,SzD) S(A,A,SzΔ)<br />
D S(D,A,CJD) S(D,A,CJΔ) S(D,A,CFD) S(D,A,CFΔ) S(D,A,SzD) S(D,A,SzΔ)<br />
Δ S(Δ,A,CJD) S(Δ,A,CJΔ) S(Δ,A,CFD) S(Δ,A,CFΔ) S(Δ,A,SzD) S(Δ,A,SzΔ)<br />
o Indici pe matricile Schultz:<br />
S(·,A,·) Σ(·) Σ(·) 2 ΣA(·) ΣA(·) 2 Σ(1/(·)) Σ(1/(·)) 2 ΣA(1/(·)) 2 ΣA(1/(·)) 2<br />
S(A,A,CJD) 550.5 4833.5 61 248 8.76175 1.31487 3.47024 0.72197<br />
S(A,A,CJΔ) 341.5 1987.5 35 59 16.89960 6.16609 8.11905 4.48810<br />
S(A,A,CFD) 565.5 5205.5 64 292 8.46774 1.26196 3.41607 0.70670<br />
S(A,A,CFΔ) 342.5 2003.5 35 59 16.81627 6.14526 8.11905 4.48810<br />
S(A,A,SzD) 628.5 6339.5 61 248 7.90838 1.13978 3.47024 0.72197<br />
S(A,A,SzΔ) 638.5 7171.5 63 342 7.49169 1.45677 3.43849 1.08596<br />
S(D,A,CJD) 6358.5 728779 1215 137976 0.57811 0.00663 0.13649 0.00177<br />
S(D,A,CJΔ) 3573.5 217760 712 45023 1.01352 0.01929 0.22652 0.00467<br />
S(D,A,CFD) 6576 764461 1278.5 147548 0.55208 0.00590 0.12597 0.00145<br />
S(D,A,CFΔ) 3591 219152 718.5 45529 1.00766 0.01898 0.22338 0.00450<br />
S(D,A,SzD) 7440 1002756 1515.5 219149 0.49894 0.00496 0.11222 0.00123<br />
S(D,A,SzΔ) 7786 1016184 1548.5 208403 0.47479 0.00423 0.10478 0.00102<br />
S(Δ,A,CJD) 13560.5 3120452 2446 527736 0.27149 0.00139 0.06576 0.00039<br />
S(Δ,A,CJΔ) 7227.5 887001 1330 150684 0.50828 0.00483 0.12147 0.00126<br />
S(Δ,A,CFD) 14022 3290896 2598.5 573094 0.25910 0.00124 0.06093 0.00032<br />
S(Δ,A,CFΔ) 7255 890817 1339.5 151878 0.50613 0.00476 0.12055 0.00123<br />
S(Δ,A,SzD) 15724 4220049 2992.5 802176 0.23648 0.00106 0.05506 0.00028<br />
S(Δ,A,SzΔ) 15684 4367127 2991.5 792573 0.23389 0.00108 0.05216 0.00025<br />
Polinoame<br />
Polinoamele au aplicaţii importante în topologia moleculară. Următoarele polinoame sunt <strong>de</strong>finite:<br />
÷ Polinomul caracteristic (ChP) asociat unui graf G [Bolboacă SD, Jäntschi L. 2007. How Good<br />
the Characteristic Polynomial Can Be for Correlations? Int J Mol Sci 8(4):335-345] se obţine pe<br />
baza matricii <strong>de</strong> adiacenţă A=A(G) astfel: ChP(G,X)=<strong>de</strong>t[XI-A(G)]<br />
÷ Polinoamele <strong>de</strong> numărare (CDi, CMx, CcM, CSz, CCf) se <strong>de</strong>finesc astfel [Jäntschi L. 2007.<br />
Characteristic and Counting Polynomials of Nonane Isomers. Cluj: Aca<strong>de</strong>micDirect, p. 101]:<br />
C(G,M,X) = Σk≥0|{Mi,j , |Mi,j| = k}|X k , un<strong>de</strong> M=D, Mx, cM, Sz, Cf.<br />
În tabelul 10 este redată matricea caracteristică, iar în Tabelele 11-15 sunt redate matricile <strong>de</strong><br />
numărare CDi, CMx, CcM, CSz, CCf asociate grafului molecular din Tabelul 9.<br />
106
Tabelul 10. Matricea caracteristică a grafului molecular din Tabelul 9<br />
[Ch] 1 2 3 4 5 6 7 8 9 10 11<br />
1 X -1 0 0 -1 0 0 0 0 0 0<br />
2 -1 X -1 0 0 0 0 0 0 0 0<br />
3 0 -1 X -1 0 -1 0 0 0 0 0<br />
4 0 0 -1 X -1 0 0 0 0 0 0<br />
5 -1 0 0 -1 X 0 0 0 0 0 0<br />
6 0 0 -1 0 0 X 0 0 -1 -1 0<br />
7 0 0 0 0 0 0 X -1 0 0 -1<br />
8 0 0 0 0 0 0 -1 X -1 0 0<br />
9 0 0 0 0 0 -1 0 -1 X 0 0<br />
10 0 0 0 0 0 -1 0 0 0 X -1<br />
11 0 0 0 0 0 0 -1 0 0 -1 X<br />
ChP X 11 - 12X 9 + 51X 7 - 2X 6 - 95X 5 + 12X 4 + 78X 3 - 18X 2 - 23X 1 + 8<br />
Tabelul 11. Matricea <strong>de</strong> numărare pe distanţe a grafului molecular din Tabelul 9<br />
[Di] 1 2 3 4 5 6 7 8 9 10 11<br />
1 0 1 2 2 1 3 6 5 4 4 5<br />
2 1 0 1 2 2 2 5 4 3 3 4<br />
3 2 1 0 1 2 1 4 3 2 2 3<br />
4 2 2 1 0 1 2 5 4 3 3 4<br />
5 1 2 2 1 0 3 6 5 4 4 5<br />
6 3 2 1 2 3 0 3 2 1 1 2<br />
7 6 5 4 5 6 3 0 1 2 2 1<br />
8 5 4 3 4 5 2 1 0 1 3 2<br />
9 4 3 2 3 4 1 2 1 0 2 3<br />
10 4 3 2 3 4 1 2 3 2 0 1<br />
11 5 4 3 4 5 2 1 2 3 1 0<br />
CDi 4X 6 + 12X 5 + 18X 4 + 22X 3 + 30X 2 + 24X 1 + 11<br />
Tabelul 12. Matricea fragmentelor maximale pentru graful molecular din Tabelul 9<br />
[Mx] 1 2 3 4 5 6 7 8 9 10 11<br />
1 1 3 4 5<br />
6 7 8 9<br />
2 2 3 4 5<br />
6 7 8 9<br />
10 11<br />
3 2 3 4 5<br />
6 7 8 9<br />
10 11<br />
4 2 3 4 5<br />
6 7 8 9<br />
10 11<br />
5 2 3 4 5<br />
6 7 8 9<br />
10 11<br />
6 2 3 4 5<br />
6 7 8 9<br />
10 11<br />
7 2 3 4 5<br />
6 7 8 9<br />
10 11<br />
10 11<br />
1 3 4 5<br />
6 7 8 9<br />
10 11<br />
1 3 4 5<br />
6 7 8 9<br />
10 11<br />
1 3 4 5<br />
6 7 8 9<br />
10 11<br />
1 3 4 5<br />
6 7 8 9<br />
10 11<br />
1 3 4 5<br />
6 7 8 9<br />
10 11<br />
1 2 4<br />
5<br />
1 2 4<br />
5<br />
1 2 4<br />
5<br />
1 2 4<br />
5<br />
6 7 8<br />
9 10<br />
11<br />
6 7 8<br />
9 10<br />
11<br />
1 2 3 5<br />
6 7 8 9<br />
10 11<br />
1 2 3 5<br />
6 7 8 9<br />
10 11<br />
1 2 3 5<br />
6 7 8 9<br />
10 11<br />
1 2 3 5<br />
6 7 8 9<br />
10 11<br />
1 2 3 5<br />
6 7 8 9<br />
10 11<br />
1 2 3 5<br />
6 7 8 9<br />
10 11<br />
1 2 3 4<br />
6 7 8 9<br />
10 11<br />
1 2 3 4<br />
6 7 8 9<br />
10 11<br />
1 2 3 4<br />
6 7 8 9<br />
10 11<br />
1 2 3 4<br />
6 7 8 9<br />
10 11<br />
1 2 3 4<br />
6 7 8 9<br />
10 11<br />
1 2 3 4<br />
6 7 8 9<br />
10 11<br />
1 2 3<br />
4 5<br />
1 2 3<br />
4 5<br />
1 2 3<br />
4 5<br />
1 2 3<br />
4 5<br />
1 2 3<br />
4 5<br />
7 8 9<br />
10<br />
11<br />
107<br />
1 2 3 4<br />
5 6 8 9<br />
10 11<br />
1 2 3 4<br />
5 6 8 9<br />
10 11<br />
1 2 3 4<br />
5 6 8 9<br />
10 11<br />
1 2 3 4<br />
5 6 8 9<br />
10 11<br />
1 2 3 4<br />
5 6 8 9<br />
10 11<br />
1 2 3 4<br />
5 6 8 9<br />
10 11<br />
1 2 3 4<br />
5 6 7 9<br />
10 11<br />
1 2 3 4<br />
5 6 7 9<br />
10 11<br />
1 2 3 4<br />
5 6 7 9<br />
10 11<br />
1 2 3 4<br />
5 6 7 9<br />
10 11<br />
1 2 3 4<br />
5 6 7 9<br />
10 11<br />
1 2 3 4<br />
5 6 7 9<br />
10 11<br />
1 2 3 4<br />
5 6 7 9<br />
10 11<br />
1 2 3 4<br />
5 6 7 8<br />
10 11<br />
1 2 3 4<br />
5 6 7 8<br />
10 11<br />
1 2 3 4<br />
5 6 7 8<br />
10 11<br />
1 2 3 4<br />
5 6 7 8<br />
10 11<br />
1 2 3 4<br />
5 6 7 8<br />
10 11<br />
1 2 3 4<br />
5 6 7 8<br />
10 11<br />
1 2 3 4<br />
5 6 7 8<br />
10 11<br />
1 2 3 4<br />
5 6 7 8<br />
9 11<br />
1 2 3 4<br />
5 6 7 8<br />
9 11<br />
1 2 3 4<br />
5 6 7 8<br />
9 11<br />
1 2 3 4<br />
5 6 7 8<br />
9 11<br />
1 2 3 4<br />
5 6 7 8<br />
9 11<br />
1 2 3 4<br />
5 6 7 8<br />
9 11<br />
1 2 3 4<br />
5 6 7 8<br />
9 11<br />
1 2 3 4<br />
5 6 7 8<br />
9 10<br />
1 2 3 4<br />
5 6 7 8<br />
9 10<br />
1 2 3 4<br />
5 6 7 8<br />
9 10<br />
1 2 3 4<br />
5 6 7 8<br />
9 10<br />
1 2 3 4<br />
5 6 7 8<br />
9 10<br />
1 2 3 4<br />
5 6 7 8<br />
9 10<br />
1 2 3 4<br />
5 6 7 8<br />
9 10
8 2 3 4 5<br />
6 7 8 9<br />
10 11<br />
9 2 3 4 5<br />
6 7 8 9<br />
10 11<br />
10 2 3 4 5<br />
6 7 8 9<br />
10 11<br />
11 2 3 4 5<br />
6 7 8 9<br />
10 11<br />
1 3 4 5<br />
6 7 8 9<br />
10 11<br />
1 3 4 5<br />
6 7 8 9<br />
10 11<br />
1 3 4 5<br />
6 7 8 9<br />
10 11<br />
1 3 4 5<br />
6 7 8 9<br />
10 11<br />
6 7 8<br />
9 10<br />
11<br />
6 7 8<br />
9 10<br />
11<br />
6 7 8<br />
9 10<br />
11<br />
6 7 8<br />
9 10<br />
11<br />
1 2 3 5<br />
6 7 8 9<br />
10 11<br />
1 2 3 5<br />
6 7 8 9<br />
10 11<br />
1 2 3 5<br />
6 7 8 9<br />
10 11<br />
1 2 3 5<br />
6 7 8 9<br />
10 11<br />
1 2 3 4<br />
6 7 8 9<br />
10 11<br />
1 2 3 4<br />
6 7 8 9<br />
10 11<br />
1 2 3 4<br />
6 7 8 9<br />
10 11<br />
1 2 3 4<br />
6 7 8 9<br />
10 11<br />
7 8 9<br />
10<br />
11<br />
7 8 9<br />
10<br />
11<br />
7 8 9<br />
10<br />
11<br />
7 8 9<br />
10<br />
11<br />
108<br />
1 2 3 4<br />
5 6 8 9<br />
10 11<br />
1 2 3 4<br />
5 6 8 9<br />
10 11<br />
1 2 3 4<br />
5 6 8 9<br />
10 11<br />
1 2 3 4<br />
5 6 8 9<br />
10 11<br />
1 2 3 4<br />
5 6 7 9<br />
10 11<br />
1 2 3 4<br />
5 6 7 9<br />
10 11<br />
1 2 3 4<br />
5 6 7 9<br />
10 11<br />
1 2 3 4<br />
5 6 7 8<br />
10 11<br />
1 2 3 4<br />
5 6 7 8<br />
10 11<br />
1 2 3 4<br />
5 6 7 8<br />
10 11<br />
1 2 3 4<br />
5 6 7 8<br />
9 11<br />
1 2 3 4<br />
5 6 7 8<br />
9 11<br />
1 2 3 4<br />
5 6 7 8<br />
9 11<br />
1 2 3 4<br />
5 6 7 8<br />
9 10<br />
1 2 3 4<br />
5 6 7 8<br />
9 10<br />
1 2 3 4<br />
5 6 7 8<br />
9 10<br />
CMx 90X 10 + 6X 6 + 10X 5 + 4X 4 +11<br />
Tabelul 13. Matricea fragmentelor complement-maximale pentru graful molecular din Tabelul 9<br />
[cM] 1 2 3 4 5 6 7 8 9 10 11<br />
1 2 3 6 7 8 9 10 11456 7 8 9 10 1178910 11<br />
2 1 3 6 7 8 9 10 11456 7 8 9 10 1178910 11<br />
3 1 2 456 7 8 9 10 1178910 11<br />
4 1 2 3 6 7 8 9 10 11 56 7 8 9 10 1178910 11<br />
5 1 2 3 6 7 8 9 10 114 6 7 8 9 10 1178910 11<br />
6 1 2 1 2 3 4 5 4 5 7 8 9 10 11<br />
7 1 2 1 2 3 4 5 4 5 1 2 3 4 5 6 8 9 10 11<br />
8 1 2 1 2 3 4 5 4 5 1 2 3 4 5 6 7 9 10 11<br />
9 1 2 1 2 3 4 5 4 5 1 2 3 4 5 6 7 8 10 11<br />
10 1 2 1 2 3 4 5 451 2 3 4 5 6 789 11<br />
11 1 2 1 2 3 4 5 4 5 1 2 3 4 5 6 7 8 9 10<br />
CcM 4X 7 + 10X 6 + 6X 5 + 90X 1 + 11<br />
Tabelul 14. Matricea fragmentelor Szged pentru graful molecular din Tabelul 9<br />
[Sz] 1 2 3 4 5 6 7 8 9 10 11<br />
1 1 5 1 5 1 2 1 2 1 2 1 2 3 4 1 2 3 4 1 2 4 5 1 2 4 5 1 2 3 4<br />
5 5 5<br />
5<br />
2 2 3 6 7 1 2 1 2 2 3 6 7 1 2 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4<br />
8 9 10<br />
8 9 10 5 5 6 5 5 5 5<br />
11<br />
11<br />
3 3 4 6 7 3 4 6 7 2 3 6 7 2 3 6 7 1 2 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4<br />
8 9 10 8 9 10 8 9 10 8 9 10 3 4 5 6 5 6 10 5 5 5 6 9<br />
11 11<br />
11 11 5<br />
4 3 4 6 7 4 5 4 5 3 4 6 7 1 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4<br />
8 9 10<br />
8 9 10 5 5 6 5 5 5 5<br />
11<br />
11<br />
5 4 5 4 5 1 5 1 5 1 4 1 2 3 4 1 2 3 4 1 2 4 5 1 2 4 5 1 2 3 4<br />
5 5 5<br />
5<br />
6 3 6 7 8 6 7 8 9 6 7 8 6 7 8 9 3 6 7 8 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4<br />
9 10 11 10 11 9 10 10 11 9 10 11 5 6 9 5 6 10 5 6 10 5 6 8 9 5 6 9<br />
11<br />
10<br />
11<br />
7 7 8 9 10 7 8 9 7 8 11 7 8 9 7 8 9 7 8 7 10 11 7 11 7 8 7 8 9<br />
11 10 11 10 11 10 11 11<br />
8 6 7 8 9 7 8 9 7 8 9 7 8 9 6 7 8 9 7 8 1 2 3 4 7 8 11 7 8 9 8 9<br />
10 11 11 11 11 10 11 5 6 8 9<br />
9 6 7 8 9 6 7 8 9 7 8 9 6 7 8 9 6 7 8 9 7 8 1 2 3 4 1 2 3 4 8 9 1 2 3 4<br />
10 11 10 11 10 11 10 11 9 5 6 9 5 6 9<br />
5 6 8 9
10 6 7 8 9<br />
10 11<br />
11 6 7 8 9<br />
10 11<br />
6 7 8 9<br />
10 11<br />
7 8 10<br />
11<br />
7 10<br />
11<br />
7 8 10<br />
11<br />
6 7 8 9<br />
10 11<br />
7 8 10<br />
11<br />
6 7 8 9<br />
10 11<br />
6 7 8 9<br />
10 11<br />
7 10<br />
11<br />
1 2 3 4<br />
5 6 10<br />
7 11 1 2 3 4<br />
5 6 10<br />
11<br />
10<br />
1 2 3 4 10 11 1 2 3 4<br />
5 6 10<br />
5 6 9<br />
11<br />
10<br />
10 11 7 10 11 7 8 11<br />
CSz 17X 8 + 8X 7 + 18X 6 + 21X 5 + 10X 4 + 16X 3 + 20X 2 + 11<br />
Tabelul 15. Matricea fragmentelor Cluj pentru graful molecular din Tabelul 9<br />
[Cf] 1 2 3 4 5 6 7 8 9 10 11<br />
1 1 5 1 5 1 2 1 2 1 4 1 4 5 1 4 5 1 4 5 1 4 5 1 4 5<br />
2 2 3 6 7<br />
8 9 10<br />
11<br />
3 3 4 6 7<br />
8 9 10<br />
11<br />
4 3 4 6 7<br />
8 9 10<br />
11<br />
3 4 6 7<br />
8 9 10<br />
11<br />
1 2 1 2 2 3 6 7<br />
8 9 10<br />
2 3 6 7<br />
8 9 10<br />
11<br />
11<br />
2 3 6 7<br />
8 9 10<br />
11<br />
4 5 4 5 3 4 6 7<br />
8 9 10<br />
11<br />
5<br />
1 2<br />
4 5<br />
1 2<br />
3 4<br />
5<br />
1 2<br />
4 5<br />
1 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5<br />
1 2 3 4<br />
5<br />
1 2 3 4<br />
5<br />
1 2 3 4<br />
5<br />
1 2 3 4<br />
5<br />
1 2 3 4<br />
5<br />
1 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5<br />
5 4 5 4 5 1 5 1 5 1 2<br />
5<br />
1 2 5 1 2 5 1 2 5 1 2 5 1 2 5<br />
6 6 7 8 9 6 7 8 9 6 7 8 6 7 8 9 6 7 8 9 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4<br />
10 11 10 11 9 10 10 11 10 11 5 6 10 5 6 10 5 6 10 5 6 8 9 5 6 9<br />
11<br />
11<br />
7 7 10 11 7 10 11 7 10<br />
11<br />
7 10 11 7 10 11 7 11 7 10 11 7 11 7 8 7 8 9<br />
8 7 8 10 7 8 10 7 8 10 7 8 10 7 8 10 7 8 1 2 3 4 7 8 11 8 9 8 9<br />
11 11 11 11 11<br />
5 6 8 9<br />
9 7 8 9 10<br />
11<br />
10 7 8 9 10<br />
11<br />
7 8 9 10<br />
11<br />
7 8 9 10<br />
11<br />
7 8 9<br />
10 11<br />
7 8 9<br />
10 11<br />
11 7 8 9 11 7 8 9 11 7 8 9<br />
11<br />
7 8 9 10<br />
11<br />
7 8 9 10<br />
11<br />
7 8 9 10<br />
11<br />
7 8 9 10<br />
11<br />
7 8<br />
9<br />
7 10<br />
11<br />
1 2 3 4<br />
5 6 9<br />
1 2 3 4<br />
5 6 10<br />
7 8 9 11 7 8 9 11 7 11 1 2 3 4<br />
5 6 10<br />
11<br />
1 2 3 4<br />
5 6 9<br />
10<br />
1 2 3 4<br />
5 6 10<br />
8 9 1 2 3 4<br />
5 6 9<br />
10 11 1 2 3 4<br />
5 6 9<br />
10<br />
10 11 10 11 7 8 11<br />
CCf 14X 8 + 7X 7 + 5X 6 + 16X 5 + 22X 4 + 23X 3 + 23X 2 +11<br />
Chimie Cuantică<br />
Se bazează pe mo<strong>de</strong>lul ondulatoriu al mecanicii atomilor şi moleculelor propus <strong>de</strong> Schrödinger în<br />
1926 [An Undulatory Theory of the Mechanics of Atoms and Molecules, Phys Rev, 28(6), 1049-1070].<br />
Două forme ale ecuaţiei lui Schrödinger sunt folosite (una <strong>de</strong>pen<strong>de</strong>ntă <strong>de</strong> timp şi cealaltă<br />
in<strong>de</strong>pen<strong>de</strong>ntă <strong>de</strong> timp), dintre care ecuaţia in<strong>de</strong>pen<strong>de</strong>ntă <strong>de</strong> timp (EΨ = ĤΨ) răspun<strong>de</strong> problematicii<br />
structurii chimice la echilibru, şi anume:<br />
÷ Un<strong>de</strong> sunt electronii şi nucleele unei molecule localizaţi în spaţiu? - şi din răspunsul la această<br />
întrebare <strong>de</strong>rivă o serie <strong>de</strong> consecinţe cum sunt: configuraţia, conformaţia, mărimea, forma, etc.<br />
÷ Sub un set dat <strong>de</strong> condiţii (<strong>de</strong> mediu) care sunt energiile (atomilor şi moleculelor)? - şi din<br />
răspunsul la această întrebare rezultă o serie <strong>de</strong> proprietăţi moleculare: căldura <strong>de</strong> formare,<br />
stabilitatea conformaţională, reactivitatea chimică, proprietăţile spectrale, etc.<br />
109
Termodinamica stabileşte relaţii cantitative între variabile macroscopice (volum, presiune,<br />
temperatură, concentraţie) ce <strong>de</strong>finesc un sistem fizico-chimic <strong>de</strong> proporţii mari, comparativ cu<br />
dimensiunile corpusculilor constituenţi (atomi, molecule, etc.). Tipul <strong>de</strong> sistem este <strong>de</strong>terminat <strong>de</strong><br />
caracteristicile suprafeţei <strong>de</strong> separare:<br />
÷ sistem <strong>de</strong>schis / închis - materia poate fi / nu poate fi transferată prin suprafaţa <strong>de</strong> separare;<br />
o sistemele închise şi <strong>de</strong>schise pot schimba energie cu mediul înconjurător;<br />
÷ sistem izolat - sistem închis care nu este în contact mecanic şi termic cu mediul înconjurător;<br />
÷ proces - transformare <strong>de</strong> stare (dilatare, răcire) sau transformare în starea fizică (topire,<br />
solidificare) sau transformare chimică complexă (se formează noi substanţe).<br />
÷ lucru este efectuat <strong>de</strong> sistem dacă în urma unui proces rezultă o energie cu care poate fi ridicată<br />
o greutate în mediu.<br />
Energia unui sistem poate varia şi ca urmare a unui transfer <strong>de</strong> căldură:<br />
÷ proces exoterm - proces în care se <strong>de</strong>gajă energie sub formă <strong>de</strong> căldură;<br />
÷ proces endoterm - proces care absoarbe energie sub formă <strong>de</strong> căldură;<br />
÷ proces adiabatic - proces care se <strong>de</strong>sfăşoară într-un sistem izolat adiabatic;<br />
o suprafeţele <strong>de</strong> separare adiabatice - nu permit transferul <strong>de</strong> căldură;<br />
Mişcarea haotică a moleculelor se numeşte mişcare termică. Din punct <strong>de</strong> ve<strong>de</strong>re molecular,<br />
lucrul este transferul <strong>de</strong> energie datorită mişcării ordonate. Distincţia între căldură şi lucru se<br />
realizează în mediu. Din punct <strong>de</strong> ve<strong>de</strong>re molecular, cele două noţiuni pot fi <strong>de</strong>finite astfel:<br />
÷ Lucrul este transferul <strong>de</strong> energie ce foloseşte mişcarea ordonată a atomilor din mediu;<br />
÷ Căldura este transferul <strong>de</strong> energie ce foloseşte mişcarea termică a atomilor din mediu.<br />
Principiul I al termodinamicii introduce noţiunea <strong>de</strong> energie internă:<br />
÷ Energia internă U este energia totală a unui sistem. Ea este o funcţie <strong>de</strong> stare: ΔU = Uf - Ui<br />
÷ U este o funcţie <strong>de</strong> proprietăţile care <strong>de</strong>termină starea sistemului la un moment dat şi<br />
in<strong>de</strong>pen<strong>de</strong>ntă <strong>de</strong> calea prin care s-a ajuns la starea respectivă: U = U(n,p,...)<br />
÷ Căldura şi lucrul sunt căi echivalente pentru variaţia energiei interne a unui sistem. Dacă un<br />
sistem este izolat <strong>de</strong> mediul înconjurător atunci nu are loc nici o variaţie <strong>de</strong> energie internă, sau,<br />
nu există nici o maşină care efectuează lucru mecanic fără consum energetic (perpetuum mobile<br />
<strong>de</strong> speţa I): energia internă a unui sistem izolat este constantă (Principiul I);<br />
Formularea principiului I nu menţionează căldura, însă o implică şi permite o <strong>de</strong>finire a căldurii pe<br />
baza lucrului.<br />
Fie două stări ale unui sistem, U1 şi U2 şi fie două transformări, una adiabatică şi una oarecare.<br />
Pentru transformarea adiabatică avem (conservarea energiei pentru sistem): ΔU = U2 - U1 = wad iar<br />
pentru transformarea oarecare avem (conservarea energiei pentru sistem): ΔU = U2 - U1 = w + q,<br />
un<strong>de</strong> q este cantitatea <strong>de</strong> energie neexplicată prin lucru sau energie internă. Diferenţa wad-w este<br />
pusă pe seama căldurii absorbite <strong>de</strong> sistem (conservarea energiei pentru mediu): q = wad - w, <strong>de</strong><br />
un<strong>de</strong>: q = ΔU - w. Concluzionând, variaţia <strong>de</strong> energie internă ΔU <strong>de</strong>pin<strong>de</strong> <strong>de</strong> energia transferată<br />
unui sistem sub formă <strong>de</strong> căldură q şi lucrul efectuat asupra unui sistem w prin: ΔU = q + w. Dacă<br />
se consi<strong>de</strong>ră variaţii infinitezimale, avem: dU = dq + dw. Transformarea pe care o suferă sistemul<br />
este cvasistatică dacă mişcarea sa este atât <strong>de</strong> lentă comparativ cu procesele care disipează energie<br />
şi materie în mediu încât peste tot în sistem presiunea şi temperatura sunt in<strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> spaţiu<br />
(pot fi însă <strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> timp).<br />
Dacă <strong>de</strong>scompunem dw în dw = dwe + dwexp un<strong>de</strong> dwexp lucrul mecanic <strong>de</strong> expansiune şi dwe un<br />
lucru mecanic suplimentar necauzat <strong>de</strong> expansiune, atunci: dU = dq + dwe + dwexp. Astfel, pentru<br />
sistemele ce evoluează la volum constant dwexp = 0; pentru sistemele care nu efectuează nici un fel<br />
<strong>de</strong> lucru (electric, optic, etc) şi dwe = 0; în aceste condiţii: dU = dq (la volum constant, fără lucru<br />
suplimentar). Pentru o transformare finită: ΔU = q, <strong>de</strong>ci prin măsurarea energiei primite <strong>de</strong> la un<br />
sistem la volum constant sub formă <strong>de</strong> căldură (q>0) sau obţinută <strong>de</strong> el sub formă <strong>de</strong> căldură (q
Astfel, adaptând principiul I al termodinamicii la condiţiile menţionate mai sus, a luat naştere o<br />
nouă funcţie <strong>de</strong> stare numită entalpie, care se notează cu H şi care însumează energia internă cu<br />
lucrul mecanic necesar pentru ocuparea <strong>de</strong> către sistem a volumului său propriu V la presiunea <strong>de</strong><br />
lucru p: H = U + pV. O variaţie <strong>de</strong> entalpie este egală cu căldura absorbită la temperatură constantă<br />
<strong>de</strong> către sistem atâta timp cât sistemul nu efectuează şi lucru suplimentar: dH = dq = dU (la presiune<br />
constantă, fără lucru suplimentar). Pentru o transformare finită: ΔH = qv,p.<br />
Proprietăţile unei probe in<strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> modul în care se obţine proba se numesc funcţii <strong>de</strong> stare.<br />
Ele pot fi privite ca fiind funcţie <strong>de</strong> alţi parametri fundamentali, ca presiunea, temperatura şi<br />
volumul, care <strong>de</strong>scriu starea curentă a sistemului. Energia internă, entalpia şi capacitatea calorică<br />
sunt funcţii <strong>de</strong> stare. Proprietăţile legate <strong>de</strong> prepararea stării se numesc funcţii <strong>de</strong> drum. Lucrul<br />
efectuat pentru prepararea unei stări, energia transferată sub formă <strong>de</strong> căldură sunt funcţii <strong>de</strong> drum.<br />
Lucrul şi căldura sunt funcţii <strong>de</strong> proces. Exprimând acum matematic această afirmaţie, avem:<br />
2<br />
2<br />
∫ 2 1<br />
∫<br />
2 1<br />
1<br />
1<br />
ΔU = dU = U − U , dU diferenţială exactă; ΔH = dH = H − H , dH diferenţială exactă<br />
Prin diferenţială exactă înţelegem o mărime infinitezimală care prin integrare conduce la un rezultat<br />
in<strong>de</strong>pen<strong>de</strong>nt <strong>de</strong> drumul dintre starea iniţială şi finală. Astfel:<br />
q = ∫ dq , dq diferenţială inexactă; w = ∫ dw , dw diferenţială inexactă<br />
γ [ 1,<br />
2]<br />
Prin diferenţială inexactă înţelegem o mărime infinitezimală care prin integrare conduce la un<br />
rezultat care <strong>de</strong>pin<strong>de</strong> <strong>de</strong> drumul dintre starea iniţială şi finală.<br />
Fie o funcţie <strong>de</strong> stare f = f(x,y) şi z o altă funcţie <strong>de</strong> stare z = z(x,y). Avem:<br />
⎛ f f ⎞<br />
⎜<br />
⎛ ∂ ⎞ ⎛ ∂ ⎞<br />
⎜ ⎟ dx + ⎜ ⎟ dy ⎟<br />
2 2<br />
∂ f ∂ f ⎛ ∂f<br />
⎞ ⎜ ⎝ ∂x<br />
⎠y<br />
⎝ ∂y<br />
⎠x<br />
⎟ ⎛ ∂f<br />
⎞ ⎛ ∂f<br />
⎞ ⎛ ∂y<br />
⎞<br />
= ⇒ ⎜ ⎟ =<br />
= ⎜ ⎟ + ⎜ ⎟ ⋅⎜<br />
⎟<br />
∂x∂y<br />
∂y∂x<br />
x ⎜<br />
z<br />
∂x<br />
⎟<br />
⎝ ∂ ⎠<br />
⎝ ∂x<br />
⎠y<br />
⎝ ∂y<br />
⎠ x x ⎝ ∂ ⎠z<br />
⎜<br />
⎟<br />
⎜<br />
⎟<br />
⎝<br />
⎠<br />
⎛ ∂x<br />
⎞ ⎛ ∂y<br />
⎞ ⎛ ∂x<br />
⎞ ⎛ ∂x<br />
⎞ ⎛ ∂y<br />
⎞ ⎛ ∂x<br />
⎞ ⎛ ∂y<br />
⎞ ⎛ ∂z<br />
⎞<br />
⎜ ⎟ = 1 ⎜ ⎟ , ⎜ ⎟ = −⎜<br />
⎟ ⋅⎜<br />
⎟ , ⎜ ⎟ ⋅⎜<br />
⎟ ⋅⎜<br />
⎟ = −1<br />
⎝ ∂y<br />
⎠ x z ⎝ ∂y<br />
⎠ z<br />
z ⎝ ∂ ⎠y<br />
⎝ ∂z<br />
⎠x<br />
⎝ ∂y<br />
⎠ z x x<br />
z ⎝ ∂ ⎠ ⎝ ∂<br />
z ⎝ ∂ ⎠<br />
⎠y<br />
Următoarea relaţie ne spune dacă df = g(x,y)dx + h(x,y)dy este sau nu o diferenţială totală (adică<br />
provine dintr-o funcţie <strong>de</strong> stare):<br />
⎛ ∂g<br />
⎞ ⎛ ∂h<br />
⎞<br />
df = g(x,y)dx + h(x,y)dy diferenţială totală ⇔ ⎜ ⎟ = ⎜ ⎟<br />
⎝ ∂y<br />
⎠ x<br />
x ⎝ ∂ ⎠y<br />
Primele studii asupra unei maşini termice care ar funcţiona după un ciclu format din patru etape<br />
reversibile: (a) dilatare izotermă (T = TA); (b) dilatare adiabatică (q = 0); (c) comprimare izotermă<br />
(T = TC); (d) comprimare adiabatică (q = 0), au fost efectuate <strong>de</strong> inginerul francez Sadi Carnot. Se<br />
numeşte ciclu Carnot, un ciclu format din cele patru etape reversibile (a), (b), (c) şi (d). Se numeşte<br />
maşină Carnot o maşină care ar funcţiona după un ciclu Carnot.<br />
Exprimând lucrul şi energia în cele patru transformări, ţinând seama <strong>de</strong> evoluţia sistemului:<br />
÷ ΔUAB = 0; qAB = -wAB; wAB = - ∫ - ⋅<br />
VB<br />
VB<br />
p dV = nRTA ⋅ ln<br />
V<br />
VC<br />
÷ qBC = 0; wBC = - p dV = ΔUBC; ΔUBC = CV(TC-TB)<br />
∫ ⋅<br />
V<br />
B<br />
VD<br />
÷ ΔUCD = 0; qCD = -wCD; wCD = - p dV = -<br />
V<br />
A<br />
∫ ⋅<br />
V<br />
C<br />
γ [ 1,<br />
2]<br />
V<br />
nRTC ⋅ ln<br />
V<br />
VA<br />
÷ qDA = 0; wDA = - p dV = ΔUDA; ΔUDA = CV(TB-TC)<br />
∫ ⋅<br />
V<br />
D<br />
111<br />
A<br />
D<br />
C<br />
z
Ţinând cont că se <strong>de</strong>fineşte randamentul unei maşini termice prin η=Lefectuat/qabsorbită, exprimând<br />
randamentul pentru un ciclu Carnot, ciclu format din cele patru etape reversibile:<br />
VC<br />
TC<br />
⋅ ln<br />
w AB + w CD − w AB + w CD qAB − qCD<br />
qCD<br />
VD<br />
TC<br />
η = =<br />
= = 1 - = 1−<br />
= 1-<br />
q<br />
V<br />
AB<br />
qAB<br />
qAB<br />
qAB<br />
B TA<br />
⋅ ln<br />
TA<br />
VA<br />
În expresia randamentului ciclului Carnot se poate observa că dacă temperatura sursei reci ar fi 0K<br />
(TC = 0K) atunci randamentul este ηCarnot = 1 (perpetuum mobile <strong>de</strong> speţa a II-a). Condiţia ca<br />
maşina Carnot să funcţioneze este ca TA > TC (pentru TC = TA ⇒ ηCarnot = 0).<br />
Unele procese au loc natural, <strong>de</strong> la sine, altele nu. Un gaz se dilată pentru a umple volumul<br />
disponibil, un corp cald se răceşte la temperatura mediului său înconjurător, iar o reacţie chimică<br />
<strong>de</strong>curge <strong>de</strong> preferinţă într-o anumită direcţie.<br />
Sensul transformărilor spontane este sensul care nu necesită efectuarea unui lucru pentru realizarea<br />
procesului.<br />
Se poate aduce un gaz la volum mai mic, se poate răci şi se pot aduce unele reacţii să <strong>de</strong>curgă în<br />
sens invers (electroliza apei) dar nici unul dintre aceste procese nu are loc spontan; fiecare se poate<br />
produce numai prin efectuarea unui lucru.<br />
Distincţia între cele două tipuri <strong>de</strong> procese, spontane şi nespontane formează obiectul principiului<br />
al doilea al termodinamicii: nu este posibil un proces al cărui unic rezultat este absorbţia <strong>de</strong> căldură<br />
<strong>de</strong> la un rezervor şi transformarea sa completă în lucru. Într-un sistem izolat sensul unui proces nu<br />
poate fi <strong>de</strong>terminat <strong>de</strong> energia sa totală. Principiul I stabileşte că energia se conservă şi nu se poate<br />
afirma că în orice proces sistemul tin<strong>de</strong> către o stare cu minim <strong>de</strong> energie, <strong>de</strong>oarece într-un sistem<br />
izolat energia totală este constantă. Când are loc un proces, energia totală a unui sistem izolat<br />
rămâne constantă, însă se distribuie în moduri diferite. Astfel, se poate corela sensul <strong>de</strong> <strong>de</strong>sfăşurare<br />
a proceselor cu modul <strong>de</strong> distribuire a energiei.<br />
Astfel, procesele spontane sunt întot<strong>de</strong>auna însoţite <strong>de</strong> o disipare a energiei într-o formă mai<br />
<strong>de</strong>zordonată.<br />
Principiul I a condus la introducerea energiei interne U. Energia internă ca funcţie <strong>de</strong> stare ne<br />
permite să stabilim dacă un proces este posibil; într-un sistem izolat pot avea loc numai acele<br />
procese (reprezentate în diagrama energetică U = U(T,V), <strong>de</strong> exemplu) în care energia internă<br />
rămâne constantă (suprafaţa <strong>de</strong> energie internă U constantă). Principiul al II-lea care permite<br />
aprecierea sensului proceselor spontane, poate fi formulat printr-o altă funcţie <strong>de</strong> stare, entropia S.<br />
Entropia arată dacă o stare a unui sistem este accesibilă din alta în mod spontan. Într-un sistem<br />
izolat entropia creşte în procesele spontane ΔStot > 0, un<strong>de</strong> ΔStot este entropia totală a sistemului<br />
izolat care conţine sistemul <strong>de</strong> analizat. Definiţia riguroasă a entropiei se poate face pe baza<br />
termodinamicii statistice.<br />
Pornind <strong>de</strong> la diferite observaţii <strong>de</strong> natură experimentală, Ludwig Boltzmann a propus ca formulă<br />
<strong>de</strong> calcul a entropiei ca grad <strong>de</strong> <strong>de</strong>zordine: S = k·lnW, un<strong>de</strong> k constanta Boltzmann şi W numărul <strong>de</strong><br />
moduri în care se poate rearanja energia sistemului prin rearanjarea atomilor şi a moleculelor pe<br />
diferite stări accesibile. Din <strong>de</strong>finirea entropiei pe baza relaţiei (6.3) rezultă şi unitatea <strong>de</strong> măsură a<br />
ei: SI = JK -1 .<br />
Relaţia dintre variaţiile <strong>de</strong> entropie în mediu şi entalpia <strong>de</strong> reacţie joacă un rol esenţial în<br />
<strong>de</strong>terminarea sensului transformărilor chimice spontane.<br />
Un sistem în contact termic şi mecanic cu mediul său, dStot = dS + dS'. Evoluţia tuturor proceselor<br />
în sistemul izolat format din sistemul observat şi mediul înconjurător este înspre creşterea<br />
<strong>de</strong>zordinii: dStot ≥ 0; egalitatea dStot = 0 (păstrarea <strong>de</strong>zordinii totale constante) se petrece pentru<br />
procesele reversibile (S - funcţie <strong>de</strong> stare) aşa încât: dS ≥ -dS', aşa încât: dS≥dq/T - inegalitatea lui<br />
Clausius.<br />
Se introduc alte două funcţii termodinamice <strong>de</strong> energie, numite potenţiale termodinamice:<br />
÷ Energie liberă Helmholtz: A = U - TS;<br />
÷ Entalpie liberă Gibbs: G = H - TS.<br />
112
Din formula sa <strong>de</strong> <strong>de</strong>finiţie dS = dqrev/T nu rezultă că entropia S este o funcţie <strong>de</strong> stare. Pentru a<br />
<strong>de</strong>monstra acest fapt, trebuie să <strong>de</strong>monstrăm că:<br />
dq<br />
= 0<br />
∫ γ]<br />
[<br />
rev<br />
T<br />
Fie un ciclu Carnot. Căldura cedată (qc) şi absorbită (qa) se exprimă prin:<br />
VD<br />
VB<br />
qc = nRTC ⋅ln<br />
; qa = nRTA ⋅ln<br />
VC<br />
VA<br />
Variaţia <strong>de</strong> entropie pe traseul [ABCDA] este:<br />
dq rev dq rev dqrev<br />
dqrev<br />
dqrev<br />
| qa<br />
| | qc<br />
|<br />
∫ =∫ +<br />
T T ∫ +<br />
T ∫ +<br />
T ∫ = - = 0<br />
T TA<br />
T<br />
[ ABCDA]<br />
[ AB]<br />
[ BC]<br />
[ CD]<br />
[ DA]<br />
C<br />
În cazul general al unui proces reversibil, acesta poate fi <strong>de</strong>scompus într-o serie <strong>de</strong> cicluri Carnot,<br />
astfel:<br />
dqrev<br />
dqrev<br />
∫ = ∑ T ∫ = ∑ 0 = 0<br />
[ γ]<br />
γ T<br />
i [ γi<br />
]<br />
γi Variaţia entropiei cu temperatura este dată <strong>de</strong>:<br />
dq<br />
ΔSAB =<br />
∫<br />
[ AB]<br />
şi exprimă faptul că valoarea variaţiei entropiei într-un proces oarecare între stările A şi B se<br />
regăseşte efectuând o transformare reversibilă între A şi B şi măsurând căldura necesară.<br />
Se combină principiul I cu al II-lea, pentru a se obţine pentru o transformare reversibilă următoarea<br />
relaţie:<br />
dU = dqrev + dwrev; dwrev = -pdV; dqrev = TdS; dU = TdS - pdV<br />
O observaţie foarte importantă este că valoarea dU este in<strong>de</strong>pen<strong>de</strong>ntă <strong>de</strong> drum, <strong>de</strong>ci in<strong>de</strong>pen<strong>de</strong>ntă<br />
<strong>de</strong> faptul că transformarea este reversibilă sau nu, aşa încât este a<strong>de</strong>vărată pentru orice tip <strong>de</strong><br />
transformare. Această ecuaţie se numeşte ecuaţia fundamentală a termodinamicii.<br />
Alegem acum alte două variabile <strong>de</strong> stare in<strong>de</strong>pen<strong>de</strong>nte care să caracterizeze starea unui sistem, S şi<br />
V. Exprimăm funcţia <strong>de</strong> stare U în raport cu acestea: U = U(S,V). În mod analog se obţine:<br />
⎛ ∂U<br />
⎞ ⎛ ∂U<br />
⎞<br />
dU = ⎜ ⎟⎠ dS + ⎜ ⎟⎠ dV<br />
⎝ ∂S<br />
V ⎝ ∂V<br />
S<br />
Prin simpla i<strong>de</strong>ntificare <strong>de</strong> coeficienţi în ecuaţiile diferenţiale rezultă că la compoziţie constantă (n<br />
= const.) avem:<br />
⎛ ∂U<br />
⎞ ⎛ ∂U<br />
⎞<br />
⎜ ⎟⎠ = T, ⎜ ⎟⎠ = - p<br />
⎝ ∂S<br />
V ⎝ ∂V<br />
S<br />
Deoarece U este funcţie <strong>de</strong> stare, rezultă relaţiile lui Maxwell:<br />
⎛ ∂T<br />
⎞ ⎛ ∂p<br />
⎞ ⎛ ∂T<br />
⎞ ⎛ ∂V<br />
⎞ ⎛ ∂p<br />
⎞ ⎛ ∂S<br />
⎞ ⎛ ∂V<br />
⎞ ⎛ ∂S<br />
⎞<br />
⎜ ⎟⎠ = - ⎜ ⎟⎠ ; ⎜ ⎟⎠ = ⎜ ⎟⎠ ; ⎜ ⎟⎠ = ⎜ ⎟⎠ ; ⎜ ⎟⎠ = - ⎜ ⎟⎠<br />
⎝ ∂V<br />
S ⎝ ∂S<br />
V ⎝ ∂p<br />
S<br />
p<br />
S ⎝ ∂ p ⎝ ∂T<br />
V ⎝ ∂V<br />
T ⎝ ∂T<br />
p ⎝ ∂ T<br />
La T = 0 toată mişcarea termică este îngheţată şi într-un cristal perfect toate particulele sunt dispuse<br />
într-o aranjare uniformă, regulată. Absenţa <strong>de</strong>zordinii spaţiale şi mişcării termice face ca S = 0.<br />
Acest fapt este în acord cu formula Boltzmann, întrucât dacă W = 1 atunci<br />
S = 0. Chiar dacă S ≠ 0 la T = 0, pentru o fază F a unei substanţe entropia sa SF(T) tin<strong>de</strong> la valoarea<br />
sa minimă, SF(0). Acest fapt se poate exprima prin teorema calorică a lui Nernst:<br />
Nernst: ΔS → 0 când T → 0<br />
Formula Boltzmann şi teorema Nernst (7.26) pun bazele pentru formularea Principiului III:<br />
Dacă entropia S a fiecărui element în starea sa cea mai stabilă la T = 0 se ia 0, atunci orice<br />
substanţă are S ≥ 0 şi S = 0 pentru substanţele perfect cristaline (inclusiv compuşii).<br />
O serie <strong>de</strong> programe soft au fost <strong>de</strong>zvoltate pentru mo<strong>de</strong>larea structurii moleculare bazată pe calcule<br />
<strong>de</strong> mecanică cuantică şi semiempirice, unele fiind în platformă open-source, altele free-to-use, şi<br />
altele fiind comerciale:<br />
113<br />
rev<br />
T
÷ AMPAC (commercial);<br />
÷ Cerius2 (commercial);<br />
÷ Chem3D (commercial);<br />
÷ Corina (commercial);<br />
÷ <strong>de</strong>Mon2k (free-to-use);<br />
÷ GAMESS (open-source);<br />
÷ GAUSSIAN (commercial);<br />
÷ HyperChem (commercial);<br />
÷ Insight II (commercial);<br />
÷ Jaguar (commercial);<br />
÷ MOE (commercial);<br />
÷ MOLDEN (open-source);<br />
÷ Molecular Mo<strong>de</strong>ling Pro (commercial);<br />
÷ MOPAC (free-to-use);<br />
÷ MPQC (open-source);<br />
÷ NWChem (open-source);<br />
÷ Octopus (open-source);<br />
÷ PCMo<strong>de</strong>l (commercial);<br />
÷ SCHRÖDINGER (commercial);<br />
÷ Spartan (commercial);<br />
÷ StoBe (commercial);<br />
÷ Sybyl (commercial).<br />
Chimie Medicală<br />
Primele evi<strong>de</strong>nţe <strong>de</strong> chimie medicală se găsesc în lucrarea lui Richet din 1893 [C R Seances Soc Biol<br />
Fil 45:775-776]: care formulează prima relaţie lipofilicitate -activitate şi care observă cantitativ că<br />
"plus ils sont solubles, moins ils sont toxiques";<br />
Hansch printr-o serie <strong>de</strong> lucrări în perioada 1962-1964 pune bazele QSAR, aducând 3 contribuţii<br />
esenţiale pentru domeniu:<br />
÷ combinarea mai multor parametrii fizico-chimici într-o singură ecuaţie <strong>de</strong> regresie;<br />
÷ <strong>de</strong>finirea parametrului <strong>de</strong> lipofilicitate π;<br />
÷ Formularea mo<strong>de</strong>lului parabolic pentru relaţia neliniară între lipofilicitate şi activitatea<br />
biologică;<br />
Enzima<br />
Cavitatea<br />
alosterică<br />
Efector<br />
alosteric<br />
Datorită<br />
schimbării<br />
conformaţionale<br />
a cavităţii active<br />
reacţia enzimatică<br />
este inhibată<br />
Absenţa<br />
reacţiei<br />
enzimatice<br />
Nu se poate<br />
lega substratul<br />
Reacţia<br />
enzimatică<br />
Cavitatea<br />
activă<br />
Substrat<br />
Are loc reacţia<br />
enzimatică<br />
Legarea<br />
substratului<br />
Căile biosintetice pot fi controlate cu ajutorul inhibiţiei <strong>de</strong> reacţie inversă, ceea ce înseamnă că<br />
114
produsul final al întregului lanţ metabolic inhibă activitatea primei enzime din lanţ (nu din genă).<br />
Dacă prima reacţie nu mai are loc, enzimele următoare sunt "înfometate" <strong>de</strong> substrat, şi produsul<br />
final nu mai este sintetizat. Produsul final se aşează pe prima enzimă într-o cavitate diferită <strong>de</strong><br />
cavitatea activă. Această a doua regiune se numeşte cavitate alosterică. Aşezarea efectorului<br />
alosteric schimbă structura tridimensională a proteinei şi în special conformaţia cavităţii active.<br />
Astfel, substratul nu se mai poate aşeza în cavitatea activă şi reacţia enzimatică este inhibată până<br />
când inhibitorul <strong>de</strong> reacţie inversă nu părăseşte cavitatea alosterică.<br />
Metabolismul zaharurilor în organism este extrem <strong>de</strong> esenţial pentru viaţă. În figura următoare este<br />
redat metabolismul glucozei:<br />
Dizahari<strong>de</strong><br />
Lactat<br />
Glicogen (animale)<br />
Amidon (plante)<br />
anabolism<br />
catabolism<br />
calea fosfogluconatului<br />
glucogeneză<br />
aerobic<br />
Glucoză Piruvat Acetil-CoA<br />
glicoliză<br />
ATP + NADH + H +<br />
anaerobic, în muşchi<br />
anaerobic, în drojdie<br />
Riboză-5-fosfat + NADPH + H +<br />
Etanol<br />
Măsurarea proprietăţilor bilogice <strong>de</strong>termină modalitatea <strong>de</strong> prelucrare şi interpretare a datelor<br />
obţinute. Operaţia <strong>de</strong> măsurare se poate efectua doar cu ajutorul unei scări <strong>de</strong> măsură. Din acest<br />
ultim unghi <strong>de</strong> ve<strong>de</strong>re a problematicii măsurătorii rezultă că măsurătoarea este direct asociată cu<br />
tipul scării <strong>de</strong> măsură. Aşa cum rezultă din ce expuse mai sus, cât <strong>de</strong> exactă este o măsurătoare este<br />
la fel <strong>de</strong> important ca valoarea măsurătorii înseşi. Din acest motiv atunci când se exprimă valoarea<br />
unei măsurători aceasta este însoţită <strong>de</strong> precizie, în diferite forme <strong>de</strong> exprimare ale acesteia. Măsura<br />
referă o mărime supusă observaţiei. Din acest punct <strong>de</strong> ve<strong>de</strong>re, mărimile se clasifică în mărimi<br />
calitative şi mărimi cantitative.<br />
O mărime este calitativă dacă pentru aceasta nu poate fi (sau cel puţin nu există) <strong>de</strong>finită o scară <strong>de</strong><br />
valori cel puţin ordonată. Dacă scara <strong>de</strong> valori a unei mărimi admite o relaţie <strong>de</strong> ordine (strictă) între<br />
elementele acesteia atunci mărimea este cantitativă.<br />
Un exemplu. Să consi<strong>de</strong>răm o mulţime cu 2 elemente în care ordinea elementelor nu este relevantă:<br />
C = {a,b}. Mulţimea submulţimilor acestei mulţimi este SC = {{},{a},{b},{a,b}}. O relaţie <strong>de</strong><br />
ordine în mulţimea SC este <strong>de</strong>finită prin numărul <strong>de</strong> elemente (cardinalitatea) al submulţimii. Încă<br />
<strong>de</strong> la început să remarcăm că relaţia <strong>de</strong> ordine cardinalitate nu este o relaţie <strong>de</strong> ordine strictă,<br />
existând două submulţimi cu acelaşi număr <strong>de</strong> elemente: |{a}| = |{b}| = 1. Relaţie <strong>de</strong> ordine strictă<br />
există între 0 = |{}| < |{a}| = 1 = |{b}| < |{a,b}| = 2.<br />
O întrebare se ridică acum: "Ce fel <strong>de</strong> scală <strong>de</strong> măsură <strong>de</strong>fineşte cardinalitatea?" şi pentru a afla<br />
răspunsul trebuie să ne întoarcem la observaţie şi anume să ne punem întrebarea "Ce caracteristică<br />
se doreşte a fi evaluată?". Dacă răspunsul la această a doua întrebare este numărul <strong>de</strong> elemente al<br />
submulţimii observate, atunci într-a<strong>de</strong>văr mărimea măsurată este cantitativă, având submulţimea cu<br />
0 elemente care este evi<strong>de</strong>nt mai mică <strong>de</strong>cât submulţimile cu 1 element şi care sunt evi<strong>de</strong>nt mai<br />
mici <strong>de</strong>cât submulţimea cu 2 elemente. Dacă se doreşte diferenţierea submulţimilor mulţimii C,<br />
atunci cu siguranţă că măsura cardinalitate nu este corect aleasă. Putem să ne concentrăm atenţia<br />
(observăm) însă numai mulţimile cu exact 1 element, pentru care măsura cardinalitate nu<br />
diferenţiază: {a} şi {b}. În acest caz ne aflăm într-o situaţie tipică <strong>de</strong> măsură calitativă, exprimată<br />
prin "Submulţimea conţine elementul 'a'?", întrebare al cărui răspuns în exemplul <strong>de</strong> mai sus este<br />
complementar cu răspunsul la întrebarea "Submulţimea conţine elementul 'b'?".<br />
115
Exemplul <strong>de</strong> mai sus a arătat cel puţin că procedura <strong>de</strong> <strong>de</strong>finire a unei scale <strong>de</strong> măsură trebuie cel<br />
puţin verificată din punct <strong>de</strong> ve<strong>de</strong>re al consistenţei, sau, dacă scala este <strong>de</strong>ja <strong>de</strong>finită (cum a fost<br />
cazul cardinalităţii), se impune cel puţin verificarea consistenţei acesteia în raport cu mărimea<br />
observată şi scopul urmărit. Mai mult, tot din exemplul <strong>de</strong> mai sus rezultă că chiar în absenţa unei<br />
relaţii <strong>de</strong> ordine între valorile măsurate ({a} şi {b}) pot exista însă alte tipuri <strong>de</strong> relaţii între valorile<br />
măsurate (în cazul <strong>de</strong> mai sus, este complementul logic, {a} = {a,b}\{b}; {b} = {a,b}\{a}), ceea ce<br />
face ca valorile unei mărimi calitative să nu fie in<strong>de</strong>pen<strong>de</strong>nte.<br />
O scală <strong>de</strong> măsură este nominală dacă între valorile acesteia nu se poate <strong>de</strong>fini o relaţie <strong>de</strong> ordine.<br />
De aici rezultă că în mod uzual scala <strong>de</strong> măsură nominală este caracteristică mărimilor calitative.<br />
În cadrul scalelor <strong>de</strong> măsură nominale, un caz extrem <strong>de</strong> importantă este scala (<strong>de</strong> măsură)<br />
binomială formată din doar două valori (între care nu există relaţie <strong>de</strong> ordine) cum ar fi: {Da, Nu},<br />
{Viu, Mort}, {Vivo, Vitro}, {Prezent, Absent}, {Alcan saturat, Alt tip <strong>de</strong> compus}, {Număr întreg,<br />
Număr neîntreg}.<br />
O caracteristică extrem <strong>de</strong> importantă a scalelor nominale este că ele au un număr finit <strong>de</strong> elemente<br />
(valori) şi aşa cum am observat şi în cazul mărimilor calitative indiferent <strong>de</strong> numărul acestora, între<br />
ele există o legătură <strong>de</strong> complementaritate. Astfel, pentru o scală <strong>de</strong> măsură nominală formată din<br />
grupele sangvine {0, A, B, AB} o valoare care este diferită <strong>de</strong> oricare 3 din cele 4 valori este cu<br />
siguranţă a 4-a dintre acestea. Scala <strong>de</strong> măsură nominală care nu este binomială se mai numeşte şi<br />
scală <strong>de</strong> măsură multinomială.<br />
O serie finită <strong>de</strong> valori poate să constituie o scală ordinală dacă elementele acesteia se află într-o<br />
relaţie <strong>de</strong> ordine. Astfel, <strong>de</strong> exemplu valorile {Prezent, Absent} enumerate între exemplele <strong>de</strong> scală<br />
binomială pot <strong>de</strong>veni scală ordinală dacă între valorile "Prezent" şi "Absent" se <strong>de</strong>fineşte o relaţie<br />
<strong>de</strong> ordine ("Absent" < "Prezent"). Alte astfel <strong>de</strong> exemple sunt "Fals" < "A<strong>de</strong>vărat", 0 < 1, "Negativ"<br />
< "Nenegativ", "Nepozitiv" < "Pozitiv". Dintre exemplele <strong>de</strong> scale <strong>de</strong> măsură cu 3 valori unul este<br />
imediat: "Negativ" < "Zero" < "Pozitiv".<br />
Ceea ce <strong>de</strong>osebeşte suplimentar o scală ordinală <strong>de</strong> o scală nominală este faptul că nu este necesar<br />
ca scala ordinală să fie formată dintr-un număr finit (sau cunoscut) <strong>de</strong> elemente. Este necesar însă<br />
ca intre ele să existe o relaţie <strong>de</strong> ordine <strong>de</strong>finită cel puţin printr-o funcţie "Succesor" al unei valori şi<br />
complementul acesteia "Pre<strong>de</strong>cesor".<br />
În scala interval distanţa între atribute are o semnificaţie. De exemplu la măsurarea temperaturii,<br />
distanţa între 30° şi 40° este aceeaşi cu distanţa între 70° şi 80°. Intervalul între valori este<br />
interpretabil (are o semnificaţie fizică). Acesta este motivul pentru care are sens să calculăm media<br />
unei variabile <strong>de</strong> tip interval, ceea ce nu se aplică la scalele ordinale. Aşa cum 80° nu reprezintă <strong>de</strong><br />
două ori mai cald <strong>de</strong>cât 40°, pe scalele interval nu are sens raportul a două valori.<br />
În final, pe scala raport există tot<strong>de</strong>auna valoarea 0 care are semnificaţie. În mod evi<strong>de</strong>nt<br />
construcţia unei scale raport presupune că cea mai mică valoare care se poate observa este 0.<br />
Aceasta înseamnă că întot<strong>de</strong>auna se poate evalua raportul a două măsuri pe o scală raport, aceasta<br />
fiind <strong>de</strong> asemenea o scală raport.<br />
Este important <strong>de</strong> notat că calitatea unei scale <strong>de</strong> măsură nu dă şi acurateţea <strong>de</strong> măsură, sau<br />
<strong>de</strong>nsitatea valorilor posibile ale unei variabile în jurul valorii măsurate. Astfel, chiar dacă frecvent<br />
folosim ipoteza că o variabilă este continuă (între oricare două valori măsurate teoretic există cel<br />
puţin încă o valoare) în practică se întâmplă <strong>de</strong>seori ca valoarea intermediară a cărei existenţă este<br />
presupusă (sau <strong>de</strong>monstrată teoretic sau practic) să nu poată fi observată (măsurată) datorită<br />
preciziei <strong>de</strong> care dispunem în măsură. Este <strong>de</strong> notat <strong>de</strong>ci că tipul scalei <strong>de</strong> măsură nu dă şi caracterul<br />
variabilei măsurate. Se pot la fel <strong>de</strong> bine măsura variabile discrete pe scale <strong>de</strong> măsură raport cum se<br />
pot măsura şi variabilele continue.<br />
Astfel, din punct <strong>de</strong> ve<strong>de</strong>re al tipului scalei <strong>de</strong> măsură, o variabilă care numără moleculele dintr-un<br />
set <strong>de</strong> date este "la fel <strong>de</strong>" variabilă raport ca o variabilă care măsoară temperatura la care aceste<br />
molecule se află în mediul ambiant sau trec <strong>de</strong> la starea <strong>de</strong> agregare solidă la cea lichidă.<br />
În tabelul 16 este redată o scară <strong>de</strong> măsură relativă (cu o singură referinţă), în care se exprimă<br />
cantitatea <strong>de</strong> dulce a zaharurilor.<br />
116
Tabelul 16. Cât <strong>de</strong> dulci sunt zaharurile<br />
Zahar Dulceaţă relativă la sucroză<br />
lactoză 0.16<br />
galactoză 0.32<br />
maltoză 0.33<br />
sucroză 1.00<br />
fructoză 1.73<br />
aspartam 180<br />
zaharină 450<br />
În figura <strong>de</strong> mai jos este reprezentată entropia scalelor <strong>de</strong> măsură în termeni <strong>de</strong> organizare a<br />
informaţiei.<br />
Binare<br />
Nominale<br />
Ordinale<br />
Interval<br />
<strong>Raport</strong><br />
Figura exprimă o serie <strong>de</strong> proprietăţi ale scalelor <strong>de</strong> măsură. Astfel, mulţimea scalelor <strong>de</strong> măsură<br />
binomiale este cea mai largă, cuprinzând scalele nominale. Demonstraţia acestui fapt este uşor <strong>de</strong><br />
făcut. Admiţând că avem la dispoziţie o scală nominală cu 3 categorii, atunci se pot <strong>de</strong>fini pe baza<br />
acesteia 3 scale binomiale, fiecare verificând apartenenţa măsurabilei la una din cele 3 categorii.<br />
Mulţimea scalelor ordinale este inclusă în mulţimea scalelor nominale. Admiţând că avem la<br />
dispoziţie o scală ordinală, renunţând la relaţia <strong>de</strong> ordine <strong>de</strong>ja am construit scala <strong>de</strong> măsură<br />
nominală asociată. În mod i<strong>de</strong>ntic, având la dispoziţie o scală interval, o putem segmenta pe aceasta<br />
într-un număr arbitrar <strong>de</strong> subintervale şi cu ajutorul acestor subintervale construim una din scalele<br />
ordinale asociate scalei interval.<br />
O proprietate importantă rezultă din incluziunea scalelor <strong>de</strong> măsură, şi anume incluziunea<br />
instrumentelor statistice (testelor statistice) cu pe care le avem la dispoziţie să caracterizăm sau<br />
investigăm mărimile măsurate. Presupunând că am înregistrat valorile variabilei X cu o scală <strong>de</strong><br />
măsură atunci toate statisticile care se pot aplica variabilei X în ipoteza că a fost măsurată cu o scală<br />
<strong>de</strong> măsură care o conţine pe cea utilizată, se aplică în egală măsură şi observaţiei cu scala <strong>de</strong> măsură<br />
utilizată, care, <strong>de</strong>sigur, oferă în plus o serie <strong>de</strong> statistici care nu se aplică <strong>de</strong>cât acestei scale şi celor<br />
pe care le inclu<strong>de</strong>.<br />
La fiecare nivel <strong>de</strong> incluziune, nivelul curent inclu<strong>de</strong> <strong>de</strong>ci toate calităţile ale mulţimilor mai mari şi<br />
aduce ceva în plus, reducând entropia scalei <strong>de</strong> măsură. În mod evi<strong>de</strong>nt, tot<strong>de</strong>auna este <strong>de</strong> dorit ca în<br />
observarea unei variabile să se folosească acea scală <strong>de</strong> măsură care înglobează cele mai multe<br />
caracteristici pe care variabila observată le prezintă, cum tot atât <strong>de</strong> important (sau mai important)<br />
este ca anumite atribute pe care le produce scala să fie proprii variabile şi să nu fie create în mod<br />
artificial <strong>de</strong> măsură, în caz contrar scala <strong>de</strong> măsură <strong>de</strong>venind o sursă <strong>de</strong> eroare.<br />
O serie <strong>de</strong> baze <strong>de</strong> date cumulează evi<strong>de</strong>nţe <strong>de</strong> chimie medicală. Grupate pe categorii, acestea sunt:<br />
÷ Conţinând date <strong>de</strong> efect biologic:<br />
÷ AmicBase;<br />
÷ Biocatalysis/Bio<strong>de</strong>gradation DB;<br />
÷ Carcinogenic Potency Project;<br />
÷ ChemBank;<br />
÷ Drug Data Report DB;<br />
÷ EDKB;<br />
÷ FDA Toxicity DBs;<br />
÷ ISS Chemical Carcinogens;<br />
÷ Leadscope Toxicity DB;<br />
÷ NIH NIEHS National Toxicology Program;<br />
117
÷ NIH NCI DBs (CambridgeSoft, CCC, MDL, DayLight);<br />
÷ Prous Science DBs;<br />
÷ PubChem;<br />
÷ RTECS (MDL, NIOSH);<br />
÷ US EPA DSSTox;<br />
÷ Vitic;<br />
÷ Conţinând biopolimeri:<br />
÷ ASEdb;<br />
÷ 3DID;<br />
÷ BID;<br />
÷ BOND;<br />
÷ BRITE;<br />
÷ DIP;<br />
÷ EMPIRE;<br />
÷ GRID;<br />
÷ iHOP;<br />
÷ IntAct;<br />
÷ InterDom;<br />
÷ KDBI;<br />
÷ MiMI;<br />
÷ MINT;<br />
÷ MPPI;<br />
÷ NuRISITE;<br />
÷ Orientation of Proteins in Membranes;<br />
÷ POINT;<br />
÷ ProtCom;<br />
÷ SNAPPI-DB;<br />
÷ SPIN-PP;<br />
÷ STRING;<br />
÷ UniHI;<br />
÷ Domain Motions;<br />
÷ molmovdb;<br />
÷ ProMo<strong>de</strong>;<br />
÷ PCDDB;<br />
÷ PPD;<br />
÷ Conţinând compuşi chimici şi medicamente:<br />
÷ Available Chemicals Directory (DayLight);<br />
÷ Cambridge Structural DB;<br />
÷ CCCBDB;<br />
÷ CenterWatch;<br />
÷ Drug Directories;<br />
÷ ChemDB;<br />
÷ ChemExper;<br />
÷ ChemFin<strong>de</strong>r;<br />
÷ ChemIDPlus;<br />
÷ chEBI;<br />
÷ ChEMnetBASE;<br />
÷ ClogP of Selected Drugs;<br />
÷ Comprehensive Medicinal Chemistry DB;<br />
118
÷ CSLS;<br />
÷ Cyberlipid Center;<br />
÷ DrugBank;<br />
÷ Drug Data Report;<br />
÷ Data & Property Calculation Websites;<br />
÷ EPA Chemical Registry System;<br />
÷ ESIS;<br />
÷ FDA Databases;<br />
÷ FDA Toxicity Databases / Leadscope;<br />
÷ FooDBank;<br />
÷ Handbook of Chemistry and Physics;<br />
÷ Henry's Law Constants;<br />
÷ Investigational Drugs DB;<br />
÷ iResearch;<br />
÷ Landolt-Börnstein;<br />
÷ LDB;<br />
÷ Leadscope Known Drugs;<br />
÷ Ligand.Info;<br />
÷ LiqCryst;<br />
÷ LogKow;<br />
÷ MDPI;<br />
÷ MedChem;<br />
÷ Merck In<strong>de</strong>x;<br />
÷ Metabolite DB;<br />
÷ NIST Online DBs (Gateway);<br />
÷ NLM SIS;<br />
÷ NCI DIS 3D DB;<br />
÷ Organic Compounds DB;<br />
÷ PhRMA New Medicines DB;<br />
÷ PhysProp DB;<br />
÷ Screening Compounds Directory;<br />
÷ SickList;<br />
÷ Solubility DB (IUPAC-NIST);<br />
÷ SRC Pointer File;<br />
÷ Stability Constants DB (IUPAC);<br />
÷ Super Drug Database;<br />
÷ World Drug In<strong>de</strong>x (DayLight);<br />
÷ ZINC;<br />
÷ Conţinând date <strong>de</strong> mediu:<br />
÷ ATSDR HazDat Database;<br />
÷ Environmental Fate DB;<br />
÷ Environmental Fate of Chemicals;<br />
÷ US EPA's IRIS;<br />
÷ Pestici<strong>de</strong> DB;<br />
÷ U.S. EPA TSCA (Cornell, DayLight, SRC);<br />
÷ Conţinând afinităţi <strong>de</strong> legătură:<br />
÷ AffinDB;<br />
÷ BindingDB;<br />
÷ Binding MOAD;<br />
119
÷ ChemBank;<br />
÷ DLRP;<br />
÷ KiBank;<br />
÷ PDBbind;<br />
÷ PDSP Drug Ki DB;<br />
÷ PubChem;<br />
÷ SCORPIO (structure-calorimetry);<br />
÷ SMID;<br />
÷ WOMBAT;<br />
÷ eF-site;<br />
÷ LigBase;<br />
÷ MSDsite;<br />
÷ PDBSite;<br />
÷ PINTS;<br />
÷ PRECISE;<br />
÷ pvSOAR;<br />
÷ Relibase;<br />
÷ sc-PDB;<br />
÷ SitesBase;<br />
÷ SMIDSuite;<br />
÷ SuMo;<br />
÷ Super Ligands;<br />
÷ Conţinând structuri şi proprietăţi ligand-receptor:<br />
÷ BioMagResBank;<br />
÷ CAZy;<br />
÷ FireDB;<br />
÷ IceDB;<br />
÷ IMB;<br />
÷ LPC/CSU;<br />
÷ Luna;<br />
÷ Macromolecular Structures DB (till 1999);<br />
÷ mmdb;<br />
÷ MSD;<br />
÷ NDB;<br />
÷ NIH CMM Links;<br />
÷ nrpdb;<br />
÷ OCA;<br />
÷ PDB;<br />
÷ PDBj;<br />
÷ PDBSelect;<br />
÷ PDBsum;<br />
÷ Planet;<br />
÷ PRECISE;<br />
÷ PROCAT;<br />
÷ RCSB DBs;<br />
÷ RECOORD;<br />
÷ SCOP;<br />
÷ Si<strong>de</strong>-Chain Interactions;<br />
÷ SPIN-PP;<br />
120
÷ STING Millenium Suite;<br />
÷ wwPDB;<br />
÷ XPDB;<br />
÷ Conţinând date <strong>de</strong> QSAR şi toxicogenomică:<br />
÷ MedChem QSAR DB;<br />
÷ ArrayExpress;<br />
÷ ArrayTrack;<br />
÷ Chemical Effects in Biological Systems.<br />
2008A2. Analiza rezultatelor obţinute şi interpretarea rezultatelor<br />
Analiza complexităţii mo<strong>de</strong>lelor structură-activitate, complexitate datorată volumului mare <strong>de</strong><br />
mo<strong>de</strong>le fizice <strong>de</strong> interacţiune posibile pentru un anume mo<strong>de</strong>l <strong>de</strong> structură moleculară şi volumului<br />
mare <strong>de</strong> modalităţi <strong>de</strong> obţinere (semi)cantitativă a activităţii biologice observate a impus ca soluţie<br />
<strong>de</strong> analiză şi interpretare a rezultatelor folosirea unui algoritm genetic, metodă euristică inspirată din<br />
natură şi teoria evoluţiei. O serie <strong>de</strong> rezultate au fost capitalizate în publicaţii din analiza cu ajutorul<br />
algoritmilor genetici <strong>de</strong>rulată în cadrul proiectului (Jäntschi & others, 2008-PTGS, Jäntschi &<br />
others, 2009-HPGS, Jäntschi & others, 2010-CAGA; Bolboacă & others, 2010-GAAS).<br />
Analiza cu ajutorul algoritmilor genetici este <strong>de</strong>sfăşurată în continuare.<br />
Grassy şi alţii în 1998 în lucrarea [Computer Assisted Rational Design of Immunosuppressive<br />
Compounds, Nature Biotechnol 16:748-752] raportează căutarea <strong>de</strong> pepdi<strong>de</strong> posedând activitate<br />
imunosupresivă. Aceştia au utilizat 27 <strong>de</strong>scriptori <strong>de</strong> proprietate (12 <strong>de</strong>scriptori <strong>de</strong> chimie<br />
matematică şi 15 <strong>de</strong>scriptori <strong>de</strong> chimie cuantică). S-a generat o librărie combinatorială cu 280000<br />
<strong>de</strong> compuşi după care s-au selectat 26 <strong>de</strong> pepti<strong>de</strong> pentru care o înaltă activitate a fost prezisă cu<br />
ajutorul <strong>de</strong>scriptorilor. 5 dintre aceste pepti<strong>de</strong> au fost sintetizate şi testate experimental. Cea mai<br />
potentă dintre acestea a arătat o activitate imunosupresivă <strong>de</strong> aproximativ 100 <strong>de</strong> ori mai mare <strong>de</strong>cât<br />
compusul <strong>de</strong> referinţă.<br />
Problema integrării informaţiilor <strong>de</strong> natură cuantică (geometria moleculară) cu cele <strong>de</strong> natură<br />
matematică (topologia moleculară) în prezicerea activităţilor biologice (chimia medicală) este o<br />
problemă dificilă şi analiza şi interpretarea rezultatelor necesită implementarea <strong>de</strong> algoritmi metaeuristici.<br />
Lamarck (Lamarck, 1809) după eforturi extraordinare <strong>de</strong> clasificare a organismelor vii, remarcă că<br />
atât în ceea ce priveşte animalele (studiind mai cu seamă animalele nevertebrate) cât şi plantele<br />
clasificarea pe specii şi varietăţi este mai mult sau mai puţin arbitrară, aducând numeroase<br />
argumente în acest sens. Făcând apel la taxonomia mo<strong>de</strong>rnă, astăzi sunt recunoscute 5 domenii, care<br />
mai apoi se subîmpart pe divizii, clase, ordine, familii, genuri şi specii. Însă studiile lui Lamarck<br />
<strong>de</strong>spre specii rămân <strong>de</strong> o <strong>de</strong>osebită importanţă, în ciuda faptului că explicaţia pe care a găsit-o<br />
Lamarck asupra observaţiilor sale bazată pe superstiţiile vremii şi anume că golurile constatate în<br />
schema <strong>de</strong> clasificare a speciilor ar fi în fapt datorată dispariţiei acestora a fost contrazisă ulterior <strong>de</strong><br />
studiile lui Darwin (Darwin, 1859). Chiar şi Darwin a fost influenţat <strong>de</strong> concluziile la care a ajuns<br />
Lamarck, aşa cum nota Fisher în 1954 (Fisher, 1954). Realizările majore ale epocii <strong>de</strong> început a<br />
geneticii sunt completate <strong>de</strong> studiile <strong>de</strong> încrucişare <strong>de</strong> varietăţi ale lui Men<strong>de</strong>l (Men<strong>de</strong>l, 1866)<br />
stabileşte legile care astăzi îi poartă numele, formularea teoriei moştenirii dure care vine să<br />
completeze elementele lipsă lăsate <strong>de</strong> pre<strong>de</strong>cesori (Weismann, 1893), şi în final studiile pe<br />
musculiţa <strong>de</strong> oţet ale lui Morgan (Morgan, 1915) în urma cărora acesta elaborează teoria<br />
cromozomială a moştenirii, care este şi astăzi la baza geneticii mo<strong>de</strong>rne. Nu în ultimul rând se<br />
menţionează studiile <strong>de</strong> o <strong>de</strong>osebită valoare ştiinţifică ale lui Fisher (Fisher, 1918; Fisher, 1922),<br />
care a adus argumente ştiinţifice <strong>de</strong> necontestat (chiar dacă la vremea când acestea au fost scrise <strong>de</strong><br />
către Fisher au fost din plin contestate, aşa cum se poate <strong>de</strong>sprin<strong>de</strong> şi din fragmentele alese pentru<br />
exemplificare) cu privire la originea speciilor şi teoria evoluţionistă.<br />
Rezumând, moştenirea dură (Weismann, 1893) şi uşoară (Lamarck, 1809), selecţia şi supravieţuirea<br />
121
(Darwin, 1859), genele şi încrucişarea genelor (Morgan, 1915) şi caracterelor (Men<strong>de</strong>l, 1866)<br />
în<strong>de</strong>lung <strong>de</strong>zbătute şi disputate <strong>de</strong>-a lungul secolului 19 (Fisher, 1954) constituie toate piese dintrun<br />
puzzle care construieşte astăzi genetica mo<strong>de</strong>rnă (Ayala şi alţii, 1994), şi reprezintă sursele <strong>de</strong><br />
inspiraţie ale algoritmilor genetici.<br />
Primele simulări ale evoluţiei se regăsesc în studiile lui Nils Aall BARRICELLI (Barricelli, 1954).<br />
Puţin timp mai târziu, Alex FRASER (1923-2002) a publicat o serie <strong>de</strong> lucrări <strong>de</strong>spre simularea<br />
selecţiei artificiale a organismelor cu locuşi multipli ce controlează o trăsătură măsurabilă.<br />
Simulările lui Fraser (Fraser, 1957-1970) includ toate elementele esenţiale ale algoritmilor genetici<br />
mo<strong>de</strong>rni.<br />
Uzual, în viaţa noastă <strong>de</strong> zi cu zi la fel ca şi în <strong>cercetare</strong>a ştiinţifică noi operăm cu probleme. În<br />
informatică şi ramurile <strong>de</strong>rivate ale acesteia (cum e cazul bio-informaticii şi chemo-informaticii) o<br />
problemă are o semnificaţie precisă, foarte apropiată cu cea <strong>de</strong> algoritm. Un algoritm este în esenţă<br />
o reţetă specificând ce să facem în anumite condiţii pentru a obţine un anumit obiectiv. Un algoritm<br />
necesită două resurse pentru a rezolva o problemă, şi anume timp (cu sensul <strong>de</strong> timp <strong>de</strong> execuţie,<br />
mărime corelată cu numărul <strong>de</strong> instrucţiuni elementare) şi spaţiu (pentru stocarea datelor <strong>de</strong> intrare<br />
şi a variabilelor).<br />
Nu toate problemele sunt <strong>de</strong> aceeaşi complexitate şi acelaşi lucru este valabil şi pentru algoritmii <strong>de</strong><br />
rezolvare. Astfel, unele probleme au complexitate exponenţială, ceea ce înseamnă că cel mai bun<br />
algoritm rezolvă problema într-un timp <strong>de</strong> execuţie ce creşte exponenţial în funcţie <strong>de</strong> dimensiunea<br />
(volumul, mărimea) datelor <strong>de</strong> intrare. Acest tip <strong>de</strong> probleme sunt numite dificile, <strong>de</strong>oarece chiar şi<br />
cel mai bun algoritm (care există sau ar putea exista) va fi probabil nepractic cu date <strong>de</strong> intrare din<br />
practică (Falkenauer, 1998).<br />
Dacă o problemă este dificilă, atunci căutarea optimului frecvent iese în afara timpului disponibil<br />
pentru aplicaţiile reale. Chiar dacă există această problemă, există totuşi o serie <strong>de</strong> probleme<br />
întâlnite în practică când obţinerea optimului nu este necesară (obligatorie). De cele mai multe ori o<br />
soluţie bună este suficientă.<br />
În concluzie, căutarea pentru algoritmi <strong>de</strong> aproximare buni este perfect legitimată, chiar dacă aceşti<br />
algoritmi nu garantează atingerea optimului global pentru orice instanţă cu care sunt hrăniţi, dar<br />
care produc soluţii aproape <strong>de</strong> soluţia optimă.<br />
Deoarece cele mai multe probleme dificile au fost împrejurul nostru <strong>de</strong> foarte mulţi ani, pentru o<br />
varietate <strong>de</strong> probleme dificile unul sau mai mulţi euristici au fost <strong>de</strong>ja concepuţi. Aceştia sunt seturi<br />
<strong>de</strong> reguli gândite pentru a rezolva o problemă anume, uzual bazaţi pe bunul simţ (în ceea ce priveşte<br />
soluţia aşteptată) prin evitarea erorilor grosolane, dar care nu sunt gândiţi pentru a produce<br />
tot<strong>de</strong>auna soluţia cu exactitate şi respectiv să fie capabili să producă o soluţie pentru orice valori <strong>de</strong><br />
intrare.<br />
Chiar dacă cei mai mulţi euristici sunt foarte mult ad-hoc şi <strong>de</strong>pen<strong>de</strong>nţi <strong>de</strong> problema dată, odată cu<br />
<strong>de</strong>zvoltarea informaticii cercetătorii au reuşit să formuleze trei euristici care sunt foarte generali, şi<br />
anume aplicabili la o mare varietate <strong>de</strong> probleme dificile. Din cauza acestei generalităţi pe care o<br />
posedă, aceştia au căpătat numele <strong>de</strong> meta-euristici. Toţi trei sunt stocastici [a fi stocastic: Implicând<br />
sau conţinând una sau mai multe variabile aleatoare, implicând şansa sau probabilitatea] în natura lor, doi<br />
dintre aceştia (SA şi GA) fiind bazaţi pe procese naturale care au loc în jurul nostru din tot<strong>de</strong>auna.<br />
Împreună cu călirea simulată (în engleză SA - Simulated Annealing; van Laarhoven and Aarts,<br />
1987; Davis, 1987) şi căutarea tabu (în engleză TS - Tabu Search; Glower, 1977 şi 1986; Glover şi<br />
alţii, 1992) sunt şi algoritmii genetici (în engleză GA - Genetic Algorithm).<br />
Primele studii în care au apărut algoritmii genetici se găsesc în anul 1954, însă studii <strong>de</strong> amploare<br />
ale acestora au apărut după 1970 (Bosworth şi alţii, 1972; Holland, 1975) şi au fost re-inventaţi ceva<br />
mai târziu (Davis, 1991, Holland, 1992).<br />
Înainte <strong>de</strong> a <strong>de</strong>fini ceea ce este un algoritm genetic, să <strong>de</strong>finim mai întâi prin ce evaluează calitatea<br />
unul algoritm euristic. Sunt trei criterii care trebuie consi<strong>de</strong>rate:<br />
÷ viteza: cât <strong>de</strong> repe<strong>de</strong> obţine soluţia;<br />
÷ precizia: cât <strong>de</strong> <strong>de</strong>parte <strong>de</strong> află acea soluţie <strong>de</strong> optimul global;<br />
÷ scopul: cât <strong>de</strong> mare este subsetul datelor <strong>de</strong> intrare în raport cu setul tuturor valorilor posibile<br />
122
pentru care algoritmul performează în raport cu anterioarele două criterii;<br />
O problemă importantă legată <strong>de</strong> complexitatea algoritmică este reprezentată <strong>de</strong> teorema<br />
inexistenţei mesei pe gratis (în engleză NFLT - No Free Lunch Theorem; Wolpert and Macready,<br />
1995 şi 1997), teoremă care utilizând aceste trei criterii <strong>de</strong> mai sus arată că toţi algoritmii sunt strict<br />
echivalenţi, ceea ce înseamnă că pentru doi algoritmi A şi B, pentru fiecare set <strong>de</strong> date pentru care<br />
A performează mai bine <strong>de</strong>cât B există un set <strong>de</strong> date pentru care B performează mai bine <strong>de</strong>cât A.<br />
Interpretarea simplă care se dă acestei teoreme în termeni comuni şi anume că oricât ai încerca să-ţi<br />
faci algoritmii tăi mai isteţi, este un efort în van <strong>de</strong>oarece ei vor performa la fel ca orice alt algoritm,<br />
nu este una corectă. Ceea ce teorema într-a<strong>de</strong>văr spune este că dacă se mediază performanţele<br />
tuturor algoritmilor pe toate datele posibile, atunci ei vor performa la fel. Revenind la termeni<br />
comuni, şmecheria este <strong>de</strong>sigur să nu încerci să hrăneşti toţi algoritmii pe care îi realizezi pe toate<br />
datele cu putinţă, ci să încerci să îţi <strong>de</strong>dici algoritmul la un domeniu <strong>de</strong> aplicabilitate, şi aici să iei<br />
în consi<strong>de</strong>rare şi să valorifici prin implementare în algoritm orice structură specială este posibil să<br />
existe în datele cu care intenţionezi să hrăneşti algoritmul. De aici rezultă că scopul algoritmului<br />
care performează bine trebuie să fie restrâns la setul <strong>de</strong> date care prezintă structurile speciale<br />
i<strong>de</strong>ntificate.<br />
Următoarele categorii <strong>de</strong> probleme pot fi subiect <strong>de</strong> rezolvare pentru algoritmii genetici:<br />
Probleme <strong>de</strong> <strong>de</strong>cizie<br />
÷ O problemă <strong>de</strong> <strong>de</strong>cizie este <strong>de</strong>finită pentr-o întrebare cu răspuns <strong>de</strong> tipul da/nu pe un set (infinit)<br />
<strong>de</strong> date <strong>de</strong> intrare; din acest motiv problemele <strong>de</strong> <strong>de</strong>cizie sunt echivalente cu obţinerea setului <strong>de</strong><br />
date <strong>de</strong> intrare pentru care răspunsul problemei este da. Problemele <strong>de</strong> <strong>de</strong>cizie sunt legată <strong>de</strong><br />
problemele <strong>de</strong> optimizare atâta timp cât problema este obţinerea celui mai bun răspuns la<br />
problemă.<br />
Probleme <strong>de</strong> clasificare<br />
÷ O problemă <strong>de</strong> clasificare pentru obiecte dintr-un domeniu dat este în<br />
separarea acestor obiecte în clase mai mici, şi producerea <strong>de</strong> criterii <strong>de</strong><br />
<strong>de</strong>terminare dacă un obiect anume dintr-un domeniu este într-o anume clasă<br />
sau nu. Una dintre cele mai faimoase probleme <strong>de</strong> clasificare este problema<br />
formulată <strong>de</strong> Carl LINNAEUS (23 Mai 23 1707 - 10 Januarie 10 1778) a<br />
clasificării vieţuitoarelor după clase, ordine, genuri şi specii (Linnaei,<br />
1735).<br />
Probleme <strong>de</strong> optimizare<br />
÷ O problemă <strong>de</strong> optimizare este o problemă <strong>de</strong> găsire a celei mai bune soluţii<br />
dintre toate soluţiile posibile. În mod formal, o problemă <strong>de</strong> optimizare este<br />
un cvadruplu (I,f,m,g) un<strong>de</strong>:<br />
o I - set <strong>de</strong> instanţe;<br />
o f(·) - setul soluţiilor posibile <strong>de</strong>finite pe I;<br />
o m(·,·) - măsura <strong>de</strong>finită pe produsul soluţiilor posibile şi instanţelor<br />
o g - min. sau max. - funcţia obiectiv<br />
o scopul este găsirea optimului lui x: m(x,f(x))=g{m(y,f(y), y ∈I}<br />
÷ Pentru fiecare problemă <strong>de</strong> optimizare există o problemă <strong>de</strong> <strong>de</strong>cizie care este asociată şi a cărei<br />
întrebare este dacă există o soluţie posibilă pentru o anumită măsură m0.<br />
Probleme <strong>de</strong> simulare<br />
÷ Simularea este imitarea unui fapt real, unei stări <strong>de</strong> fapt, sau a unui proces. Actul simulării a<br />
ceva în general implică reprezentarea unor anumite caracteristici sau comportamente cheie ale<br />
unui sistemul fizic sau abstract. Simularea este folosită în multe contexte incluzând mo<strong>de</strong>larea<br />
sistemelor naturale, pentru a pătrun<strong>de</strong> funcţionalitatea acestora. Elementele cheie în simulare<br />
includ achiziţia unei surse vali<strong>de</strong> <strong>de</strong> informaţie <strong>de</strong>spre subiectul <strong>de</strong> studiu, selecţia<br />
caracteristicilor şi comportamentelor cheie, utilizarea <strong>de</strong> aproximaţii şi presupuneri<br />
simplificatoare în cadrul simulării, şi evaluarea fi<strong>de</strong>lităţii şi validităţii rezultatelor simulării.<br />
Algoritmii genetici sunt algoritmi <strong>de</strong> căutare euristici adaptivi bazaţi pe i<strong>de</strong>ile teoriei evoluţiei şi<br />
123
anume aduce conceptele <strong>de</strong> selecţie naturală şi genetică în arena simulării matematice cu ajutorul<br />
calculatorului. Mimica proceselor observate în evoluţia naturală a materiei organice în general<br />
serveşte drept instrument algoritmilor genetici în scopul <strong>de</strong> a rezolva probleme <strong>de</strong> <strong>de</strong>cizie,<br />
clasificare, optimizare şi simulare. Elementele cheie la care se face apel în algoritmii genetici sunt:<br />
÷ Mo<strong>de</strong>lul genetic (dualismul genotip - fenotip) aşa cum a fost el formulat şi argumentat încă <strong>de</strong> la<br />
primii paşi ai geneticii (Morgan, 1915; Fisher, 1918);<br />
÷ Încrucişarea (dualismul caractere - gene) aşa cum a fost ea observată încă <strong>de</strong> la precursorii<br />
geneticii mo<strong>de</strong>rne (Lamarck, 1830; Men<strong>de</strong>l, 1865; Weismann, 1893);<br />
÷ Mutaţia, aşa cum a fost ea observată încă <strong>de</strong> la precursorii geneticii mo<strong>de</strong>rne şi până în zilele<br />
noastre:<br />
o întâmplătoare (De Veies, 1902);<br />
o <strong>de</strong>liberată prin expunerea la anumite condiţii (Patterson, 1928; Auerbach şi alţii, 1947);<br />
o sub presiunea factorilor <strong>de</strong> mediu: (Cains şi alţii, 1988);<br />
÷ Selecţia naturală sau "supravieţuirea celui mai tare" (Darwin, 1859).<br />
Construcţia algoritmilor genetici<br />
Algoritmii genetici se materializează sub forma <strong>de</strong> programe evolutive şi sunt simulări în care:<br />
(spaţiul <strong>de</strong> căutare)<br />
÷ Se operează asupra unei populaţii <strong>de</strong> reprezentări abstracte numite (după elementele genetice pe<br />
baza cărora au fost imaginate) cromozomi sau genotipuri ale unui genom, la rândul său fiecare<br />
reprezentare abstractă a unui cromozom fiind compusă din gene.<br />
···<br />
···<br />
···<br />
genă cromozom genom<br />
Spaţiul <strong>de</strong> căutare al unui algoritm genetic<br />
÷ Fiecare generaţie este compusă dintr-o populaţie <strong>de</strong> şiruri <strong>de</strong> caractere (sau alte forme <strong>de</strong><br />
reprezentare abstractă) analog cu cromozomii ADN-ului. Fiecare element al populaţiei<br />
reprezintă un punct în spaţiul <strong>de</strong> căutare şi în acelaşi timp o soluţie posibilă.<br />
÷ Ceea ce Figura 1 reprezintă formal, şi anume spaţiul <strong>de</strong> căutare al unui algoritm genetic, poate<br />
avea multe variante <strong>de</strong> implementare, trei dintre ele fiind următoarele:<br />
o Dacă algoritmul genetic are ca subiect rezolvarea unei probleme dificile formulate în<br />
sistemul S (în engleză: S-system formalism, Savageau, 1976) care este un tip <strong>de</strong> formalism<br />
<strong>de</strong>rivat din mo<strong>de</strong>lul <strong>de</strong> proces al reacţiilor stoechiometrice cu pre-echilibru (ΣiRi ↔ ΣjIj →<br />
ΣkPk, un<strong>de</strong> Ri reactanţi, Ij intermediari, Pk produşi ai unei reacţii în care constantele <strong>de</strong><br />
proces - constantă <strong>de</strong> viteză şi ordine parţiale <strong>de</strong> reacţie - sunt necunoscute şi se doresc a fi<br />
<strong>de</strong>terminate), atunci următoarea este o posibilă implementare:<br />
O genă: o constantă (un ordin parţial sau o constantă <strong>de</strong> viteză <strong>de</strong> reacţie) subiect al<br />
găsirii (optimizării);<br />
Un cromozom: o posibilă cale <strong>de</strong> <strong>de</strong>sfăşurare a reacţiei, având specificate toate ordinele<br />
parţiale şi constantele <strong>de</strong> viteză specificate;<br />
Genomul: toate căile <strong>de</strong> <strong>de</strong>sfăşurarea a reacţiei prezente într-o iteraţie a algoritmului<br />
genetic;<br />
o Dacă algoritmul genetic are ca subiect rezolvarea unei probleme dificile <strong>de</strong> aliniament <strong>de</strong><br />
secvenţe genetice (Notredame şi Higgins, 1996) <strong>de</strong> ADN, ARN sau proteine în scopul<br />
i<strong>de</strong>ntificării regiunilor <strong>de</strong> similaritate care pot fi sursă <strong>de</strong> relaţii structurale, funcţionale sau<br />
evolutive între secvenţe, atunci următoarea este o implementare posibilă:<br />
O genă: două (sau mai multe) poziţii corespunzătoare la două (sau mai multe) subsecvenţe<br />
aliniate (sau mai exact pseudo-aliniate) şi lungimea aliniamentului acestora;<br />
Un cromozom: o posibilitate <strong>de</strong> aliniament pentru cele două (sau mai multe) secvenţe;<br />
Genomul: toate posibilităţile <strong>de</strong> aliniament <strong>de</strong> secvenţe stocate într-o iteraţie a<br />
algoritmului genetic;<br />
o Dacă algoritmul genetic are ca scop o problemă <strong>de</strong> setare în managementul efectuat în<br />
124<br />
···
scopul maximizării randamentului <strong>de</strong> producţie în câmp (Liu şi alţii, 2001), o problemă<br />
dificilă <strong>de</strong> setare a parametrilor controlabili (sau alteori predictibili) pentru obţinerea unei<br />
productivităţi maxime, atunci următoarea este o implementare posibilă:<br />
O genă: una dintre următoarele: pH-ul solului, fertilizatori în termeni <strong>de</strong> cantitate <strong>de</strong> N,<br />
P şi K, cantitatea <strong>de</strong> materie organică din sol, gradul <strong>de</strong> creştere termică zilnică (o<br />
mărime medie între temperatura minimă şi maximă a zilei), potenţialul genetic (ce poate<br />
fi exprimat în termeni <strong>de</strong> randament care s-ar obţine dacă vremea, solul şi fertilitatea<br />
sunt toate optime), cantităţile <strong>de</strong> precipitaţii pe perioada <strong>de</strong> maximă vegetaţie pe lunile<br />
Mai, Iunie, Iulie şi August, <strong>de</strong>nsitatea <strong>de</strong> plantare şi factorul <strong>de</strong> rotaţie;<br />
Un cromozom: o stare <strong>de</strong> fapt care poate apare în practică în câmp;<br />
Genomul: toate stările <strong>de</strong> fapt stocate într-o iteraţie a algoritmului genetic;<br />
(selecţia şi supravieţuirea)<br />
÷ Un scor sau şansă <strong>de</strong> supravieţuire a fiecărei soluţii este calculată pentru fiecare genotip cu<br />
ajutorul unei funcţii, numită şi funcţie obiectiv. Valoarea acestei funcţii este asociată cu<br />
abilitatea individului să supravieţuiască şi <strong>de</strong>fineşte astfel fenotipul asociat genotipului.<br />
ADN plantă cultivar<br />
<strong>de</strong>codare mediu<br />
codare<br />
genotip fenotip supravieţuire<br />
<strong>de</strong>codare funcţie<br />
codare<br />
obiectiv<br />
şir soluţie<br />
valoare<br />
Selecţia: genotip, fenotip şi supravieţuire<br />
÷ Dacă fiecare genotip reprezintă un punct în spaţiul <strong>de</strong> căutare şi în acelaşi timp o soluţie<br />
posibilă, prin intermediul selecţiei genotipul este concretizat în fenotip (operaţie care iterează<br />
reprezentarea soluţiilor posibile în spaţiul soluţiilor şi evaluează valoarea acestora). Principiul<br />
selecţiei naturale se exprimă astfel:<br />
o Indivizii (fenotipurile) din populaţie concurează pentru supravieţuire (selecţie).<br />
o Genele indivizilor selectaţi se propagă <strong>de</strong> la o generaţie la alta (datorită selecţiei);<br />
o Fiecare generaţie <strong>de</strong>vine mai potrivită mediului în care se află (prin penalizarea indivizilor<br />
care eşuează a supravieţui).<br />
÷ Scorul este asociat fiecărui fenotip (soluţie) reprezentând abilitatea acestuia să concureze pentru<br />
resurse în mediu, pentru supravieţuire (selecţie). Scopul algoritmului genetic este ca să aplice<br />
încrucişarea şi mutaţia selectivă a fenotipurilor (prin intermediul <strong>de</strong>codării lor în genotipurile<br />
din care provin) pentru a produce <strong>de</strong>scen<strong>de</strong>nţi mai buni <strong>de</strong>cât părinţii lor.<br />
÷ Algoritmul genetic menţine un cultivar (un eşantion <strong>de</strong> populaţie) <strong>de</strong> un număr dat (sau uneori<br />
variabil) <strong>de</strong> genotipuri a căror selecţie se poate face aplicând acelaşi operator. Astfel, selecţia şi<br />
supravieţuirea sunt două concepte asociate. Selecţie se face pentru operaţiile <strong>de</strong> încrucişare şi<br />
mutaţie, şi selecţie se face şi pentru supravieţuire în populaţia limitată <strong>de</strong> fenotipuri.<br />
÷ Prin selecţie o parte din indivizii populaţiei mor şi sunt înlocuiţi <strong>de</strong> alţii. În acest mod se speră<br />
că <strong>de</strong>-a lungul generaţiilor soluţii mai bune vor răsări în timp ce cele mai slabe soluţii sunt<br />
înlăturate. Odată cu trecerea <strong>de</strong> la o generaţie la alta populaţia va conţine din ce în ce mai bune<br />
soluţii <strong>de</strong>cât generaţia anterioară.<br />
÷ În tabelul următor este redată legătura care se stabileşte între scorul (exprimat prin funcţia<br />
125
Fitness(·) în tabel) şi regula <strong>de</strong> selecţie în funcţie <strong>de</strong> metoda (aşa cum este ea cunoscută în<br />
literatura <strong>de</strong> specialitate) folosită.<br />
Scor şi selecţie în algoritmii genetici<br />
Metodă Expresia funcţiei <strong>de</strong> scor Selecţie Comentarii<br />
Proporţional pi=fi/Σifi Şansa <strong>de</strong> selecţie este proporţională cu<br />
scorul (utilizând probabilitatea pi în<br />
selecţie)<br />
Deterministic<br />
fi=Fitness(Cromozom_i)<br />
i | fi = max. Selecţia indivizilor este făcută pe baza celui<br />
sau min. mai tare (sau celui mai slab) individ<br />
(elitism)<br />
Turnir (fi,fj) Perechi <strong>de</strong> indivizi concurează între ei<br />
max. sau pentru selecţie (din nou cel mai tare sau cel<br />
min. mai slab)<br />
Normalizare gi=(fi-N0)(fmax.-fmin.)/(N1- pi=gi/Σigi O scală fixă [N0,N1] normalizează scorul<br />
N0)<br />
fenotipurilor între generaţii diferite<br />
Ranguri hi=Rank(fi)(fmax.-fmin.)/Size pi=hi/Σihi Şansa este proporţională cu rangul scorului<br />
un<strong>de</strong>: Rank(·): rangul; Size: volum genom<br />
÷ Ceea ce se reprezintă formal, şi anume selecţia şi supravieţuirea fenotipurilor poate avea multe<br />
variante <strong>de</strong> implementare, trei dintre ele fiind următoarele:<br />
o Dacă algoritmul genetic are ca subiect rezolvarea unei probleme dificile formulate în<br />
sistemul S (Savageau, 1976), atunci următoarea este o posibilă implementare:<br />
Şirul, corespunzător unui genotip: o listă <strong>de</strong> valori constante subiect al optimizării şi<br />
asociat cu un experiment virtual;<br />
Soluţia, corespunzătoare genotipului (şi cromozomului): seria <strong>de</strong> timp a elementelor<br />
experimentului virtual (pentru o reacţie chimică prin soluţie se înţeleg seriile <strong>de</strong> timp ale<br />
concentraţiilor reactanţilor, intermediarilor şi produşilor <strong>de</strong> reacţie pe parcursul<br />
<strong>de</strong>sfăşurării reacţiei);<br />
Valoarea, corespunzătoare scorului: suma pătrată a diferenţelor dintre valorile observate<br />
(ca serie sau serii <strong>de</strong> timp) şi valorile estimate (<strong>de</strong> fenotip) ale uneia (sau mai multor)<br />
observabile (cum ar fi concentraţie sau concentraţii <strong>de</strong> intermediari);<br />
o Dacă algoritmul genetic are ca subiect rezolvarea unei probleme dificile <strong>de</strong> aliniament <strong>de</strong><br />
secvenţe <strong>de</strong> aminoacizi (Notredame şi Higgins, 1996), atunci următoarea este o posibilă<br />
implementare:<br />
Şirul, corespunzător unui genotip: o listă <strong>de</strong> perechi (sau <strong>de</strong> mai multe) poziţii <strong>de</strong> subsecvenţe<br />
aliniate urmată <strong>de</strong> lungimea fiecărei sub-secvenţe;<br />
Soluţia, corespunzătoare fenotipului (şi genotipului): o serie <strong>de</strong> valori conţinând poziţii<br />
<strong>de</strong> rupere şi lungimi <strong>de</strong> translatare necesare pentru a alinia secvenţele;<br />
Valoarea, corespunzătoare scorului: o funcţie <strong>de</strong> scor dând (uzual sub forma unei sume)<br />
costul total pentru toate ruperile şi <strong>de</strong>plasările necesare pentru a alinia secvenţele,<br />
utilizând un cost pre<strong>de</strong>finit pentru o rupere şi pentru <strong>de</strong>plasarea unei unităţi în secvenţă;<br />
o Dacă algoritmul genetic setarea parametrilor necesari pentru obţinerea unei bune producţii<br />
în câmp (Liu şi alţii, 2001), atunci următoarea este o posibilă implementare:<br />
Şirul, corespunzător unui genotip: o listă <strong>de</strong> valori ce corespund unui experiment virtual<br />
şi constituie obiect al optimizării; Valorile din şir pot fi: pH-ul solului, fertilizatori în<br />
termeni <strong>de</strong> cantitate <strong>de</strong> N, P şi K, cantitatea <strong>de</strong> materie organică din sol, gradul <strong>de</strong><br />
creştere termică zilnică (o mărime medie între temperatura minimă şi maximă a zilei),<br />
potenţialul genetic (ce poate fi exprimat în termeni <strong>de</strong> randament care s-ar obţine dacă<br />
vremea, solul şi fertilitatea sunt toate optime), cantităţile <strong>de</strong> precipitaţii pe perioada <strong>de</strong><br />
maximă vegetaţie pe lunile Mai, Iunie, Iulie şi August, <strong>de</strong>nsitatea <strong>de</strong> plantare şi factorul<br />
<strong>de</strong> rotaţie;<br />
Soluţia, corespunzătoare fenotipului (şi genotipului): un şir <strong>de</strong> valori caracterizând<br />
soluţia, cuprinzând valori obţinute prin aplicarea <strong>de</strong> funcţii care să exprime: calitatea<br />
126
solului, calitatea vremii, managementul <strong>de</strong> cultivare, potenţialul genetic şi efectul unor<br />
evenimente întâmplătoare;<br />
Valoarea, corespunzătoare scorului: suma pătratelor diferenţelor între randamente<br />
observate (în serii <strong>de</strong> experimente anterioare) şi estimate (<strong>de</strong> fenotip) ale randamentelor;<br />
(încrucişarea şi mutaţia)<br />
÷ Încrucişarea reprezintă împerecherea între fenotipuri; fenotipurile (uzual două) sunt selectate<br />
din populaţie folosind operatorul <strong>de</strong> selecţie; o porţiune <strong>de</strong> încrucişat <strong>de</strong>-a lungul şirului <strong>de</strong> gene<br />
ale genotipurilor asociate fenotipurilor este aleasă (întâmplător sau <strong>de</strong>terministic) şi valorile<br />
celor două porţiuni <strong>de</strong> şiruri sunt schimbate între ele, rezultând astfel din această împerechere<br />
doi <strong>de</strong>scen<strong>de</strong>nţi care sunt direct selectaţi pentru a face parte din noua generaţie <strong>de</strong> populaţie;<br />
încrucişarea este făcută în speranţa că dacă se recombină porţiuni <strong>de</strong> genotipuri <strong>de</strong> succes,<br />
atunci acest proces este probabil să producă <strong>de</strong>scen<strong>de</strong>nţi chiar mai buni <strong>de</strong>cât părinţii din care<br />
provin;<br />
··· ··· ···<br />
site încrucişare<br />
··· ··· ···<br />
recombinare<br />
··· ··· ···<br />
··· ··· ···<br />
părinţi<br />
copii<br />
O încrucişare dublă implicând ruperea şi reunirea cromozomilor părinţilor<br />
părinte<br />
··· ···<br />
<strong>de</strong>scen<strong>de</strong>nţi<br />
··· ···<br />
mutant<br />
Mutaţia<br />
÷ Mutaţia este operatorul care introduce modificări noi (inexistente în populaţia unei generaţii);<br />
ceea ce este caracteristic în general mutaţiei şi implicit şi operatorului acesteia corespon<strong>de</strong>nt în<br />
algoritmii genetici este că ea se petrece cu o probabilitate scăzută, fiind <strong>de</strong>ci aplicată cu o<br />
probabilitate scăzută (cu probabilitatea <strong>de</strong> 1/8 în figura <strong>de</strong> mai sus); operatorul <strong>de</strong> mutaţie poate<br />
implementa o mutaţie:<br />
o Întâmplătoare: când o porţiune a unui individ selectat va suferi schimbarea valorilor stocate<br />
în genele sale cu alte valori existente în materialul genetic al populaţiei şi are rolul<br />
menţinerii diversităţii în populaţie pentru a preveni populaţia să prezinte o convergenţă<br />
prematură;<br />
o Deliberată: când expunerea la anumite condiţii se transpune în folosirea unei reguli<br />
pre<strong>de</strong>terminate <strong>de</strong> modificare a valorilor genelor;<br />
o Sub presiunea factorilor <strong>de</strong> mediu, când valorile genelor se schimbă în raport cu scorul<br />
fenotipului supus modificării genetice;<br />
(evoluţia)<br />
÷ Utilizând doar selecţia singură un algoritm nu va reuşi <strong>de</strong>cât să copieze (cloneze) cel mai bun<br />
individ (fenotip) al său în întreaga populaţie;<br />
÷ Utilizând mutaţia singură un algoritm va reuşi doar să inducă parcurgerea întâmplătoare a<br />
spaţiului <strong>de</strong> căutare;<br />
÷ Utilizând încrucişarea şi selecţia un algoritm va reuşi să conveargă către o soluţie bună dar nu<br />
127
sub-optimală (în apropierea celei optime);<br />
÷ Mutaţia şi selecţia (fără încrucişare) într-un algoritm creează algoritmi paraleli, toleranţi la<br />
perturbaţii în căutarea <strong>de</strong> puncte <strong>de</strong> maxim local (în terminologia în engleză: hill-climbing);<br />
÷ Utilizarea tuturor operatorilor (mutaţie, încrucişare si selecţie) asigură unui algoritm toate<br />
caracteristicile <strong>de</strong> <strong>de</strong>finire ale unui algoritm genetic;<br />
t+1<br />
scor<br />
selecţie<br />
cel mai bun fenotip<br />
t+1<br />
scor<br />
Schema ilustrativă a modului <strong>de</strong> lucru al unui algoritm genetic clasic<br />
÷ Într-un algoritm genetic clasic (<strong>de</strong> genul celui ilustrat), pentru a rezolva o problemă, se<br />
generează întâmplător sau se iniţiază cu valori pre<strong>de</strong>finite o populaţie <strong>de</strong> un volum dat <strong>de</strong><br />
genotipuri; cerinţele preliminare algoritmului genetic este existenţa funcţiei obiectiv cu ajutorul<br />
căreia se evaluează scorul unui fenotip în populaţie; algoritmul genetic iterează astfel:<br />
o Repetă<br />
Pasul_1: Utilizând operatorul <strong>de</strong> selecţie selectează doi cromozomi;<br />
Pasul_2: Utilizând o funcţie discretă <strong>de</strong> probabilitate pentru alegerea porţiunii <strong>de</strong><br />
încrucişat încrucişează cei doi părinţi şi creează <strong>de</strong>scen<strong>de</strong>nţii acestora;<br />
Pasul_3: Cu o mică probabilitate şi utilizând o funcţie discretă <strong>de</strong> probabilitate pentru<br />
alegerea porţiunii <strong>de</strong> mutat efectuează mutaţia unui genotip, eventual un <strong>de</strong>scen<strong>de</strong>nt al<br />
încrucişării din pasul anterior;<br />
Pasul_4: Iniţializează o nouă populaţie cu noile fenotipuri (<strong>de</strong> la paşii 2 şi 3 anteriori);<br />
Pasul_5: Completează utilizând operatorul <strong>de</strong> selecţie aplicat populaţiei <strong>de</strong> părinţi noua<br />
populaţie cu fenotipuri (până cel puţin la refacerea numărului iniţial <strong>de</strong> membrii);<br />
Pasul_6: Refă valorile funcţiei <strong>de</strong> scor ale noii populaţii în conformitate cu noua<br />
compoziţie a acesteia;<br />
o Până când cel mai bun fenotip al populaţiei satisface o condiţie impusă (condiţie care<br />
reprezintă condiţia <strong>de</strong> sfârşit a algoritmului).<br />
O problemă dificilă <strong>de</strong> structură biochimică şi formalismul algoritmilor genetici<br />
Lucrarea (Jäntschi şi alţii, 2007) serveşte drept sursă a exemplificării unei probleme dificile <strong>de</strong><br />
structură biochimică şi relaţia acesteia cu o proprietate măsurată. Astfel, în lucrare autorii pornesc<br />
<strong>de</strong> la datele experimentale ale timpilor <strong>de</strong> retenţie observaţi pentru separarea cromatografică a<br />
bifenililor policloruraţi (PCBs) raportaţi în (Mullin şi alţii, 1984). Folosind informaţia structurală, o<br />
bază <strong>de</strong> date conţinând <strong>de</strong>scriptori <strong>de</strong> structură a fost construită.<br />
`MDF`<br />
`ready`<br />
`qspr_qsar`<br />
selecţie<br />
t<br />
încrucişare<br />
`PCB_data`<br />
`PCB_tmpx`<br />
`PCB_xval`<br />
`PCB_yval`<br />
Baza <strong>de</strong> date pentru studiul problemei dificile <strong>de</strong> relaţie structură-activitate<br />
128<br />
t+1<br />
mutaţie
Fragmentation criteria<br />
Fragment of `i`vs. `j`<br />
Probe atom `i`<br />
Atomic property<br />
Distance metric<br />
Probe atom `j`<br />
Interaction <strong>de</strong>scriptor Interaction mo<strong>de</strong>l<br />
Molecular overall<br />
superposing formula<br />
Linearization<br />
formula<br />
Metodologia relaţiilor structură-activitate (SAR) în abordarea Familiei <strong>de</strong> Descriptori Moleculari<br />
(MDF), imagine preluată din (Jäntschi şi Bolboacă, 2008-MQMC)<br />
Problema dificilă <strong>de</strong> relaţie structură chimică - activitate/proprietate măsurată se formulează astfel:<br />
având la dispoziţie o informaţie structurală (obţinută din realizarea topologiei moleculare a fiecărui<br />
compus pe baza legăturilor chimice care se stabilesc între atomi şi realizarea geometriei moleculare<br />
pe baza aplicării mo<strong>de</strong>lelor aproximative ale fizicii cuantice şi moleculare) şi o informaţie rezultată<br />
în urma observaţiei experimentale a unei proprietăţi/activităţi pentru fiecare din cei 209 compuşi în<br />
aceleaşi condiţii <strong>de</strong> mediu, care este cea mai bună relaţie structură-activitate care să <strong>de</strong>scrie<br />
proprietatea/activitatea compuşilor în funcţie <strong>de</strong> structură.<br />
În acord cu metodologia <strong>de</strong>scrisă în (Jäntschi şi alţii, 2007) informaţia structurală se poate valorifica<br />
construind o familie <strong>de</strong> <strong>de</strong>scriptori. Fără a mai <strong>de</strong>talia procedura clasică <strong>de</strong> rezolvare a problemei,<br />
abordarea din perspectiva unui algoritm genetic aplicat problemei este următoarea:<br />
÷ Populaţia este familia <strong>de</strong> <strong>de</strong>scriptori moleculari având fiecare genotip (cromozom) <strong>de</strong>scris <strong>de</strong><br />
următoarele gene:<br />
o gena d conţinând operatorul <strong>de</strong> distanţă folosit la construirea <strong>de</strong>scriptorului molecular<br />
(fenotipului), având 2 valori posibile: `g` - distanţă geometrică; `t` - distanţă topologică;<br />
o gena p conţinând proprietatea atomică folosită la construirea fenotipului, cu 6 valori<br />
posibile: `M` - masa atomică relativă; `Q` - sarcina electrică parţială a atomului (obţinută în<br />
aproximaţia Hückel extinsă); `C` - cardinalitatea (proprietate atomică trivială, tot<strong>de</strong>auna<br />
valoarea sa pentru orice atom este 1); `E` - electronegativitatea atomică (valoare relativă la<br />
scara <strong>de</strong> electronegativitate San<strong>de</strong>rson); `G` - electronegativitatea <strong>de</strong> grup (valoare obţinută<br />
prin calcularea unei medii geometrice a electronegativităţii grupului <strong>de</strong> atomi situat în<br />
imediata vecinătate a atomului cercetat); `H` - numărul <strong>de</strong> atomi <strong>de</strong> hidrogen ce înconjoară<br />
atomul cercetat;<br />
o gena I conţinând <strong>de</strong>scriptorul <strong>de</strong> interacţiune, implicând 2 atomi participanţi şi având una<br />
din următoarele 24 <strong>de</strong> valori (în care s-au folosit notaţiile: d - operatorul <strong>de</strong> distanţă; p -<br />
proprietatea atomică): `D(d)`, `d(1/d)`, `O(p1)`, ‘o(1/p1)`, `P(p1p2)`, `p(1/p1p2)`, `Q(√p1p2)`,<br />
`q(1/√p1p2)`, `J(p1d)`, `j(1/p1d)`, `K(p1p2d)`, `k(1/p1p2d)`, `L(d√p1p2)`, `l(1/d√p1p2)`,<br />
`V(p1/d)`, `E(p1/d2)`, `W(p1 2 /d)`, `w(p1p2/d)`, `F(p1 2 /d 2 )`, `f(p1p2/d 2 )`, `S(p1 2 /d 3 ), `s(p1p2/d 3 )`,<br />
`T(p1 2 /d 4 )`, `t(p1p2/d 4 )`, în care prima literă dă valoarea genei şi între paranteze este dată<br />
formula <strong>de</strong> calcul asociată valorii acesteia;<br />
o gena O codificând suprapunerea interacţiunilor, fiind implementate 6 valori ale acesteia,<br />
două pentru mo<strong>de</strong>le în care interacţiunile sunt rare şi la distanţă (`R` şi `r`), două pentru<br />
129
mo<strong>de</strong>lele în care interacţiunile sunt <strong>de</strong>nse dar la distanţă (`M` şi `m`), şi două pentru<br />
mo<strong>de</strong>lele în care interacţiunile sunt <strong>de</strong>nse şi apropiate (`D` şi `d`);<br />
o gena f care codifică algoritmul <strong>de</strong> fragmentare moleculară pe perechi <strong>de</strong> atomi, care poate<br />
avea una din următoarele 4 valori: `P` - pentru fragmentare bazată pe căi; `D` - pentru<br />
fragmentare bazată pe distanţe; `M` - pentru fragmentare în fragmente maximale; `m` -<br />
pentru fragmentare în fragmente minimale (fragmente triviale conţinând un singur atom);<br />
o gena M care codifică modalitatea <strong>de</strong> suprapunere globală a interacţiunilor fragmentelor, care<br />
poate lua una din următoarele 19 valori împărţite în 4 grupuri: grupul <strong>de</strong> mărimi ( `m` -<br />
selectează cea mai mică valoare; `M` - cea mai mare valoare; `n` - cea mai mică valoare<br />
absolută; `N` - cea mai mare valoare absolută); grupul <strong>de</strong> medii ( `S` - suma; `A` - media<br />
aritmetică după numărul <strong>de</strong> proprietăţi <strong>de</strong> fragmente; `a` - media aritmetică după numărul<br />
<strong>de</strong> fragmente; `B` - media aritmetică după numărul <strong>de</strong> atomi; `b` - media aritmetică după<br />
numărul <strong>de</strong> legături); grupul geometric (`P` - multiplicare; `G` - medie geometrică după<br />
numărul <strong>de</strong> proprietăţi <strong>de</strong> fragmente; `g` - medie geometrică după numărul <strong>de</strong> fragmente;<br />
`F` - medie geometrică după numărul <strong>de</strong> atomi; `f`` - media geometrică după numărul <strong>de</strong><br />
legături); grupul armonic (`s` - suma armonică; `H` - medie armonică după numărul <strong>de</strong><br />
proprietăţi <strong>de</strong> fragmente; `h` - medie armonică după numărul <strong>de</strong> fragmente; `I` - medie<br />
armonică după numărul <strong>de</strong> atomi; `i`` - media armonică după numărul <strong>de</strong> legături);<br />
o gena L care rezultă în algoritm în urma unei mutaţii <strong>de</strong>terministe asupra fenotipului şi<br />
reprezintă unul din cei 6 operatori <strong>de</strong> linearizare ce urmează: `I` - i<strong>de</strong>ntitate, `i` - inversa,<br />
`A` - valoarea absolută, `a` - inversa valorii absolute, `L` - logaritmul valorii absolute, `l` -<br />
logaritmul;<br />
÷ Scorul (funcţia obiectiv): având proprietatea măsurată pentru cei 209 compuşi exprimată în şirul<br />
Y (cu 209 valori), urmează:<br />
o Fenotipul, caracterizat <strong>de</strong> genele care compun cromozomul este transformat în fenotip când<br />
se calculează valorile corespunzătoare genotipului pentru fiecare din cele 209 molecule ale<br />
setului <strong>de</strong> PCBs.<br />
o Pentru o funcţie obiectiv <strong>de</strong> estimare a proprietăţii măsurate folosind 2 genotipuri (în cazul<br />
general putând fi un număr oarecare fixat <strong>de</strong> genotipuri, r), ecuaţia <strong>de</strong> regresie este <strong>de</strong><br />
forma: Ŷ = a0 + a1·Fenotip1 + a2·Fenotip2, (în general: Ŷ = a0 + Σ1≤i≤rai·Fenotipi), un<strong>de</strong>:<br />
Ŷ este estimatorul proprietăţii măsurate;<br />
a0..a2 sunt coeficienţii care rezultă din minimizarea pătratelor diferenţelor între valorile<br />
măsurate Y şi cele estimate prin intermediul lui Ŷ pentru setul <strong>de</strong> 209 compuşi;<br />
Fenotip1=Fenotip(Genotip1) şi Fenotip2=Fenotip(Genotip2) sunt fenotipurile (şirurile <strong>de</strong><br />
valori ale <strong>de</strong>scriptorilor moleculari obţinuţi prin operaţiile prescrise <strong>de</strong> genotipurile<br />
Genotip1=d1p1I1O1f1M1L1 şi Genotip2=d2p2I2O2f2M2L2 pentru cei 209 compuşi;<br />
o Tăria (scorul) unei perechi <strong>de</strong> genotipuri (sau mai multe, pentru regresia multivariată) poate<br />
fi exprimată <strong>de</strong> una din următoarele (Tabelul 18).<br />
Tabelul 18. Funcţii <strong>de</strong> scor pentru penalizarea regresiilor cu perechi <strong>de</strong> fenotipuri<br />
Nr. Scor (i=1..2) Semnificaţie Obiectiv Remarci<br />
1 Suma minim Uzual p=2; pentru p = 1 şi mai mult pentru p<br />
Σ(Y-a0-Σiai·Fenotipi) p<br />
reziduurilor<br />
<strong>de</strong> estimare<br />
=1/2 există avantajul că se favorizează<br />
tendinţa generală în regresie în <strong>de</strong>favoarea<br />
abaterilor grosolane <strong>de</strong> la ecuaţia <strong>de</strong> regresie<br />
2 r 2 (Y,a0+Σiai·Fenotipi) Coeficient <strong>de</strong> maxim Are avantajul legăturii cu scopul general al<br />
<strong>de</strong>terminare optimizării (maximizarea coeficientului <strong>de</strong><br />
<strong>de</strong>terminare)<br />
÷ Încrucişarea:<br />
o Se selectează (folosind una din meto<strong>de</strong>le <strong>de</strong> selecţie <strong>de</strong>scrise în Tabelul 17) două genotipuri,<br />
Genotip1=d1p1I1O1f1M1L1 şi Genotip2=d2p2I2O2f2M2L2;<br />
o Se generează două numere aleatoare (din distribuţia uniformă) între 0 şi 6 (fie ele 2 şi 4);<br />
130
o Se încrucişează Genotip1 cu Genotip2 când se obţin <strong>de</strong>scen<strong>de</strong>nţii Descen<strong>de</strong>nt1 =<br />
d1p1I2O2f2M1L1 şi Descen<strong>de</strong>nt2 = d2p2I1O1f1M2L2; se obţin fenotipurile acestor <strong>de</strong>scen<strong>de</strong>nţi<br />
şi se adaugă la cultivar;<br />
÷ Mutaţia:<br />
o Se foloseşte o probabilitate <strong>de</strong> mutaţie α=1/7 (numărul <strong>de</strong> gene) pentru a <strong>de</strong>ci<strong>de</strong> dacă se<br />
aplică sau nu mutaţia;<br />
o Se alege unul din <strong>de</strong>scen<strong>de</strong>nţi (cel mai tare sau cel mai slab în raport cu scorul, sau<br />
aleatoriu);<br />
o Se generează un număr aleatoriu între 0 şi 6 pentru a <strong>de</strong>ci<strong>de</strong> care genă va suferi mutaţia (fie<br />
acest număr 3);<br />
o Corespunzător lui 3 este gena I; se generează atunci un număr aleatoriu între 1 şi 24<br />
(numărul <strong>de</strong> valori posibile pe care le permite gena I); folosind valoarea generată aleatoriu<br />
între 1 şi 24 (fie acesta 12) se înlocuieşte valoarea genei I cu noua valoare (pentru 12<br />
valoarea genei I este `k(1/p1p2d)`);<br />
÷ Evoluţia (algoritmul genetic):<br />
o Aşa cum rezultă în acest punct, din întregul populaţiei (care numără, după un calcul simplu)<br />
787968 membrii, implementarea în abordarea algoritmilor genetici necesită generarea şi<br />
păstrarea unui eşantion (cultivar) restrâns din întreaga populaţie (maxim 100 <strong>de</strong> genotipuri);<br />
fie volumul cultivarului N;<br />
o Se generează aleatoriu N genotipuri;<br />
o Se obţin N fenotipuri asociate celor N genotipuri;<br />
o Se repetă:<br />
Pentru fiecare pereche (în cazul regresiei bivariate) <strong>de</strong> genotipuri<br />
• Se obţine scorul asociat perechii <strong>de</strong> fenotipuri: r 2 (Y,a0+a1·Fenotip1+a2·Fenotip2)<br />
Sfârşit pentru.<br />
Pentru fiecare genotip<br />
• Se obţine scorul genotipului ca valoarea minimă a scorului pe care el îl obţine prin<br />
împerechere cu celelalte genotipuri;<br />
Sfârşit pentru.<br />
Se aleg două genotipuri din cultivar folosind operatorul <strong>de</strong> selecţie (Tabelul 17) şi se<br />
încrucişează; li se generează fenotipurile şi se adaugă cultivarului (volumul cultivarului<br />
<strong>de</strong>vine N+2);<br />
Se <strong>de</strong>ci<strong>de</strong> dacă unul dintre genotipuri va fi mutat folosind probabilitatea α=1/7; dacă da,<br />
atunci se alege unul dintre genotipurile încrucişate şi se aplică operatorul <strong>de</strong> mutaţie;<br />
mutantului i se generează fenotipul şi se adaugă cultivarului (în caz favorabil mutaţiei<br />
volumul cultivarului <strong>de</strong>vine N+3);<br />
Folosind scorul genotipurilor se înlătură din cultivar exact atâtea genotipuri până când<br />
volumul cultivarului <strong>de</strong>vine din nou N (minim 0, maxim 3);<br />
o Până când scorul asociat celei mai bune perechi (în cazul regresiei bivariate) <strong>de</strong> genotipuri<br />
satisface condiţia impusă (<strong>de</strong> exemplu r 2 > 0.99).<br />
÷ Remarcă cu privire la cultivar, mutaţie şi încrucişare:<br />
o Nu orice combinaţie <strong>de</strong> valori ale genelor produce un fenotip sănătos; la fel mutaţia poate<br />
produce un fenotip mort; acesta este motivul pentru care există posibilitatea ca după rularea<br />
unui ciclu complet <strong>de</strong> evoluţie, cultivarul să rămână neschimbat (atunci când încrucişarea<br />
urmată <strong>de</strong> o eventuală mutaţie produc 3 fenotipuri care fie nu se nasc, fie nu se adaptează<br />
mediului);<br />
o Semnificaţia este următoarea: aplicarea secvenţelor <strong>de</strong> construcţie a fenotipului <strong>de</strong>scrise <strong>de</strong><br />
cromozom pentru o anumită moleculă (sau pentru mai multe dintre acestea) poate, în traseul<br />
<strong>de</strong> construcţie să întâlnească ne<strong>de</strong>terminări (împărţiri la 0, logaritm din număr negativ);<br />
o Chiar dacă este născut fenotipul, există posibilitatea să nu se adapteze mediului (având <strong>de</strong><br />
131
exemplu valori i<strong>de</strong>ntice pentru toate moleculele setului, ceea ce-l face nefolositor în<br />
exprimarea unei ecuaţii <strong>de</strong> regresie cu proprietatea măsurată).<br />
Abordări, variante, adaptări şi alternative ale formalismului algoritmilor genetici<br />
Există multe variante şi adaptări ale algoritmilor genetici menite să îmbunătăţească performanţele<br />
acestora pentru un anume tip <strong>de</strong> probleme.<br />
Menţionarea tehnicilor <strong>de</strong>rivate şi/sau bazate pe tehnica algoritmilor genetici este suficientă pentru<br />
problematica abordată:<br />
÷ Optimizarea bazată pe strategia coloniilor <strong>de</strong> furnici (în engleză: Ant colony optimization;<br />
Bouktir şi Slimani, 2005);<br />
÷ Algoritmi bacteriologici (în engleză: Bacteriologic algorithms; Benoit şi alţii, 2005);<br />
÷ Metoda încrucişării entropiei (în engleză: cross-entropy method; De Boer şi alţii, 2005);<br />
÷ Algoritmi culturali (în engleză: Cultural algorithms; Kobti şi alţii, 2004);<br />
÷ Strategii evolutive (în engleză: Evolution strategies; Schwefel, 1995);<br />
÷ Programare evolutivă (în engleză: Evolutionary programming; Fogel şi alţii, 1966);<br />
÷ Optimizare extremistă (în engleză: Extremal optimization; Bak şi Sneppen, 1993);<br />
÷ Adaptare Gausiană (în engleză: Gaussian adaptation; Kjellström, 1991);<br />
÷ Programare genetică (în engleză: genetic programming; Banzhaf şi alţii, 1997);<br />
÷ Algoritmi memetici (în engleză: memetic algorithm; Smith, 2007);<br />
÷ Alte variate, colectate în (Davis, 1991).<br />
Alte abordări conjugă algoritmii genetici cu alte concepte. Următoarele se pot menţiona:<br />
÷ Utilizarea maşinilor cu suport vectorial (în engleză: Support Vector Machines (Brown şi alţii,<br />
2000);<br />
÷ Analiza <strong>de</strong> localizare a asemănărilor structurale prin histograme secvenţiale (acronim în<br />
engleză: SPLASH; Califano, 2000);<br />
÷ Setul neregulat (în engleză: Rough set; Hvidsten şi alţii, 2001).<br />
2008A3. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi<br />
dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />
Introduction to Practical Statistics for Medical Research<br />
÷ Organizator: University College London (UCL), Londra, UK<br />
÷ Tip: curs<br />
÷ Perioadă: 6-11 Aprilie 2008;<br />
÷ Deplasare: aferentă Obiectiv 1, Activitate 3;<br />
÷ Participanţi: <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>;<br />
÷ Tematica cursului:<br />
Basics of Study Design Rumana OMAR UCL<br />
Introduction to Data Analysis Caroline DORE MRC<br />
Observational Studies in Health Research Rumana OMAR UCL<br />
Randomised Controlled Trials Doug ALTMAN UOx<br />
Estimation and Hypothesis Testing Gareth AMBLER UCL<br />
Comparing Groups of Continuous Data Caroline DORE MRC<br />
Analysis of Categotical Data Pauline ROGERS UCL<br />
Sample Size Calculations Caroline DORE MRC<br />
Correlation and Linear Regression Gareth AMBLER UCL<br />
Further Regression Topics Gareth AMBLER UCL<br />
132
Measures of Disease in Health Research Rumana OMAR UCL<br />
Logistic Regression Andrew COPAS UCL<br />
Analysis of Survival Data Andrew COPAS UCL<br />
Analysis of Clustered Data Rebeca TURNER MRC<br />
Statistics in Medical Journals Doug ALTMAN UOx<br />
Legendă:<br />
UCL - University College London, Londra, UK<br />
MRC - Medical Research Center, Londra, UK<br />
UOx - University of Oxford, Oxford, UK<br />
÷ Puncte cheie din tematica cursului:<br />
o Basics of Study Design<br />
Designul este cel mai important aspect al unui studiu;<br />
Trebuie să răspundă întrebării <strong>de</strong> <strong>cercetare</strong>;<br />
Designul studiului acoperă:<br />
• Studii observaţionale;<br />
• Trialuri controlate randomizate;<br />
Este esenţială pregătirea protocolului <strong>de</strong> <strong>cercetare</strong>;<br />
Aspecte metodologice:<br />
• Specificarea obiectivului cercetării trebuie să includă:<br />
o Estimarea frecvenţei <strong>de</strong> apariţie a fenomenului observat;<br />
o Generarea şi testarea ipotezelor;<br />
o Înţelegerea cauzelor fenomenului observat;<br />
o Evaluarea intervenţiei sugerate <strong>de</strong> <strong>cercetare</strong>;<br />
• Specificarea populaţiei incluse în studiu:<br />
o Asigurarea reprezentativităţii eşantionului;<br />
o Criteriile <strong>de</strong> inclu<strong>de</strong>re şi exclu<strong>de</strong>re din studiu;<br />
o Specificarea răspunsului primar urmărit;<br />
o Specificarea răspunsurilor secundare urmărite;<br />
o Asigurarea unui eşantion <strong>de</strong> control;<br />
o Influenţa dimensiunii eşantionului asupra semnificaţiei;<br />
• Estimarea influenţelor:<br />
o Evaluarea confuziilor între factorul urmărit şi alţi factori;<br />
o Eroarea produsă <strong>de</strong> selecţie;<br />
o Eroarea produsă <strong>de</strong> observabilă;<br />
o Eroarea produsă <strong>de</strong> observator;<br />
o Eroarea produsă <strong>de</strong> evenimente anterioare celui urmărit;<br />
• Manipularea datelor:<br />
o Responsabilitate;<br />
o Evi<strong>de</strong>nţe duble;<br />
o Construcţie unei baze <strong>de</strong> date;<br />
o Menţinerea confi<strong>de</strong>nţialităţii;<br />
o Planul <strong>de</strong> analiză statistică;<br />
o Introduction to Data Analysis<br />
Meto<strong>de</strong> statistice utilizate pentru înţelegerea şi explicarea variaţiilor;<br />
Alegerea meto<strong>de</strong>i <strong>de</strong> analiză în funcţie <strong>de</strong>:<br />
• Tipul datelor;<br />
• Structura studiului;<br />
• Presupunerile cu privire la distribuţia datelor;<br />
Tipuri <strong>de</strong> date grupate pe categorii:<br />
• Două categorii (date binare);<br />
133
• Categorii nominale (neordonate);<br />
• Categorii ordinale (ordonate);<br />
Variabile răspuns şi variabile expunere;<br />
Date lipsă;<br />
Descrierea datelor;<br />
Măsuri:<br />
• De sumar:<br />
o Valoare tipică;<br />
o Împrăştierea valorilor;<br />
• Valori tipice:<br />
o Media;<br />
o Mediana;<br />
o Centila şi cuartila;<br />
• Împrăştierea valorilor:<br />
o Deviaţia standard;<br />
o Domeniu şi domeniu interquartilic;<br />
Verificarea datelor;<br />
Distribuţii statistice:<br />
• Presupuneri;<br />
• In<strong>de</strong>pen<strong>de</strong>nţă;<br />
• Legi <strong>de</strong> distribuţie:<br />
o Distribuţia normală;<br />
o Distribuţia binomială;<br />
o Distribuţia uniformă;<br />
o Distribuţia log-normală;<br />
o Distribuţia Poisson;<br />
o Distribuţia χ 2 ;<br />
o Distribuţia Stu<strong>de</strong>nt;<br />
Meto<strong>de</strong> parametrice;<br />
Meto<strong>de</strong> neparametrice;<br />
o Observational Studies in Health Research<br />
Studii observaţionale:<br />
• Serii caz-raport;<br />
• Secţionare încrucişată;<br />
• Cohorte;<br />
• Caz-control;<br />
Puterea şi limitele fiecărui tip <strong>de</strong> studiu;<br />
Tipuri <strong>de</strong> studii:<br />
• Studii <strong>de</strong>scriptive;<br />
• Studii analitice;<br />
Aplicaţiile <strong>de</strong>signului <strong>de</strong> studiu;<br />
Stabilirea cauzalităţii în studii observaţionale analitice:<br />
• Criteriul Bradford Hill<br />
o Randomised Controlled Trials<br />
Ce este un trial controlat randomizat;<br />
Aspecte cheie ale <strong>de</strong>signului şi analizei unui trial controlat;<br />
Întâmplarea;<br />
Simularea întâmplării;<br />
Generarea <strong>de</strong> secvenţe întâmplătoare;<br />
Designul;<br />
Generarea întâmplătoare pe blocuri;<br />
134
Generarea întâmplătoare stratificată;<br />
Când generarea întâmplătoare apare;<br />
Când generarea întâmplătoare operează corespunzător;<br />
Când generarea întâmplătoare operează necorespunzător;<br />
Alocarea sistematică;<br />
Conducerea (execuţia) unui trial;<br />
Orbirea: asigurarea întâmplării prin privarea <strong>de</strong> informaţii;<br />
Designul trialurilor clinice;<br />
Trialuri <strong>de</strong> echivalenţă;<br />
Volumul eşantionului;<br />
Măsuri ale răspunsului;<br />
Protocolul <strong>de</strong> <strong>cercetare</strong>;<br />
Probleme <strong>de</strong> etică;<br />
Probleme cheie ale analizei unui trial controlat;<br />
o Estimation and Hypothesis Testing<br />
Populaţii şi eşantioane;<br />
Analiza statistică;<br />
Estimarea parametrilor populaţiei;<br />
Incertitudinea în estimare;<br />
Distribuţia <strong>de</strong> eşantionare;<br />
Măsuri ale incertitudinii;<br />
Intervale <strong>de</strong> încre<strong>de</strong>re;<br />
Testarea ipotezelor în populaţii şi eşantioane;<br />
Valori <strong>de</strong> probabilitate;<br />
Semnificativ vs. nesemnificativ (statistic);<br />
Interpretarea valorilor <strong>de</strong> probabilitate;<br />
Estimare vs. testarea ipotezelor;<br />
o Comparing Groups of Continuous Data<br />
Structura datelor;<br />
Presupuneri cu privire la distribuţia datelor;<br />
Eşantioane pereche;<br />
Distribuţia t (Stu<strong>de</strong>nt);<br />
Eşantioane in<strong>de</strong>pen<strong>de</strong>nte;<br />
Distribuţia reziduurilor;<br />
Transformarea logaritmică;<br />
Analiza <strong>de</strong> varianţă ANOVA;<br />
Distribuţia F (Fisher);<br />
Comparaţii multiple;<br />
Procedura Bonferoni;<br />
o Analysis of Cathegorical Data<br />
Analiza a două grupuri <strong>de</strong> date grupate pe categorii;<br />
Compararea riscului în două grupuri in<strong>de</strong>pen<strong>de</strong>nte;<br />
Tabele <strong>de</strong> frecvenţă 2X2;<br />
Testul χ 2 ;<br />
Mai mult <strong>de</strong> două categorii;<br />
Tabele <strong>de</strong> frecvenţă mari;<br />
Testul Fisher exact;<br />
Două grupuri pereche;<br />
Testul McNemar;<br />
o Sample size calculations<br />
Importanţa calculului volumului eşantionului;<br />
Calcule bazate pe putere vs. calcule bazate pe precizie;<br />
135
Meto<strong>de</strong> <strong>de</strong> bază pentru medii şi pentru proporţii;<br />
<strong>Raport</strong>area calculelor <strong>de</strong> volum <strong>de</strong> eşantion;<br />
Fezabilitatea studiilor;<br />
Erori <strong>de</strong> tipul I;<br />
Erori <strong>de</strong> tipul II;<br />
Nivel <strong>de</strong> semnificaţie;<br />
o Further Regression Topics<br />
Regresia multiplă;<br />
Predictori binari şi predictori pe categorii;<br />
Interacţiuni;<br />
Selecţia mo<strong>de</strong>lelor;<br />
o Measures of Disease in Health Research<br />
Determinarea factorilor ce contribuie la un răspuns medical;<br />
I<strong>de</strong>ntificarea şi explicarea amprentelor geografice;<br />
Determinarea, <strong>de</strong>scrierea şi raportarea unui răspuns medical în curs;<br />
Determinarea măsurilor preventive;<br />
Sănătatea în planificarea şi <strong>de</strong>zvoltarea serviciilor <strong>de</strong> sănătate;<br />
Furnizarea <strong>de</strong> date administrative şi <strong>de</strong> planificare;<br />
o Logistic regression<br />
Când şi un<strong>de</strong> se foloseşte regresia logistică;<br />
Ce este regresia logistică;<br />
Interpretare: rata parităţilor;<br />
Rata parităţilor vs. riscul relativ;<br />
o Analysis of Survival Data<br />
Ce sunt datele <strong>de</strong> supravieţuire;<br />
Tabele <strong>de</strong> viaţă şi curbe <strong>de</strong> supravieţuire;<br />
Testarea pentru diferite rate <strong>de</strong> supravieţuire între grupuri;<br />
Analiza <strong>de</strong> regresie;<br />
Greşeli comune;<br />
o Analysis of clustered data<br />
Când sunt datele grupate;<br />
Meto<strong>de</strong> statistice vs. date grupate;<br />
Meto<strong>de</strong> complexe <strong>de</strong> investigare;<br />
o Statistics in medical journals<br />
Utilizarea <strong>de</strong>signului şi analizei;<br />
Utilizarea tehnicilor <strong>de</strong> analiză;<br />
Interpretarea rezultatelor;<br />
<strong>Raport</strong>area selectivă a rezultatelor;<br />
Citarea selectivă a literaturii;<br />
Obţinerea concluziilor;<br />
Summer School on Neural Networks in Classification, Regression and Data Mining<br />
÷ Organizator: Institutos Superiores <strong>de</strong> Engenharia do Porto (ISEP), Porto, PT<br />
÷ Tip: şcoală <strong>de</strong> vară<br />
÷ Perioadă: 6-12 Iulie 2008;<br />
÷ Deplasare: aferentă Obiectiv 1, Activitate 3;<br />
÷ Participanţi: <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>;<br />
÷ Tematica cursului:<br />
Basic Notions. Why NN? Joaquim Marques <strong>de</strong> Sá<br />
MLP and RBF algorithms Petia Georgieva<br />
MLP’s with Entropic Criteria Jorge Santos<br />
Data Mining with MLPs Paulo Cortez<br />
136
Functional Networks Noelia Sánchez Maroño<br />
Multi-class SVMs, Theory Yann Guermeur<br />
Functional Networks application Noelia Sánchez Maroño<br />
SVMs application to protein secondary structure prediction Yann Guermeur<br />
Multiple kernel learning and HM-SVM for bioinformatic applications Alexan<strong>de</strong>r Zien<br />
Semi-Supervised Learning Alexan<strong>de</strong>r Zien<br />
Multi-Valued and UB Neurons - I Igor Aizenberg<br />
Kernel PLS Mark Embrechts<br />
Multi-Valued and UB Neurons - II Igor Aizenberg<br />
Selecting Algorithms and Parameters with Meta-Learning Carlos Soares<br />
Text Mining Mark Embrechts<br />
÷ Puncte cheie din tematica cursului:<br />
o Basic Notions. Why NN?<br />
Learning Approaches<br />
What are NNs?<br />
A Simple Neuron: The Linear Discriminant<br />
Neural Activation Functions<br />
Learning Dichotomies: The Perceptron<br />
Neural Net Types<br />
FFNN as Universal Approximators<br />
o MLP and RBF algorithms<br />
Historical perspective - biological analogy<br />
Learning algorithms: Backpropagation, conjugate gradient, Newton’s<br />
methods<br />
NN Architectures - MLP, RBF<br />
Examples and applications<br />
o MLP’s with Entropic Criteria<br />
Entropy<br />
Entropy Estimation<br />
Entropy in Learning Systems<br />
Entropic Cost Function<br />
Algorithm Optimizations<br />
Other Similar Algorithms<br />
Experiments<br />
o Data Mining with MLPs<br />
Intensive Care and Meat Quality applications<br />
Knowledge Discovery in Databases (KDD)<br />
Data Mining (DM)<br />
Business Intelligence and Data Mining<br />
DM Methodologies: CRISP-DM<br />
DM goals & DM methods<br />
• Classification<br />
• Regression<br />
• Clustering<br />
• Link analysis<br />
Multilayer Perceptrons (MLPs)<br />
Activation functions<br />
Architecture/Topology<br />
Why Data Mining with MLPs?<br />
137
• Popularity<br />
• Universal Approximators<br />
• Nonlinearity<br />
• Robustness<br />
• Explanatory Knowledge<br />
Software<br />
R statistical environment<br />
Supervised Learning<br />
Handling Missing Data<br />
Outliers<br />
Non numerical variable remapping<br />
Feature Selection<br />
Classification Metrics<br />
Receiver Operating Characteristic (ROC)<br />
Regression Metrics<br />
Validation method: how to estimate the performance?<br />
MLP Training Algorithm<br />
Local Minima with MLP<br />
Overfitting<br />
Case Study: Intensive Care Medicine (Classification)<br />
Knowledge extraction (Decision Tree example for the renal organ)<br />
Case Study: Lamb Meat Quality (Regression)<br />
o Functional Networks<br />
Introduction to functional networks<br />
Differences between functional and artificial neural networks<br />
Functional equations<br />
Working with functional networks<br />
Different mo<strong>de</strong>ls<br />
Applications<br />
o Multi-class SVMs, Theory<br />
Yann Guermeur<br />
Guaranteed risk for large margin multi-category classifiers<br />
• Theoretical framework<br />
• Basic uniform convergence result<br />
• γ-ψ-dimensions<br />
• Generalized Sauer-Shelah lemma<br />
• Nature and rate of convergence<br />
Multi-class SVM<br />
• Multi-cathegory classification with binary SVMs<br />
• Class of functions implemented by the M-SVMs<br />
• Generalized formulation of the training algorithm<br />
• Three main mo<strong>de</strong>ls of M-SVMs<br />
• Some variants of the main mo<strong>de</strong>ls<br />
• Margins and support vectors<br />
Guaranteed risk for multi-class SVMs<br />
• Bounds on the covering numbers<br />
• Use of the Ra<strong>de</strong>macher complexity<br />
Mo<strong>de</strong>l selection for multi-class SVMs<br />
• Algorithms fitting the entire regularization path<br />
• Bounds on the leave-one-aut cross-validation error<br />
Open problems<br />
138
o SVMs application to protein secondary structure prediction<br />
Protein secondary structure prediction<br />
• Different levels of structural organization in proteins<br />
• A problem of central importance in structural biology<br />
• Different measures of prediction accuracy<br />
State of the art<br />
• Choice of the predictors<br />
• Building blocks and architecture of the main prediction methods<br />
Implementation of multi-class SVMs<br />
• Mo<strong>de</strong>ls implemented<br />
• Training algorithm<br />
• Dedicated RBF kernel<br />
• Computation opf weighting vector θ<br />
• Experimental results<br />
Future work<br />
o Multiple kernel learning and HM-SVM for bioinformatic applications<br />
Support Vector Machines (SVMs)<br />
Handling Non-Linearity with Kernels<br />
SVMs as Perceptrons<br />
Application: Predicting Protein Subcellular Localization<br />
Multiple Kernel Learning (MKL)<br />
Large Margin MKL Mo<strong>de</strong>l<br />
Optimization for MKL<br />
Normalization of Kernels<br />
Multiclass Multiple Kernel Learning<br />
Application: Predicting Protein Subcellular Localization<br />
o Semi-Supervised Learning<br />
Why Semi-Supervised Learning?<br />
Why and How Does SSL Work?<br />
Generative Mo<strong>de</strong>ls<br />
The Semi-Supervised SVM (S 3 VM)<br />
Graph-Based Methods<br />
Further Approaches (Co-Training, Transduction)<br />
o Multi-Valued and UB Neurons - I<br />
Why we need the complex valued neurons?<br />
A classical Minsky-Papert’s limitation<br />
Is it possible to learn XOR and Parity n functions using a single neuron?<br />
Multi-Valued and Universal Binary Neurons (MVN and UBN)<br />
Multi-valued mappings<br />
Traditional approaches to learn the multiple-valued mappings on a neuron<br />
Sigmoidal neurons: limitations<br />
Multi-Valued Neuron (MVN)<br />
Multi-valued mappings and multiple-valued logic<br />
Discrete-Valued (k-valued) Activation Function<br />
Multiple-Valued (k-valued) Threshold Functions<br />
Learning Algorithm for the Discrete MVN with the Error-Correction<br />
Learning Rule<br />
Continuous-Valued Activation Function<br />
Learning Algorithm for the Continuous MVN with the Error Correction<br />
Learning Rule<br />
A role of the factor 1/(n+1) in the Learning Rule<br />
Self-Adaptation of the Learning Rate<br />
139
Modified Learning Rules with the Self-Adaptive Learning Rate<br />
Convergence of the learning algorithm<br />
MVN as a mo<strong>de</strong>l of a biological neuron<br />
P-realizable Boolean Functions over the field of Complex numbers and a<br />
Universal Binary Neuron<br />
Depen<strong>de</strong>nce of the number of sectors on the number of inputs<br />
Learning Algorithm for UBN<br />
Mail Applications<br />
o Kernel PLS<br />
Introduction<br />
• Latent Variables<br />
• The Machine Learning Paradox<br />
• Beyond Regression (PCR)<br />
Principal Component Analysis (PCA)<br />
• Definition<br />
• NIPALS algorithm<br />
• Principal Component Regression (PCR)<br />
• Loading factors and variable selection<br />
Partial Least Squares (PLS)<br />
Nonlinear PLS<br />
• Kernels<br />
• Direct kernel methods<br />
• K-PCA<br />
• K-PLS<br />
• Preprocessing and centering the kernel<br />
• Variable/feature selection with sensitivity analysis<br />
Applications<br />
• Portuguese Wine data<br />
• Pima Indians<br />
• Italian Olive Oils multi-class classification<br />
• Svante Wold’s QSAR data<br />
• Real QSAR data<br />
• Time series prediction<br />
o Multi-Valued and UB Neurons - II<br />
Associative memory<br />
A feedforward multilayer MVN-based neural network (MLMVN), its<br />
<strong>de</strong>rivative-free backpropagation learning algorithm and solving some<br />
classification and prediction problems<br />
Learning of the genetic co<strong>de</strong> using MLMVN<br />
Gene expression data classification using MLMVN<br />
Blur i<strong>de</strong>ntification using MLMVN<br />
Solving the problem of Gene Expression Patterns<br />
Classification using the MVN-based neural network<br />
Learning of non-threshold Boolean functions using a single<br />
UBN<br />
o Selecting Algorithms and Parameters with Meta-Learning<br />
Background: why is this a problem?<br />
• approximating functions with machine learning<br />
• algorithm selection and bias<br />
• a few solutions<br />
Meta-Learning: THE solution<br />
140
Meta-learning for Algorithm Recommendation<br />
o Text Mining<br />
What is text mining<br />
Text mining process<br />
Visualizations for text mining<br />
Kernel methods<br />
Case studies<br />
Fingerprinting text<br />
Text categorization<br />
Applying text mining to bioinformatics<br />
Customer service center analysis<br />
Detecting ontologies<br />
2008A4. Stabilirea necesarelor <strong>de</strong> materiale şi consumabile, i<strong>de</strong>ntificarea furnizorilor şi<br />
condiţiilor <strong>de</strong> procurare, întocmirea documentaţiilor <strong>de</strong> procurare, <strong>de</strong>rularea licitaţiilor pentru<br />
achiziţii<br />
÷ S-au achiziţionat serie <strong>de</strong> echipamente pentru <strong>cercetare</strong>:<br />
o Fluorometru (pentru analize în soluţie)<br />
o Staţie Meteo Wireless (pentru monitorizare parametrii <strong>de</strong> mediu)<br />
o Notebook (pentru preluare date <strong>de</strong> la fluorometru şi <strong>de</strong> monitorizare parametrii <strong>de</strong><br />
mediu)<br />
÷ S-au achiziţionat o serie <strong>de</strong> obiecte <strong>de</strong> inventar necesare cercetării:<br />
o Procesor CPU Intel Xeon Quad Core; Multifunctional Brother; Panou solar fotovoltaic;<br />
Acumulatori; Regulator <strong>de</strong> încărcare; Afişaj regulator; Invertor; Imprimanta Canon;<br />
Senzor umiditate frunze; Senzor umiditate sol; Senzor temperatura din otel inoxidabil;<br />
Repetitor; Antena Yagi; Repetitor standard wireless<br />
÷ S-au achiziţionat o serie <strong>de</strong> cărţi:<br />
o Evolutionary Dynamics; Evolutionary Computation: The Fossil Record; The Genetical<br />
Theory of Natural Selection<br />
2008A5. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi<br />
dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />
Strasbourg Summer School on Chemoinformatics: CheminfoS3<br />
÷ Organizator: Louis Pasteur University (ULP), Strasbourg, FR<br />
÷ Tip: şcoală <strong>de</strong> vară<br />
÷ Perioadă: 20-04 Iunie-Iulie 2008;<br />
÷ Deplasare: aferentă Obiectiv 2, Activitate 5;<br />
÷ Participanţi: <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Carmen E. STOENOIU;<br />
÷ Cursurile şcolii:<br />
QSAR: discovery and first steps T. Fujita<br />
History and challenges of chemoinformatics J. Gasteiger<br />
Current trends in chemoinformatics W. Warr<br />
Fingerprint Design and Molecular Complexity Effects J. Bajorath<br />
Diversity Analysis and Library Design V. Gillet<br />
De novo Design G. Schnei<strong>de</strong>r<br />
Lessons learned from mo<strong>de</strong>lling bioactivity - what works and what doesn't R. Glen<br />
141
Exploring novel estrogen receptors and more... T. Oprea<br />
Tutorial: Impact of dataset composition on mo<strong>de</strong>ls performance A. Varnek<br />
Molecular <strong>de</strong>scriptors: an overview R. To<strong>de</strong>schini<br />
The good, the bad and the ugly practices of QSAR mo<strong>de</strong>lling A. Tropsha<br />
Pharmacophore Approach in Drug Discovery T. Langer<br />
Classification of chemical reactions J. Aires-<strong>de</strong>-Sousa<br />
Machine learning methods in QSAR I. Tetko<br />
Tutorial on application of non-linear methods in chemistry (neural networks,<br />
I. Baskin<br />
support vector machines)<br />
In silico target profiling J. Mestres<br />
Docking and post-docking strategies D. Rognan<br />
What Crystal Structure Databases Tell us about Conformational Preferences of<br />
M. Stahl<br />
Drug-like Molecules<br />
The Role of Cheminformatics in the Mo<strong>de</strong>rn Drug Discovery Process P. Ertl<br />
÷ Puncte cheie din cursuri:<br />
o QSAR: discovery and first steps<br />
Origin of Classical QSAR is from the SAR Studies of Agrochemicals<br />
Plant Growth Regulators/Herbici<strong>de</strong>s<br />
Structure-Activity Patterns<br />
The "Birth" of the Multi-variable Approach<br />
Features of the QSAR<br />
Conditions for the QSAR<br />
Classical QSAR for Series of Substituted Analogs<br />
Process of the Emergence of Biological Activity<br />
Early Trials of the Quantitative Approach<br />
Commercialized Drugs <strong>de</strong>veloped with the Aid of Classical QSAR<br />
o History and challenges of chemoinformatics<br />
the scope of chemoinformatics<br />
the beginnings<br />
a field of ist own<br />
scientific challenges<br />
political challenges<br />
o Current trends in chemoinformatics<br />
Literature analysis<br />
Hardware and infrastructure<br />
Web 2.0<br />
The Semantic Web<br />
Text mining<br />
Combichem<br />
Evaluation of scientific methods<br />
o Fingerprint Design and Molecular Complexity Effects<br />
Chemical Similarity Searching<br />
Molecular Fingerprints<br />
Similarity Search<br />
Multiple Active Reference Molecules<br />
Molecular Complexity and Size Effects<br />
Fingerprint Design<br />
Activity-Specific Descriptor Value Ranges<br />
Assessment of Descriptor Selectivity<br />
PDR-FP Descriptor Selection<br />
142
Similarity Assessment with PDR-FP<br />
Relevance of Complexity Effects<br />
Tversky Similarity<br />
Relevance of Complexity Effects<br />
Activity Classes of Different Avg. Size<br />
Pairwise Tversky Similarity<br />
Complexity Effects<br />
Weighted Tversky Coefficient<br />
Random Reduction of Bit Density<br />
o Diversity Analysis and Library Design<br />
Diversity Analysis<br />
• Measuring diversity<br />
• Selecting diverse subsets<br />
• Computational filtering<br />
Combinatorial Library Design<br />
• Designing libraries optimised on multiple properties<br />
• Reduced Graphs as Molecular Descriptors<br />
o De novo Design<br />
De Novo Design Concepts<br />
Adaptive Walk in a “Fitness Landscape”<br />
What is a Molecule?<br />
Local Neighborhood Search<br />
Local Neighborhood Strategies<br />
Elements of Artificial Adaptive Systems<br />
Ant Colony Optimization. A Simple Combinatorial Case: Pepti<strong>de</strong> Design<br />
Ant System for Combinatorial Design<br />
Principle of Evolutionary Strategies<br />
Algorithm of the (1,λ) Evolution Strategy<br />
De novo Fragment Assembly<br />
Operators of Evolutionary Optimization<br />
Particle Swarm Optimization (PSO)<br />
Visualization of Particle Trajectories<br />
COLIBREE®: Combinatorial Library Breeding<br />
Self-Organizing Map (SOM)<br />
Pharmacophore Road Map of Chemical Space<br />
o Lessons learned from mo<strong>de</strong>lling bioactivity - what works and what doesn't<br />
Dynamic pharmacophores in the 5HT1b/d GPCR<br />
• An introduction to <strong>de</strong>signing 5-HT1B ligands<br />
• 5-HT1B pharmacophore <strong>de</strong>velopment<br />
• Homology mo<strong>de</strong>lling based on the beta-2 crystal structure<br />
• Dynamic pharmacophores<br />
• Efficacy mo<strong>de</strong>ls<br />
Moving on to Structure-Activity/Property mo<strong>de</strong>ls - some observations<br />
• How reliable are solubility data?<br />
• ‘Solubility’ in the literature<br />
• So, we have created a Solubility Challenge<br />
• Methods to discover mo<strong>de</strong>ls<br />
• Property behaviour<br />
• So - does (Q)SAR work?<br />
• Overfitting and cross validation: three papers to read by Hawkins<br />
• A simple mo<strong>de</strong>l example, again using solubility - putting in<br />
143
parameters that relate to the phenomenon<br />
o Exploring novel estrogen receptors and more...<br />
MLI in Numbers<br />
NM MLSC (3-year summary) U54MH074425<br />
Summary Assays NMMLSC<br />
Integrated Discovery Teams<br />
HyperCyt<br />
Integration of VS & HTS<br />
GPR30 - A Novel Estrogen Target for MLI<br />
2D Similarity<br />
Shape Similarity - ROCS<br />
Electrostatic Similarity - EON<br />
In Silico Screening: Bet on all horses…<br />
Summary of Estrogen Receptors Results<br />
Biomolecular Screening Results<br />
Virtual and Biomolecular Screening Workflow<br />
Probe Discovery At NMMLSC<br />
How Many Drug Targets?<br />
WOMBAT-PK<br />
Measured Data in WOMBAT-PK<br />
Drug Targets & Dis-ease<br />
The Fitness Landscape<br />
Multi-Target Binding Affinity Cliffs<br />
Mono-Target Drugs<br />
Current Drugs Classification<br />
Unique Drug Targets by Class<br />
Urban Legend…<br />
Drug Targets Revisited<br />
From DrugBank<br />
What are the relevant drug metabolizing enzymes?<br />
The Problem with unique lists…<br />
More realistic? Overview of drug metabolism<br />
o Tutorial: Impact of dataset composition on mo<strong>de</strong>ls performance<br />
Software<br />
• R<br />
• Weka<br />
Datasets<br />
Mo<strong>de</strong>l building<br />
• Descriptors<br />
• Data files<br />
• Obtaining and validation of the mo<strong>de</strong>ls<br />
• Extracting the training and the external related test set from the<br />
Cherkasov dataset<br />
• Build and analyze a Bayesian mo<strong>de</strong>l<br />
• External validations on unrelated test set<br />
Detection of the bias: profiling of data sets<br />
o Molecular <strong>de</strong>scriptors: an overview<br />
The chemical data<br />
Molecular structure<br />
Some historical notes<br />
Molecular <strong>de</strong>scriptors intro<br />
• The role of the molecular <strong>de</strong>scriptors<br />
144
• Representations of a molecular structure<br />
• Properties of a molecular <strong>de</strong>scriptor<br />
Molecular <strong>de</strong>scriptors <strong>de</strong>tail<br />
• Molecular graph<br />
• Topological matrices<br />
• Local vertex invariants<br />
• Distance matrix<br />
• Strategies for molecular <strong>de</strong>scriptors<br />
o Următoarele 3 figuri<br />
• QSAR strategy<br />
o mo<strong>de</strong>ls ...<br />
regression mo<strong>de</strong>ls (quantitative response)<br />
classification mo<strong>de</strong>ls (qualitative response)<br />
ranking mo<strong>de</strong>ls (or<strong>de</strong>red response)<br />
145
• FAQ -Frequently Asked Questions<br />
• FGA - our Frequently Given Answers<br />
o The good, the bad and the ugly practices of QSAR mo<strong>de</strong>lling<br />
Introduction: The need for <strong>de</strong>veloping externally validated predictive<br />
mo<strong>de</strong>ls of biological data<br />
Why do mo<strong>de</strong>ls fail (bad practices)<br />
Predictive QSAR Mo<strong>de</strong>ling Workflow (good practices)<br />
Examples of the Workflow applications<br />
• QSAR based virtual screening and hit i<strong>de</strong>ntification<br />
• Consensus QSAR mo<strong>de</strong>ling of chemical toxicity<br />
Conclusions: “best”QSAR mo<strong>de</strong>ling is a <strong>de</strong>cision support science<br />
• focus on accurate predictions<br />
o Pharmacophore Approach in Drug Discovery<br />
146
Introduction - Non HTS Hit Recognition<br />
The SOSA Approach<br />
• Concept<br />
• Application Examples<br />
Pharmacophore-based Ligand Profiling<br />
• HT Mo<strong>de</strong>l Generation<br />
• Software Solutions<br />
• Application Examples<br />
o Classification of chemical reactions<br />
Why do we need to classify reactions?<br />
Representation of reactions<br />
RC (Reaction Classification) numbers<br />
Con<strong>de</strong>nsed Reaction Graphs (CRG)<br />
Fingerprints of enzymatic reaction features<br />
Representation of the reaction center with physicochemical parameters<br />
• Representation of reactions by physicochemical properties of the<br />
reaction center<br />
Representation of differences between the structures of products and<br />
reactants<br />
• Daylight fingerprints of reactions<br />
Reaction MOLMAPs<br />
Reaction signatures<br />
Fingerprints of reactions based on atom types<br />
o Machine learning methods in QSAR<br />
Multiple Linear Regression (MLR)<br />
Partial Least Squares (PLS)<br />
Support Vector Regression (SVR)<br />
Back-Propagation Neural Network (BPNN)<br />
K Nearest Neighbours(kNN)<br />
Decision Trees (DT)<br />
o Tutorial on application of non-linear methods in chemistry (neural networks,<br />
support vector machines)<br />
Benchmarking of Different Machine Learning Regression Methods<br />
• Machine Learning Methods<br />
• Datasets and Descriptors<br />
• Files<br />
• Step-by-Step Instructions<br />
o Initialization of the Experimenter mo<strong>de</strong><br />
o Specification of the list of databases to be processed<br />
o Specification of the list of machine learning methods<br />
o Running machine learning methods<br />
o Analysis of obtained results<br />
Descriptor Selection Bias<br />
• Datasets and Descriptors<br />
• Files<br />
• Mo<strong>de</strong>ling<br />
o Internal Cross-Validation using Preliminary Selected<br />
Descriptors<br />
o Internal cross-validation using <strong>de</strong>scriptors selected in<br />
course of mo<strong>de</strong>l building<br />
o External cross-validation<br />
147
o In silico target profiling<br />
Traditional drug discovery<br />
High-throughput screening<br />
Chemical Screening<br />
The need to go beyond traditional drug discovery<br />
Pharmacological Profiling<br />
Chemogenomic Profiling<br />
Necessary drug discovery<br />
Annotated chemical libraries: WOMBAT<br />
Chemo and Target spaces covered by WOMBAT<br />
Biologically-relevant <strong>de</strong>scriptors: SHED (Shannon Entropy Descriptors)<br />
Biologically-relevant molecular <strong>de</strong>scriptors<br />
Ligand-based approach to in silico pharmacology<br />
Validation example: nuclear receptor family<br />
Target ID case #1: Drug profiling<br />
Target ID case #2: Targeted chemical biology<br />
o Docking and post-docking strategies<br />
A few starting points<br />
Strategic importance of docking<br />
Docking Flowchart<br />
Which Compound Library?<br />
Commercially-available screening collections<br />
Library set--up<br />
Chemical Filters<br />
Pharmacokinetical filters<br />
Lead-likeness<br />
Which Ligand Conformation?<br />
Which Protein coordinates?<br />
Which Docking Tool?<br />
Docking methods<br />
Conformational sampling methods<br />
Which Scoring function?<br />
Scoring functions<br />
Scoring ΔG bind is extraordinarily difficult<br />
Predicting binding free energies<br />
Empirical scoring functions<br />
Potentials of mean force<br />
Force-fields<br />
Predicting ΔG bind is very difficult<br />
Docking Accuracy<br />
Ranking Accuracy<br />
Source of Docking Errors<br />
Pros and Cons of docking co<strong>de</strong>s<br />
Post-processing<br />
Consensus scoring<br />
Efficient Post-processing<br />
Docking + QSAR<br />
Flexible Protein - Flexible ligand docking<br />
Refining docking poses par MM-PB/SA, MM-GB/SA<br />
Use of topological scoring functions<br />
Post-processing by molecular diversity<br />
Post-processing vHTS results<br />
148
Post-processing: Visual Inspection<br />
Protein-based virtual screening: Current status<br />
o What Crystal Structure Databases Tell us about Conformational Preferences of<br />
Drug-like Molecules<br />
Conformational Energies Matter<br />
• Strained Bioactive Conformations Affect Binding Energy<br />
Required Generalizations<br />
• Statistics over Recurring Fragments<br />
Coverage of Relevant Substructures<br />
• In Crystal Structure Databases<br />
Cis or Trans? From Ami<strong>de</strong>s to Electrostatic Repulsion<br />
• Generalized Allylic Strain<br />
• The Sulfonyl Group<br />
• Properties of Aniline Derivatives<br />
• Project Example: New F.VIIaInhibitors<br />
o The Role of Cheminformatics in the Mo<strong>de</strong>rn Drug Discovery Process<br />
Data Explosion in Chemistry<br />
Cheminformatics in the Pharma Industry<br />
Drug Discovery & Development Process<br />
Typical Cheminformatics Activities at Pharmaceutical Industry<br />
• Molecular databases<br />
• Large-scale data analysis, knowledge discovery<br />
• Calculation of molecular properties / <strong>de</strong>scriptors<br />
• Estimation of ADME characteristics, toxicity alerting<br />
• Navigation in chemistry space<br />
• Virtual screening<br />
• Support for HTS - hitlist triaging<br />
• Support for combinatorial chemistry and molecule optimization<br />
Novartis Web-based Cheminformatics System<br />
• Novartis Data Warehouse - Avalon<br />
• Classification of GPCR Ligands<br />
• Novartis In Silico Profiling<br />
• 3D Hydrophobicity<br />
149
• Molecular Property Space<br />
• Structural Diversity Space<br />
The Scaffold Tree - Basic Algorithm<br />
• Scaffold Tree Example for HTS results<br />
Virtual Screening<br />
• Virtual Screening Workflow<br />
• Learning from the Nature<br />
High-Throughput Screening - HTS<br />
Combinatorial Chemistry Molecule Design<br />
• Early CombiChem<br />
• Database of Organic Substituents<br />
Bioisosteric Design<br />
• Substituent Bioisosteric Design<br />
• Cheminformatics - Future Trends<br />
2008A6. Planificarea activităţilor experimentale; <strong>de</strong>rularea experimentelor <strong>de</strong>monstrative (<strong>de</strong><br />
testare a meto<strong>de</strong>lor <strong>de</strong> analiză)<br />
În această fază s-au testat meto<strong>de</strong>le <strong>de</strong> predicţie bazată pe regresie şi calcul al intervalului <strong>de</strong><br />
încre<strong>de</strong>re al estimatei pentru ca în final să se planifice activităţile experimentale. O serie <strong>de</strong> studii<br />
anterioare (Diu<strong>de</strong>a & others, 2001-MT; Jäntschi & Ungureşan, 2001-SCA; Jäntschi & Ungureşan,<br />
2001-MKD; Jäntschi & others, 2006-GPAP; Jäntschi, 2007-CCPN; Jäntschi & others, 2007-CCPN;<br />
Jäntschi & Bolboacă, 2008-EEVC) au reprezentat suportul cercetării, finalizate prin publicarea unui<br />
nou rezultat (Jäntschi & others, 2008-FVCT).<br />
Testarea meto<strong>de</strong>i <strong>de</strong> predicţie bazată pe regresie (metoda leave-one-out):<br />
Metoda constă în următoarele etape:<br />
÷ <strong>de</strong>terminarea valorilor estimate (YY) pe baza ecuaţiei mo<strong>de</strong>lului <strong>de</strong> regresie lineară: Y=aX+b<br />
÷ eliminarea pe rând a câte unei valori din mulţimea valorilor observate şi reconstructţia<br />
mo<strong>de</strong>lului <strong>de</strong> regresie;<br />
÷ calcularea valorii prezise pentru compusul elininat pentru valorilor prezise pe baza ecuaţiei<br />
noului mo<strong>de</strong>l <strong>de</strong> regresie lineară<br />
÷ coeficienţii (ai) şi (bi), 1 ≤ i ≤ n, n = numărul <strong>de</strong> valori observate (măsurate) sunt obţinuţi prin<br />
minimizarea sumei pătratelor distanţelor între valorile observate şi cele estimate:<br />
Rezultate obţinute:<br />
n<br />
∑<br />
j=<br />
1<br />
j≠i<br />
2<br />
( ) min<br />
YYi = aiXi+bi, (ai, bi) din Y − a X − b = , i = 1..n<br />
Mol ISDmsHt lADrtHg Y YY YYY<br />
PCB001 151.28 -2.4129 0.0997 0.108431 0.108812<br />
PCB002 150.54 -2.4752 0.1544 0.154384 0.154383<br />
PCB003 150.89 -2.4799 0.1937 0.167591 0.166551<br />
PCB004 147.93 -2.5878 0.2245 0.206896 0.206397<br />
PCB005 148.27 -2.6449 0.2785 0.273453 0.273315<br />
PCB006 146.92 -2.661 0.2709 0.257517 0.257212<br />
PCB007 147.28 -2.6499 0.2566 0.254805 0.254763<br />
PCB008 147.4 -2.6659 0.2783 0.274048 0.27395<br />
PCB009 146.92 -2.6638 0.257 0.26038 0.260456<br />
PCB010 147.93 -2.5976 0.2243 0.216919 0.216717<br />
PCB011 146.28 -2.7289 0.3238 0.311597 0.311365<br />
PCB012 147.99 -2.7018 0.3298 0.324924 0.324777<br />
j<br />
150<br />
i<br />
j<br />
i
PCB013 146.55 -2.7348 0.3315 0.324111 0.323962<br />
PCB014 146.17 -2.7028 0.2373 0.282264 0.28317<br />
PCB015 146.95 -2.7398 0.3387 0.338825 0.338828<br />
PCB016 144.84 -2.809 0.3625 0.358953 0.358902<br />
PCB017 143.95 -2.8148 0.3398 0.343524 0.343579<br />
PCB018 143.92 -2.8046 0.3378 0.332372 0.332284<br />
PCB019 144.45 -2.7588 0.3045 0.298253 0.298128<br />
PCB020 143.94 -2.8881 0.417 0.418247 0.418263<br />
PCB021 145.59 -2.8521 0.4135 0.421032 0.42121<br />
PCB022 144.33 -2.8943 0.4267 0.433949 0.434063<br />
PCB023 144.26 -2.8423 0.377 0.379088 0.379115<br />
PCB024 144.98 -2.7928 0.3508 0.345746 0.345669<br />
PCB025 142.85 -2.8941 0.3937 0.398222 0.398271<br />
PCB026 143.03 -2.8787 0.3911 0.386793 0.386743<br />
PCB027 143.2 -2.8355 0.3521 0.346692 0.346606<br />
PCB028 143.38 -2.8993 0.4031 0.416261 0.416403<br />
PCB029 144.72 -2.843 0.382 0.390845 0.390974<br />
PCB030 143.55 -2.8075 0.3165 0.326457 0.326639<br />
PCB031 143.43 -2.8846 0.4094 0.402427 0.40235<br />
PCB032 143.81 -2.8378 0.3636 0.363685 0.363687<br />
PCB033 144.41 -2.8783 0.4163 0.419506 0.419553<br />
PCB034 142.48 -2.8821 0.3782 0.377069 0.377054<br />
PCB035 143.67 -2.9513 0.4738 0.476401 0.476445<br />
PCB036 141.95 -2.9517 0.4375 0.435528 0.435511<br />
PCB037 143.98 -2.9575 0.4858 0.490183 0.490277<br />
PCB038 144.95 -2.9018 0.5102 0.4565 0.455205<br />
PCB039 142.13 -2.9587 0.4488 0.447007 0.446992<br />
PCB040 141.79 -3.0255 0.5102 0.507163 0.507135<br />
PCB041 142.2 -3.0078 0.499 0.498902 0.498901<br />
PCB042 140.81 -3.0324 0.487 0.490699 0.490723<br />
PCB043 140.74 -3.0015 0.4587 0.457417 0.457406<br />
PCB044 140.86 -3.0208 0.4832 0.480035 0.480013<br />
PCB045 141.71 -2.9477 0.4334 0.425677 0.425602<br />
PCB046 141.3 -2.9745 0.445 0.443245 0.443229<br />
PCB047 139.96 -3.0381 0.4639 0.476127 0.476233<br />
PCB048 141.3 -3.0027 0.4651 0.472085 0.472136<br />
PCB049 139.89 -3.0274 0.461 0.463504 0.46353<br />
PCB050 140.38 -2.9636 0.4007 0.410016 0.41018<br />
PCB051 140.51 -2.9777 0.4242 0.427557 0.427602<br />
PCB052 139.93 -3.0156 0.4557 0.452396 0.452356<br />
PCB053 140.35 -2.967 0.4187 0.412774 0.412672<br />
PCB054 141.12 -2.9114 0.38 0.374393 0.374275<br />
PCB055 141.2 -3.0914 0.5562 0.560398 0.560449<br />
PCB056 141.37 -3.1016 0.5676 0.57491 0.575025<br />
PCB057 139.95 -3.08 0.5515 0.518738 0.518549<br />
PCB058 139.53 -3.1049 0.5267 0.534122 0.534163<br />
PCB059 140.56 -3.0287 0.486 0.480914 0.480878<br />
PCB060 141.2 -3.0914 0.5676 0.560398 0.560311<br />
PCB061 142.89 -3.0272 0.5331 0.535303 0.535349<br />
PCB062 142.2 -2.9831 0.4685 0.473641 0.473687<br />
151
PCB063 140.25 -3.0872 0.529 0.533302 0.533328<br />
PCB064 141.08 -3.032 0.4999 0.49677 0.496749<br />
PCB065 142.2 -2.9716 0.4671 0.46188 0.461836<br />
PCB066 140.33 -3.1075 0.5447 0.555983 0.556066<br />
PCB067 140.32 -3.0814 0.5214 0.52905 0.529096<br />
PCB068 138.35 -3.1119 0.504 0.51296 0.513051<br />
PCB069 139.06 -3.0453 0.451 0.461889 0.462054<br />
PCB070 140.46 -3.0913 0.5407 0.542535 0.542548<br />
PCB071 140.74 -3.0447 0.4989 0.501598 0.501615<br />
PCB072 138.61 -3.0945 0.4984 0.501405 0.501437<br />
PCB073 138.69 -3.0486 0.4554 0.456383 0.456402<br />
PCB074 140.76 -3.0875 0.5341 0.545849 0.545945<br />
PCB075 139.7 -3.0475 0.4643 0.4795 0.479638<br />
PCB076 141.3 -3.073 0.5408 0.543981 0.544014<br />
PCB077 141.04 -3.1696 0.6295 0.636533 0.636727<br />
PCB078 140.67 -3.1465 0.6024 0.604028 0.604054<br />
PCB079 139.28 -3.1702 0.5894 0.594904 0.594942<br />
PCB080 137.65 -3.1697 0.5464 0.555271 0.55534<br />
PCB081 140.89 -3.1536 0.6149 0.61657 0.616604<br />
PCB082 139.09 -3.2205 0.6453 0.641786 0.641744<br />
PCB083 137.72 -3.2131 0.6029 0.601336 0.601328<br />
PCB084 138.58 -3.158 0.5744 0.565626 0.565582<br />
PCB085 138.15 -3.2273 0.6224 0.626179 0.626201<br />
PCB086 139.42 -3.179 0.6105 0.607264 0.607236<br />
PCB087 138.16 -3.2153 0.6175 0.614147 0.614129<br />
PCB088 138.96 -3.1307 0.5486 0.546827 0.546818<br />
PCB089 138.7 -3.1661 0.5779 0.57679 0.576785<br />
PCB090 136.66 -3.2207 0.5814 0.583667 0.583687<br />
PCB091 137.71 -3.1622 0.5549 0.549041 0.548992<br />
PCB092 136.78 -3.2077 0.5742 0.573252 0.573243<br />
PCB093 138.85 -3.1224 0.5437 0.535699 0.53565<br />
PCB094 137.12 -3.1594 0.5331 0.532016 0.532001<br />
PCB095 137.63 -3.1503 0.5464 0.53495 0.53483<br />
PCB096 138.3 -3.0959 0.5057 0.495397 0.495259<br />
PCB097 138.19 -3.2151 0.61 0.614662 0.614687<br />
PCB098 137.18 -3.1758 0.5415 0.550229 0.550321<br />
PCB099 137.26 -3.2215 0.588 0.598886 0.598946<br />
PCB100 136.43 -3.1787 0.5212 0.535194 0.535458<br />
PCB101 137.26 -3.2094 0.5816 0.586511 0.586542<br />
PCB102 137.78 -3.1579 0.5431 0.546323 0.54635<br />
PCB103 136.24 -3.1675 0.5142 0.519179 0.519303<br />
PCB104 137.08 -3.1084 0.4757 0.478899 0.478988<br />
PCB105 138.61 -3.301 0.7049 0.712592 0.712776<br />
PCB106 138.53 -3.2612 0.668 0.669969 0.669995<br />
PCB107 137.32 -3.289 0.6628 0.669358 0.669406<br />
PCB108 136.74 -3.3048 0.6626 0.671596 0.671651<br />
PCB109 137.73 -3.2154 0.6016 0.603928 0.603939<br />
PCB110 138.04 -3.2333 0.6314 0.629675 0.629665<br />
PCB111 135.57 -3.2916 0.6183 0.630015 0.630114<br />
PCB112 137.81 -3.2023 0.5986 0.592451 0.592421<br />
152
PCB113 136.08 -3.2367 0.5862 0.58611 0.586109<br />
PCB114 138.87 -3.2683 0.6828 0.68539 0.68544<br />
PCB115 138.28 -3.2186 0.6171 0.620402 0.620421<br />
PCB116 140.69 -3.1448 0.6132 0.60277 0.602604<br />
PCB117 138.24 -3.2065 0.615 0.607067 0.607026<br />
PCB118 137.73 -3.29 0.6693 0.680221 0.680334<br />
PCB119 136.58 -3.2505 0.5968 0.612223 0.612321<br />
PCB120 135.85 -3.2936 0.6256 0.638781 0.638869<br />
PCB121 134.49 -3.255 0.5518 0.566663 0.567115<br />
PCB122 138.29 -3.2921 0.6871 0.69581 0.695956<br />
PCB123 137.16 -3.2988 0.6658 0.67554 0.675613<br />
PCB124 137.38 -3.2808 0.6584 0.662412 0.66244<br />
PCB125 137.56 -3.2324 0.6142 0.617234 0.617249<br />
PCB126 137.98 -3.3609 0.7512 0.758731 0.758968<br />
PCB127 136.31 -3.3607 0.7078 0.718444 0.718545<br />
PCB128 136.38 -3.4116 0.7761 0.77218 0.772101<br />
PCB129 136.34 -3.387 0.7501 0.746061 0.746005<br />
PCB130 134.97 -3.4039 0.7184 0.730463 0.730554<br />
PCB131 135.78 -3.3375 0.6853 0.681997 0.681978<br />
PCB132 135.93 -3.3453 0.7035 0.693574 0.693512<br />
PCB133 133.67 -3.3952 0.6871 0.690364 0.690401<br />
PCB134 135.77 -3.3282 0.6796 0.672246 0.672204<br />
PCB135 134.43 -3.3376 0.6563 0.649698 0.649618<br />
PCB136 135.51 -3.2748 0.6257 0.611394 0.611236<br />
PCB137 135.48 -3.4055 0.7329 0.74434 0.744453<br />
PCB138 135.48 -3.4055 0.7403 0.74434 0.74438<br />
PCB139 134.95 -3.3413 0.6707 0.665962 0.665925<br />
PCB140 134.57 -3.3634 0.6707 0.679443 0.679516<br />
PCB141 135.4 -3.3811 0.72 0.717466 0.717448<br />
PCB142 137.38 -3.2892 0.6848 0.671003 0.670897<br />
PCB143 135.84 -3.3307 0.6789 0.676483 0.676469<br />
PCB144 134.83 -3.3291 0.6563 0.650605 0.65055<br />
PCB145 135.58 -3.2721 0.6149 0.610312 0.610263<br />
PCB146 134.06 -3.3977 0.6955 0.702281 0.70234<br />
PCB147 134.81 -3.3329 0.6608 0.654011 0.653947<br />
PCB148 132.95 -3.3566 0.6243 0.633607 0.633874<br />
PCB149 135 -3.3367 0.6672 0.662458 0.66242<br />
PCB150 134.21 -3.2887 0.5969 0.594407 0.594344<br />
PCB151 134.81 -3.3196 0.6499 0.64041 0.640304<br />
PCB152 135.38 -3.263 0.6062 0.596206 0.596062<br />
PCB153 134.57 -3.399 0.7036 0.715851 0.715939<br />
PCB154 133.65 -3.3544 0.6349 0.648158 0.648398<br />
PCB155 133.03 -3.3014 0.5666 0.579074 0.579654<br />
PCB156 135.88 -3.4662 0.8105 0.816018 0.816172<br />
PCB157 135.48 -3.4879 0.8184 0.82861 0.828896<br />
PCB158 135.19 -3.4161 0.7429 0.74822 0.748271<br />
PCB159 134.09 -3.4692 0.7655 0.776124 0.77623<br />
PCB160 136.25 -3.3722 0.7396 0.728765 0.72865<br />
PCB161 133.2 -3.42 0.6968 0.704446 0.704542<br />
PCB162 134.27 -3.4743 0.7737 0.78566 0.785797<br />
153
PCB163 135.23 -3.4027 0.7396 0.735476 0.735442<br />
PCB164 134.89 -3.4161 0.7399 0.74102 0.741029<br />
PCB165 133.36 -3.4053 0.692 0.693253 0.693269<br />
PCB166 136.72 -3.3762 0.7572 0.744137 0.743928<br />
PCB167 134.6 -3.4758 0.7814 0.795115 0.795307<br />
PCB168 133.35 -3.4347 0.7068 0.72308 0.723245<br />
PCB169 134.95 -3.5475 0.8625 0.876843 0.877402<br />
PCB170 133.57 -3.5738 0.874 0.870618 0.870535<br />
PCB171 133.12 -3.5207 0.8089 0.805512 0.805473<br />
PCB172 132.24 -3.565 0.8278 0.829696 0.829721<br />
PCB173 134.24 -3.4918 0.8152 0.802837 0.802667<br />
PCB174 133.1 -3.5046 0.7965 0.788566 0.788485<br />
PCB175 131.58 -3.513 0.7611 0.760675 0.760668<br />
PCB176 132.74 -3.4468 0.7305 0.720814 0.720684<br />
PCB177 133.06 -3.5114 0.8031 0.794561 0.79447<br />
PCB178 131.64 -3.5024 0.7537 0.751275 0.751234<br />
PCB179 132.62 -3.4369 0.7205 0.707809 0.707608<br />
PCB180 132.66 -3.567 0.8362 0.841822 0.841904<br />
PCB181 133.32 -3.496 0.7968 0.785051 0.784934<br />
PCB182 131.66 -3.5238 0.7653 0.77364 0.77376<br />
PCB183 132.19 -3.5115 0.772 0.773782 0.773803<br />
PCB184 131.49 -3.4607 0.7016 0.705028 0.705119<br />
PCB185 133.28 -3.4826 0.7848 0.770387 0.770252<br />
PCB186 133.94 -3.424 0.7416 0.726298 0.726173<br />
PCB187 132.13 -3.502 0.7654 0.762626 0.76259<br />
PCB188 131.25 -3.4517 0.692 0.690063 0.689999<br />
PCB189 132.78 -3.6479 0.9142 0.927439 0.927898<br />
PCB190 133.66 -3.5688 0.874 0.867664 0.867511<br />
PCB191 132 -3.5952 0.8447 0.854821 0.854973<br />
PCB192 131.75 -3.5718 0.8269 0.82489 0.824864<br />
PCB193 132.12 -3.5803 0.8397 0.842463 0.842502<br />
PCB194 130.8 -3.7308 0.962 0.964698 0.964782<br />
PCB195 131.52 -3.6711 0.9321 0.920924 0.920651<br />
PCB196 130.24 -3.6759 0.8938 0.895111 0.895135<br />
PCB197 129.97 -3.6147 0.8293 0.826041 0.825977<br />
PCB198 130.07 -3.6621 0.8845 0.876917 0.876784<br />
PCB199 131.14 -3.594 0.8494 0.832953 0.832718<br />
PCB200 129.81 -3.6048 0.8197 0.812076 0.811905<br />
PCB201 130.07 -3.6621 0.8875 0.876917 0.876731<br />
PCB202 129.77 -3.5937 0.8089 0.799764 0.79954<br />
PCB203 130.59 -3.661 0.8938 0.888273 0.888176<br />
PCB204 129.8 -3.6087 0.8217 0.815825 0.815695<br />
PCB205 130.5 -3.743 0.9678 0.969974 0.970041<br />
PCB206 128.67 -3.8212 1.0103 1.006027 1.005892<br />
PCB207 128.32 -3.7579 0.9423 0.93289 0.932664<br />
PCB208 128.24 -3.747 0.932 0.919822 0.919526<br />
PCB209 126.7 -3.8963 1.0496 1.035549 1.035067<br />
Din analiza regresiei se poate observa că valorile prezise aproximează foarte bine valorile observate<br />
aşa incât mo<strong>de</strong>lul studiat e stabil.<br />
ANOVA df SS MS F Significance F<br />
154
Regression 1 6.730776811 6.730777 71183.87637 1.2444E-264<br />
Residual 207 0.019572842 9.46E-05<br />
Total 208 6.750349654<br />
Coefficients Standard Error t Stat P-value Lower 95%<br />
Intercept 0.001676011 0.002337583 0.716985 0.474191692 -0.002932507<br />
Y 0.997196853 0.003737576 266.8031 1.2444E-264 0.989828262<br />
Testarea meto<strong>de</strong>i <strong>de</strong> calcul a intervalului <strong>de</strong> încre<strong>de</strong>re (confi<strong>de</strong>nţă) pentru variabile distribuite binomial<br />
Definiţie: un şir estimat <strong>de</strong> valori care cu o anumită probabilitate (e.g. 95%, 99%, 99.9%) includ un<br />
parametru necunoscut al populaţiei, intervalul estimat fiind calculat pe un anumit set <strong>de</strong> date. Dacă<br />
din populaţie se extrag în mod repetat, eşantioane in<strong>de</strong>pen<strong>de</strong>nte şi se calculează câte un interval <strong>de</strong><br />
confi<strong>de</strong>nţă pentru fiecare eşantion, atunci un anumit procent al intervalelor va conţine parametrul<br />
necunoscut al populaţiei. Cel mai frenvent intervalele <strong>de</strong> confi<strong>de</strong>nţă sunt calculate pentru un procent<br />
<strong>de</strong> 95%. Generic acest procent se notează cu α şi se mai numeşte şi prag <strong>de</strong> semnificaţie.<br />
Variabilele cantitative şi calitative care rezultă din observaţii urmează anumite distribuţii teoretice.<br />
Varibilele continue urmează <strong>de</strong> regulă, distribuţia normală (Laplace-Gauss) în timp ce varibilelele<br />
discrete urmează distribuţia binomială.<br />
Distribuţia normală a fost introdusă <strong>de</strong> De Moivre în contextul aproximării unei distribuţii<br />
binomiale cu un n (volum al eşantionului) mare. Mai târziu rezultatele au fost extinse <strong>de</strong> Laplace în<br />
teorema care acum este cunoscută sub numele <strong>de</strong> Teorema lui De Moivre-Laplace.<br />
Estimarea intervalelor <strong>de</strong> confi<strong>de</strong>nţă pentru proporţii utilizând o distribuţie normală a fost şi este şi<br />
astăzi frecvent utilizată în simulare, datorită faptului că, în practică era mai uşor <strong>de</strong> aplicat<br />
distribuţia normală <strong>de</strong>cât cea binomială <strong>de</strong> exemplu (calcul mai puţin laborios).<br />
Dacă pe un eşantion <strong>de</strong> talie n consi<strong>de</strong>răm variabila X ce urmează o distribuţie binomialǎ atunci<br />
probabilitatea <strong>de</strong> a obţine valoarea Y(0 ≤ Y ≤ n) este dată <strong>de</strong> formula:<br />
Y<br />
n−<br />
Y<br />
n!<br />
X<br />
( )<br />
( n − X)<br />
PB<br />
n,<br />
X,<br />
Y = ⋅<br />
n<br />
Y!<br />
( n − Y)<br />
! n<br />
Media, respectiv variaţia distributiei binomiale sunt:<br />
M n,X = X<br />
( )<br />
( )<br />
X⋅ n−X Var ( n, X)<br />
=<br />
n<br />
Probabilitatea <strong>de</strong> a obţine variabila normală Y care are media M(n, X) şi variaţia Var(n,X) este dată<br />
<strong>de</strong> formula:<br />
( Y−M<br />
( n,<br />
X)<br />
)<br />
2Var(<br />
n,<br />
X)<br />
1<br />
−<br />
PN<br />
( n,<br />
X,<br />
Y)<br />
=<br />
⋅e<br />
2πVar(<br />
n,<br />
X)<br />
Întrucât noua variabilă normala <strong>de</strong>pin<strong>de</strong> doar <strong>de</strong> medie şi dispersie, înlocuind media şi dispersia din<br />
formula distribuţiei binomiale se obţine următoarea formulă:<br />
( n,<br />
X,<br />
Y)<br />
2 ( Y − X)<br />
X(<br />
n − X)<br />
−<br />
2<br />
2 ( Y−X<br />
)<br />
X(<br />
n−X<br />
) n<br />
PN<br />
=<br />
⋅e<br />
2 n<br />
Eroarea <strong>de</strong> aproximare a distribuţiei binomiale a variabilei Y printr-o distribuţie normală este dată<br />
astfel <strong>de</strong> formula:<br />
Err( n,<br />
X,<br />
Y)<br />
= PB<br />
( n,<br />
X,<br />
Y)<br />
− PN<br />
( n,<br />
X,<br />
Y)<br />
Având în ve<strong>de</strong>re că probabilitatea lui Y <strong>de</strong>screşte odată cu creşterea dispersiei lui X, funcţia <strong>de</strong><br />
eroare poate fi discretizată prin:<br />
⎧ PB<br />
( n,<br />
X,<br />
Y)<br />
− PN<br />
( n,<br />
X,<br />
Y)<br />
, PB<br />
( n,<br />
X,<br />
Y)<br />
> 1 n<br />
Errc<br />
( n,<br />
X,<br />
Y)<br />
= ⎨<br />
⎩0<br />
, PB<br />
( n,<br />
X,<br />
Y)<br />
< 1 n<br />
O serie <strong>de</strong> meto<strong>de</strong> au fost propuse pentru evaluarea intervalelor <strong>de</strong> confi<strong>de</strong>nţă [Sorana Daniela<br />
BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>. Binomial Distribution Sample Confi<strong>de</strong>nce Intervals Estimation<br />
155<br />
2
for Positive and Negative Likelihood Ratio Medical Key Parameters. Annual Symposium on<br />
Biomedical and Health Informatics, American Informatics Medical Association, Bethseda, Special<br />
Issue: from Foundations to Applications to Policy (Proc. CD, October 22-26, Washington D.C.,<br />
USA), 2005:66-70, && Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>. Optimized Confi<strong>de</strong>nce<br />
Intervals for Binomial Distributed Samples. International Journal of Pure and Applied Mathematics<br />
2007;40(3)]:<br />
Metoda Formula<br />
AvgOEA<br />
∑ − n A M<br />
εX<br />
, n<br />
100 α −<br />
X=<br />
An<br />
+ 1−<br />
2A<br />
( )<br />
∑ −<br />
StDOEA n A M<br />
2<br />
εX<br />
, n − AvgOEA<br />
X=<br />
A n − 2A<br />
( )<br />
∑ −<br />
SiDOEA<br />
n A M<br />
2<br />
εX,<br />
n −100α<br />
X=<br />
A n + 1−<br />
2A<br />
AvADAA n<br />
M<br />
A ε − AvgOEA<br />
AvADSA<br />
S8DOEA<br />
∑ −<br />
X=<br />
A<br />
8<br />
∑ − n A<br />
X=<br />
A<br />
n A<br />
∑<br />
X A<br />
−<br />
=<br />
X,<br />
n<br />
ε<br />
n − 2A<br />
M<br />
X,<br />
n<br />
−100α<br />
n + 1−<br />
2A<br />
M ( ε −100α)<br />
n + 1−<br />
2A<br />
un<strong>de</strong>:<br />
n = talia eşantionului;<br />
M = metoda utilizatǎ pentru calculul intervalului <strong>de</strong> confi<strong>de</strong>nţă;<br />
ε M = eroarea experimentalǎ obţinutǎ în urma aplicǎrii meto<strong>de</strong>i investigate;<br />
α = pragul <strong>de</strong> semnificaţie impus (α = 5%);<br />
A = variabila binarǎ (cu valorile 0 sau 1);<br />
Eroarea experimentalǎ pentru distribuţia binomialǎ corespunzǎtoare unui eşantion <strong>de</strong> volum<br />
n este datǎ <strong>de</strong> formula:<br />
∑dBin(<br />
n,<br />
X,<br />
Y)<br />
+ ∑dBin(<br />
n,<br />
X,<br />
Y)<br />
M<br />
M<br />
CIL<br />
( n,<br />
X,<br />
Y)<br />
> X<br />
CIL<br />
( n,<br />
X,<br />
Y)<br />
> X<br />
Err(<br />
n,<br />
X,<br />
Y)<br />
= n−1<br />
dBin n,<br />
X,<br />
Y<br />
∑<br />
Y=<br />
1<br />
X,<br />
n<br />
8<br />
( )<br />
M<br />
un<strong>de</strong> dBin(X,Y) este probabilitatea distribuţiei binomiale, CI este limita inferioarǎ a intervalului<br />
M<br />
<strong>de</strong> încre<strong>de</strong>re <strong>de</strong>termiat prin metoda M, iar CIU<br />
este limita inferioarǎ a intervalului <strong>de</strong> încre<strong>de</strong>re<br />
<strong>de</strong>termiat prin metoda M.<br />
În <strong>de</strong>terminarea intervalului <strong>de</strong> confi<strong>de</strong>nţǎ s-a generat un eşantion cu distribuţie binomialǎ. În acest<br />
sens s-au implementat în PHP funcţii care genereazǎ coeficientul binomial şi distribuţia <strong>de</strong><br />
probabilitate. Totodatǎ s-au evaluat şi timpii <strong>de</strong> execuţie necesari pentru calculul eşantionului ce<br />
urmeazǎ o distribuiţie binomialǎ observându-se cǎ optimizarea parametrului X/n în loc <strong>de</strong> X şi a lui<br />
(n-X)/n în loc <strong>de</strong> (n-X) duce la creşterea performanţei.<br />
Întervalul <strong>de</strong> confi<strong>de</strong>nţă în cazul distribuţiei binomiale pentru o singură variabilă este dat <strong>de</strong> formula<br />
CII ( X)<br />
= ( CIL(<br />
X)<br />
, CIU<br />
( X)<br />
) , un<strong>de</strong> CIL(X) şi CIU(X) sunt limita inferioară, respective superioară a<br />
intervalului <strong>de</strong> confi<strong>de</strong>nţă. Au fost calculate şi evaluate o serie <strong>de</strong> meto<strong>de</strong> diferite utilizate şi<br />
raportate în literatura <strong>de</strong> specialitate pentru calcularea intervalului <strong>de</strong> confi<strong>de</strong>nţă.<br />
Următorul tabel conţine meto<strong>de</strong>le supuse evaluării:<br />
156<br />
L
Metoda Formula intervalului <strong>de</strong> încre<strong>de</strong>re<br />
0 . 5<br />
X ± z(<br />
X(<br />
n − X n)<br />
) + c ,<br />
Wald un<strong>de</strong> c=0(corectia standard);<br />
c=0.5 (corectia la continuitate)<br />
2<br />
X + z<br />
n ⋅<br />
2<br />
1 2<br />
2 ± z(<br />
z 4 + X(<br />
1−<br />
X n)<br />
)<br />
2<br />
n + z<br />
Wilson<br />
Corecţia la continuitate:<br />
2<br />
2<br />
X + z 2 − z(<br />
( z −1<br />
n ) 4 + X(<br />
1−<br />
( X −1)<br />
n)<br />
+ 1 2<br />
n ⋅<br />
2<br />
n + z<br />
2<br />
2<br />
X + z 2 + z(<br />
( z −1<br />
n ) 4 + X(<br />
1−<br />
( X −1)<br />
n)<br />
+ 1 2<br />
n ⋅<br />
2<br />
n + z<br />
sin ( arcsin X n z 2 n )<br />
2<br />
± sau 0 (X=0) sau 1 (X=1)<br />
Corecţia la continuitate:<br />
sin ( arcsin ( X 0.<br />
5)<br />
( n 3 4)<br />
z 2 n )<br />
2<br />
ArcSin<br />
± + ±<br />
sin arcsin X 0.<br />
5 n z 2 n<br />
2<br />
± ±<br />
sin 2<br />
( )<br />
( )<br />
( ( ) )<br />
( X + 3 8 ± 0.<br />
5)<br />
n + 3 4 ± z 2<br />
( arcsin<br />
n + 0.<br />
5)<br />
1 2<br />
1 2<br />
2<br />
2<br />
2<br />
2<br />
( X + z 2)<br />
( n + z − ( n ⋅ X + z 2)<br />
)( n + z )<br />
Agresti-<br />
Coull<br />
2<br />
X + z<br />
n ⋅<br />
2 ± z<br />
2<br />
n + z<br />
1 2<br />
Logit<br />
−1<br />
⎡<br />
1 2<br />
⎛<br />
⎞ ⎤<br />
⎢ ⎜ X ⎛<br />
⎞<br />
⎜ ⎛ n ⎞<br />
n ⋅ 1−<br />
1+<br />
exp ± z⎜<br />
⎟ ⎟⎟<br />
⎥ pentru 0
1.2<br />
1<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
1.2<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
Metoda Wald<br />
0<br />
0 1 2 3 4 5 6 7 8 9 10<br />
1<br />
Metoda Wald_C<br />
0<br />
0 1 2 3 4 5 6 7 8 9 10<br />
1.2<br />
1<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
Metoda Wilson<br />
0<br />
0 1 2 3 4 5 6 7 8 9 10<br />
1.2<br />
1<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
Metoda Wilson_C<br />
0<br />
0 1 2 3 4 5 6 7 8 9 10<br />
158<br />
Limita inferioara<br />
Limita superioara<br />
Limita inferioara<br />
Limita superioara<br />
Limita inferioara<br />
Limita superioara<br />
Limita inferioara<br />
Limita superioara
1.2<br />
1<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
Metoda ArcS<br />
0<br />
0 1 2 3 4 5 6 7 8 9 10<br />
1.2<br />
1<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
Metoda ArcS1<br />
0<br />
0 1 2 3 4 5 6 7 8 9 10<br />
1.2<br />
1<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
Metoda ArcS2<br />
0<br />
0 1 2 3 4 5 6 7 8 9 10<br />
1.2<br />
1<br />
0.8<br />
0.6<br />
0.4<br />
0.2<br />
Metoda ArcS3<br />
0<br />
0 1 2 3 4 5 6 7 8 9 10<br />
159<br />
Limita inferioara<br />
Limita superioara<br />
Limita inferioara<br />
Limita superioara<br />
Limita inferioara<br />
Limita superioara<br />
Limita inferioara<br />
Limita superioara
Pentru eşantione a cǎror mǎrime este <strong>de</strong> la 7 la 1000, s-au aplicat 12 meto<strong>de</strong> <strong>de</strong> evaluare a<br />
intervalului <strong>de</strong> încre<strong>de</strong>re.<br />
Tabelul <strong>de</strong> mai jos redǎ meto<strong>de</strong>le folosite pentru <strong>de</strong>terminarea intervalului <strong>de</strong> încre<strong>de</strong>re şi notaţiile<br />
folosite:<br />
Metodă Notaţie<br />
Wald Wald<br />
Wald cc (corectat la continuitate) WaldC<br />
Agresti-Coull AC<br />
Agresti-coull cc ACC1<br />
Agresti-Coull cc ACC2<br />
Wilson Wilson<br />
Wilson cc WilsonC<br />
ArcSine ArcS<br />
ArcSine cc ArcSc1<br />
Arcsine cc ArcSc2<br />
Arcsine cc ArcSc3<br />
Logit Logit<br />
Logit cc LogitC<br />
Bayes (Fisher) BetaC11<br />
Cloppper-Pearson BetaC01<br />
Jeffreys BetaCJ0<br />
Beta cc Beta C00<br />
Beta cc Beta C10<br />
Beta cc Beta CJ1<br />
Beta cc Beta CJ2<br />
OptB Optimized<br />
Tabelul <strong>de</strong> mai jos conţine rezultatele evaluării meto<strong>de</strong>lor <strong>de</strong> calcul al intervalului <strong>de</strong> încre<strong>de</strong>re,<br />
valori ce au fost calculate pentru n = 20:<br />
Metoda AvgOE(0) AvgOE(1) StDOE(0) StDOE(1) SiDOE(0) SiDOE(1)<br />
Wald 11.96 10.82 9.35 9.57 11.46 11.01<br />
Wald_C 9.04 8.18 9.82 9.7 10.38 9.99<br />
AC 3.4 3.07 1.01 1.4 1.87 2.36<br />
ACC1 4.04 3.66 1.69 2.01 1.9 2.38<br />
ACC2 4.42 4 1.66 2.06 1.72 2.24<br />
Wilson 4.25 3.84 1.66 2.03 1.78 2.29<br />
Wilson_C 2.42 2.19 1.11 1.28 2.79 3.07<br />
ArcS 10.07 9.11 10.07 10.02 11.03 10.61<br />
ArcSc1 3.7 3.35 1.49 1.8 1.94 2.4<br />
ArcSc2 2.87 2.59 1.37 1.56 2.51 2.84<br />
ArcSc3 2.6 2.35 1.23 1.4 2.68 2.98<br />
Logit 3.81 3.44 1.21 1.62 1.67 2.22<br />
Logit_C 4.5 4.07 1.52 1.98 1.56 2.14<br />
BetaC00 5.02 4.54 2.65 2.94 2.58 2.9<br />
BetaC10 9.66 8.74 2.45 3.72 5.23 5.21<br />
BetaC01 3.17 2.87 1.43 1.66 2.29 2.67<br />
BetaC11 4.66 4.21 1.57 2.05 1.57 2.14<br />
BetaCJ0 4.66 4.22 1.49 1.99 1.49 2.09<br />
BetaCJ1 4.32 3.91 1.41 1.87 1.53 2.12<br />
BetaCJ2 4.95 4.48 1.38 1.98 1.34 2<br />
BetaCJA 4.32 3.91 1.41 1.87 1.53 2.12<br />
OptB 4.95 4.48 1.38 1.98 1.34 2<br />
160
Metoda AvADA(0) AvADA(1) AvADS(0) AvADS(1) S8DOE(0) S8DOE(1)<br />
Wald 6.83 6.83 7.05 6.86 23.47 23.18<br />
Wald_C 6.71 6.38 4.97 4.97 23.3 23.01<br />
AC 0.93 1.21 1.59 1.92 2.66 3.75<br />
ACC1 1.32 1.65 1.52 1.85 3.03 3.8<br />
ACC2 1.33 1.58 1.47 1.81 2.56 3.74<br />
Wilson 1.27 1.53 1.6 1.92 2.3 3.73<br />
Wilson_C 1 1.11 2.57 2.8 3.35 3.88<br />
ArcS 6.8 6.7 5.61 5.55 24.47 24.17<br />
ArcSc1 1.16 1.5 1.57 1.89 3.03 3.8<br />
ArcSc2 1.21 1.39 2.12 2.4 3.67 4.01<br />
ArcSc3 1.12 1.26 2.39 2.64 3.5 3.93<br />
Logit 0.95 1.31 1.41 1.75 2.61 3.75<br />
Logit_C 1.16 1.4 1.39 1.73 2.1 3.73<br />
BetaC00 2.21 2.47 2.09 2.37 3.93 4.15<br />
BetaC10 1.95 2.95 4.8 4.82 6.43 6.36<br />
BetaC01 1.19 1.4 2.04 2.32 3.06 3.8<br />
BetaC11 1.36 1.55 1.42 1.76 2.09 3.73<br />
BetaCJ0 1.24 1.52 1.23 1.58 2.58 3.74<br />
BetaCJ1 1.09 1.43 1.27 1.62 2.58 3.74<br />
BetaCJ2 1.23 1.49 1.18 1.54 1.93 3.72<br />
BetaCJA 1.09 1.43 1.27 1.62 2.58 3.74<br />
OptB 1.23 1.49 1.18 1.54 1.93 3.72<br />
Valorile obţinute pentru n=20, pentru meto<strong>de</strong>le menţionate sunt redate şi în graficele <strong>de</strong> mai<br />
jos (la toate meto<strong>de</strong>le se aplică principiul "0 the best"):<br />
14<br />
11.96<br />
12<br />
10 9.04<br />
8<br />
6<br />
4<br />
2<br />
0<br />
Wald<br />
Wald_C AC<br />
12 10.82<br />
10<br />
8<br />
6<br />
4<br />
2<br />
0<br />
8.18<br />
Wald<br />
Wald_C AC<br />
3.4 4.04 4.25<br />
4.42<br />
2.42<br />
3.66 4 3.84<br />
3.07<br />
2.19<br />
10.07<br />
ACC1<br />
ACC2<br />
Wilson<br />
Wilson_C<br />
ArcS<br />
ArcSc1<br />
ArcSc2<br />
9.11<br />
ACC1<br />
ACC2<br />
Wilson<br />
Wilson_C<br />
ArcS<br />
ArcSc1<br />
ArcSc2<br />
Metoda AvgOE(0)<br />
3.7 3.81<br />
2.872.6<br />
Metoda AvgOE(1)<br />
5.02<br />
4.5<br />
4.54<br />
3.35<br />
2.59 3.44 4.07<br />
2.35<br />
161<br />
9.66<br />
4.66 4.95 4.95<br />
4.66 4.32 4.32<br />
3.17<br />
ArcSc3<br />
Logit<br />
Logit_C<br />
BetaC00<br />
BetaC10<br />
BetaC01<br />
BetaC11<br />
BetaCJ0<br />
BetaCJ1<br />
BetaCJ2<br />
BetaCJA<br />
OptB<br />
8.74<br />
4.21 4.48 4.48<br />
3.91<br />
2.87<br />
4.22 3.91<br />
ArcSc3<br />
Logit<br />
Logit_C<br />
BetaC00<br />
BetaC10<br />
BetaC01<br />
BetaC11<br />
BetaCJ0<br />
BetaCJ1<br />
BetaCJ2<br />
BetaCJA<br />
OptB
12<br />
10<br />
8<br />
6<br />
4<br />
2<br />
0<br />
12<br />
10<br />
8<br />
6<br />
4<br />
2<br />
0<br />
9.35 9.82<br />
9.57 9.7<br />
14<br />
12 11.46<br />
10.38<br />
10<br />
8<br />
6<br />
4<br />
2<br />
0<br />
Wald<br />
Wald_C AC<br />
1.01 1.69 1.66 1.66 1.11<br />
1.4 2.01 2.03 2.06 1.28<br />
Metoda StDOE(0)<br />
10.07<br />
10.02<br />
Wald<br />
Wald_C<br />
AC<br />
ACC1<br />
ACC2<br />
Wilson<br />
Wilson_C<br />
ArcS<br />
ArcSc1<br />
2.65<br />
1.49<br />
1.57 1.41<br />
1.37<br />
1.38<br />
1.21 1.52 1.43 1.49 2.45<br />
1.23<br />
1.381.41<br />
Wald<br />
Wa ld_C<br />
AC<br />
ACC1<br />
ACC2<br />
Wilson<br />
Wilson_C<br />
ArcS<br />
ArcSc1<br />
ArcSc2<br />
ArcSc3<br />
Logit<br />
Logit_C<br />
BetaC00<br />
Be taC10<br />
Be taC01<br />
BetaC11<br />
BetaC J0<br />
Be taCJ1<br />
BetaCJ2<br />
BetaCJA<br />
OptB<br />
Metoda StDOE(1)<br />
1.8 1.561.4 1.621.982.943.721.66 1.99 1.98 1.98<br />
2.05 1.87 1.87<br />
Metoda SiDOE(0)<br />
11.03<br />
2.79<br />
2.58<br />
1.87 1.72 1.94<br />
1.9 1.78 2.51 1.671.56 2.68<br />
ACC1<br />
ACC2<br />
Wilson<br />
Wilson_C<br />
ArcS<br />
ArcSc1<br />
ArcSc2<br />
162<br />
ArcSc2<br />
ArcSc3<br />
Logit<br />
Logit_C<br />
BetaC00<br />
BetaC10<br />
BetaC01<br />
BetaC11<br />
BetaCJ0<br />
BetaCJ1<br />
BetaCJ2<br />
BetaCJA<br />
OptB<br />
5.23<br />
2.29<br />
1.57<br />
1.49<br />
1.53 1.53<br />
1.34 1.34<br />
ArcSc3<br />
Logit<br />
Logit_C<br />
BetaC00<br />
BetaC10<br />
BetaC01<br />
BetaC11<br />
BetaCJ0<br />
BetaCJ1<br />
BetaCJ2<br />
BetaCJA<br />
OptB
12 11.01<br />
9.99<br />
10<br />
8<br />
6<br />
4<br />
2<br />
0<br />
6<br />
5<br />
4<br />
3<br />
2<br />
1<br />
0<br />
Wald<br />
Wald_C AC<br />
8<br />
6.83<br />
7<br />
6.71<br />
8<br />
7<br />
6<br />
5<br />
4<br />
3<br />
2<br />
1<br />
0<br />
Wald<br />
Wald_C AC<br />
6.83 6.38<br />
Wald<br />
Wald_C AC<br />
10.61<br />
Metoda SiDOE(1)<br />
5.21<br />
2.36 2.29 3.07<br />
2.98<br />
2.4<br />
2.14 2.9 2.67<br />
2.38 2.84<br />
2.14 2.12<br />
2.24<br />
2.22<br />
2.09 2 2.12 2<br />
ACC1<br />
ACC2<br />
Wilson<br />
Wilson_C ArcS<br />
Arc Sc1<br />
6.8<br />
Arc Sc 2<br />
ArcSc3<br />
Logit<br />
Logit_C<br />
BetaC 00<br />
Metoda AvADA(0)<br />
BetaC10<br />
BetaC 01<br />
BetaC11<br />
BetaCJ0 BetaC J1<br />
BetaCJ2<br />
BetaCJA<br />
OptB<br />
0.93 1.32<br />
2.211.95 1 1.16 1.16 1.191.36 1.331.27<br />
1.21<br />
1.091.23 1.23<br />
1.12 0.95<br />
1.24 1.09<br />
ACC1<br />
ACC2<br />
Wilson<br />
Wilson_C Arc S<br />
ArcSc1<br />
1.21 1.651.581.53 1.11<br />
6.7<br />
ACC1<br />
ACC2<br />
Wilson<br />
Wilson_C ArcS<br />
ArcSc1<br />
ArcSc2<br />
Arc Sc3<br />
Logit<br />
Logit_C<br />
BetaC00<br />
BetaC10<br />
Metoda AvADA(0)<br />
BetaC 01<br />
BetaC 11<br />
BetaCJ0<br />
BetaCJ1<br />
BetaCJ2<br />
BetaCJA<br />
OptB<br />
2.95<br />
2.47<br />
1.5 1.4 1.4 1.55<br />
1.39<br />
1.52 1.49 1.49<br />
1.26<br />
1.31<br />
1.43 1.43<br />
163<br />
ArcSc2<br />
ArcSc3<br />
Logit<br />
Logit_C<br />
BetaC00<br />
BetaC10<br />
BetaC01<br />
BetaC11<br />
BetaCJ0<br />
BetaCJ1<br />
BetaCJ2<br />
BetaCJA<br />
OptB
30<br />
8<br />
7<br />
6<br />
5<br />
4<br />
3<br />
2<br />
1<br />
0<br />
8<br />
7<br />
6<br />
5<br />
4<br />
3<br />
2<br />
1<br />
0<br />
7.05<br />
4.97<br />
Wald<br />
Wald_C AC<br />
6.86<br />
4.97<br />
Wald<br />
Wald_C<br />
AC<br />
25<br />
23.47 23.3<br />
20<br />
15<br />
10<br />
5<br />
0<br />
30<br />
AC<br />
Wald<br />
Wald_C<br />
23.18<br />
25 23.01<br />
20<br />
15<br />
10<br />
5<br />
0<br />
Wald<br />
Wald_C<br />
2.57<br />
1.59 1.6<br />
Metoda AvADS(0)<br />
5.61<br />
2.39<br />
2.09<br />
1.52 2.12<br />
1.47 1.57 1.41<br />
1.39<br />
2.8<br />
1.92 1.92<br />
1.85 1.81<br />
ACC1<br />
ACC2<br />
Wilson<br />
Wilson_C<br />
ArcS<br />
ArcSc1<br />
ArcSc2<br />
5.55<br />
ACC1<br />
ACC2<br />
Wilson<br />
Wilson_C<br />
ArcS<br />
ArcSc1<br />
2.3 3.35<br />
2.66 3.03 2.56<br />
ACC1<br />
ACC2<br />
Wilson<br />
Wilson_C<br />
24.47<br />
24.17<br />
Metoda AvADS(1)<br />
2.64<br />
1.89 1.751.73 2.37<br />
2.4<br />
Metoda S8DOE(0)<br />
4.8<br />
2.04<br />
1.42 1.27 1.27<br />
1.23 1.18 1.18<br />
ArcSc3<br />
Logit<br />
Logit_C<br />
BetaC00<br />
BetaC10<br />
BetaC01<br />
BetaC11<br />
BetaCJ0<br />
BetaCJ1<br />
BetaCJ2<br />
BetaCJA<br />
OptB<br />
4.82<br />
2.32<br />
1.76 1.62 1.62<br />
1.58 1.54<br />
1.54<br />
ArcSc2<br />
ArcSc3<br />
Logit<br />
Logit_C<br />
BetaC00<br />
BetaC10<br />
BetaC01<br />
BetaC11<br />
BetaCJ0<br />
BetaCJ1<br />
BetaCJ2<br />
BetaCJA<br />
OptB<br />
3.93<br />
2.61<br />
6.43<br />
3.06<br />
3.03 3.5<br />
2.58<br />
3.67<br />
2.1<br />
2.09 2.58 2.58<br />
1.93 1.93<br />
ArcS<br />
ArcSc1<br />
ArcSc2<br />
ArcSc3<br />
Metoda S8DOE(1)<br />
Logit<br />
Logit_C<br />
BetaC00<br />
BetaC10<br />
BetaC01<br />
BetaC11<br />
BetaCJ0<br />
BetaCJ1<br />
BetaCJ2<br />
BetaCJA<br />
OptB<br />
6.36<br />
3.8 3.88 4.01<br />
3.8 3.72 3.72<br />
3.75 3.8 3.75 4.15 3.74<br />
3.743.73<br />
3.93 3.73 3.73 3.74 3.74<br />
AC<br />
ACC1<br />
ACC2<br />
Wilson<br />
Wilson_C<br />
ArcS<br />
ArcSc1<br />
ArcSc2<br />
ArcSc3<br />
164<br />
Logit<br />
Logit_C<br />
BetaC00<br />
BetaC10<br />
BetaC01<br />
BetaC11<br />
BetaCJ0<br />
BetaCJ1<br />
BetaCJ2<br />
BetaCJA<br />
OptB
Planificarea activităţilor experimentale urmează schema:<br />
÷ Selectare activitate biologică <strong>de</strong> interes (chimie medicală);<br />
÷ Selectare clasă <strong>de</strong> compuşi cu potenţă biologică (biochimie);<br />
÷ Design structură la nivel topologic (chimie matematică);<br />
÷ Design structură la nivel geometric (chimie cuantică);<br />
÷ Generare familie <strong>de</strong> <strong>de</strong>scriptori moleculari (chimie combinatorială);<br />
÷ Analiză structură-activitate (virtual screening);<br />
÷ Mo<strong>de</strong>lare matematică şi validare statistică (statistică aplicată);<br />
÷ Selecţie, mutaţie şi încrucişare mo<strong>de</strong>le (informatică aplicată);<br />
÷ Validare potenţă biologică (chimie medicală).<br />
Experimente <strong>de</strong>monstrative au fost <strong>de</strong>rulate pentru punctul <strong>de</strong> topire (MP) al aminoacizilor (fiind<br />
incluşi în analiză 31 <strong>de</strong> aminoacizi, dintre care 23 au format setul <strong>de</strong> învăţare) când s-a reuşit<br />
îmbunătăţirea capacităţii estimative <strong>de</strong> la o <strong>de</strong>terminare <strong>de</strong> 63% (folosind un mo<strong>de</strong>l structurăactivitate<br />
cu o variabilă in<strong>de</strong>pen<strong>de</strong>ntă) 99% (folosind un mo<strong>de</strong>l structură-activitate cu patru<br />
variabile in<strong>de</strong>pen<strong>de</strong>nte).<br />
2008A7. Proiectarea şi crearea bazelor <strong>de</strong> date pentru managementul cercetării şi a rezultatelor<br />
cercetării<br />
Baza <strong>de</strong> date şi aplicaţiile <strong>de</strong> gestiune a bazei <strong>de</strong> date au fost construite având ca suport arhitectura<br />
<strong>de</strong> calcul i386 (Jäntschi, 2003-I386), platforma <strong>de</strong> operare FreeBSD (Jäntschi, 2003-FBSD),<br />
serverul <strong>de</strong> baze <strong>de</strong> date MySQL (Jäntschi & Avram, 2002-IBLD) şi limbajul <strong>de</strong> scriptare şi<br />
interpretare PHP (Ştefu & others, 2002-FSD2), acesta oferind capabilităţi sporite <strong>de</strong> lucru eficient<br />
cu fişiere <strong>de</strong> date (Jäntschi & Zaharieva-Stoyanova, 2003-UFS). Combinaţia PHP + MySQL şi-a<br />
dovedit eficienţa, ea fiind anterior probată într-o serie <strong>de</strong> studii (Jäntschi, 2003-SQL1; Bolboacă &<br />
others, 2003; Jäntschi & others, 2003-SQLA; Bolboacă & others, 2003-TW2). Problema relaţionării<br />
datelor în baza <strong>de</strong> date a fost realizată beneficiind <strong>de</strong> experienţa acumulată din studii anterioare<br />
(Naşcu & Jäntschi, 2004-MCE1; Naşcu & Jäntschi, 2004-MCE2; Gligor & Jäntschi, 2005-PSEA).<br />
Pe parcursul <strong>de</strong>rulării activităţii s-a ivit oportunitatea valorificării noii experienţe dobândite într-o<br />
publicaţie (Bălan & others, 2008-SRDI).<br />
Baza <strong>de</strong> date nou realizată (<strong>de</strong>numită MDFV) are următoarea structură (repetitivă pentru fiecare set<br />
<strong>de</strong> compuşi supus investigaţiilor şi exemplificată pentru setul <strong>de</strong> 31 <strong>de</strong> aminoacizi):<br />
÷ Tabela 31aa_data (3 câmpuri, 31 înregistrări): Id (cheie primară), Mol (abreviere aminoacid),<br />
Hin (câmp binar conţinând <strong>de</strong>signul geometric al structurii obţinut din optimizarea geometrică a<br />
conformaţiei moleculare);<br />
÷ Tabela 31aa_prop (31 câmpuri, 1 înregistrare): Property (abreviere proprietate), Aib..Val<br />
(câmpuri numerice conţinând valoarea proprietăţii măsurate pentru fiecare compus);<br />
÷ Tabela 31aa_mdfv (1+31 câmpuri, 2387280 înregistrări): valorile <strong>de</strong>scriptorilor moleculari<br />
in<strong>de</strong>xate după un câmp cheie primară;<br />
÷ Tabela 31aa__MP (4+31 câmpuri, 7617 înregistrări - pentru MP) - conţinând mo<strong>de</strong>lele<br />
structură-activitate cu o variabilă in<strong>de</strong>pen<strong>de</strong>ntă pentru proprietatea MP obţinute în urma<br />
selecţiei pe baza concordanţei folosind algoritmul Goodman-Kruskal;<br />
÷ Tabela 31aa_qsar (6 câmpuri, număr variabil <strong>de</strong> înregistrări - 30 pentru MP) - conţinând<br />
mo<strong>de</strong>lele structură-activitate mai mult <strong>de</strong> o variabilă in<strong>de</strong>pen<strong>de</strong>ntă pentru setul 31aa obţinute în<br />
urma încrucişării folosind un algoritm genetic clasic.<br />
165
2008A8. Completarea bazelor <strong>de</strong> date cu cunoştinţele provenite din documentare şi actualizare<br />
documentare (O1/2007) şi respectiv managementul cunoştinţelor (O2/2007)<br />
Completarea bazelor <strong>de</strong> date cu cunoştinţele provenite din documentare şi Actualizare documentare<br />
şi respectiv Managementul cunoştinţelor a avut ca rezultat:<br />
÷ Actualizarea documentării cu privire la stadiul cunoaşterii a dus la inclu<strong>de</strong>rea în evi<strong>de</strong>nţe a unui<br />
număr <strong>de</strong> 321 <strong>de</strong> baze <strong>de</strong> date relevante pentru caracterizarea structurii şi proprietăţilor chimice<br />
ale compuşilor <strong>de</strong> interes medical, aşa cum s-au enumerat mai sus în secţiunea "Management<br />
cunoştinţe. I<strong>de</strong>ntificarea meto<strong>de</strong>lor <strong>de</strong> analiză. Chimie Medicală".<br />
÷ Baza <strong>de</strong> date a fost completată cu cunoştinţe provenite din Managementul cunoştinţelor prin<br />
inclu<strong>de</strong>rea în baza <strong>de</strong> programe a unui algoritm genetic clasic pentru încrucişarea variabilelor<br />
in<strong>de</strong>pen<strong>de</strong>nte aşa cum în lucrarea [<strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Mircea V.<br />
DIUDEA, Chromatographic Retention Times of Polychlorinated Biphenyls: from Structural Information<br />
to Property Characterization, International Journal of Molecular Sciences, 8(11), p. 1125-1157, 2007.<br />
CAS-AN 2008:423655; CCC&WOS: 000251238700005] a fost prima dată comunicată metoda.<br />
Adaptarea acesteia face ca pentru o funcţie obiectiv <strong>de</strong> estimare a proprietăţii măsurate folosind<br />
2 genotipuri (în cazul general putând fi un număr oarecare fixat <strong>de</strong> genotipuri, r), ecuaţia <strong>de</strong><br />
regresie este <strong>de</strong> forma: Ŷ = a0 + a1·Fenotip1 + a2·Fenotip2, (în general: Ŷ = a0 + Σ1≤i≤rai·Fenotipi),<br />
un<strong>de</strong>: Ŷ este estimatorul proprietăţii măsurate; a0..a2 sunt coeficienţii care rezultă din<br />
minimizarea pătratelor diferenţelor între valorile măsurate Y şi cele estimate prin intermediul lui<br />
Ŷ pentru setul <strong>de</strong> compuşi; Fenotip1=Fenotip(Genotip1) şi Fenotip2=Fenotip(Genotip2) sunt<br />
fenotipurile (şirurile <strong>de</strong> valori ale <strong>de</strong>scriptorilor moleculari obţinuţi prin operaţiile prescrise <strong>de</strong><br />
genotipurile Genotip1=d1p1I1O1f1M1L1 şi Genotip2=d2p2I2O2f2M2L2 pentru compuşi; Tăria<br />
(scorul) unei perechi <strong>de</strong> genotipuri (sau mai multe, pentru regresia multivariată) se exprimă prin<br />
coeficientul <strong>de</strong> <strong>de</strong>terminare asociat perechii <strong>de</strong> fenotipuri: r 2 (Y,a0+a1·Fenotip1+a2·Fenotip2).<br />
2008A9. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi<br />
dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />
Fourth International Conference of Applied Mathematics and Computing<br />
÷ Organizator: Technical University of Plovdiv (TUP), Plovdiv, BG<br />
÷ Tip: conferinţă internaţională<br />
÷ Perioadă: 11-19 August 2008;<br />
÷ Deplasare: aferentă Obiectiv 3, Activitate 9;<br />
÷ Participanţi: <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Carmen E. STOENOIU;<br />
÷ Secţiuni ştiinţifice:<br />
o Combinatorics;<br />
o Graph theory;<br />
o ODE, PDE, difference equations;<br />
o Functional equations;<br />
o Integral and differential inequalities and inclusions;<br />
o Differential games;<br />
o Control theory;<br />
o Dynamical systems;<br />
o Probability, statistics and stochastic processes;<br />
o Statistical mechanics;<br />
o Quantum theory;<br />
o Relativity and gravitational theory;<br />
o Integral and differential operators;<br />
o Fractional calculus;<br />
o Special functions;<br />
166
o Generalized functions;<br />
o Operator research and algebraic analysis;<br />
o Fluid mechanics;<br />
o Mechanics of particles and systems;<br />
o Mathematical programming and optimization;<br />
o Approximation theory;<br />
o Numerical algebraic or transcen<strong>de</strong>ntal equations;<br />
o Numerical analysis for ordinary differential equations;<br />
o Numerical analysis for partial differential equations;<br />
o Numerical methods in complex analysis;<br />
o Numerical methods in linear algebra;<br />
o Numerical simulation;<br />
o Acceleration of convergence;<br />
o Interval arithmetic;<br />
o Information systems;<br />
o Software engineering;<br />
o Software technology;<br />
o System theory;<br />
o Theory of data;<br />
o Programming and image processing;<br />
o Pattern recognition;<br />
o Parallel and distributed algorithms;<br />
o Communication systems;<br />
o Computer ai<strong>de</strong>d <strong>de</strong>sign;<br />
o Computer arithmetic and numerical analysis;<br />
o Computer aspects of numerical algorithms;<br />
o Computer networks;<br />
o Concurrent and parallel computations;<br />
o Data base;<br />
o Discrete mathematics in relation to computer science;<br />
o Manufacturing systems;<br />
o Applications in mechanics, physics, chemistry, biology, technology, economics<br />
and industrial problems.<br />
17th European Symposium on Quantitative Structure-Activity Relationships & Omics<br />
Technologies and Systems Biology<br />
÷ Organizator: The Cheminformatics and QSAR Society (CI-QSAR), Uppsala, SE<br />
÷ Tip: simpozion<br />
÷ Perioadă: 20-27 Septembrie 2008;<br />
÷ Deplasare: aferentă Obiectiv 3, Activitate 9;<br />
÷ Participanţi: <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>;<br />
÷ Prezentări:<br />
o Session 1: QSAR in OMICS and Systems Biology<br />
2008:09:22:09.00: Top-Down Systems Biology and Integrative<br />
Approaches to Superorganism Medicine<br />
2008:09:22:10.00: Systems chemical biological studies on enzymatic<br />
metabolic networks and inhibitors<br />
2008:09:22:11.00: Potentialities of PLSand OPLS in 'OMICS' cancer<br />
diagnostics and elucidation of antiumour drugs mechanism of action<br />
2008:09:22:11.20: Building Blocks for Metabolic simulation: Automated<br />
elucidation of metabolite structures<br />
2008:09:22:11.40: Theoretical structural metabolomics<br />
2008:09:22:12.00: QSAR: <strong>de</strong>ad or alive?<br />
167
o Session 2: QSAR<br />
2008:09:22:14.00: Beyond QSAR<br />
2008:09:22:14.50: Linking chemical and biological similarity of small<br />
molecules<br />
2008:09:22:15.10: A Novel Conservative <strong>de</strong>sign for fast followers -<br />
Focused Hierarchical <strong>de</strong>sign of a pepti<strong>de</strong> library targeted at M.<br />
tuberculosis Ribonucleotid reductase<br />
2008:09:22:16.00: A QSAR study on indole-based PPAR-y agonists in<br />
respect to receptor binding and gene transactivation data<br />
2008:09:22:16.20: QSAR mo<strong>de</strong>lling of small datasets<br />
2008:09:22:16.40: QSAR for Estimation of human volume of distribution<br />
2008:09:22:17.00: Development of Fast, Interpretable 2D pharmacophore<br />
mo<strong>de</strong>ls for predicting hERG and NaV1.5 Cardiac Ion Channel safety<br />
liabilities using TRUST fingerprints<br />
2008:09:22:17.20: Global or local QSAR: is there a way out?<br />
o Session 3: QSAR and Natural Product Medicine<br />
2008:09:23:09.00: PLS-Trees and QSAR<br />
2008:09:23:09.45: Metabolomics in nutritional studies<br />
2008:09:23:12.00: SIRC/TCM: a Database of Traditional Chinese<br />
Medicine<br />
o Session 4: Molecular Mo<strong>de</strong>ling and Chemical Properties<br />
2008:09:23:14.00: Does pKa predictions matter anymore?<br />
2008:09:23:14.50: Cytotoxicity and 3D-QSAR Analysis of Lmaellarind<br />
against human hormone <strong>de</strong>pen<strong>de</strong>nt breast cancer (T47D) and Humane<br />
hormone in<strong>de</strong>pen<strong>de</strong>nt breast cancer (MDA-MB231)<br />
2008:09:23:15.10: GABAa and GABAc Receptors: Molecular mo<strong>de</strong>lling<br />
and QSAR analysis of selective ligands<br />
2008:09:23:15.30: Fast and accurate method for flexible ligand<br />
superposition and shape-based screening<br />
2008:09:23:16.20: Predicted 3D structures for Coupled Receptors G-<br />
Protein and ligand-GPCR complexes for agonists, antagonists, and<br />
inverse agonists<br />
2008:09:23:17.00: Design of New Chemical Entities as selective COX-2<br />
inhibitors using Structure optimisation by QSAR<br />
2008:09:23:17.20: A novel 3D QSAR metod exploiting protein flexibility<br />
to kinase inhibition<br />
2008:09:23:17.40: An automated metod to interface ligand- and structurebased<br />
drug <strong>de</strong>sign<br />
o Session 5: Combinatorial Chemistry and Virtual Screening<br />
2008:09:24:09.00: From Molecular Interaction Fields to Enzyme<br />
Inhibitors and Biochemical Networks<br />
2008:09:24:09.45 : Minimizing Benchmark Dataset Bias in Ligand Based<br />
viritual screening by maximum unbiased validation (MUV) Datasets<br />
2008:09:24:10.05: Data mining and comperative analysis of<br />
chemosensitivity and gene expression profiles for human tumor cell lines<br />
o Session 6: QSAR in Toxicology and Environmental Research<br />
2008:09:24:10.50: Human and mammalian toxic equivalency factors for<br />
dioxins and dioxin-like compounds: The who 2005 re-evaluation<br />
2008:09:24:11.35: A combined use of in vitro screening and<br />
cheminformatics approaches improves the accuracy of in vivo toxicity<br />
prediction for environmental chemicals<br />
2008:09:24:12.05: Prediction of cytochrome P450 inhibition by different<br />
168
approaches of QSAR mo<strong>de</strong>ling<br />
o Session 7: Case Studies in QSAR<br />
2008:09:25:09.00: Un<strong>de</strong>rstanding QSAR: Do we always use the correct<br />
structural mo<strong>de</strong>ls to establish affinity correlation?<br />
2008:09:25:09.50: Computer-ai<strong>de</strong>d drug <strong>de</strong>sign for the beta2-adrenergic<br />
receptor<br />
2008:09:25:12.00: QSAR investigation of novel compounds targeting the<br />
serotonin receptors<br />
2008:09:25:12.20: Docking and viritual screening for virus targets<br />
exploiting distributed grid technology<br />
o Session 8: QSAR in Chemical Risk Assessment<br />
2008:09:25:14.00: Advances in Toxico-Cheminformatics: Supporting a<br />
New Paradigm for Predictive Toxicology<br />
2008:09:25:14.45: Use of structural alerts to screen EINECS for<br />
substances of very high concern<br />
2008:09:25:15.05: Predicting Toxicity from Non-Test Data: Utilising in<br />
silico and in chemico information for Risk assessment<br />
2008:09:25:16.00: Computational Ecotoxicology to predict<br />
Biomagnification of contaminants<br />
2008:09:25:16.20: Similarity based assessment of Mo<strong>de</strong>l applicability<br />
domain and quantitative evaluation of reliability of the prediction<br />
2008:09:25:16.40: Using all the data in comprehensive risk assessment of<br />
the mutagenetic potential of drugs<br />
2008:09:25:17.00: Human Monitoring of Phtalates and Chemical Risk<br />
Assessment<br />
o Session 9: Emerging Technologies<br />
2008:09:26:09.00: Complex systems, QSAR, and control of stem cell fate<br />
2008:09:26:09.50: Proteochemometrics<br />
2008:09:26:10.10: From Mathematical chemistry to quantum and<br />
medicinal chemistry through genetic algorithms<br />
2008:09:26:10.50 GAUDI navigator, a new data mining platform<br />
2009A1. Crearea aplicaţiilor pentru interogarea bazei <strong>de</strong> date pentru managementul cercetării<br />
Problematica structurării eficiente a informaţiei în baza <strong>de</strong> date astfel încât să se poată beneficia <strong>de</strong><br />
facilităţile relaţionale <strong>de</strong> interogare a fost analizată în <strong>de</strong>taliu în studii anterioare (Jäntschi &<br />
Bolboacă, 2006-DDI; Jäntschi & others, 2006-RPRD) iar pe parcursul <strong>de</strong>sfăşurării activităţii a fost<br />
finalizat un nou studiu în acest subiect (Bălan & others, 2008-SRMS).<br />
Structura bazei <strong>de</strong> date MDFV nou create este următoarea:<br />
MDFV<br />
_mdfv<br />
31aa_<br />
CQd_<br />
sulfon_<br />
data mdfv prop qsar _MP ...<br />
... ... ... ... ...<br />
sulfon18_<br />
taxoids_<br />
169<br />
estro_<br />
triph_<br />
logBBB_<br />
...
Baza <strong>de</strong> date MDFV este alcătuită dintr-un tabel (_mdfv) şi o serie <strong>de</strong> constelaţii (grupuri <strong>de</strong><br />
tabele).<br />
Tabela `_mdfv` este tabela template (şablon) cuprinzând codul şi numele fiecărui <strong>de</strong>scriptor<br />
molecular <strong>de</strong> structură membru al familiei MDFV.<br />
Fiecare constelaţie <strong>de</strong> tabele a bazei <strong>de</strong> date MDFV are un număr <strong>de</strong> 4 tabele care se creează la<br />
fiecare set <strong>de</strong> molecule supus investigaţiei:<br />
÷ Tabela `data` conţine codul, <strong>de</strong>numirea şi structura (în format HyperChem) moleculelor setului<br />
investigat;<br />
÷ Tabela `prop` conţine valorile măsurate ale fiecărei activităţi observate pentru fiecare moleculă<br />
a setului;<br />
÷ Tabela `mdfv` conţine valorile calculate ale <strong>de</strong>scriptorilor familiei MDFV pentru fiecare<br />
moleculă a setului inclus în studiu;<br />
÷ Tabela `qsar` conţine ecuaţiile structură-activitate obţinute în urma analizei <strong>de</strong> regresie pentru<br />
toate activităţile investigate aferente setului supus studiului;<br />
Fiecare constelaţie <strong>de</strong> tabele a bazei <strong>de</strong> date MDFV mai are şi un număr variabil <strong>de</strong> tabele (numărul<br />
variabil <strong>de</strong> tabele este egal cu numărul <strong>de</strong> înregistrări în tabela `prop` aferente numărului <strong>de</strong><br />
activităţi experimentale pentru care s-a rulat studiul structură-activitate; <strong>de</strong>numirile acestor tabele au<br />
ca sufix <strong>de</strong>numirile activităţilor din tabela `prop`.<br />
S-a realizat aplicaţia care interoghează baza <strong>de</strong> date şi transferă programului <strong>de</strong> navigare pe Internet<br />
lista seturilor <strong>de</strong> molecule existente în baza <strong>de</strong> date MDFV; pentru aceasta se foloseşte adresa:<br />
http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs/MDFV/<br />
când se obţine rezultatul:<br />
Fiecare set <strong>de</strong> molecule din lista <strong>de</strong> mai sus poate avea stocate în baza <strong>de</strong> date 1 sau mai multe<br />
activităţi; aplicaţia realizată permite selectarea proprietăţii dorite din lista celor disponibile; un<br />
exemplu <strong>de</strong> navigare în lista activităţilor este dat <strong>de</strong> adresa:<br />
http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs/MDFV/?set=nitro<br />
când se obţine rezultatul:<br />
S-a realizat aplicaţia file_pdb_get.php care interoghează baza <strong>de</strong> date şi transformă informaţia <strong>de</strong><br />
structură moleculară din baza <strong>de</strong> date stocată în format HyperChem în informaţie stocată în format<br />
170
Bookhaven pe care o transferă programului <strong>de</strong> navigare pe Internet; structura moleculară se<br />
vizualizează folosind programul <strong>de</strong> navigare pe Internet (Internet Explorer în Windows) atunci când<br />
are instalată o librărie auxiliară (MDL Chime v. 2.6 SP6); prin integrarea suportului server şi client<br />
aplicaţia realizată permite vizualizarea 3D a structurii moleculare folosind navigatorul pentru<br />
Internet; un exemplu <strong>de</strong> vizualizare 3D a structurii moleculare se află la adresa:<br />
http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs/MDFV/?set=nitro&pdb=001_7416<br />
când se obţine rezultatul:<br />
S-a realizat aplicaţia care interoghează baza <strong>de</strong> date şi transferă programului <strong>de</strong> navigare pe Internet<br />
informaţia <strong>de</strong> structură moleculară din baza <strong>de</strong> date stocată în format HyperChem; un exemplu <strong>de</strong><br />
vizualizare text a structurii moleculare se află la adresa:<br />
http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs/MDFV/?set=nito&get=001_7416<br />
când se obţine rezultatul:<br />
Odată generate mo<strong>de</strong>lele structură-activitate cu ajutorul programelor <strong>de</strong>zvoltate, trebuie să fie<br />
posibilă interogarea bazei <strong>de</strong> date (a tabelei <strong>de</strong> set cu terminaţia _qsar) care să producă lista<br />
mo<strong>de</strong>lelor QSAR i<strong>de</strong>ntificate; în acest sens s-a realizat aplicaţia care să permită această operaţie; un<br />
exemplu în acest sens este vizualizarea relaţiilor structură-activitate pentru setul nitro şi activitatea<br />
logLD50, dată mai jos:<br />
http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs/MDFV/?set=31aa&property=logLD50<br />
când se obţine rezultatul:<br />
mol var r2 eq research<br />
y=-2.51986728389499E-001+GA5aCCDL*<br />
39 1 0.423803154745641 Link<br />
5.21558657163717E+000<br />
171
y= 6.74698673621303E+000+GA5aCCDL*-<br />
39 2 0.530654376498168 1.70258853068498E-001+TAtIFfDL*<br />
Link<br />
3.13582898594199E-001<br />
y= 6.42608063592238E+000+GA5aCCDL*-<br />
39 2 0.574491953815928 1.90355431095039E-001+TAxAIfDR*-<br />
Link<br />
3.82520782963772E+000<br />
y= 6.76467699947407E+000+GA5aCCDL*-<br />
39 2 0.582198432091616 2.68250910837082E-001+GMLiAPdI*-<br />
Link<br />
3.22593469107696E+000<br />
y= 9.47850382461388E+000+TAtIFfDL*<br />
39 2 0.58815416668693 5.14091975972415E-001+GAsaCcdR*-<br />
Link<br />
1.10567575078389E+000<br />
y= 6.26163608400332E+000+TAsFPIDL*-<br />
39 2 0.600267821983716 8.42045542648347E-001+GAsaCcdR*-<br />
Link<br />
1.30802112973012E+000<br />
y= 6.69552416046760E+000+TAfFPFDL*-<br />
39 2 0.644278113888757 9.78150753609102E-001+GAsaCcdR*-<br />
Link<br />
1.50831828914801E+000<br />
y= 6.34252467532257E+000+TAfFPFDL*-<br />
39 2 0.663845164400658 1.04296487704456E+000+GAsAIcdR*-<br />
Link<br />
1.30383647100216E+000<br />
y= 6.40007482263077E+000+TAfFPFDL*-<br />
39 2 0.668822860582434 1.12360870766758E+000+GAsaAcdR*-<br />
Link<br />
1.50830323984517E+000<br />
y= 8.22325743438927E+000+GA5aCCDL*-<br />
1.88533710470963E-001+TAtIFfDL*<br />
39 3 0.683015020335616 Link<br />
3.04685086129343E-001+GMLiAPdI*-<br />
3.16477930966330E+000<br />
y= 8.68188079248948E+000+GA5aCCDL*-<br />
1.99439316654648E-001+TAqPIFDR*-<br />
39 3 0.711717834291881 Link<br />
5.29736556552302E-003+GMLiAPdI*-<br />
3.37308192564265E+000<br />
y= 9.47575675391378E+000+GA5aCCDL*-<br />
1.94808177957800E-001+TAtAIfDR*-<br />
39 3 0.738711257236817 Link<br />
3.96221260445197E-001+GMLiAPdI*-<br />
4.11487187264147E+000<br />
y= 8.34822538239668E+000+TAfFPFDL*-<br />
9.60662413900666E-001+GAkCIcdL*-<br />
39 3 0.749766284163236 Link<br />
2.79525279544323E-001+GAsaCcdR*-<br />
1.13109726928306E+000<br />
y= 8.05048904505580E+000+TAfFPFDL*-<br />
1.01191512261529E+000+GAkCIcdL*-<br />
39 3 0.764633588116481 Link<br />
2.73198010939187E-001+GAsAIcdR*-<br />
9.94126168067764E-001<br />
y= 3.33691859158614E+000+GA5aCCDL*-<br />
1.59424590735126E-001+TAxAIfDR*-<br />
39 4 0.766643598194283 Link<br />
2.12827104660222E+000+GLvFaFDR*<br />
3.02942526551910E-002+TAsPifDL*<br />
172
1.21739507388622E+000<br />
y= 7.38149868242850E+000+GA5aCCDL*-<br />
1.54681779894843E-001+TAxAIfDR*-<br />
39 4 0.777185991913265 2.98863972048376E+000+GAkCIcdL*-<br />
Link<br />
3.12930072207785E-001+GAtFACDL*-<br />
7.36069962620339E-001<br />
y= 9.51027537370945E+000+GA5aCCDL*-<br />
1.51385020587630E-001+TAqPIFDR*-<br />
39 4 0.781634330171587 5.66709405265237E-003+GLbIPPdL*-<br />
Link<br />
3.78224354845121E-001+GMLiAPdI*-<br />
3.77723705042659E+000<br />
y= 3.33633641030288E+000+GA5aCCDL*-<br />
1.94876226261915E-001+TA1FPIDL*-<br />
39 4 0.784873793896405 4.23346842676077E-001+TLDFAIDL*<br />
Link<br />
4.01318298880704E-001+GMLiAPdI*-<br />
3.64590811981607E+000<br />
y= 6.02201396063550E+000+GA5aCCDL*-<br />
1.24589135140765E-001+GAbPPFdL*-<br />
39 4 0.802067501247866 5.48765716327511E-001+GAwPACDL*<br />
Link<br />
9.23482598792537E-001+GAZAAIDL*<br />
3.18120042599435E-001<br />
y= 9.77031338191638E+000+GA5aCCDL*-<br />
1.69264629070674E-001+TAtAIfDR*-<br />
39 4 0.804286530946939 4.07716403919092E-001+GMTPiCdL*-<br />
Link<br />
4.37418322056800E-001+GMLiAPdI*-<br />
4.33739000919138E+000<br />
y= 1.36123461166612E+001+GA5aCCDL*-<br />
1.54340240635941E-001+TAtAIfDR*-<br />
39 4 0.814105679893478 4.71424618541177E-001+GQ1PIfdL*-<br />
Link<br />
9.25363290053647E-001+GMLiAPdI*-<br />
4.08009171325853E+000<br />
y= 1.29633594351980E+001+GA5aCCDL*-<br />
1.78281216341697E-001+TAtPFfDR*-<br />
39 4 0.821473243777755 2.24609677097928E+000+GQ1PIfdL*-<br />
Link<br />
1.02316958895442E+000+GMLiAPdI*-<br />
3.60251165923635E+000<br />
y= 2.14872674323368E+000+GA5aCCDL*-<br />
1.83498321953278E-001+GATAPaDR*<br />
39 4 0.827782539556989 3.91672165448696E+001+GQ0AAiDL*<br />
Link<br />
3.53336909208376E-001+TAsPifDL*<br />
2.06282871618359E+000<br />
y= 7.77395091651078E+000+TAfFPFDL*-<br />
7.89048423146169E-001+GAkCIcdL*-<br />
39 4 0.843849931580623 2.93135152758776E-001+TAtIFFDI*<br />
Link<br />
1.02634578605081E+002+GAsAIcdR*-<br />
1.03916642897475E+000<br />
Pentru fiecare mo<strong>de</strong>l disponibil în baza <strong>de</strong> date, analiza <strong>de</strong> mo<strong>de</strong>l trebuie să permită vizualizarea<br />
rezultatelor; având în ve<strong>de</strong>re că aceasta reprezintă însă un rezultat al cercetării, interfaţa care<br />
permite această operaţie este protejată cu parolă; un exemplu în acest sens este următorul:<br />
173
http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs/MDFV/?set=nitro&property=logLD50&id=24<br />
când se obţine rezultatul după introducerea corespunzătoare a parolei <strong>de</strong> acces; aplicaţia realizată<br />
permite vizualizarea rezultatelor analizei <strong>de</strong> mo<strong>de</strong>l pentru mo<strong>de</strong>lul <strong>de</strong> regresie selectat; pentru setul<br />
(nitro), activitatea (logLD50) şi mo<strong>de</strong>lul (id) selectate mai sus, se <strong>de</strong>schi<strong>de</strong> o interfaţă care permite<br />
analiza <strong>de</strong> mo<strong>de</strong>l pe componente <strong>de</strong> interes, aşa cum arată captura <strong>de</strong> ecran <strong>de</strong> mai jos, urmată <strong>de</strong><br />
analiza pe componente, redată în a 2-a figură <strong>de</strong> mai jos:<br />
Mo<strong>de</strong>l<br />
Set Molecules<br />
Name Number<br />
Property<br />
Name<br />
Molecules<br />
Number<br />
In<strong>de</strong>pen<strong>de</strong>nt<br />
Variables<br />
Determination<br />
Coefficient<br />
nitro 39 logLD50 39 4 0.843849931580623<br />
174<br />
Structure-Activity<br />
Relationship<br />
7.77395091651078E+000+<br />
TAfFPFDL*-7.89048423146169E-001+<br />
GAkCIcdL*-2.93135152758776E-001+<br />
TAtIFFDI* 1.02634578605081E+002+<br />
GAsAIcdR*-1.03916642897475E+000<br />
Analysis<br />
No Mol Prop TAfFPFDL GAkCIcdL TAtIFFDI GAsAIcdR Estimated Diff%<br />
1 001_7416 5.855 -1.3428 7.202 0.004126 1.3089 5.786 1<br />
2 002_7452 3.384 -0.24485 8.068 0.008221 2.2322 4.126 20<br />
3 003_7434 5.617 0.29329 6.433 0.0008335 0.006739 5.735 2<br />
4 004_11761 6.815 -0.345 6.692 0.008463 0.4392 6.497 5<br />
5 005_8461 5.591 -0.3782 6.21 0.0011986 0.3994 5.960 6<br />
6 006_11813 5.176 -0.3757 8.094 0.0011986 1.2188 4.554 13<br />
7 007_12067 5.375 -0.3783 6.23 0.003584 0.6294 5.960 10<br />
8 008_8376 6.409 0.22035 6.626 0.003938 0.015569 6.046 6<br />
9 009_6946 7.378 -1.1922 7.585 0.007296 0.0645 7.173 3<br />
10 010_7423 6.282 -1.2171 7.09 3.166e-05 0.5752 6.061 4<br />
11 011_7475 6.62 -1.2309 7.669 0.007296 1.0707 6.133 8<br />
12 012_7447 7.719 -2.1631 5.219 0.007705 0.9793 7.724 0<br />
13 013_8492 8.769 -1.2309 4.642 0.007296 0.09741 8.032 9<br />
14 014_23108 7.944 -2.0756 5.996 0.005694 0.11535 8.119 2<br />
15 015_4338370 7.65 -1.0753 4.566 0.0079 0.6603 7.409 3<br />
16 016_6947 5.811 -1.7969 8.254 0.010268 2.0852 5.659 3<br />
17 017_11137 5.793 -1.8034 9.757 0.008221 1.5057 5.616 3<br />
18 018_980 5.308 -1.8087 10.752 0.007197 1.8329 4.883 8<br />
19 019_1493 3.401 -0.3719 9.344 0.0022138 1.7075 3.781 11
20 020_3613389 7.783 -1.627 5.661 0.004126 0.5393 7.261 7<br />
21 021_6954 5.298 0.22417 8.591 0.003261 0.9482 4.428 18<br />
22 022_6108 7.581 -3.0803 7.67 0.012619 1.1459 8.060 6<br />
23 023_8494 8.086 -3.034 7.94 0.015547 1.6165 7.756 4<br />
24 024_8489 6.04 -1.7214 5.469 0.005785 1.7859 6.267 4<br />
25 025_33096 5.704 -0.21674 8.844 0.015486 0.6829 6.232 9<br />
26 026_214168 6.052 -0.6002 8.531 0.010229 0.7655 6.001 1<br />
27 027_67967 5.298 -2.382 9.018 0.008027 2.3431 5.399 2<br />
28 028_6974 7.8 -2.8392 10.287 0.016055 0.7306 7.887 1<br />
29 029_67350 8.7 -3.449 5.913 0.009096 1.3666 8.276 5<br />
30 030_541 8.455 -2.5978 8.622 0.010162 0.6859 7.627 10<br />
31 031_12090 3.401 -1.657 11.613 0.00347 1.6802 4.287 23<br />
32 032_5111791 6.524 -1.1019 4.456 0.004624 1.1886 6.577 1<br />
33 033_8462 6.98 -1.4327 6.451 0.015287 2.0797 6.421 8<br />
34 034_7114 7.71 -1.6518 6.798 0.011366 1.0543 7.156 7<br />
35 035_7457 7.886 -1.4819 5.896 0.013735 1.0788 7.504 5<br />
36 036_97443 6.745 -2.1663 4.84 0.007304 1.2072 7.560 11<br />
37 037_11346 7.378 -3.0875 7.428 0.014112 1.1802 8.255 11<br />
38 038_15787 6.109 -0.7537 5.615 0.009721 0.10692 7.609 22<br />
39 039_94665 6.922 -1.5705 5.959 0.003249 0.06567 7.532 8<br />
175
2009A2. Construirea mo<strong>de</strong>lelor moleculare (chimie cuantică) & procesarea informaţiei<br />
moleculare (chimie matematică)<br />
Elaborarea mo<strong>de</strong>lelor matematice ale structurilor şi proceselor chimice a constituit subiect <strong>de</strong><br />
preocupări anterior realizării acestei activităţi (Jäntschi & Naşcu, 2002-FSD3; Jäntschi & Naşcu,<br />
2002-NDT; Jäntschi & Pică, 2002-NKC; Jäntschi & Ungureşan, 2002-PCEI; Jäntschi & Pică, 2003-<br />
ORM; Jäntschi & Pică, 2003-NCDR; Jäntschi, 2003-KB). O serie <strong>de</strong> studii recente (Jäntschi &<br />
others, 2007-FVCT; Stoenoiu & others, 2007-MFI) au pregătit terenul pentru seria <strong>de</strong> rezultate care<br />
au fost valorificate din <strong>de</strong>rularea acestei activităţi în cadrul proiectului (Ştefu & others, 2008-<br />
MHHS; Stoenoiu & others, 2008-MFET; Jäntschi & others, 2008-IEbT; Jäntschi & Diu<strong>de</strong>a, 2009sGPV;<br />
Jäntschi & others, 2009-CCPI; Jäntschi & Bolboacă, 2009-CPRI; Jäntschi & Bolboacă,<br />
2009-EDFD) şi chiar rezultate care au apărut după finalizarea activităţii (Jäntschi & Diu<strong>de</strong>a, 2011-<br />
C16V).<br />
Mo<strong>de</strong>lele moleculare s-au implementat modularizat folosind clase; astfel informaţia structurii<br />
moleculare s-a implementat la 5 nivele, aşa cum rezultă în continuare.<br />
Procesarea informaţiei la nivel atomic (legat <strong>de</strong> valenţă, masă atomică, sarcină electrică parţială,<br />
afinitate pentru electroni, punct <strong>de</strong> topire în stare fundamentală, număr <strong>de</strong> protoni situaţi în<br />
vecinătatea imediată în structură, coordonate <strong>de</strong> geometrie tridimensională, legăturile cu<br />
heteroatomii învecinaţi) sunt obţinute pentru fiecare atom al unei structuri analizate pornind <strong>de</strong> la<br />
structura în format HyperChem şi folosind o bază <strong>de</strong> date cu constante atomice <strong>de</strong> către funcţiile<br />
implementate în clasa class_<strong>de</strong>scriptor_1atoms.php.<br />
class ato_type{<br />
function __construct(){<br />
$this->mass["H"] = 1.0078; $this->elng["H"] = 2.1; $this->melt["H"] = 14; $this->elaf["H"] = -72.8;<br />
$this->mass["B"] = 10.810; $this->elng["B"] = 2.0; $this->melt["B"] = 2573; $this->elaf["B"] = -15;<br />
$this->mass["C"] = 12.011; $this->elng["C"] = 2.5; $this->melt["C"] = 3820; $this->elaf["C"] = -121;<br />
$this->mass["N"] = 14.007; $this->elng["N"] = 3.0; $this->melt["N"] = 63.29; $this->elaf["N"] = 31;<br />
$this->mass["O"] = 15.999; $this->elng["O"] = 3.5; $this->melt["O"] = 54.8; $this->elaf["O"] = -141;<br />
$this->mass["F"] = 18.998; $this->elng["F"] = 4.0; $this->melt["F"] = 54; $this->elaf["F"] = -333;<br />
$this->mass["AL"]= 26.982; $this->elng["AL"]= 1.5; $this->melt["AL"]= 933; $this->elaf["AL"]= -44;<br />
$this->mass["SI"]= 28.086; $this->elng["SI"]= 1.8; $this->melt["SI"]= 1683; $this->elaf["SI"]= -135;<br />
$this->mass["P"] = 30.974; $this->elng["P"] = 2.1; $this->melt["P"] = 317.3; $this->elaf["P"] = -60;<br />
$this->mass["S"] = 32.066; $this->elng["S"] = 2.5; $this->melt["S"] = 386; $this->elaf["S"] = -200.4;<br />
$this->mass["CL"]= 35.453; $this->elng["CL"]= 3.0; $this->melt["CL"]= 172; $this->elaf["CL"]= -348;<br />
$this->mass["FE"]= 55.847; $this->elng["FE"]= 1.8; $this->melt["FE"]= 1808; $this->elaf["FE"]= -44;<br />
$this->mass["CU"]= 63.546; $this->elng["CU"]= 1.9; $this->melt["CU"]= 1357; $this->elaf["CU"]= -118.3;<br />
$this->mass["GA"]= 69.723; $this->elng["GA"]= 1.6; $this->melt["GA"]= 303; $this->elaf["GA"]= -36;<br />
$this->mass["GE"]= 72.610; $this->elng["GE"]= 1.8; $this->melt["GE"]= 1211; $this->elaf["GE"]= -116;<br />
$this->mass["AS"]= 74.923; $this->elng["AS"]= 2.0; $this->melt["AS"]= 1090; $this->elaf["AS"]= -77;<br />
$this->mass["SE"]= 78.960; $this->elng["SE"]= 2.4; $this->melt["SE"]= 490; $this->elaf["SE"]= -195;<br />
$this->mass["BR"]= 79.904; $this->elng["BR"]= 2.8; $this->melt["BR"]= 266; $this->elaf["BR"]= -324;<br />
$this->mass["IN"]= 114.82; $this->elng["IN"]= 1.7; $this->melt["IN"]= 429; $this->elaf["IN"]= -34;<br />
$this->mass["SN"]= 118.71; $this->elng["SN"]= 1.8; $this->melt["SN"]= 505; $this->elaf["SN"]= -121;<br />
$this->mass["SB"]= 121.75; $this->elng["SB"]= 1.9; $this->melt["SB"]= 904; $this->elaf["SB"]= -101;<br />
$this->mass["TE"]= 127.60; $this->elng["TE"]= 2.1; $this->melt["TE"]= 722.7; $this->elaf["TE"]= -190.2;<br />
$this->mass["I"] = 126.90; $this->elng["I"] = 2.5; $this->melt["I"] = 387; $this->elaf["I"] = -295;<br />
}<br />
}<br />
class hin_file{<br />
var $n=0;<br />
function __construct($mol){<br />
$q=mysql_query("SELECT `hin` FROM `".setd."_data` WHERE `mol`='".$mol."'");<br />
if(!$q)die("SELECT HIN ERROR!\r\n");<br />
$n=mysql_num_rows($q);<br />
if($n===1){<br />
$r=mysql_fetch_array($q);<br />
mysql_free_result($q);<br />
$text=$r[0];<br />
}else die("MORE THAN ONE HIN!");<br />
$a=explo<strong>de</strong>("mol 1",$text);<br />
if(count($a)3)die("data is more or less than a molecule.\r\n");<br />
$text=$a[1];unset($a);$a=explo<strong>de</strong>("\r\n",$text);unset($text);<br />
$n=count($a);for($i=0;$in=count($atom);<br />
$this->text=$atom;<br />
176
}<br />
function atom_info($atom,&$cnv_tool){<br />
$list=explo<strong>de</strong>(" ",$atom);<br />
//echo($atom."\r\n");<br />
//die();<br />
$n=count($list);<br />
for($i=12;$iatom[]=array_values($list);<br />
}<br />
function create_structure(){<br />
$conversion_tool=array("s" => 1,"d" => 2, "t" => 3, "a" => 1.5);<br />
for($i=0;$in;$i++){<br />
$this->atom_info($this->text[$i],$conversion_tool);<br />
$this->proton[]=0;<br />
}<br />
}<br />
function remove_atoms($remove_list=0){<br />
if($remove_list){<br />
if(!is_array($remove_list))<br />
$this->remove_a_atom($remove_list);<br />
else{<br />
$n=count($remove_list);<br />
for($i=0;$iremove_a_atom($remove_list[$i]);<br />
}<br />
}<br />
}<br />
unset($this->text);<br />
}<br />
function remove_a_atom($atom){<br />
$at_li=array();<br />
for($i=0;$in;$i++){<br />
if($atom==$this->atom[$i][1]){<br />
$at_li[]=$i;<br />
for($j=0;$jatom[$j][$k]==$this->atom[$i][0]){<br />
if($atom=="H"){<br />
$this->proton[$j]++;<br />
unset($this->proton[$i]);<br />
}<br />
unset($this->atom[$j][$k]);<br />
unset($this->atom[$j][$k+1]);<br />
$this->atom[$j][6]--;<br />
$this->atom[$j]=array_values($this->atom[$j]);<br />
break;<br />
}<br />
}<br />
}<br />
for($j=$i+1;$jn;$j++){<br />
for($k=7;$katom[$j]);$k+=2){<br />
if($this->atom[$j][$k]==$this->atom[$i][0]){<br />
if($atom=="H"){<br />
$this->proton[$j]++;<br />
unset($this->proton[$i]);<br />
}<br />
unset($this->atom[$j][$k]);<br />
unset($this->atom[$j][$k+1]);<br />
$this->atom[$j][6]--;<br />
$this->atom[$j]=array_values($this->atom[$j]);<br />
break;<br />
}<br />
}<br />
}<br />
}<br />
}<br />
$n=count($at_li);<br />
if($n){<br />
for($i=0;$iatom[$at_li[$i]]);<br />
$this->n--;<br />
}<br />
$this->atom=array_values($this->atom);<br />
$this->proton=array_values($this->proton);<br />
}<br />
177
}<br />
function create_in<strong>de</strong>x(){<br />
for($i=0;$in;$i++){<br />
$this->in<strong>de</strong>x[$i]=$this->atom[$i][0];<br />
}<br />
}<br />
function create_topology(){<br />
$this->m=0;<br />
for($i=0;$in;$i++){<br />
//$this->in<strong>de</strong>x[$i]=$this->atom[$i][0];<br />
$label[$this->atom[$i][0]]=$i;<br />
$this->topology["count"][$i]=$this->atom[$i][6];<br />
$this->m+=$this->topology["count"][$i];<br />
}<br />
$this->m/=2;<br />
for($i=0;$in;$i++){<br />
for($j=0;$jtopology["count"][$i];$j++){<br />
$this->topology["edges"][$i][$j]=$label[$this->atom[$i][7+2*$j]];<br />
}<br />
}<br />
}<br />
function create_chemistry(&$a){<br />
for($i=0;$in;$i++){<br />
$this->chemstry[$i]=strtoupper($this->atom[$i][1]);<br />
$this->property["mass"][$i]=$a->mass[$this->chemstry[$i]];//M<br />
$this->property["elng"][$i]=$a->elng[$this->chemstry[$i]];//E<br />
$this->property["melt"][$i]=$a->melt[$this->chemstry[$i]];//L<br />
$this->property["elaf"][$i]=$a->elaf[$this->chemstry[$i]];//A<br />
$this->property["char"][$i]=$this->atom[$i][5];//Q<br />
$this->property["prot"][$i]=$this->proton[$i];//H<br />
$this->property["card"][$i]=1;//1<br />
$this->geometry["x"][$i]=$this->atom[$i][2];<br />
$this->geometry["y"][$i]=$this->atom[$i][3];<br />
$this->geometry["z"][$i]=$this->atom[$i][4];<br />
}<br />
unset($this->in<strong>de</strong>x);<br />
unset($this->proton);<br />
unset($this->chemstry);<br />
unset($this->atom);<br />
}<br />
function tmp_edve_cut($v){<br />
for($i=0;$itopology["count"][$v];$i++){<br />
for($j=0;$jtopology["count"][$this->tmp_edge[$v][$i]];$j++){<br />
if($this->tmp_edge[$this->tmp_edge[$v][$i]][$j]==$v){<br />
unset($this->tmp_edge[$this->tmp_edge[$v][$i]][$j]);<br />
break;<br />
}<br />
}<br />
}<br />
unset($this->tmp_edge[$v]);<br />
}<br />
function tmp_vert_cut($v){<br />
unset($this->tmp_edge[$v]);<br />
}<br />
function tmp_edge_cut($v1,$v2){<br />
for($j=0;$jtopology["count"][$v1];$j++){<br />
if($this->tmp_edge[$v1][$j]==$v2){<br />
unset($this->tmp_edge[$v1][$j]);<br />
$this->tmp_edge[$v1]=array_values($this->tmp_edge[$v1]);<br />
break;<br />
}<br />
}<br />
for($j=0;$jtopology["count"][$v2];$j++){<br />
if($this->tmp_edge[$v2][$j]==$v1){<br />
unset($this->tmp_edge[$v2][$j]);<br />
$this->tmp_edge[$v2]=array_values($this->tmp_edge[$v2]);<br />
break;<br />
}<br />
}<br />
}<br />
function create_matrix_distance(&$edges = NULL){<br />
if($edges==NULL){<br />
$edges=&$this->topology["edges"];<br />
$this->distance["t"]=array();<br />
$mat_a=&$this->distance["t"];<br />
for($i=0;$in;$i++){<br />
$this->distance["g"][$i][$i]=0;<br />
$this->distance["v"][$i][$i]=array(1,1,1);<br />
for($j=$i+1;$jn;$j++){<br />
178
}else{<br />
}<br />
}<br />
$this->tmp_dist=array();<br />
$mat_a=&$this->tmp_dist;<br />
$this->distance["v"][$i][$j]=array(<br />
$this->geometry["x"][$i]-$this->geometry["x"][$j],<br />
$this->geometry["y"][$i]-$this->geometry["y"][$j],<br />
$this->geometry["z"][$i]-$this->geometry["z"][$j]<br />
);<br />
$this->distance["g"][$i][$j]=pow(pow($this->distance["v"][$i][$j][0],2)+<br />
pow($this->distance["v"][$i][$j][1],2)+pow($this->distance["v"][$i][$j][2],2),0.5);<br />
$this->distance["v"][$i][$j][0]/=$this->distance["g"][$i][$j];<br />
$this->distance["v"][$i][$j][1]/=$this->distance["g"][$i][$j];<br />
$this->distance["v"][$i][$j][2]/=$this->distance["g"][$i][$j];<br />
$this->distance["v"][$j][$i]=array(<br />
-$this->distance["v"][$i][$j][0],<br />
-$this->distance["v"][$i][$j][1],<br />
-$this->distance["v"][$i][$j][2],<br />
);<br />
$this->distance["g"][$j][$i]=$this->distance["g"][$i][$j];<br />
}<br />
for($i=0;$in;$i++){<br />
for($j=0;$jm+1;<br />
}<br />
$mat[$i][$i]=0;<br />
for($j=$i+1;$jn;$j++){<br />
$mat[$i][$j]=$this->m+1;<br />
}<br />
}<br />
foreach($edges as $i => &$v){<br />
foreach($edges[$i] as $j => &$v){<br />
$mat[$i][$edges[$i][$j]]=1;<br />
}<br />
}<br />
for($k=0;$kn;$k++){<br />
for($i=0;$in;$i++){<br />
for($j=0;$jn;$j++){<br />
if($mat[$i][$k]+$mat[$k][$j]adjcency=array();<br />
$mat_a=&$this->adjcency;<br />
for($i=0;$in;$i++){<br />
$mat[$i]=array_fill(0,$this->n,0);<br />
}<br />
foreach($this->topology["edges"] as $i => &$v){<br />
foreach($this->topology["edges"][$i] as $j => &$v){<br />
$mat[$i][$this->topology["edges"][$i][$j]]=1;<br />
}<br />
}<br />
$mat_a=$mat;<br />
}<br />
function create_fragments(){<br />
for($vi=0;$vin;$vi++){<br />
$this->tmp_edge=$this->topology["edges"];<br />
$this->tmp_edve_cut($vi);<br />
$this->create_matrix_distance($this->tmp_edge);<br />
$chek_list=array_keys($this->tmp_dist);<br />
$i=0;$n_i=$this->n;<br />
do{<br />
$fr[$i][0]=$chek_list[0];<br />
for($j=1;$jtmp_dist[$fr[$i][0]][$chek_list[$j]]m){<br />
$fr[$i][]=$chek_list[$j];<br />
unset($chek_list[$j]);<br />
}<br />
}<br />
unset($chek_list[0]);<br />
$n_i=count($chek_list);<br />
if(!$n_i)break;<br />
179
}<br />
$i++;<br />
$chek_list=array_values($chek_list);<br />
}while(1);<br />
//modified !!!!!!!!!!!!<br />
$n_i=count($fr);<br />
for($i=0;$ifragment[$vi]=array_values($fr);<br />
//modified !!!!!!!! from $this->fragment[$vi]=$fr;<br />
unset($this->tmp_edge);<br />
unset($this->tmp_dist);<br />
unset($fr);<br />
}<br />
function display_all_fragments_subgraphs(){<br />
$ret="";<br />
for($i=0;$in;$i++){<br />
$ret.="\{".$i."} -> ".$this->display_fragments($i," ","{}"," ","\r\n");<br />
$ret.=$this->display_subgraphs($i)."\r\n";<br />
}<br />
return $ret;<br />
}<br />
function display_all_fragments(){<br />
$ret="";<br />
for($i=0;$in;$i++){<br />
$ret.="\{".$i."} -> ".$this->display_fragments($i," ","{}"," ","\r\n");<br />
}<br />
return $ret;<br />
}<br />
function display_fragments($v,$s1,$s3,$s2,$s4){<br />
$n=count($this->fragment[$v]);<br />
for($i=0;$ifragment[$v][$i])==1)&&($v==$this->fragment[$v][$i][0])){<br />
$ret[]=" X ";<br />
$uns=$i;<br />
continue;<br />
}<br />
*/<br />
$ret[]=$s3[0].$this->display_a_fragment($v,$i,$s1).$s3[1];<br />
}<br />
//unset($this->fragment[$v][$uns]);<br />
//$this->fragment[$v]=array_values($this->fragment[$v]);<br />
return implo<strong>de</strong>($s2,$ret).$s4;<br />
}<br />
function display_a_fragment($v,$f,$s){<br />
return implo<strong>de</strong>($s,$this->fragment[$v][$f]);<br />
}<br />
function display_all_subgraphs(){<br />
$ret="";<br />
for($i=0;$in;$i++){<br />
$ret.=$this->display_subgraphs($i)."\r\n";<br />
}<br />
return $ret;<br />
}<br />
function display_subgraphs($v){<br />
$n=count($this->fragment[$v]);<br />
$ret="\{".$v."} -> ";<br />
for($i=0;$idisplay_a_subgraph($v,$i,"")." ";<br />
}<br />
return $ret;<br />
}<br />
function display_a_subgraph($v,$f,$s){<br />
$n=count($this->fragedge[$v][$f]);<br />
if($n==0){<br />
$vll="(".$s.")";<br />
}else{<br />
$vl=array();<br />
for($i=0;$ifragedge[$v][$f][$i]).")";<br />
}<br />
$vll=implo<strong>de</strong>(",",$vl);<br />
180
}<br />
}<br />
return "({".implo<strong>de</strong>(",",$this->fragment[$v][$f])."},{".$vll."})";<br />
}<br />
Procesarea informaţiei pentru perechi <strong>de</strong> atomi înzestraţi cu trăsăturile (proprietăţile) <strong>de</strong> mai sus ce<br />
referă aplicarea mo<strong>de</strong>lelor <strong>de</strong> interacţiune pentru perechi <strong>de</strong> atomi este realizată <strong>de</strong> funcţiile<br />
implementate în clasa class_<strong>de</strong>scriptor_2pairs.php; sunt implementate:<br />
÷ 2 mo<strong>de</strong>le <strong>de</strong> interacţiune pereche bazate exclusiv pe distanţa (geometrică sau topologică) între<br />
atomi (proporţionalitate directă şi respectiv reciprocă);<br />
÷ 8 mo<strong>de</strong>le <strong>de</strong> interacţiune pereche bazate exclusiv pe proprietatea atomică (geometrică sau<br />
topologică) între atomi (valenţă, masă atomică, sarcină electrică parţială, afinitate pentru<br />
electroni, punct <strong>de</strong> topire în stare fundamentală, număr <strong>de</strong> protoni situaţi în vecinătatea imediată<br />
în structură, numărul <strong>de</strong> legături cu heteroatomii învecinaţi);<br />
÷ 8 mo<strong>de</strong>le <strong>de</strong> interacţiune bazate pe forţa elastică;<br />
÷ 8 mo<strong>de</strong>le <strong>de</strong> interacţiune bazate pe energia unei forţe <strong>de</strong> natură elastică;<br />
÷ 8 mo<strong>de</strong>le <strong>de</strong> interacţiune ce caracterizează interacţiunea invers proporţională cu distanţa;<br />
÷ 8 mo<strong>de</strong>le <strong>de</strong> interacţiune ce caracterizează interacţiunea invers proporţională cu pătratul<br />
distanţei;<br />
÷ 8 mo<strong>de</strong>le <strong>de</strong> interacţiune ce caracterizează interacţiunea invers proporţională cu puterea a 3-a a<br />
distanţei;<br />
÷ 8 mo<strong>de</strong>le <strong>de</strong> interacţiune ce caracterizează interacţiunea invers proporţională cu puterea a 4-a a<br />
distanţei;<br />
function create_pd_<strong>de</strong>scriptor($n,$pp,$dd,&$p,&$d,&$e){<br />
for($i=0;$ip[$pp][$j],$d->d[$dd][$i][$j]);<br />
$e[$i][$j]=$pd->f;<br />
}<br />
}<br />
}<br />
class distance_object{<br />
function __construct(&$dst){<br />
$this->n=2;<br />
$this->d[0]=$dst["t"];<br />
$this->d[1]=$dst["g"];<br />
}<br />
}<br />
class versor_object_g{<br />
function __construct(&$dst){<br />
$this->v=$dst["v"];<br />
}<br />
function val($k,$i,$j){<br />
return $this->v[$i][$j][$k];<br />
}<br />
}<br />
class versor_object_t{<br />
function val($k,$i,$j){<br />
return 1;<br />
}<br />
}<br />
class property_object{<br />
function __construct(&$pro){<br />
$this->n=7;<br />
$this->p[0]=$pro["card"];//C<br />
$this->p[1]=$pro["prot"];//H<br />
$this->p[2]=$pro["mass"];//M<br />
$this->p[3]=$pro["elng"];//E<br />
$this->p[4]=$pro["char"];//Q<br />
$this->p[5]=$pro["melt"];//L<br />
$this->p[6]=$pro["elaf"];//A<br />
}<br />
}<br />
class <strong>de</strong>scriptor_pair{<br />
function __construct($p1,$p2,$d12){<br />
$this->n=58;<br />
//init distance<br />
181
$this->d12=$d12;<br />
$this->d12_0=$this->d12*$this->d12;<br />
if($this->d12)<br />
$this->d12_1=1.0/$this->d12;<br />
else<br />
$this->d12_1=(float)"INF";<br />
$this->d12_2=$this->d12_1*$this->d12_1;<br />
$this->d12_3=$this->d12_2*$this->d12_1;<br />
$this->d12_4=$this->d12_2*$this->d12_2;<br />
//init property<br />
$this->p1=$p1;<br />
$this->p2=$p2;<br />
$this->p12=$this->p1*$this->p2;<br />
$this->p12_2=pow($this->p12,0.5);<br />
//distance<br />
$this->f[0] =$this->d_J();<br />
$this->f[1] =$this->d_1_J();<br />
//property<br />
$this->f[2] =$this->d_O();<br />
if($this->p1) $this->f[3] =$this->d_1_O(); else $this->f[3]=(float)"INF";<br />
$this->f[4] =$this->d_P();<br />
if($this->p2) $this->f[5] =$this->d_1_P(); else $this->f[5]=(float)"INF";<br />
$this->f[6] =$this->d_Q();<br />
if($this->p12) $this->f[7] =$this->d_1_Q(); else $this->f[7]=(float)"INF";<br />
$this->f[8] =$this->d_R();<br />
if($this->p12_2) $this->f[9] =$this->d_1_R(); else $this->f[9]=(float)"INF";<br />
//elastic force<br />
$this->f[10] =$this->d_K();<br />
if($this->p1) $this->f[11] =$this->d_1_K(); else $this->f[11]=(float)"INF";<br />
$this->f[12] =$this->d_L();<br />
if($this->p2) $this->f[13] =$this->d_1_L(); else $this->f[13]=(float)"INF";<br />
$this->f[14] =$this->d_M();<br />
if($this->p12) $this->f[15] =$this->d_1_M(); else $this->f[15]=(float)"INF";<br />
$this->f[16] =$this->d_N();<br />
if($this->p12_2) $this->f[17] =$this->d_1_N(); else $this->f[17]=(float)"INF";<br />
//energy from elastic force<br />
$this->f[18] =$this->d_W();<br />
if($this->p1) $this->f[19] =$this->d_1_W(); else $this->f[19]=(float)"INF";<br />
$this->f[20] =$this->d_X();<br />
if($this->p2) $this->f[21] =$this->d_1_X(); else $this->f[21]=(float)"INF";<br />
$this->f[22] =$this->d_Y();<br />
if($this->p12) $this->f[23] =$this->d_1_Y(); else $this->f[23]=(float)"INF";<br />
$this->f[24] =$this->d_Z();<br />
if($this->p12_2) $this->f[25] =$this->d_1_Z(); else $this->f[25]=(float)"INF";<br />
//potential, field, force 1<br />
$this->f[26] =$this->d_S();<br />
if($this->p1) $this->f[27] =$this->d_1_S(); else $this->f[27]=(float)"INF";<br />
$this->f[28] =$this->d_T();<br />
if($this->p2) $this->f[29] =$this->d_1_T(); else $this->f[29]=(float)"INF";<br />
$this->f[30] =$this->d_U();<br />
if($this->p12) $this->f[31] =$this->d_1_U(); else $this->f[31]=(float)"INF";<br />
$this->f[32] =$this->d_V();<br />
if($this->p12_2) $this->f[33] =$this->d_1_V(); else $this->f[33]=(float)"INF";<br />
//potential, field, force 2<br />
$this->f[34] =$this->d_F();<br />
if($this->p1) $this->f[35] =$this->d_1_F(); else $this->f[35]=(float)"INF";<br />
$this->f[36] =$this->d_G();<br />
if($this->p2) $this->f[37] =$this->d_1_G(); else $this->f[37]=(float)"INF";<br />
$this->f[38] =$this->d_H();<br />
if($this->p12) $this->f[39] =$this->d_1_H(); else $this->f[39]=(float)"INF";<br />
$this->f[40] =$this->d_I();<br />
if($this->p12_2) $this->f[41] =$this->d_1_I(); else $this->f[41]=(float)"INF";<br />
//potential, field, force 3<br />
$this->f[42] =$this->d_A();<br />
if($this->p1) $this->f[43] =$this->d_1_A(); else $this->f[43]=(float)"INF";<br />
$this->f[44] =$this->d_B();<br />
if($this->p2) $this->f[45] =$this->d_1_B(); else $this->f[45]=(float)"INF";<br />
$this->f[46] =$this->d_C();<br />
if($this->p12) $this->f[47] =$this->d_1_C(); else $this->f[47]=(float)"INF";<br />
$this->f[48] =$this->d_D();<br />
if($this->p12_2) $this->f[49] =$this->d_1_D(); else $this->f[49]=(float)"INF";<br />
//potential, field, force 4<br />
$this->f[50] =$this->d_E_0();<br />
if($this->p1) $this->f[51] =$this->d_E_1(); else $this->f[51]=(float)"INF";<br />
$this->f[52] =$this->d_E_2();<br />
if($this->p2) $this->f[53] =$this->d_E_3(); else $this->f[53]=(float)"INF";<br />
$this->f[54] =$this->d_E_4();<br />
if($this->p12) $this->f[55] =$this->d_E_5(); else $this->f[55]=(float)"INF";<br />
$this->f[56] =$this->d_E_6();<br />
182
if($this->p12_2) $this->f[57] =$this->d_E_7(); else $this->f[57]=(float)"INF";<br />
unset($this->p1);<br />
unset($this->p2);<br />
unset($this->p12);<br />
unset($this->p12_2);<br />
unset($this->d12);<br />
unset($this->d12_0);<br />
unset($this->d12_1);<br />
unset($this->d12_2);<br />
unset($this->d12_3);<br />
unset($this->d12_4);<br />
}<br />
//distance<br />
function d_J(){ return $this->d12; }//J=D<br />
function d_1_J(){ return $this->d12_1; } //j=1/D<br />
//property<br />
function d_O(){ return $this->p1; } //O=P1<br />
function d_1_O(){ return 1.0/$this->p1; } //o=1/P1<br />
function d_P(){ return $this->p2; } //P=P2<br />
function d_1_P(){ return 1.0/$this->p2; } //p=1/P2<br />
function d_Q(){ return $this->p12; } //Q=P1P2<br />
function d_1_Q(){ return 1.0/$this->p12; } //q=1/P1P2<br />
function d_R(){ return $this->p12_2; } //R=sqrt(P1P2)<br />
function d_1_R(){ return 1.0/$this->p12_2; } //r=1/sqrt(P1P2)<br />
//elastic force<br />
function d_K(){ return $this->p1*$this->d12; } //K=P1D<br />
function d_1_K(){ return $this->d12/$this->p1; } //k=(1/P1)D<br />
function d_L(){ return $this->p2*$this->d12; } //L=P2D<br />
function d_1_L(){ return $this->d12/$this->p2; } //l=(1/P2)D<br />
function d_M(){ return $this->p12*$this->d12; } //M=P1P2D<br />
function d_1_M(){ return $this->d12/$this->p12; } //m=(1/P1P2)D<br />
function d_N(){ return $this->p12_2*$this->d12; } //N=sqrt(P1P2)D<br />
function d_1_N(){ return $this->d12/$this->p12_2; } //n=(1/sqrt(P1P2))D<br />
//energy from elastic force<br />
function d_W(){ return $this->p1*$this->d12_0; } //W=P1D2<br />
function d_1_W(){ return $this->d12_0/$this->p1; } //w=(1/P1)D2<br />
function d_X(){ return $this->p2*$this->d12_0; } //X=P2D2<br />
function d_1_X(){ return $this->d12_0/$this->p2; } //x=(1/P2)D2<br />
function d_Y(){ return $this->p12*$this->d12_0; } //Y=P1P2D2<br />
function d_1_Y(){ return $this->d12_0/$this->p12; } //y=(1/P1P2)D2<br />
function d_Z(){ return $this->p12_2*$this->d12_0; } //Z=sqrt(P1P2)D2<br />
function d_1_Z(){ return $this->d12_0/$this->p12_2; } //z=(1/sqrt(P1P2))D2<br />
//potential, field, force 1<br />
function d_S(){ return $this->p1*$this->d12_1; } //S=P1/D<br />
function d_1_S(){ return $this->d12_1/$this->p1; } //s=(1/P1)/D<br />
function d_T(){ return $this->p2*$this->d12_1; } //T=P2/D<br />
function d_1_T(){ return $this->d12_1/$this->p2; } //t=(1/P2)/D<br />
function d_U(){ return $this->p12*$this->d12_1; } //U=P1P2/D<br />
function d_1_U(){ return $this->d12_1/$this->p12; } //u=(1/P1P2)/D<br />
function d_V(){ return $this->p12_2*$this->d12_1; } //V=sqrt(P1P2)/D<br />
function d_1_V(){ return $this->d12_1/$this->p12_2; } //v=(1/sqrt(P1P2))/D<br />
//potential, field, force 2<br />
function d_F(){ return $this->p1*$this->d12_2; } //F=P1/D2<br />
function d_1_F(){ return $this->d12_2/$this->p1; } //f=(1/P1)/D2<br />
function d_G(){ return $this->p2*$this->d12_2; } //G=P2/D2<br />
function d_1_G(){ return $this->d12_2/$this->p2; } //g=(1/P2)/D2<br />
function d_H(){ return $this->p12*$this->d12_2; } //H=P1P2/D2<br />
function d_1_H(){ return $this->d12_2/$this->p12; } //h=(1/P1P2)/D2<br />
function d_I(){ return $this->p12_2*$this->d12_2; } //I=sqrt(P1P2)/D2<br />
function d_1_I(){ return $this->d12_2/$this->p12_2; } //i=(1/sqrt(P1P2))/D2<br />
//potential, field, force 3<br />
function d_A(){ return $this->p1*$this->d12_3; } //A=P1/D3<br />
function d_1_A(){ return $this->d12_3/$this->p1; } //a=(1/P1)/D3<br />
function d_B(){ return $this->p2*$this->d12_3; } //B=P2/D3<br />
function d_1_B(){ return $this->d12_3/$this->p2; } //b=(1/P2)/D3<br />
function d_C(){ return $this->p12*$this->d12_3; } //C=P1P2/D3<br />
function d_1_C(){ return $this->d12_3/$this->p12; } //c=(1/P1P2)/D3<br />
function d_D(){ return $this->p12_2*$this->d12_3; } //D=sqrt(P1P2)/D3<br />
function d_1_D(){ return $this->d12_3/$this->p12_2; } //d=(1/sqrt(P1P2))/D3<br />
//potential, field, force 4<br />
function d_E_0(){ return $this->p1*$this->d12_4; } //0=P1/D4<br />
function d_E_1(){ return $this->d12_4/$this->p1; } //1=(1/P1)/D4<br />
function d_E_2(){ return $this->p2*$this->d12_4; } //2=P2/D4<br />
function d_E_3(){ return $this->d12_4/$this->p2; } //3=(1/P2)/D4<br />
function d_E_4(){ return $this->p12*$this->d12_4; } //4=P1P2/D4<br />
function d_E_5(){ return $this->d12_4/$this->p12; } //5=(1/P1P2)/D4<br />
function d_E_6(){ return $this->p12_2*$this->d12_4; } //6=sqrt(P1P2)/D4<br />
function d_E_7(){ return $this->d12_4/$this->p12_2; } //7=(1/sqrt(P1P2))/D4<br />
183
}<br />
Procesarea informaţiei <strong>de</strong> interacţiune la nivelul fragmentului molecular este realizată prin<br />
suprapunerea interacţiunilor pereche obţinute anterior folosind o serie <strong>de</strong> mo<strong>de</strong>le <strong>de</strong> suprapunere a<br />
interacţiunilor; funcţiile implementate în clasa class_<strong>de</strong>scriptor_3fragm.php implementează:<br />
÷ 2 tipuri <strong>de</strong> suprapuneri vectoriale folosind drept reper sistemul <strong>de</strong> coordonate <strong>de</strong> referinţă al<br />
moleculei (suprapuneri scalare pe proiecţiile axiale ale sistemului <strong>de</strong> coordonate folosit);<br />
÷ 2 tipuri <strong>de</strong> suprapuneri vectoriale folosind drept reper un sistem <strong>de</strong> coordonate local al<br />
fragmentului - calculat ca centru <strong>de</strong> proprietate - (suprapuneri scalare pe proiecţiile axiale ale<br />
sistemului <strong>de</strong> coordonate folosit);<br />
÷ 2 tipuri <strong>de</strong> suprapuneri scalare (ignorând orientarea vectorială şi folosind valoarea absolută) -<br />
interacţiune <strong>de</strong> tip potenţial;<br />
÷ 2 tipuri <strong>de</strong> selecţii ale valorilor maxime <strong>de</strong> interacţiune dintre interacţiunile existente în<br />
fragment între perechi <strong>de</strong> atomi;<br />
÷ 2 tipuri <strong>de</strong> selecţii ale valorilor minime <strong>de</strong> interacţiune dintre interacţiunile existente în fragment<br />
între perechi <strong>de</strong> atomi;<br />
class <strong>de</strong>scriptor_fragment{<br />
//versori<br />
//<strong>de</strong>scriptori <strong>de</strong> proprietate -> 1 proprietate, 1 distanta, 1 <strong>de</strong>scriptor<br />
//un fragment -> un fragment & un varf<br />
//->meto<strong>de</strong> <strong>de</strong> suprapunere<br />
function __construct($vx){<br />
$this->v=$vx;<br />
$this->n=10;<br />
$this->f=array();<br />
}<br />
function calculate($e,&$fr,&$s,&$v){<br />
$this->spp_fr_field($e,$fr,$s,$v,0);/*f*/<br />
$this->spp_vx_field($e,$fr,$s,$v,1);/*F*/<br />
$this->spp_fr_prcen($e,$fr,$s,$v,2);/*c*/<br />
$this->spp_vx_prcen($e,$fr,$s,$v,3);/*C*/<br />
$this->spp_fr_poten($e,$fr,$s,$v,4);/*p*/<br />
$this->spp_vx_poten($e,$fr,$s,$v,5);/*P*/<br />
$this->spp_fr_maxfr($e,$fr,$s,$v,6);/*a*/<br />
$this->spp_vx_maxvx($e,$fr,$s,$v,7);/*A*/<br />
$this->spp_fr_minfr($e,$fr,$s,$v,8);/*i*/<br />
$this->spp_vx_minvx($e,$fr,$s,$v,9);/*I*/<br />
}<br />
function spp_fr_field($e,&$fr,&$s,&$v,$a){<br />
//suprapune proiectii axiale<br />
//interactii in fragment, in<strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> varf<br />
$this->n=count($fr);<br />
$fr_f_x=0.0;<br />
$fr_f_y=0.0;<br />
$fr_f_z=0.0;<br />
for($i=0;$in-1;$i++){<br />
for($j=$i+1;$jn;$j++){<br />
$val=$s[$fr[$i]][$fr[$j]][$e];<br />
$fr_f_x+=$val*abs($v->val(0,$fr[$i],$fr[$j]));<br />
$fr_f_y+=$val*abs($v->val(1,$fr[$i],$fr[$j]));<br />
$fr_f_z+=$val*abs($v->val(2,$fr[$i],$fr[$j]));<br />
}<br />
}<br />
$fr_f_t=pow(pow($fr_f_x,2)+pow($fr_f_y,2)+pow($fr_f_z,2),0.5);<br />
if(!$fr_f_t) $fr_f_t=1.0;<br />
$fr_f_x/=$fr_f_t;<br />
$fr_f_y/=$fr_f_t;<br />
$fr_f_z/=$fr_f_t;<br />
$this->f[$a]=array($fr_f_t,$fr_f_x,$fr_f_y,$fr_f_z);<br />
}<br />
function spp_vx_field($e,&$fr,&$s,&$v,$a){<br />
//suprapune proiectii axiale<br />
//interactii ale fragmentului cu varful<br />
$fr_f_x=0.0;<br />
$fr_f_y=0.0;<br />
$fr_f_z=0.0;<br />
for($i=0;$in;$i++){<br />
$val=$s[$this->v][$fr[$i]][$e];<br />
$fr_f_x+=$val*$v->val(0,$this->v,$fr[$i]);<br />
$fr_f_y+=$val*$v->val(1,$this->v,$fr[$i]);<br />
$fr_f_z+=$val*$v->val(2,$this->v,$fr[$i]);<br />
}<br />
184
$fr_f_t=pow(pow($fr_f_x,2)+pow($fr_f_y,2)+pow($fr_f_z,2),0.5);<br />
if(!$fr_f_t) $fr_f_t=1.0;<br />
$fr_f_x/=$fr_f_t;<br />
$fr_f_y/=$fr_f_t;<br />
$fr_f_z/=$fr_f_t;<br />
$this->f[$a]=array($fr_f_t,$fr_f_x,$fr_f_y,$fr_f_z);<br />
}<br />
function spp_fr_prcen($e,&$fr,&$s,&$v,$a){<br />
//calculeaza centru <strong>de</strong> <strong>de</strong>scriptor<br />
$fr_f_t=0.0;<br />
$fr_f_x=0.0;<br />
$fr_f_y=0.0;<br />
$fr_f_z=0.0;<br />
for($i=0;$in-1;$i++){<br />
for($j=$i+1;$jn;$j++){<br />
$val=$s[$fr[$i]][$fr[$j]][$e];<br />
$fr_f_t+=$val;<br />
$fr_f_x+=$val*abs($v->val(0,$fr[$i],$fr[$j]));<br />
$fr_f_y+=$val*abs($v->val(1,$fr[$i],$fr[$j]));<br />
$fr_f_z+=$val*abs($v->val(2,$fr[$i],$fr[$j]));<br />
}<br />
}<br />
if(!$fr_f_t) $fr_f_t=1.0;<br />
$fr_f_x/=$fr_f_t;<br />
$fr_f_y/=$fr_f_t;<br />
$fr_f_z/=$fr_f_t;<br />
$this->f[$a]=array($fr_f_t,$fr_f_x,$fr_f_y,$fr_f_z);<br />
}<br />
function spp_vx_prcen($e,&$fr,&$s,&$v,$a){<br />
//calculeaza centru <strong>de</strong> <strong>de</strong>scriptor<br />
$fr_f_t=0.0;<br />
$fr_f_x=0.0;<br />
$fr_f_y=0.0;<br />
$fr_f_z=0.0;<br />
for($i=0;$in;$i++){<br />
$val=$s[$this->v][$fr[$i]][$e];<br />
$fr_f_t+=$val;<br />
$fr_f_x+=$val*$v->val(0,$this->v,$fr[$i]);<br />
$fr_f_y+=$val*$v->val(1,$this->v,$fr[$i]);<br />
$fr_f_z+=$val*$v->val(2,$this->v,$fr[$i]);<br />
}<br />
if(!$fr_f_t) $fr_f_t=1.0;<br />
$fr_f_x/=$fr_f_t;<br />
$fr_f_y/=$fr_f_t;<br />
$fr_f_z/=$fr_f_t;<br />
$this->f[$a]=array($fr_f_t,$fr_f_x,$fr_f_y,$fr_f_z);<br />
}<br />
function spp_fr_poten($e,&$fr,&$s,&$v,$a){<br />
//mediaza versori & suprapune valori <strong>de</strong>scriptori<br />
$fr_f_t=0.0;<br />
$fr_f_x=0.0;<br />
$fr_f_y=0.0;<br />
$fr_f_z=0.0;<br />
for($i=0;$in-1;$i++){<br />
for($j=$i+1;$jn;$j++){<br />
$val=$s[$fr[$i]][$fr[$j]][$e];<br />
$fr_f_t+=$val;<br />
$fr_f_x+=abs($v->val(0,$fr[$i],$fr[$j]));<br />
$fr_f_y+=abs($v->val(1,$fr[$i],$fr[$j]));<br />
$fr_f_z+=abs($v->val(2,$fr[$i],$fr[$j]));<br />
}<br />
}<br />
if($this->nf[$a]=array(0.0,0.0,0.0,0.0);<br />
}else{<br />
$val=$this->n*($this->n-1)/2;<br />
$fr_f_x/=$val;<br />
$fr_f_y/=$val;<br />
$fr_f_z/=$val;<br />
$this->f[$a]=array($fr_f_t,$fr_f_x,$fr_f_y,$fr_f_z);<br />
}<br />
}<br />
function spp_vx_poten($e,&$fr,&$s,&$v,$a){<br />
//mediaza versori & suprapune valori <strong>de</strong>scriptori<br />
$fr_f_t=0.0;<br />
$fr_f_x=0.0;<br />
$fr_f_y=0.0;<br />
$fr_f_z=0.0;<br />
for($i=0;$in;$i++){<br />
185
$val=$s[$this->v][$fr[$i]][$e];<br />
$fr_f_t+=$val;<br />
$fr_f_x+=$v->val(0,$this->v,$fr[$i]);<br />
$fr_f_y+=$v->val(1,$this->v,$fr[$i]);<br />
$fr_f_z+=$v->val(2,$this->v,$fr[$i]);<br />
}<br />
$fr_f_x/=$this->n;<br />
$fr_f_y/=$this->n;<br />
$fr_f_z/=$this->n;<br />
$this->f[$a]=array($fr_f_t,$fr_f_x,$fr_f_y,$fr_f_z);<br />
}<br />
function spp_fr_maxfr($e,&$fr,&$s,&$v,$a){<br />
//maxim valori <strong>de</strong>scriptori<br />
$ret=array(0.0,0.0,0.0,0.0);<br />
for($i=0;$in-1;$i++){<br />
for($j=$i+1;$jn;$j++){<br />
$val=$s[$fr[$i]][$fr[$j]][$e];<br />
if($val>$ret[0]){<br />
$ret[0]=$val;<br />
$ret[1]=abs($v->val(0,$fr[$i],$fr[$j]));<br />
$ret[2]=abs($v->val(1,$fr[$i],$fr[$j]));<br />
$ret[3]=abs($v->val(2,$fr[$i],$fr[$j]));<br />
}<br />
}<br />
}<br />
$this->f[$a]=$ret;<br />
}<br />
function spp_vx_maxvx($e,&$fr,&$s,&$v,$a){<br />
//maxim valori <strong>de</strong>scriptori<br />
$ret=array(0.0,0.0,0.0,0.0);<br />
for($i=0;$in;$i++){<br />
$val=$s[$this->v][$fr[$i]][$e];<br />
if($val>$ret[0]){<br />
$ret[0]=$val;<br />
$ret[1]=abs($v->val(0,$this->v,$fr[$i]));<br />
$ret[2]=abs($v->val(1,$this->v,$fr[$i]));<br />
$ret[3]=abs($v->val(2,$this->v,$fr[$i]));<br />
}<br />
}<br />
$this->f[$a]=$ret;<br />
}<br />
function spp_fr_minfr($e,&$fr,&$s,&$v,$a){<br />
//minim valori <strong>de</strong>scriptori<br />
if($this->nf[$a]=array(0.0,0.0,0.0,0.0);<br />
return;<br />
}else{<br />
$ret[0]=$s[$fr[0]][$fr[1]][$e];<br />
$ret[1]=abs($v->val(0,$fr[0],$fr[1]));<br />
$ret[2]=abs($v->val(1,$fr[0],$fr[1]));<br />
$ret[3]=abs($v->val(2,$fr[0],$fr[1]));<br />
for($i=0;$in-1;$i++){<br />
for($j=$i+1;$jn;$j++){<br />
$val=$s[$fr[$i]][$fr[$j]][$e];<br />
if($valval(0,$fr[$i],$fr[$j]));<br />
$ret[2]=abs($v->val(1,$fr[$i],$fr[$j]));<br />
$ret[3]=abs($v->val(2,$fr[$i],$fr[$j]));<br />
}<br />
}<br />
}<br />
}<br />
$this->f[$a]=$ret;<br />
}<br />
function spp_vx_minvx($e,&$fr,&$s,&$v,$a){<br />
//minim valori <strong>de</strong>scriptori<br />
$ret[0]=$s[$this->v][$fr[0]][$e];<br />
$ret[1]=abs($v->val(0,$this->v,$fr[0]));<br />
$ret[2]=abs($v->val(1,$this->v,$fr[0]));<br />
$ret[3]=abs($v->val(2,$this->v,$fr[0]));<br />
for($i=1;$in;$i++){<br />
$val=$s[$this->v][$fr[$i]][$e];<br />
if($valval(0,$this->v,$fr[$i]));<br />
$ret[2]=abs($v->val(1,$this->v,$fr[$i]));<br />
$ret[3]=abs($v->val(2,$this->v,$fr[$i]));<br />
}<br />
186
}<br />
}<br />
$this->f[$a]=$ret;<br />
}<br />
Interacţiunile din interiorul unui fragment se cumulează la nivel <strong>de</strong> atom pentru toate fragmentele ce<br />
rezultă prin <strong>de</strong>localizarea atomului consi<strong>de</strong>rat din structura moleculară; suprapunerile la acest nivel<br />
sunt realizate <strong>de</strong> funcţiile implementate în clasa class_<strong>de</strong>scriptor_4vertx.php; la acest nivel au loc<br />
din nou suprapuneri <strong>de</strong> acelaşi tip (dar distincte ca modalitate <strong>de</strong> calcul) ca cele <strong>de</strong> la pasul anterior,<br />
şi anume:<br />
÷ 2 tipuri <strong>de</strong> suprapuneri vectoriale folosind drept reper sistemul <strong>de</strong> coordonate <strong>de</strong> referinţă al<br />
moleculei (suprapuneri scalare pe proiecţiile axiale ale sistemului <strong>de</strong> coordonate folosit);<br />
÷ 2 tipuri <strong>de</strong> suprapuneri vectoriale folosind drept reper un sistem <strong>de</strong> coordonate local al atomului<br />
- calculat ca centru <strong>de</strong> proprietate - (suprapuneri scalare pe proiecţiile axiale ale sistemului <strong>de</strong><br />
coordonate folosit);<br />
÷ 2 tipuri <strong>de</strong> suprapuneri scalare (ignorând orientarea vectorială şi folosind valoarea absolută) -<br />
interacţiune <strong>de</strong> tip potenţial;<br />
÷ 2 tipuri <strong>de</strong> selecţii ale valorilor maxime <strong>de</strong> interacţiune dintre interacţiunile existente în<br />
fragmentele atomului;<br />
÷ 2 tipuri <strong>de</strong> selecţii ale valorilor minime <strong>de</strong> interacţiune dintre interacţiunile existente în<br />
fragmentele atomului;<br />
class <strong>de</strong>scriptor_vertex{<br />
function __construct($e,$vx,&$fr,&$s,&$v){<br />
$this->v=$vx;<br />
$this->n=count($fr);<br />
$local = new <strong>de</strong>scriptor_fragment($vx);<br />
$this->m=$local->n;<br />
for($i=0;$in;$i++){<br />
$local->calculate($e,$fr[$i],$s,$v);<br />
$this->d[$i]=$local->f;<br />
}<br />
}<br />
function calculate(){<br />
$this->superposing_max_0(0);//A<br />
$this->superposing_max_1(1);//a<br />
$this->superposing_min_0(2);//I<br />
$this->superposing_min_1(3);//i<br />
$this->superposing_field(4);//F<br />
$this->superposing_poten(5);//P<br />
$this->superposing_centr(6);//C<br />
unset($this->d);<br />
$this->n=7;<br />
}<br />
function superposing_max_0($r){//A<br />
$ret=$this->d[0];<br />
for($i=1;$in;$i++){<br />
for($j=0;$jm;$j++){//fFcCpP<br />
if($ret[$j][0]d[$i][$j][0]) $ret[$j]=$this->d[$i][$j];<br />
}<br />
}<br />
$this->f[$r]=$ret;<br />
}<br />
function superposing_min_0($r){//a<br />
$ret=$this->d[0];<br />
for($i=1;$in;$i++){<br />
for($j=0;$jm;$j++){//fFcCpP<br />
if($ret[$j][0]>$this->d[$i][$j][0]) $ret[$j]=$this->d[$i][$j];<br />
}<br />
}<br />
$this->f[$r]=$ret;<br />
}<br />
function superposing_max_1($r){//I<br />
$ret=$this->d[0];<br />
$retv=pow($ret[1],2)+pow($ret[2],2)+pow($ret[3],2);<br />
for($i=1;$in;$i++){<br />
for($j=0;$jm;$j++){//fFcCpP<br />
$dv=pow($this->d[$i][$j][1],2)+pow($this->d[$i][$j][2],2)+pow($this->d[$i][$j][3],2);<br />
if($retvd[$i][$j];<br />
$retv=$dv;<br />
}<br />
187
}<br />
}<br />
$this->f[$r]=$ret;<br />
}<br />
function superposing_min_1($r){//i<br />
$ret=$this->d[0];<br />
$retv=pow($ret[1],2)+pow($ret[2],2)+pow($ret[3],2);<br />
for($i=1;$in;$i++){<br />
for($j=0;$jm;$j++){//fFcCpP<br />
$dv=pow($this->d[$i][$j][1],2)+pow($this->d[$i][$j][2],2)+pow($this->d[$i][$j][3],2);<br />
if($retv>$dv){<br />
$ret[$j]=$this->d[$i][$j];<br />
$retv=$dv;<br />
}<br />
}<br />
}<br />
$this->f[$r]=$ret;<br />
}<br />
function superposing_field($r){//F<br />
for($j=0;$jm;$j++){<br />
$ret[$j]=array(0.0,0.0,0.0,0.0);<br />
}<br />
for($i=0;$in;$i++){<br />
for($j=0;$jm;$j++){//fFcCpP<br />
$ret[$j][1]+=$this->d[$i][$j][0]*$this->d[$i][$j][1];<br />
$ret[$j][2]+=$this->d[$i][$j][0]*$this->d[$i][$j][2];<br />
$ret[$j][3]+=$this->d[$i][$j][0]*$this->d[$i][$j][3];<br />
}<br />
}<br />
for($j=0;$jm;$j++){<br />
$ret[$j][0]=pow(pow($ret[$j][1],2)+pow($ret[$j][2],2)+pow($ret[$j][3],2),0.5);<br />
}<br />
$this->f[$r]=$ret;<br />
}<br />
function superposing_poten($r){//P<br />
for($j=0;$jm;$j++){<br />
$ret[$j]=array(0.0,0.0,0.0,0.0);<br />
}<br />
for($i=0;$in;$i++){<br />
for($j=0;$jm;$j++){//fFcCpP<br />
for($k=0;$kd[$i][$j][$k];<br />
}<br />
}<br />
}<br />
$this->f[$r]=$ret;<br />
}<br />
function superposing_centr($r){//C<br />
for($j=0;$jm;$j++){<br />
$ret[$j]=array(0.0,0.0,0.0,0.0);<br />
}<br />
for($i=0;$in;$i++){<br />
for($j=0;$jm;$j++){//fFcCpP<br />
$ret[$j][0]+=$this->d[$i][$j][0];<br />
for($k=1;$kd[$i][$j][$k]);<br />
}<br />
}<br />
}<br />
$this->f[$r]=$ret;<br />
}<br />
}<br />
Interacţiunile din interiorul unei molecule se cumulează <strong>de</strong> la nivel <strong>de</strong> atom; suprapunerile la acest<br />
nivel sunt realizate <strong>de</strong> funcţiile implementate în clasa class_<strong>de</strong>scriptor_5molec.php; la acest nivel<br />
au loc din nou suprapuneri <strong>de</strong> acelaşi tip (dar distincte ca modalitate <strong>de</strong> calcul) ca cele <strong>de</strong> la ultimii<br />
doi paşi realizaţi anterior, şi anume:<br />
÷ 2 tipuri <strong>de</strong> suprapuneri vectoriale folosind drept reper sistemul <strong>de</strong> coordonate <strong>de</strong> referinţă al<br />
moleculei (suprapuneri scalare pe proiecţiile axiale ale sistemului <strong>de</strong> coordonate folosit);<br />
÷ 2 tipuri <strong>de</strong> suprapuneri vectoriale folosind drept reper un sistem <strong>de</strong> coordonate local al<br />
moleculei - calculat ca centru <strong>de</strong> proprietate - (suprapuneri scalare pe proiecţiile axiale ale<br />
sistemului <strong>de</strong> coordonate folosit);<br />
÷ 2 tipuri <strong>de</strong> suprapuneri scalare (ignorând orientarea vectorială şi folosind valoarea absolută) -<br />
interacţiune <strong>de</strong> tip potenţial;<br />
188
÷ 2 tipuri <strong>de</strong> selecţii ale valorilor maxime <strong>de</strong> interacţiune dintre interacţiunile existente în atomii<br />
moleculei;<br />
÷ 2 tipuri <strong>de</strong> selecţii ale valorilor minime <strong>de</strong> interacţiune dintre interacţiunile existente în atomii<br />
moleculei;<br />
class <strong>de</strong>scriptor_molecule{<br />
function __construct($e,&$fr,&$s,&$v){<br />
$this->n=count($fr);<br />
for($i=0;$in;$i++){<br />
$local = new <strong>de</strong>scriptor_vertex($e,$i,$fr[$i],$s,$v);<br />
$local->calculate();<br />
$this->m=$local->n;<br />
$this->p=$local->m;<br />
$this->d[$i]=$local->f;<br />
}<br />
}<br />
function calculate(){<br />
$this->superposing_max_0(0);//A<br />
$this->superposing_max_1(1);//a<br />
$this->superposing_min_0(2);//I<br />
$this->superposing_min_1(3);//i<br />
$this->superposing_field(4);//F<br />
$this->superposing_poten(5);//P<br />
$this->superposing_centr(6);//C<br />
unset($this->d);<br />
}<br />
function sprint(&$contor,&$mol/*$fp*/){//$s $md="AaIiFPC" $vd="AaIiFPC" $fd="fFcCpPaAiI"<br />
$m=count($this->f);<br />
$n=count($this->f[0]);<br />
$p=count($this->f[0][0]);<br />
for($i=0;$iformats($md[$i])."\r\n");//$s.$sd[$i]."I"<br />
if($md[$i]){<br />
$contor++;<br />
$q=mysql_query("UPDATE `".setd."_mdfv` SET `".$mol."` = '".$this->formats(1.00/$md[$i])."' WHERE `id`='".$contor."'");<br />
$contor++;<br />
$q=mysql_query("UPDATE `".setd."_mdfv` SET `".$mol."` = '".$this->formats(log($md[$i]))."' WHERE `id`='".$contor."'");<br />
//fputs($fp,$this->formats(1.00/$md[$i])."\r\n");//$s.$sd[$i]."R"<br />
//fputs($fp,$this->formats(log($md[$i]))."\r\n");//$s.$sd[$i]."L"<br />
}else{<br />
$contor++;<br />
$q=mysql_query("UPDATE `".setd."_mdfv` SET `".$mol."` = 'INF' WHERE `id`='".$contor."'");<br />
$contor++;<br />
$q=mysql_query("UPDATE `".setd."_mdfv` SET `".$mol."` = 'INF' WHERE `id`='".$contor."'");<br />
//fputs($fp,"INF\r\n");//$s.$sd[$i]."R"<br />
//fputs($fp,"INF\r\n");//$s.$sd[$i]."L"<br />
}<br />
//////////////////////////<br />
}<br />
}<br />
function formats($value){<br />
$prec=4;<br />
if(!is_finite($value))<br />
return (float)"INF";<br />
$nr_cifre=round(log(abs($value),10));<br />
$value*=pow(10,-$nr_cifre);<br />
$value=sprintf("%.".$prec."f",$value);<br />
$value*=pow(10,$nr_cifre);<br />
return $value;<br />
}<br />
function superposing_max_0($r){//A<br />
$ret=$this->d[0];<br />
189
for($i=1;$in;$i++){//vertices<br />
for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />
for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />
if($ret[$j][$k][0]d[$i][$j][$k][0])<br />
$ret[$j][$k]=$this->d[$i][$j][$k];<br />
}<br />
}<br />
}<br />
$this->f[$r]=$ret;<br />
}<br />
function superposing_min_0($r){//a<br />
$ret=$this->d[0];<br />
for($i=1;$in;$i++){//vertices<br />
for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />
for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />
if($ret[$j][$k][0]>$this->d[$i][$j][$k][0])<br />
$ret[$j][$k]=$this->d[$i][$j][$k];<br />
}<br />
}<br />
}<br />
$this->f[$r]=$ret;<br />
}<br />
function superposing_max_1($r){//I<br />
$ret=$this->d[0];<br />
$retv=pow($ret[0][0][1],2)+pow($ret[0][0][2],2)+pow($ret[0][0][3],2);<br />
for($i=1;$in;$i++){//vertices<br />
for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />
for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />
$dv=pow($this->d[$i][$j][$k][1],2)+pow($this->d[$i][$j][$k][2],2)+pow($this->d[$i][$j][$k][3],2);<br />
if($retvd[$i][$j][$k];<br />
$retv=$dv;<br />
}<br />
}<br />
}<br />
}<br />
$this->f[$r]=$ret;<br />
}<br />
function superposing_min_1($r){//i<br />
$ret=$this->d[0];<br />
$retv=pow($ret[0][0][1],2)+pow($ret[0][0][2],2)+pow($ret[0][0][3],2);<br />
for($i=1;$in;$i++){//vertices<br />
for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />
for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />
$dv=pow($this->d[$i][$j][$k][1],2)+pow($this->d[$i][$j][$k][2],2)+pow($this->d[$i][$j][$k][3],2);<br />
if($retv>$dv){<br />
$ret[$j][$k]=$this->d[$i][$j][$k];<br />
$retv=$dv;<br />
}<br />
}<br />
}<br />
}<br />
$this->f[$r]=$ret;<br />
}<br />
function superposing_field($r){//F<br />
for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />
for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />
$ret[$j][$k]=array(0.0,0.0,0.0,0.0);<br />
}<br />
}<br />
for($i=0;$in;$i++){//vertices<br />
for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />
for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />
$ret[$j][$k][1]+=$this->d[$i][$j][$k][0]*$this->d[$i][$j][$k][1];<br />
$ret[$j][$k][2]+=$this->d[$i][$j][$k][0]*$this->d[$i][$j][$k][2];<br />
$ret[$j][$k][3]+=$this->d[$i][$j][$k][0]*$this->d[$i][$j][$k][3];<br />
}<br />
}<br />
}<br />
for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />
for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />
$ret[$j][$k][0]=pow(pow($ret[$j][$k][1],2)+pow($ret[$j][$k][2],2)+pow($ret[$j][$k][3],2),0.5);<br />
}<br />
}<br />
$this->f[$r]=$ret;<br />
}<br />
function superposing_poten($r){//P<br />
for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />
for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />
190
}<br />
$ret[$j][$k]=array(0.0,0.0,0.0,0.0);<br />
}<br />
for($i=0;$in;$i++){//vertices<br />
for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />
for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />
for($l=0;$ld[$i][$j][$k][$l];<br />
}<br />
}<br />
}<br />
}<br />
$this->f[$r]=$ret;<br />
}<br />
function superposing_centr($r){//C<br />
for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />
for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />
$ret[$j][$k]=array(0.0,0.0,0.0,0.0);<br />
}<br />
}<br />
for($i=0;$in;$i++){//vertices<br />
for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />
for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />
$ret[$j][$k][0]+=$this->d[$i][$j][$k][0];<br />
for($l=1;$ld[$i][$j][$k][$l]);<br />
}<br />
}<br />
}<br />
}<br />
$this->f[$r]=$ret;<br />
}<br />
}<br />
În final, trei tipuri <strong>de</strong> linearizări reprezintă alternative <strong>de</strong> calcul, care însă datorită simplităţii<br />
(directă, reciprocă, logaritm) nu au mai necesitat <strong>de</strong>finirea şi implementarea unei clase în acest sens,<br />
fiind calculate după construcţia efectivă a fiecărui <strong>de</strong>scriptor molecular pe calea <strong>de</strong>scrisă mai sus şi<br />
fiind apoi stocate în baza <strong>de</strong> date (tabela <strong>de</strong> set cu terminaţia _mdfv).<br />
O serie <strong>de</strong> 8 aplicaţii procesează informaţia moleculară şi materializează familia <strong>de</strong> <strong>de</strong>scriptori<br />
pentru un set <strong>de</strong> molecule; aplicaţiile realizate sunt <strong>de</strong>scrise în continuare.<br />
0_mdfv_set_<strong>de</strong>f.php - iniţializează variabilele <strong>de</strong> mediu pentru realizarea conexiunii la baza <strong>de</strong> date<br />
şi iniţializează variabila ce <strong>de</strong>fineşte setul supus investigaţiei.<br />
<strong>de</strong>fine("host","172.27.211.5");<br />
<strong>de</strong>fine("user","XXXX");<br />
<strong>de</strong>fine("pass","YYYY");<br />
<strong>de</strong>fine("mdfv","MDFV");<br />
<strong>de</strong>fine("setd","taxoids");<br />
$c=@mysql_connect(host,user,pass);<br />
if($c===FALSE){<br />
echo("Host, User, or Pass Wrong and/or Not avaliable.\r\n");<br />
echo("Application cannot continue.\r\n");<br />
return(FALSE);<br />
}<br />
$q=@mysql_query("USE `".mdfv."`");<br />
if($q===FALSE){<br />
echo("Database ".mdfv." inexistent or not granted.\r\n");<br />
echo("Application cannot continue.\r\n");<br />
return(FALSE);<br />
}<br />
return FALSE;<br />
1_mdfv_set_init.php - materializează şablonul (macheta) structurii tabelelor <strong>de</strong> date (_data), pentru<br />
<strong>de</strong>scriptorii <strong>de</strong> structură (_mdfv), pentru activităţile experimentale observate (_prop) şi pentru<br />
relaţiile structură-activitate ce urmează a fi obţinute; alocă spaţiu în baza <strong>de</strong> date pentru <strong>de</strong>scriptorii<br />
<strong>de</strong> structură ce urmează a fi calculaţi.<br />
$test=@inclu<strong>de</strong>("0_mdfv_set_<strong>de</strong>f.php");<br />
if($test===FALSE){<br />
echo("Missing important <strong>de</strong>finitions for MDFV (0_mdfv_set_<strong>de</strong>f.php).\r\n");<br />
echo("Application cannot continue.\r\n");<br />
return(FALSE);<br />
}<br />
if(<strong>de</strong>fined("setd")===FALSE){<br />
echo("Constant 'setd' un<strong>de</strong>fined. Application cannot continue.\r\n");<br />
return(FALSE);<br />
191
}<br />
$query="SHOW TABLES FROM `".mdfv."` LIKE '_mdfv'";<br />
$q=@mysql_query($query);<br />
if(!$q){<br />
echo($query." :ERROR!\r\n");<br />
return(FALSE);<br />
}<br />
$n=mysql_num_rows($q);<br />
mysql_free_result($q);<br />
if($n==0){<br />
echo("Table `_mdfv` must be created!\r\n");<br />
$query="CREATE TABLE `_mdfv` (`id` BIGINT NOT NULL AUTO_INCREMENT, `name` VARCHAR(8) NOT NULL, PRIMARY<br />
KEY(`id`))";<br />
$q=@mysql_query($query);<br />
if(!$q){<br />
echo($query." :ERROR!\r\n");<br />
return(FALSE);<br />
}<br />
$test=@inclu<strong>de</strong>("class_<strong>de</strong>scriptor_0names.php");<br />
if($test===FALSE){<br />
echo("Missing important <strong>de</strong>finitions for MDFV (class_<strong>de</strong>scriptor_0names.php).\r\n");<br />
echo("Application cannot continue.\r\n");<br />
return(FALSE);<br />
}<br />
$f = new <strong>de</strong>scriptor_names();<br />
$f->sprint();<br />
unset($f);<br />
//return(FALSE);<br />
}<br />
$test=@dir(setd);<br />
if($test===FALSE){<br />
echo("Directory '".setd."' does not exists. Please check manualy.\r\n");<br />
echo("Application cannot continue.\r\n");<br />
return(FALSE);<br />
}<br />
$hin_files=array();<br />
while(TRUE){<br />
$entry = $test->read();<br />
if($entry === FALSE)break;<br />
$hin=explo<strong>de</strong>(".hin",$entry);<br />
if(count($hin)>2){<br />
echo("Hin processing error. Application cannot continue.\r\n");<br />
return(FALSE);<br />
}elseif(count($hin)close();<br />
if(count($hin_files)0){<br />
echo("Tables `".setd."_%` already exist into `".mdfv."` database. Drop them and try again!\r\n");<br />
return(FALSE);<br />
}<br />
$query="CREATE TABLE `".setd."_data` (`id` INT NOT NULL AUTO_INCREMENT, `mol` VARCHAR(255) NOT NULL, `hin` LONGTEXT<br />
NOT NULL, PRIMARY KEY(`id`))";<br />
$q=@mysql_query($query);<br />
if(!$q){<br />
echo($query." :ERROR!\r\n");<br />
return(FALSE);<br />
}<br />
echo("`".setd."_data` table created.\r\n");<br />
foreach($hin_files as $k => $v){<br />
$query="INSERT INTO `".setd."_data` (`mol`,`hin`) VALUES<br />
('".addslashes($v)."','".addslashes(file_get_contents(setd."/".$v.".hin"))."')";<br />
$q=@mysql_query($query);<br />
192
if(!$q){<br />
}<br />
echo($query." :ERROR!\r\n");<br />
return(FALSE);<br />
}<br />
echo("*hin files uploa<strong>de</strong>d into `".setd."_data` table.\r\n");<br />
$query="CREATE TABLE `".setd."_prop` (`property` VARCHAR(255) NOT NULL, ";<br />
$query.="`".implo<strong>de</strong>("` DOUBLE NOT NULL DEFAULT '1e101', `",$hin_files)."` DOUBLE NOT NULL DEFAULT '1e101'";<br />
$query.=")";<br />
$q=@mysql_query($query);<br />
if(!$q){<br />
echo($query." :ERROR!\r\n");<br />
return(FALSE);<br />
}<br />
echo("`".setd."_prop` table created for further usage.\r\n");<br />
$query="CREATE TABLE `".setd."_mdfv` (`id` BIGINT NOT NULL AUTO_INCREMENT,";<br />
$query.="`".implo<strong>de</strong>("` DOUBLE NOT NULL, `",$hin_files)."` DOUBLE NOT NULL,";<br />
$query.=" PRIMARY KEY(`id`))";<br />
$q=@mysql_query($query);<br />
if(!$q){<br />
echo($query." :ERROR!\r\n");<br />
return(FALSE);<br />
}<br />
echo("`".setd."_mdfv` table created.\r\n");<br />
$query="INSERT INTO `".setd."_mdfv` (`id`) SELECT `id` FROM `_mdfv`";<br />
$q=@mysql_query($query);<br />
if(!$q){<br />
echo($query." :ERROR!\r\n");<br />
return(FALSE);<br />
}<br />
echo("space allocated for mdfv <strong>de</strong>scriptors into `".setd."_data` table.\r\n");<br />
2_mdfv_set_calc.php - foloseşte o parte din clasele <strong>de</strong>finite (<strong>de</strong> la 1 la 5) pentru a calcula familia <strong>de</strong><br />
<strong>de</strong>scriptori pentru moleculele setului supus investigaţiei; stochează rezultatele în baza <strong>de</strong> date în<br />
tabela <strong>de</strong> set cu terminaţia _mdfv.<br />
require_once("class_jobs.php");<br />
require_once("class_<strong>de</strong>scriptor_1atoms.php");<br />
require_once("class_<strong>de</strong>scriptor_2pairs.php");<br />
require_once("class_<strong>de</strong>scriptor_3fragm.php");<br />
require_once("class_<strong>de</strong>scriptor_4vertx.php");<br />
require_once("class_<strong>de</strong>scriptor_5molec.php");<br />
$test=@inclu<strong>de</strong>("0_mdfv_set_<strong>de</strong>f.php");<br />
if($test===FALSE){<br />
echo("Missing important <strong>de</strong>finitions for MDFV (0_mdfv_set_<strong>de</strong>f.php).\r\n");<br />
echo("Application cannot continue.\r\n");<br />
return(FALSE);<br />
}<br />
if(<strong>de</strong>fined("setd")===FALSE){<br />
echo("Constant 'setd' un<strong>de</strong>fined. Application cannot continue.\r\n");<br />
return(FALSE);<br />
}<br />
$job = new job_list(array()/*array("033_7282","034_11507","037_7892","038_6403","046_8900","047_8058","049_7296","051_8003")*/);<br />
$a = new ato_type();<br />
for($i=0;$in;$i++){<br />
$m = new hin_file($job->m[$i]);<br />
$m->create_structure();<br />
$m->remove_atoms("H");<br />
$m->create_topology();<br />
$m->create_chemistry($a);<br />
$m->create_matrix_adjacency();<br />
$m->create_matrix_distance();<br />
unset($m->geometry);<br />
$m->create_fragments();<br />
unset($m->topology);<br />
unset($m->adjcency);<br />
//echo($m->display_all_fragments());<br />
$d = new distance_object($m->distance);<br />
$v[0] = new versor_object_t($m->distance);<br />
$v[1] = new versor_object_g($m->distance);<br />
unset($m->distance);<br />
$p = new property_object($m->property);<br />
unset($m->property);<br />
echo($i."\t[".memory_get_usage()."]\t".$job->m[$i]."\r\n");<br />
compute_molecule($m->n,$m->fragment,$p,$d,$v,$job->m[$i]);<br />
unset($m->fragment);<br />
unset($v);<br />
unset($d);<br />
unset($p);<br />
193
unset($m);<br />
}<br />
unset($a);<br />
unset($job);<br />
die();<br />
function compute_molecule($n,&$fr,&$p,&$d,&$v,&$mol){<br />
//$dd="TG"; $pp="CHMEQLA"; $ee="JjOoPpQqRrKkLlMmNnWwXxYyZzSsTtUuVvFfGgHhIiAaBbCcDd01234567";<br />
$contor=0;<br />
//$fp=@fopen($fn,"w+");<br />
//if(!$fp)die("die from fopen: open of ".$fn." fails.\r\n");<br />
for($id=0;$idn;$id++){<br />
for($ip=0;$ipn;$ip++){<br />
create_pd_<strong>de</strong>scriptor($n,$ip,$id,$p,$d,$e);<br />
for($ie=0;$iecalculate();<br />
$md->sprint($contor,$mol/*$fp*/);//$dd[$id].$pp[$ip].$ee[$ie]<br />
unset($md);<br />
}<br />
unset($e);<br />
}<br />
}<br />
//fclose($fp);<br />
}<br />
3_mdfv_prop_<strong>de</strong>f.php - iniţializează variabilele <strong>de</strong> mediu pentru o activitate supusă analizei.<br />
$test=@inclu<strong>de</strong>("0_mdfv_set_<strong>de</strong>f.php");<br />
if($test===FALSE){<br />
echo("Missing important <strong>de</strong>finitions for MDFV (0_mdfv_set_<strong>de</strong>f.php).\r\n");<br />
echo("Application cannot continue.\r\n");<br />
return(FALSE);<br />
}<br />
if(<strong>de</strong>fined("setd")===FALSE){<br />
echo("Constant 'setd' un<strong>de</strong>fined. Application cannot continue.\r\n");<br />
return(FALSE);<br />
}<br />
<strong>de</strong>fine("propd","logIC50");<br />
<strong>de</strong>fine("nact",1e100);<br />
<strong>de</strong>fine("dcnt",2387280);<br />
<strong>de</strong>fine("clas",3);<br />
<strong>de</strong>fine("bige",1e+14);<br />
<strong>de</strong>fine("lowe",1e-14);<br />
<strong>de</strong>fine("uppe",0.90);<br />
<strong>de</strong>fine("boto",0.10);<br />
//return FALSE;<br />
4_mdfv_prop_upload.php - încarcă în baza <strong>de</strong> date în tabela cu terminaţia _prop dintr-un fişier local<br />
valorile activităţii pentru moleculele setului investigat.<br />
$test=@inclu<strong>de</strong>("3_mdfv_prop_<strong>de</strong>f.php");<br />
if($test===FALSE){<br />
echo("Missing important <strong>de</strong>finitions for MDFV (3_mdfv_prop_<strong>de</strong>f.php).\r\n");<br />
echo("Application cannot continue.\r\n");<br />
return(FALSE);<br />
}<br />
if(<strong>de</strong>fined("propd")===FALSE){<br />
echo("Constant 'setd' un<strong>de</strong>fined. Application cannot continue.\r\n");<br />
return(FALSE);<br />
}<br />
$q=@mysql_query("SELECT * FROM `".setd."_prop` WHERE `property` = '".propd."'");<br />
if(!$q){<br />
echo(propd." property SELECT in `".setd."_prop` table ERROR!\r\n");<br />
return(FALSE);<br />
}<br />
$n=mysql_num_rows($q);<br />
if($n>0){<br />
echo(propd." property already found in `".setd."_prop` table. :ERROR!\r\n");<br />
return(FALSE);<br />
}<br />
mysql_free_result($q);<br />
$a=@file_get_contents(setd."/_".propd.".txt");<br />
if($a===FALSE){<br />
echo(setd."/_".propd.".txt file NOT FOUND. Application cannot continue.\r\n");<br />
return(FALSE);<br />
}<br />
$b=explo<strong>de</strong>("\r\n",$a);<br />
if(!(count(explo<strong>de</strong>("\t",$b[0]))==2)){<br />
echo(setd."/_".propd.".txt file DID NOT CONTAINS TWO COLUMNS. Application cannot continue.\r\n");<br />
return(FALSE);<br />
194
}<br />
unset($a);<br />
$query="INSERT INTO `".setd."_prop` (`property`";<br />
for($i=0;$i
$y_values=array();<br />
foreach($r as $k => $v){<br />
if($vbrowse_names();<br />
die("normal shutdown.\r\n");<br />
class <strong>de</strong>scriptor_filter{<br />
function __construct(&$m_list,&$y_list){<br />
$this->m=count($m_list);<br />
$this->ml=$m_list;<br />
$this->y=$y_list;<br />
$this->x=array();<br />
$this->my1=$this->m1($this->y);<br />
$this->dy2=$this->m2($this->y,$this->y)-$this->my1*$this->my1;<br />
$this->mx1=0.0;<br />
$this->dx2=0.0;<br />
$this->r2=0.0;<br />
$this->qs="SELECT `".implo<strong>de</strong>("`, `",$m_list)."` FROM `".setd."_mdfv` WHERE `id` = ";<br />
$this->qi="INSERT INTO `".setd."__".propd."` VALUES ('',";<br />
$this->qk="SELECT `".implo<strong>de</strong>("`, `",$m_list)."` FROM `".setd."__".propd."` WHERE `kc` = ";<br />
$this->qn="SELECT `name` FROM `_mdfv` WHERE `id` = ";<br />
$this->l=array();<br />
$this->n=0;<br />
}<br />
function coef_r2(){<br />
$mxy=$this->m2($this->x,$this->y);<br />
$this->r2=pow($mxy-$this->mx1*$this->my1,2)/($this->dx2*$this->dy2);<br />
}<br />
function coeg_r2(&$y){<br />
$m1y=$this->m1($y);<br />
$m2y=$m1y*$m1y;<br />
$my2=$this->m2($y,$y);<br />
$dy2=$my2-$m2y;<br />
if(!$dy2)return(-1.0);<br />
$mxy=$this->m2($y,$this->x);<br />
return pow($mxy-$this->mx1*$m1y,2)/($this->dx2*$dy2);<br />
}<br />
function get_mdfv(&$id){<br />
$q=mysql_query($this->qs."'".$id."'");<br />
$this->x=mysql_fetch_row($q);<br />
mysql_free_result($q);<br />
}<br />
function table_insert($i,$k){<br />
$q=mysql_query($this->qn."'".$i."'");<br />
if(!$q)die("SELECT NAME ERROR!");<br />
$n=mysql_fetch_row($q);<br />
mysql_free_result($q);<br />
$query=$this->qi."'".$n[0]."','".$k."','".$this->r2."','".implo<strong>de</strong>("', '",$this->x)."')";<br />
$q=mysql_query($query);<br />
if(!$q) die($query." :insert error\r\n");<br />
}<br />
function table_select($k){<br />
$q=mysql_query($this->qk."'".$k."'");<br />
if(!$q) die("select error\r\n");<br />
return($q);<br />
}<br />
function in<strong>de</strong>x(){<br />
$val=$this->r2*pow(10,clas);<br />
$val=trim(sprintf("%.0f",$val));<br />
return($val);<br />
}<br />
function one_row(){<br />
196
$ok=$this->check_finite();if(!$ok)return(FALSE);<br />
$ok=$this->check_similarity();if(!$ok)return(FALSE);<br />
$ok=$this->check_too_big();if($ok)return(FALSE);<br />
$ok=$this->check_too_low();if($ok)return(FALSE);<br />
$this->mx1=$this->m1($this->x);<br />
$m2x=$this->mx1*$this->mx1;<br />
$mx2=$this->m2($this->x,$this->x);<br />
$this->dx2=$mx2-$m2x;<br />
if(!$this->dx2)return(FALSE);<br />
return(TRUE);<br />
}<br />
function check_similarity(){<br />
$is_same=1;<br />
for($i=1;$im;$i++){<br />
if($this->x[$i]==$this->x[0]){<br />
$is_same++;<br />
}else break;<br />
}<br />
return ($is_same$this->m);<br />
}<br />
function check_finite(){<br />
$is_finite=TRUE;<br />
for($i=0;$im;$i++){<br />
if(strtoupper($this->x[$i])=="INF"){<br />
$is_finite=FALSE;<br />
break;<br />
}<br />
$this->x[$i]=(float)$this->x[$i];<br />
}<br />
return $is_finite;<br />
}<br />
function check_too_big(){<br />
$is_big=FALSE;<br />
for($i=0;$im;$i++){<br />
if(abs($this->x[$i])>bige){<br />
$is_big=TRUE;<br />
break;<br />
}<br />
}<br />
return $is_big;<br />
}<br />
function check_too_low(){<br />
$is_low=FALSE;<br />
for($i=0;$im;$i++){<br />
if($this->x[$i])<br />
if(abs($this->x[$i])m;<br />
}<br />
function m2(&$v,&$u){<br />
$rez=0;<br />
for($i=0;$im;$i++)<br />
$rez+=$v[$i]*$u[$i];<br />
return $rez/$this->m;<br />
}<br />
function browse_names(){<br />
$maxr=0.0;<br />
$number_of=0;<br />
for($i=1;$il))." ".sprintf("%5d",$number_of)." [".memory_get_usage()."] ".sprintf("%.4f",$maxr)."<br />
".$q."\r\n");<br />
$this->get_mdfv($i);<br />
$finite=$this->one_row();<br />
if(!$finite)continue;<br />
$this->coef_r2();<br />
if($this->r2r2;<br />
$k=$this->in<strong>de</strong>x();<br />
if(array_key_exists($k,$this->l)===TRUE){//<strong>de</strong> imbunatatit cu corelatii incrucisate<br />
197
}<br />
}else{<br />
}<br />
$q=$this->table_select($k);<br />
$is_already=FALSE;<br />
for(;$r=mysql_fetch_row($q);){<br />
$new_r2=$this->coeg_r2($r);<br />
if($new_r2uppe){//0.90<br />
$is_already=TRUE;<br />
break;<br />
}<br />
}<br />
mysql_free_result($q);<br />
if(!$is_already){<br />
$this->table_insert($i,$k);<br />
$number_of++;<br />
}<br />
$this->table_insert($i,$k);<br />
$this->l[$k]=$i;<br />
}<br />
$this->n=count($this->l);<br />
echo("classes: ".$this->n."\r\n");<br />
echo("members: ".$number_of."\r\n");<br />
echo($maxr."\r\n");<br />
}<br />
6_mdfv_prop_kusk.php - calculează statistica Jarque-Bera (valoarea Chi Square pentru boltire şi<br />
asimetrie simultane) a activităţii experimentale observate şi a fiecărui <strong>de</strong>scriptor calificat <strong>de</strong><br />
impunerile anterioare (5_mdfv_prop_init.php); calculează coeficientul <strong>de</strong> <strong>de</strong>terminare dintre<br />
activitate şi <strong>de</strong>scriptor; <strong>de</strong>scalifică (şterge din tabelă) <strong>de</strong>scriptorii care simultan prezintă o <strong>de</strong>părtare<br />
<strong>de</strong> la normalitate mai mare <strong>de</strong>cât cea existentă în activitatea experimentală observată şi au o<br />
<strong>de</strong>terminare mai mică <strong>de</strong>cât o valoare <strong>de</strong> prag (<strong>de</strong>finită în 3_mdfv_prop_<strong>de</strong>f.php).<br />
require_once("/usr/home/lori/MDFV/Probability_Distributions_Library/ChiSqrDistribution.php");<br />
$test=@inclu<strong>de</strong>("3_mdfv_prop_<strong>de</strong>f.php");<br />
if($test===FALSE)<br />
{echo("Missing important <strong>de</strong>finitions for MDFV (3_mdfv_prop_<strong>de</strong>f.php).\r\nApplication cannot continue.\r\n");return(FALSE);}<br />
if(<strong>de</strong>fined("propd")===FALSE){echo("Constant 'setd' un<strong>de</strong>fined. Application cannot continue.\r\n");return(FALSE);}<br />
$q=@mysql_query("SELECT * FROM `".setd."_prop` WHERE `property` = '".propd."'");<br />
if(!$q){echo(propd." property SELECT in `".setd."_prop` table ERROR!\r\n");return(FALSE);}<br />
$n=mysql_num_rows($q);<br />
if(($n1)){echo(propd." property not properly <strong>de</strong>fined in `".setd."_prop` table. :ERROR!\r\n");return(FALSE);}<br />
$r=mysql_fetch_array($q,MYSQL_ASSOC);<br />
array_shift($r);<br />
$mols=array();$Y=array();foreach($r as $k => $v){if($vCDF($JB);<br />
$Y_JB=$JB;<br />
$Y_p=$pchi22;<br />
//echo("PTrueX2JB2/2=".(1.0-$chi22->CDF($JB/2))."\r\n");<br />
//echo("Property `".propd."` found into database (`".setd."_prop` table).\r\n");<br />
//echo("Var\tKurt\tSkew\tJBera\tpTrue\tr2\r\n");<br />
//echo("Y\t".$Y_ku."\t".$Y_sk."\t".$JB."\t".$pchi22."\t".(1.0)."\r\n");<br />
$query="SHOW TABLES FROM `".mdfv."` LIKE '".setd."__".propd."'";<br />
$q=@mysql_query($query);if(!$q){echo($query." :ERROR!\r\n");return(FALSE);}$n=mysql_num_rows($q);mysql_free_result($q);<br />
if($n
$q=mysql_query($query_prop."'".$mdfvprop[$j]."'");<br />
if(!$q)die($query_prop."'".$mdfvprop[$j]."' :ERROR!\r\n");<br />
$X=mysql_fetch_row($q);<br />
mysql_free_result($q);<br />
$X_m=m1($X,$n_mol);<br />
$X_ku=g2_s($X_m,$X,$n_mol);<br />
$X_sk=g1_s($X_m,$X,$n_mol);<br />
$JB=$n_mol*(pow($X_sk,2)+pow($X_ku,2)/4.0)/6.0;<br />
$chi22 = new ChiSqrDistribution(2);<br />
$pchi22=1.0-$chi22->CDF($JB);<br />
$X2m=m2($X,$X,$n_mol);<br />
$X2d=$X2m-$X_m*$X_m;<br />
$mXY=m2($X,$Y,$n_mol);<br />
$r20=$mXY-$X_m*$Y_m;<br />
$r21=$r20/$X2d;<br />
$r22=$r20/$Y2d;<br />
$r2=$r21*$r22;<br />
if(($JB$Y_JB)&&($r2_reject>0))$acceptance=FALSE;<br />
if($acceptance){<br />
//echo($mdfvprop[$j]."\t".$X_ku."\t".$X_sk."\t".$JB."\t".$pchi22."\t".$r2."\r\n");<br />
$cnt_acc++;<br />
}else{<br />
$query_<strong>de</strong>let="DELETE FROM `".setd."__".propd."` WHERE `id` = '".$mdfvprop[$j]."'";<br />
$q=mysql_query($query_<strong>de</strong>let);<br />
if(!$q)die($query_<strong>de</strong>let."'".$mdfvprop[$j]."' :ERROR!\r\n");<br />
}<br />
}<br />
$q=mysql_query("OPTIMIZE TABLE `".setd."__".propd."`");<br />
if(!$q)die("OPTIMIZE TABLE `".setd."__".propd."` ERROR!\r\n");<br />
echo("Remained <strong>de</strong>scriptors: ".$cnt_acc."\r\n");<br />
die();<br />
function m1(&$v,$m){$rez=0;for($i=0;$i
$mdfvprop[]=$r[0];<br />
}<br />
$n_<strong>de</strong>sc=count($mdfvprop);<br />
mysql_free_result($q);<br />
$query_prop="SELECT `".implo<strong>de</strong>("`, `",$mol_list)."` FROM `".setd."__".propd."` WHERE `id` = ";<br />
for($j1=0;$j1
2005-RIMC; Jäntschi & Bolboacă, 2006-OCPG) au constituit filtre în colectarea informaţiei<br />
medicale <strong>de</strong> activitate terapeutică.<br />
În cadrul activităţii <strong>de</strong> colectare a informaţiei medicale o serie <strong>de</strong> aspecte cu privire la confi<strong>de</strong>nţa în<br />
observaţiile experimentale (Drugan & others, 2003-BCI1; Bolboacă & Jäntschi, 2005-CILR;<br />
Bolboacă & Jäntschi, 2007BCIO) au constituit subiect <strong>de</strong> studiu având ca rezultat elaborarea unei<br />
serii <strong>de</strong> studii în acest subiect (Bolboacă & Jäntschi, 2008-ABCI; Bolboacă & Jäntschi, 2008-OCIB;<br />
Jäntschi & Bolboacă, 2010-EPCI).<br />
S-au căutat seturi <strong>de</strong> molecule cu potentă activitate terapeutică; s-au construit mo<strong>de</strong>le pentru<br />
structurile moleculelor seturilor folosind aplicaţia comercială HyperChem; s-au colectat valorile<br />
activităţilor experimentale observate.<br />
Denumirile în limba engleză ale activităţilor terapeutice colectate sunt: LC50/EC50 & NOEC &<br />
LOEC - fertilization of sea urchin & embryological <strong>de</strong>velopment of sea urchin & germination of sea<br />
urchin & zoospore germination of green macroalgae & germling length of green macroalgae &<br />
germling cell number of green macroalgae & survival and reproductive success of polychaete &<br />
redfish larvae survival & juveniles survival of opossum shrimp (LC50 = lethal concentration to<br />
50% of the test organisms; EC50 = effective concentration to 50% of the test organisms; NOEC =<br />
no observed effect concentration; LOEC = lowest observed effect concentration), inhibition<br />
activity, mutagenicity, antiallergic activity, anti-HIV-1 potencies, antituberculotic activity, growth<br />
inhibition activity, insecticidal activity, antioxidant efficacy, inhibition activity on carbonic<br />
anhydrase I & II & IV, herbicidal activity.<br />
Seria <strong>de</strong> lucrări selectate este după cum urmează:<br />
Nr Set n Total Clear 2var R2_old Ref R2_pred R2_est v Ref<br />
1 2<br />
1 23151_ 16 289206 93362 0.985 (4, n = 13) [ ] 0.997 0.995 3 [ ]<br />
0.741 (4, n = 16)<br />
2 23158 40 324181 99125 0.8 (5) [ ] 0.951 0.945 2<br />
3 36638_ 16 335657 105319 0.967 (?)<br />
4<br />
[ ] 0.994 0.991<br />
5<br />
3 [ ]<br />
4 41521_ 8 350233 86407 0.985 (5)<br />
0.913 (3)<br />
6<br />
[ ] 0.999 0.998<br />
7<br />
2 [ ]<br />
5 IChr10_ 10 324388 103237 0.9 (2)<br />
8<br />
[ ] 0.999 0.999<br />
9<br />
2 [ ]<br />
1<br />
Vijay K. Agrawal, Ravindra Srivastavaa and Padmakar V. Khadikarb, QSAR Studies on Some<br />
Antimalarial Sulfonami<strong>de</strong>s, Bioorganic & Medicinal Chemistry, 2001, 9, p. 3287–3293.<br />
2<br />
<strong>Lorentz</strong> <strong>JÄNTSCHI</strong> and Sorana BOLBOACA, Molecular Descriptors Family on Structure<br />
Activity Relationships 5. Antimalarial Activity of 2,4-Diamino-6-Quinazoline Sulfonami<strong>de</strong><br />
Derivates, Leonardo Journal of Sciences, 2006, Issue 8, p. 77-88.<br />
3<br />
Agrawala V.K., Khadikarb P.V., QSAR Prediction of Toxicity of Nitrobenzenes, Bioorganic &<br />
Medicinal Chemistry, 2001, 9, 3035–3040.<br />
4<br />
Brasquet C., Le Cloirec P., QSAR for Organics Adsorption Onto Activated Carbon In Water:<br />
What About The Use Of Neural Networks?, Wat. Res., 1999, 33(17), p. 3603-3608.<br />
5<br />
Jäntschi L., Water Activated Carbon Organics Adsorption Structure - Property Relationships,<br />
Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, 2004, Issue 5, p. 63-73.<br />
6<br />
Hasegawa K., Arakawa M., Funatsu K., 3D-QSAR study of insecticidal neonicotinoid compounds<br />
based on 3-way partial least squares mo<strong>de</strong>l, Chemometrics and Intelligent Laboratory Systems,<br />
1999, 47, p. 33–40.<br />
7<br />
Bolboacă S., Jäntschi ., Molecular Descriptors Family on Structure Activity Relationships 2.<br />
Insecticidal Activity of Neonicotinoid Compounds, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect,<br />
2005, Issue 6, 78-85.<br />
8<br />
Jäntschi L., Muresan S., Diu<strong>de</strong>a M., Mo<strong>de</strong>ling Molecular Refraction and Chromatographic<br />
Retention by Szeged Indices, Studia Universitatis Babes-Bolyai, Chemia, 2000, XLV(1-2), p. 313-<br />
318..<br />
9<br />
. Jäntschi L., MDF - A New QSAR/QSPR Molecular Descriptors Family, Leonardo Journal of<br />
Sciences, Aca<strong>de</strong>micDirect, 2004, Issue 4, p. 67-84.<br />
201<br />
3
7 Ta395_ 15 319867 102608 0.87 (2, n = 13)<br />
10<br />
[ ] 0.977 0.961<br />
11<br />
2 [ ]<br />
8 Tox395_ 14 319827 103411 0.8 (2, n = 13) 0.957 0.934 2<br />
9 Triazines_ 30 298462 74467 58694 0.97 (3)<br />
12<br />
[ ] 0.951 0.946<br />
13<br />
1 [ ]<br />
0.975 0.971 2<br />
0.983 0.976 3<br />
14<br />
0.989 0.985 4<br />
10 23167 31 305164 95123 0.366 (1, n = 31) [ ] 0.724 0.697 1<br />
0.861 (4, n = 31) 0.862 0.842 2<br />
0.930 (3, n = 27) 0.939 0.924 3<br />
11 23159 18 301889 101257 0.388 (1, n = 18)<br />
15<br />
[ ] 0.755 0.684<br />
16<br />
1 [ ]<br />
23159e 8 302983 0.839 (3, n = 18) 0.982 0.974 2<br />
0.899 (8) 0.758 1<br />
17<br />
0.968 (8) 0.898 2<br />
12 Dipepti<strong>de</strong>s 58 293236 93310 85533 0.782 (2) [ ] 0.85 0.836 2<br />
0.879 0.867 3<br />
0.904 0.883 4<br />
0.925 0.910 5<br />
13 22583_ 57 296965 95277 84408 0.888 (5, n = 37)<br />
18<br />
[ ] 0.783 0.766<br />
19<br />
2 [ ]<br />
0.885 (5, n = 20) 0.835 0.809 3<br />
0.883 (5, n = 57) 0.9 0.884 4<br />
10 Smith, C. J. Hansch C., Morton M. J., QSAR treatment of multiple toxicities: the mutagenicity<br />
and cytotoxicity of quinolines, Mutation Research, 1997, 379, p. 167–175.<br />
11 Jäntschi L., Bolboacă S., Molecular Descriptors Family on QSAR Mo<strong>de</strong>ling of Quinoline-based<br />
Compounds Biological Activities, The 10th Electronic Computational Chemistry Conference, April<br />
2005, http://eccc.monmouth.edu<br />
12 Diu<strong>de</strong>a M, Jäntschi L., Pejov L., Topological Substituent Descriptors, Leonardo Electronic<br />
Journal of Practices and Technologies, Aca<strong>de</strong>micDirect, 2002, 1, p. 1-18.<br />
13 Ţigan S., Jäntschi L., Bolboaca S., Mo<strong>de</strong>ling Herbicidal Activity of a Substituted Triazines Class<br />
by Integration of Compounds Complex Structural Information, Proceeding of the XXIII<br />
International Biometric Conference, Montreal, Canada, July 16-21, 2006.<br />
14 Wei D., Zhang A., Wu C., Han S., Wang L., Progressive study and robustness test of QSAR<br />
mo<strong>de</strong>l based on quantum chemical parameters for predicting BCF of selected polychlorinated<br />
organic compounds (PCOCs), Chemosphere, 2001, 44, p. 1421-1428.<br />
15 Baker J. R., Mihelcic J. R., Sabljic A., Reliable QSAR for estimating KOC for persistent organic<br />
pollutants: correlation with molecular connectivity indices, Chemosphere, 2001, 45, p. 213-221.<br />
16 . Jäntschi L., Delphi Client - Server Implementation of Multiple Linear Regression Findings: a<br />
QSAR/QSPR Application, Applied Medical Informatics, Cluj-Napoca, 2004, Issue 15, p. 48-55.<br />
17 . Diu<strong>de</strong>a M., Gutman I., Jäntschi L., Molecular Topology, 2nd Edition, Nova Science, Huntington,<br />
New York, 2002, 332 p. & & Opris D., Diu<strong>de</strong>a M. V., Pepti<strong>de</strong> Property Mo<strong>de</strong>ling by Cluj Indices,<br />
SAR/QSAR Environ. Res., 2001, 12, 159-179.<br />
18 Toropova A. A., Toropova A. P., Nesterova I. V., Nabiev O. M., Comparison of QSAR mo<strong>de</strong>ls of<br />
anti-HIV-1 potencies based on labeled hydrogen filled graph and graph of atomic orbitals, Journal<br />
of Molecular Structure (Theochem), 2003, xx, p. xxx–xxx &Castro E. A., Torrens F., Toropov A.<br />
A., Nesterov I. V., Nabiev O. M., QSAR Mo<strong>de</strong>ling ANTI-HIV-1 Activities by Optimization of<br />
Correlation Weights of Local Graph Invariants, Molecular Simulation, Taylor & Francis, 2004,<br />
30(10), p. 691-696.<br />
19 Sorana BOLBOACĂ, Ştefan ŢIGAN, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Molecular Descriptors Family on<br />
Structure-Activity Relationships on anti-HIV-1 Potencies of HEPTA and TIBO Derivatives, Assa<br />
Reichert, George Mihalaş, Lăcrămioara Stoicu-Tivadar, Ştefan Schulz, Rolf Engelbrech (Eds.),<br />
Proceedings of the European Fe<strong>de</strong>ration for Medical Informatics Special Topic Conference, April<br />
6-8, 2006, Timişoara, Romania, p. 222-226. ISBN: 3-89838-072-6 (Aka), 1-58603-614-9 (IOS<br />
Press), 973-625-303-1 (Editura Politehnica).<br />
202
0.918 0.9 5<br />
14 23110_ 69 332064 83793 70915 0.898 (5, n = 44)<br />
20<br />
[ ] 0.683 0.666 1<br />
0.918 (5, n = 25) 0.871 0.859 2<br />
0.900 (5, n = 69) 0.904 0.890 3<br />
0.923 0.913 4<br />
0.936 0.928 5<br />
15 PCB_rrt 209 297938 99806<br />
21<br />
[ ] 0.984 0.984 1<br />
0.997 0.997 2<br />
16 PCB_lkow 206 297938 100828 0.873 0.870<br />
22<br />
1 [ ]<br />
0.890 0.885 2<br />
0.917 0.909 4<br />
17 PCB_rrf 209 297926 98434 0.628 0.619<br />
23<br />
1 [ ]<br />
0.693 0.682 2<br />
0.737 0.717 4<br />
18 40846_1 40 - - 70943 0.753 (6, n=40)<br />
24<br />
[ ] 0.628 0.606 1<br />
0.700 (5, n=36) 0.806 0.789 2<br />
0.909 (5, n=20)<br />
0.917 (7, n=20)<br />
0.918 0.891 4<br />
19 40846_2 40 - - 70954 0.719 (7, n=40) 0.551 0.516<br />
25<br />
1 [ ]<br />
0.876 (7, n=36) 0.785 0.756 2<br />
0.902 (6, n=20) 0.904 0.88 4<br />
20 40846_4 40 - - 70943 0.632 (4, n=40) 0.556 0.523<br />
26<br />
1 [ ]<br />
0.769 (5, n=36) 0.752 0.728 2<br />
0.760 (3, n=20)<br />
0.822 (4, n=20)<br />
0.92 0.903 4<br />
21 26449 10 298110 94843<br />
27<br />
[ ] 0.8248<br />
28<br />
0.6966 1 [ ]<br />
20 Toporov A. A., Toporova A. P., QSAR mo<strong>de</strong>ling of toxicity on optimization of correlation<br />
weights of Morgan exten<strong>de</strong>d connectivity, Journal of Molecular Structure (Theochem), 2002, 578, p.<br />
129-134.<br />
21 Eisler R., Belisle A. A., Planar PCB Hazards to Fish, Wildlife, and Invertebrates: A Synoptic<br />
Review, Biological Report 31 and Contaminant Hazard Reviews Report 31, 1996, IV, p.75,<br />
http://www.pwrc.usgs.gov/infobase/eisler/CHR_31_Planar_PCBs.pdf.<br />
22 <strong>Lorentz</strong> <strong>JÄNTSCHI</strong> and Sorana BOLBOACĂ, Molecular Descriptors Family on Structure<br />
Activity Relationships 6. Octanol-Water Partition Coefficient of Polychlorinated Biphenyls,<br />
Leonardo Electronic Journal of Practices and Technologies, Aca<strong>de</strong>micDirect, 2006, Issue 8, p. 71-<br />
86.<br />
23 Jäntschi L., QSPR on Estimating of Polychlorinated Biphenyls Relative Response Factor using<br />
Molecular Descriptors Family, Leonardo Electronic Journal of Practices and Technologies,<br />
Aca<strong>de</strong>micDirect, 2004, Issue 5, p. 67-84.<br />
24 Supuran C. T., Clare B. W., Carbonic anhydrase inhibitors – Part 57: Quantum chemical QSAR<br />
of a group of 1,3,4-thiadiazole- and 1,3,4-thiadiazoline disulfonami<strong>de</strong>s with carbonic anhydrase<br />
inhibitory properties, Eur. J. Med. Chem, 1999, 34, p. 41-50.<br />
25 <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mihaela Ligia UNGUREŞAN, Sorana-Daniela BOLBOACĂ, Integration of<br />
Complex Structural Information in Mo<strong>de</strong>ling of Inhibition Activity on Carbonic Anhydrase II of<br />
Substituted Disulfonami<strong>de</strong>s, Applied Medical Informatics, Vol. 17, No. 3, 4/2005, p. 12-21.<br />
26 L. Jäntschi, S. Bolboaca, Mo<strong>de</strong>lling the Inhibitory Activity on Carbonic Anhydrase IV of<br />
Substituted Thiadiazole- and Thiadiazoline- Disulfonami<strong>de</strong>s: Integration of Structure Information,<br />
Proceedings of the 1st European Chemistry Congress, Budapest, Hungary, August 27-31, 2006.<br />
27 Ungwitayatorn J., Pickert M., Frahm A.W., Quantitative structure-activity relationship (QSAR)<br />
study of polyhydroxyxanthones, Pharmaceutica Acta Helvetiae, 1997, 72, p. 23-29.<br />
28 Bolboacă S, Jäntschi L. Molecular Descriptors Family on Structure Activity Relationships 3.<br />
Antituberculotic Activity of some Polyhydroxyxanthones, Leonardo Journal of Sciences,<br />
Aca<strong>de</strong>micDirect, 2005, Issue 7, p. 58-64.<br />
203
0.9974 0.9948 2<br />
22 RRC_lbr 30 - 98604<br />
29<br />
86409 r = 0.955 (2, n = 30) ? [ ] 0.7153 0.6755 1<br />
0.8972 0.8745 2<br />
0.9737 0.9650 4<br />
0.9739 0.9637 4<br />
23 RRC_lkow 30 - - 86388 0.70769 0.6586<br />
30<br />
1 [ ]<br />
0.89433 0.8659 2<br />
0.97805 0.9680 4<br />
24 RRC_pka 30 - - 86373 0.68471 0.6418 1<br />
0.85106 0.8198 2<br />
0.96052 0.9490 4<br />
0.96147 0.9464 4<br />
0.96377 0.9474 4<br />
25 MR10 10 349553 107692 r2 = 0.9755 (2, n=10)<br />
31<br />
[ ] 0.9919 0.9884<br />
32<br />
1 [ ]<br />
0.99996 0.9999 2<br />
26 52344 8 r 2 = 0.78 (1, n=8)<br />
33<br />
[ ] 0.90397 0.8316<br />
34<br />
1 [ ]<br />
r 2 = 0.71 (1, n=8) 0.99946 0.9988 2<br />
r 2 = 0.81 (2, n=8) 0.99978 0.99935 2<br />
r 2 = 0.97 (4, n=8) 0.99980 0.99937 2<br />
27 52730 10 0.9664 0.9466<br />
35<br />
1 [ ]<br />
0.9983 0.9965 2<br />
28 19654 23 r 2 = 0.8865 (3, n= 23)<br />
36<br />
[ ] 0.9222 0.9049 1<br />
0.9895 0.9778 2<br />
0.9973 0.9956 4<br />
0.9978 0.9839 4<br />
29 3300_ 35 r 2 = -0.979 (5, n=35)<br />
37<br />
[ ] 0.8295 0.8111 1<br />
0.9172 0.9029 2<br />
0.9184 0.9039 2<br />
0.9655 0.9564 4<br />
29 IVANCIUC O, Artificial neural netwoeks applications. Part 4. Quantitative structure-activity<br />
relationships for the estimation of the relative toxicity of phenols for Tetrahymena, Revue<br />
Roumanian <strong>de</strong> Chinie, 1998, 43 (3), 255-260.<br />
30 <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana-Daniela BOLBOACĂ, Mihaela UNGUREŞAN, Mo<strong>de</strong>ling the<br />
Octanol-Water Partition Coefficient of Substituted Phenols by the Use of Structure Information,<br />
Proceedings of the 3rd Humboldt Conference on Computational Chemistry, Varna, Bulgaria, May<br />
25-27, 2006.<br />
31 Jäntschi L., Mureşan S., Diu<strong>de</strong>a M.V., Mo<strong>de</strong>ling molar refraction and chromatographic retention<br />
by Szeged Indices, Studia Universitatis Babeş-Bolyai, Chemia, 2000, XLV(1-2), p. 313-318<br />
32 <strong>Lorentz</strong> <strong>JÄNTSCHI</strong> and Sorana BOLBOACĂ, Molecular Descriptors Family on Structure<br />
Activity Relationships 4. Molar Refraction of Cyclic Organophosphorus Compounds, Leonardo<br />
Electronic Journal of Practices and Technologies, Aca<strong>de</strong>micDirect, 2005, Issue 7, p. 55-102.<br />
33 Shertzer GH, Tabor MW, Hogan ITD, Brown JS, Sainsbury M. Molecular mo<strong>de</strong>ling parameters<br />
predict antioxidant efficacy of 3-indolyl compounds. Arch Toxicol 1996;70:830-4.<br />
34 Sorana BOLBOACĂ, Claudia FILIP, Ştefan ŢIGAN, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Antioxidant Efficacy<br />
of 3-Indolyl Derivates by Complex Information Integration, Clujul Medical, 2006.<br />
35 Sorana Daniela BOBLOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>. Mo<strong>de</strong>ling of Structure-Toxicity Relationship<br />
of Alkyl Metal Compounds by Integration of Complex Structural Information. Terapeutics,<br />
Pharmacology and Clinical Toxicology, 2006, X(1), p. 110-114.<br />
36 Yu-xin Zhou, Lu Xu, Ya-ping Wu, Bai-li Liu, A QSAR study of the antiallergic activities of<br />
substituted benzami<strong>de</strong>s and their structures, Chemometrics and Intelligent Laboratory Systems,<br />
1999, 45, 95-100.<br />
37 Hiroshi Morita, Akira Gonda, Lan Wei, Koichi Takeya, and Hi<strong>de</strong>ji Itokawa, 3D QSAR ANALYSIS<br />
OF TAXOIDS FROM TAXUS CUSPIDATA VAR. NANA BY COMPARATIVE MOLECULAR<br />
FIELD APPROACH, Bioorganic & Medicinal Chemistry Letters, 1997, Vol. 7, No. 18, pp. 2387-<br />
2392.<br />
204
0.9665 0.9525 4<br />
30 33504 73 r = 0.9892 (1, n= 73)<br />
38<br />
[ ] 0.9912 0.9908 1<br />
r = 0.9857 (1, n= 73) 0.9982 0.9980 2<br />
r = 0.9961 (2, n= 73)<br />
r = 0.9953 (2, n= 73)<br />
r = 0.9986 (3, n= 73)<br />
r = 0.9984 (3, n= 73)<br />
r = 0.9974 (3, n= 73)<br />
Heats of atomization<br />
r = 1.0000 (4, n= 38)<br />
Heats of vaporization<br />
r = 0.9985 (4, n= 47)<br />
Heats of formation<br />
r = 0.9964 (2, n= 38)<br />
Molar volumes<br />
r = 0.9897 (2, n= 46)<br />
0.9982 0.9980 2<br />
31 31572 24 r 2 = 0.771 (1, n = 37)<br />
r<br />
39<br />
[ ]<br />
2 = 0.894 (4, n = 38)<br />
r 2 = 0.953 (4, n = 37)<br />
r 2 = 0.951 (4, n = 38)<br />
2009A4. Construirea mo<strong>de</strong>lelor Structură - Activitate folosind instrumentele specifice <strong>de</strong>zvoltate<br />
O serie <strong>de</strong> lucrări (Jäntschi, 2004-MDF; Jäntschi, 2005-MDF1; Jäntschi & others, 2005-CSII;<br />
Jäntschi & Bolboacă, 2006-OMDF; Jäntschi & Bolboacă, 2006-MDFR; Jäntschi & Diu<strong>de</strong>a, 2006-<br />
SPV; Jäntschi & Bolboacă, 2007-RMDF; Bolboacă & Jäntschi, 2007-SPBP; Jäntschi & Bolboacă,<br />
2007-MDFC; Jäntschi & Bolboacă, 2007-MDFA; Jäntschi & Bolboacă, 2007-MDFE) cumulează<br />
cunoştinţele prealabile în legătură cu instrumentele specifice <strong>de</strong>zvoltate, iar <strong>de</strong>rularea activităţii a<br />
permis obţinerea <strong>de</strong> noi rezultate (Jäntschi & Bolboacă, 2008-EMGT).<br />
Seturile supuse investigaţiei structură-activitate cu ajutorul instrumentelor <strong>de</strong>zvoltate (MDF şi<br />
MDFV) sunt interogabile online din cele două baze <strong>de</strong> date (MDF şi MDFV); adresa este<br />
următoarea:<br />
http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs/<br />
Mo<strong>de</strong>lele structură-activitate obţinute sunt disponibile online pentru acele seturi <strong>de</strong> molecule pentru<br />
care s-a realizat şi valorificat (prin publicare) obţinerea relaţiilor (semi)cantitative structurăactivitate,<br />
sQSARs.<br />
Mo<strong>de</strong>lele stocate în baza <strong>de</strong> date MDF sunt redate în tabelul <strong>de</strong> mai jos:<br />
Nr Set Mo<strong>de</strong>l r2 v m<br />
y=-62.361371746820275+<br />
lSDmwMt*6.372504386827629+<br />
1 IChr10_ iHPDEQg*0.058693170881799<br />
0.999221607 2 10<br />
y=20.460137586773501+<br />
lHMrtCt*-6.961293758269948+<br />
2 IChr10_ iBPmTEt*-969.172867908018304 0.998805743 2 10<br />
y=2.582556947454996+<br />
3 36638_<br />
lPMDVQg*0.002969357191374+<br />
IsPrVHg*-22.592449746207965<br />
0.977605386 2 16<br />
38 Andrey Toropova, Alla Toropovab, Temur Ismailovb, Danail Bonchev, 3D weighting of<br />
molecular <strong>de</strong>scriptors for QSPWQSAR by the method of i<strong>de</strong>al symmetry (MIS). 1. Application to<br />
boiling points of alkanes, Journal of Molecular Structure (Theochem) 1998, 424, pp. 237-247.<br />
39 M. H. ABRAHAM, R. KUMARSINGH, J. E. COMETTO-MUNIZ, W. S. CAIN, A Quantitative<br />
Structure-Activity Relationship (QSAR) for a Draize Eye Irritation Database, Toxicology in Vitro,<br />
1998, 12, 201-207.<br />
205
4 36638_<br />
y=2.585556625918434+<br />
lPMDVQg*0.002984666705928+<br />
IsPmVHg*-22.108669187753978<br />
y=2.577163501835581+<br />
IiMMWHt*0.853020387909027+<br />
0.976781931 2 16<br />
5 36638_ lPMDVQg*0.002947685825620<br />
y=2.745069935843683+<br />
IiMMWHt*0.964882719278833+<br />
IFMmkHg*0.002015868714906+<br />
0.981091504 2 16<br />
6 36638_ LPDMVQg*0.002704618929348<br />
y=2.568663834381964+<br />
IiMMWHt*0.857321758795370+<br />
lPMDVQg*0.002952308975991+<br />
0.992472044 3 16<br />
7 36638_ iFMdFQg*0.000000000000802<br />
y=2.572960050395093+<br />
IiMMWHt*0.862026691653915+<br />
lPMDVQg*0.002975951926473+<br />
0.994462046 3 16<br />
8 36638_ iSPMtQg*0.000359275274073<br />
y=2.573205449280688+<br />
IiMMWHt*0.862522334633554+<br />
lPMDVQg*0.002984079061001+<br />
0.994961682 3 16<br />
9 36638_ ibPMtQg*0.000060106252532<br />
y=5.085278949837590+<br />
imMrFHt*-357.296321414089600+<br />
0.995018995 3 16<br />
10 PCB_rrf_ iHDdFHg*2.156138113196185<br />
y=6.055340736461524+<br />
imMrFHt*-416.942003738513088+<br />
iHDdFHg*2.313956389789302+<br />
iMMMjQg*1.829475297508006+<br />
0.692921683 2 209<br />
11 PCB_rrf_ iAMrVQg*-0.002506945942322<br />
y=16.624223709106445+<br />
lfDMWHt*-0.216979935765266+<br />
0.736793462 4 209<br />
12 23159e_ IbmrTEt*-0.683317601680756<br />
y=18.090740203857424+<br />
lfDMWHt*-0.217230200767517+<br />
0.98164165 2 14<br />
13 23159e_ IbmrtEt*-0.770600378513336<br />
y=-4.488118053335837+<br />
INDRLQt*8.348191853294373+<br />
0.981111884 2 14<br />
14 Ta395_ lHPmTMt*1.965121565280751<br />
y=-1.293780346589664+<br />
liMrSQg*0.223497432069395+<br />
0.976574132 2 15<br />
15 Tox395_ ASPrVQg*0.095534977438483<br />
y=-1.272088763676020+<br />
lIMrSQg*0.223829242224039+<br />
0.95585816 2 14<br />
16 Tox395_ ASPrVQg*0.095600357852137<br />
y=-0.717673381133009+<br />
lsMrSQg*0.225050651084089+<br />
0.955056854 2 14<br />
17 Tox395_ ASPrVQg*0.098706316363904<br />
y=-1.575004492205578+<br />
lNMrSQg*0.205885242323993+<br />
0.957735266 2 14<br />
18 Tox395_ ASPrVQg*0.092984460101768<br />
0.956820302 2 14<br />
19 Tox395_ y=-1.597971465629698+ 0.955928148 2 14<br />
206
20 41521_<br />
lNMrEQg*0.336843860556055+<br />
ASPrVQg*0.094660231172752<br />
y=15.977082257070075+<br />
lAPRkHg*4.411577306950580+<br />
iAPmEQg*-0.004799303305105<br />
y=15.557416220778391+<br />
lHPDKHg*-4.447021764795913+<br />
0.998675191 2 8<br />
21 41521_ iBPmEQg*-0.045008303244039<br />
y=15.977082257072571+<br />
lHPRKHg*-4.411577306951695+<br />
0.9990247 2 8<br />
22 41521_ iAPmEQg*-0.004799303305106<br />
y=43.344306644672435+<br />
ImMdsEg*-2.208255961271429+<br />
0.998675191 2 8<br />
23 41521_ lIMMFQt*3.740518408044116<br />
y=19.406881564985923+<br />
lGDrtMg*21.873029005600086+<br />
0.999125495 2 8<br />
24 MR10_ lAmrVGg*-164.023794938214048<br />
y=17.394528468178550+<br />
lGDmSMt*28.247433444091738+<br />
0.999797892 2 10<br />
25 MR10_ lAmrfEt*-83.965315146143757<br />
y=-19.112864129011363+<br />
lHPDOQg*2.317497007317971+<br />
0.999958406 2 10<br />
26 26449t_ IsMRKGg*19.343096061022083<br />
y=-5.342090912944618+<br />
ISDrSQg*-0.000836073645555+<br />
0.997345142 2 10<br />
27 52344_ iSmrJQt*-33.145388286106125<br />
y=-13.259851363534467+<br />
IAPdwCg*7.421342259908507+<br />
0.999457098 2 8<br />
28 52344_ lSDMkMg*-1.203325361332910<br />
y=7.182585269595931+<br />
lbPMkHg*-1.097130469643120+<br />
0.99978832 2 8<br />
29 52344_ iAPrVGt*-33.244348016071162<br />
y=82487.779927956544000+<br />
iSDmtQg*-4291.591445441648640+<br />
0.999803127 2 8<br />
30 DevMTOp00_ lAMrFEt*-24751.302374423369600<br />
y=-5.211074704460113+<br />
IAPMLMt*0.000744091093604+<br />
0.999997516 2 8<br />
31 DevMTOp01_ lmPmlQg*2.674299018254657<br />
y=8.572782794598863+<br />
anPrdQg*-0.062403551223709+<br />
1 2 5<br />
32 DevMTOp02_ IsmRLQt*233.992406665280768<br />
y=21.577675933246624+<br />
iHDRkMg*-0.004324723908977+<br />
0.999966002 2 7<br />
33 DevMTOp03_ inMrPQg*11.108974534804655<br />
y=6.946100250910472+<br />
iGDREHg*-10.090383646214632+<br />
0.999152012 2 8<br />
34 DevMTOp04_ lnDDVQg*-1.391295355575833<br />
y=5.972901448850221+<br />
AHDmtQg*382.966792379103488+<br />
0.999779572 2 8<br />
35 DevMTOp05_ inMDqQg*-5.152599794558495<br />
0.9992016 2 8<br />
36 DevMTOp06_<br />
y=4.258542471386298+<br />
lGPMqGg*-55.309513051550080+ 0.999981768 2 7<br />
207
37 DevMTOp07_<br />
IBPrJHt*-0.016924218996259<br />
y=16.997960609979277+<br />
iAMrECt*-14.724870628170749+<br />
aAPmfQt*-0.105749387186883<br />
y=2.299452498508210+<br />
LsDmjQg*-1.172330969315326+<br />
0.999603803 2 8<br />
38 DevMTOp08_ lAMrDHt*-6.960913760516673<br />
y=49.601873825853658+<br />
IAMrDQg*-0.353928603916190+<br />
0.999959098 2 7<br />
39 DevMTOp09_ iBPRwMt*31653.215583361798400<br />
y=-4.563145600075828+<br />
isMdsGg*-0.076556062852060+<br />
0.999903215 2 7<br />
40 DevMTOp10_ lsDDkQg*-1.431507685251379<br />
y=-39.637026030878438+<br />
iGPMpEg*14.697649143241879+<br />
0.999898517 2 7<br />
41 DevMTOp11_ lPDDpEg*0.044063759116077<br />
y=-252.938700802085632+<br />
lMMRSGt*24.401713743828797+<br />
0.9999946 2 6<br />
42 DevMTOp12_ lsPmpMg*-28.277181303483437<br />
y=28.031130403667130+<br />
IHMRFEg*-0.897288952138859+<br />
0.999253357 2 8<br />
43 DevMTOp14_ INPmsQt*-13455.651827727787520<br />
y=-269.701345715687040+<br />
iIMMoEg*32.790755969495002+<br />
0.99957823 2 8<br />
44 DevMTOp15_ IHmrlEt*1058.588149821219040<br />
y=-4.591222054726206+<br />
asDmkQg*0.003446474307407+<br />
0.999995588 2 6<br />
45 DevMTOp16_ IGMmTHt*2.246662887026612<br />
y=0.276515007162331+<br />
iIPdqQg*1.456930890306632+<br />
0.99894463 2 8<br />
46 DevMTOp17_ iImrSCg*-0.008375218150532<br />
y=5.277557317326950+<br />
iGMmSQt*-0.925518492017054+<br />
0.999544921 2 8<br />
47 DevMTOp18_ IIPdwQg*-561.357019867305216<br />
y=484.609231791737472+<br />
iADDOMg*-6893.174261695466240+<br />
0.999999653 2 6<br />
48 DevMTOp19_ lmPmLMt*-52.452348531199731<br />
y=-76.465419087381811+<br />
lGPrfGt*11.765097022456481+<br />
0.999942872 2 7<br />
49 DevMTOp20_ iGPMqMg*14.548142362264151<br />
y=-0.466773345458314+<br />
ISPRfEt*0.658065324549722+<br />
0.999179456 2 8<br />
50 DevMTOp21_ imDrwEt*-688.623604086868352<br />
y=35.886964607142445+<br />
lIDrdQg*8.293607635627836+<br />
0.999019748 2 8<br />
51 DevMTOp22_ isMdPQg*0.001557300106484<br />
y=-267.218704057874592+<br />
lsPmkEg*-20.968463155992515+<br />
0.999927658 2 7<br />
52 DevMTOp23_ lSmRFGt*51.184666540653107<br />
0.999864996 2 8<br />
y=0.355538934447154+<br />
53 DevMTOp24_<br />
IsPDPHg*99.897075577592973+<br />
InDRLQg*-0.736739109598832<br />
0.9999568 2 7<br />
208
54 DevMTOp25_<br />
y=1.893045064859439+<br />
lBMDVQg*4.089050756254091+<br />
iHDrDQt*-42.497588982800794<br />
y=-2.260942771393344+<br />
ASMmVQt*0.036537920618985+<br />
0.999931515 2 7<br />
55 RRC433_lbr_ lfDdOQg*-0.216319157172228<br />
y=-3.294716228841605+<br />
ASMmVQt*0.034759339883385+<br />
lfDdOQg*-0.326175236962887+<br />
InMrLQg*0.079023124090750+<br />
0.897264116 2 30<br />
56 RRC433_lbr_ LsDMpQg*-0.346227342563766<br />
y=-3.309083909227967+<br />
ASMmVQt*0.035359451252071+<br />
lfDdOQg*-0.326340537986437+<br />
InMrLQt*0.083521027478412+<br />
0.973702913 4 30<br />
57 RRC433_lbr_ LsDMpQg*-0.353965995278507<br />
y=1.068504837149195+<br />
isDDkGg*0.003385972696729+<br />
0.973908851 4 30<br />
58 RRC433_lkow_ IMmrKQg*-0.401342461954502<br />
y=0.086887657603207+<br />
isDDkGg*0.005559930394138+<br />
IMmrKQg*-0.416458920866538+<br />
lPMDKQg*0.009409040694936+<br />
0.894339198 2 30<br />
59 RRC433_lkow_ lFMMKQg*-0.077972151747497<br />
y=12.145778693743030+<br />
AHMMVQg*-1.759312774646531+<br />
0.978050343 4 30<br />
60 RRC433_pka_ inDmwHg*-1.423171133335602<br />
y=12.250129572666588+<br />
AHMMVQg*-1.878604996401587+<br />
inDmwHg*-1.409105150926869+<br />
IimRJQg*-1.255850637865408+<br />
0.85106015 2 30<br />
61 RRC433_pka_ AsPrwQg*-551.820132942366464<br />
y=12.266395089058967+<br />
AHMMVQg*-1.886964796625174+<br />
inDmwHg*-1.431793246534204+<br />
IImRJQg*-1.492725761439522+<br />
0.96048211 4 30<br />
62 RRC433_pka_ IHDrsQg*-132.763291817560480<br />
y=13.187486747004316+<br />
AHMMVQg*-1.628307288455412+<br />
inDmwHg*-1.315727674279415+<br />
LBMRlQg*-0.450392531615080+<br />
0.961458919 4 30<br />
63 RRC433_pka_ AHDmEQg*-3.537408893070444<br />
y=2.799163315535306+<br />
IbMmpMg*28.064230202549747+<br />
0.963779329 4 30<br />
64 52730_ LPPROQg*0.081524293438233<br />
y=3.982186750193776+<br />
iImrKHt*1.516060326175799+<br />
0.99763089 2 10<br />
65 DHFR_ liMDWHg*2.357039692152132<br />
y=-1.172577695940167+<br />
lImrKHt*-4.863206399509672+<br />
0.85627596 2 67<br />
66 DHFR_ IiMDWHg*5.474142782322419<br />
0.857180673 2 67<br />
67 DHFR_ y=3.261481723647712+ 0.858873758 2 67<br />
209
lImrKHt*-4.900679297589359+<br />
lIMDWHg*2.313684191877673<br />
y=22.783498446732483+<br />
IbMmSHt*-0.044781937978148+<br />
inPRjHg*0.036908423922842+<br />
68 DHFR_ lsMMTGg*2.276594353795319<br />
0.887769256 3 67<br />
y=3.766172816092689+<br />
iImrKHt*1.630691978329184+<br />
liMDWHg*2.398496510115706+<br />
LSPmEQg*-0.085551239269939+<br />
69 DHFR_ IIDrJQt*0.293720167343832<br />
0.905161273 4 67<br />
70 DHFR_<br />
y=3.781999644467336+<br />
iImrKHt*1.619894894103214+<br />
liMDWHg*2.371371074452369+<br />
IsDrJQt*6.402293814267814+<br />
LSPmEQg*-0.085177985460006<br />
y=-5.746809646380628+<br />
IiPdJHg*11.956269601549317+<br />
0.905784714 4 67<br />
71 a_acids_ iHMmVQg*0.065716945111961<br />
y=11.256459289110492+<br />
iHmrsGg*0.389578813720558+<br />
0.984823373 2 12<br />
72 a_acids_ iiPDOHg*-2.366249952762924<br />
y=9.387440286015163+<br />
lIPrVGt*6.088203345034852+<br />
0.987102214 2 12<br />
73 a_acids_ IHDDKHg*0.381482245798468<br />
y=-8.951974935678216+<br />
lIMdFGg*-9.901521373121243+<br />
0.98835913 2 12<br />
74 34121bad_ IAPmTCt*36.243596058596800<br />
y=13.360278625318943+<br />
iIPRLGg*-4.412916051903299+<br />
0.509261534 2 76<br />
75 34121nopt_ LiMmwQg*0.421902462393154<br />
y=0.183306719129093+<br />
IFDDpGg*-0.000068304771741+<br />
0.622248309 2 76<br />
76 19654_ ISDrFMt*-0.000001260853126<br />
y=-0.008829461052500+<br />
isDRtHg*-0.000051338532157+<br />
0.984019252 2 23<br />
77 19654_ iHMMtHg*0.130030477933933<br />
y=0.046790454181503+<br />
ismRSEg*-0.000172348201588+<br />
0.988351291 2 23<br />
78 19654_ isDRTCg*0.000030999802774<br />
0.98955647 2 23<br />
y=7.616547989246049+<br />
lIDrpMg*1.001309641822330+<br />
lsPrJGt*-1.069779866848350+<br />
ismRSEg*-0.000163062657210+<br />
79 19654_ isDRTCg*0.000029929545873<br />
0.996248249 4 23<br />
y=2.733124886439780+<br />
lmDDKMg*-0.286110586112610+<br />
imPrdQt*-1.789020475582959+<br />
ismRSEg*-0.000161361248412+<br />
80 19654_ isDRTCg*0.000029725595809<br />
0.997851065 4 23<br />
81 19654_<br />
y=6.884466558075200+<br />
liMRsCg*0.921784722969737+<br />
0.996819148 4 23<br />
210
82 19654_<br />
lIDRFMg*-1.317553545161115+<br />
isDRtHg*-0.000050399261806+<br />
iHMMtHg*0.135432046071406<br />
y=-0.146575674440346+<br />
imMRkMg*0.000902003747302+<br />
imMDVQg*-0.322525717918453+<br />
isDRtHg*-0.000052364343767+<br />
iHMMtHg*0.139074684280391<br />
y=-17.709380801328218+<br />
isMdTHg*0.002306275036298+<br />
0.997260489 4 23<br />
83 3300_ IiDrQHg*77.216162936821005<br />
0.918384193 2 34<br />
84 3300_<br />
y=-17.092683014823635+<br />
iHDmkQt*0.688855852114620+<br />
AsDmtQg*205224.367519787520000+<br />
isMdTHg*0.002310828590955+<br />
IiDrQHg*72.349612191442458<br />
y=-4.303662300109863+<br />
lIDrFEg*-19.435102462768554+<br />
0.966514933 4 34<br />
85 22583_ IiMMsGg*11.070854187011718<br />
y=-4.358335018157959+<br />
lIDrFEg*-19.590654373168944+<br />
0.782257676 2 57<br />
86 22583_ IiMMSGg*11.005515098571777<br />
0.783080041 2 57<br />
y=16.697563171386717+<br />
InMdTHg*-9.215051651000977+<br />
lfDMwEt*-0.860860228538513+<br />
87 22583_ AsMrKQt*141.058273315429680 0.835162103 3 57<br />
y=-5.146468639373779+<br />
lIDrFEg*-18.882848739624022+<br />
IiMMSGg*9.991197586059570+<br />
iFDmkHg*-0.000023631801014+<br />
88 22583_ inMrEQt*-1.860737323760986<br />
0.900917828 4 57<br />
y=17.723573684692381+<br />
InMdTHg*-7.113586425781251+<br />
lFDMwEt*-1.234191298484802+<br />
AiMrKQt*8.357679367065430+<br />
ImDMtQt*659184.625000000000000+<br />
89 22583_ lIMdEMg*-5.981501102447510<br />
0.917499542 5 57<br />
90 22583_<br />
y=10.439790725708008+<br />
InMdTHg*-6.621389389038086+<br />
lFDMwEt*-1.115040302276611+<br />
AiMrKQt*7.575278282165527+<br />
IMDMtQt*782467.875000000000000+<br />
iIMdTMg*18.747991561889648<br />
y=-323.024772597417024+<br />
liDmEHt*-105.929211454059789+<br />
0.917872667 5 57<br />
91 33504_ IADmwHt*17.760000133301725<br />
y=-129.202920028528064+<br />
lGDrtGt*-67.450781570303091+<br />
0.998191949 2 73<br />
92 33504_ IbDrfHt*4.889627699125125<br />
0.998194885 2 73<br />
y=6.272650515627022+<br />
93 23158c_<br />
iiMdLGg*-24.465622121014768+<br />
AsPmVQt*7.416438629162940<br />
0.949331559 2 40<br />
211
94 23158c_<br />
y=-8.925568204084518+<br />
lIMdLGg*6.533652861276372+<br />
AsPmVQt*7.390652840339525<br />
y=-9.030826989310386+<br />
lIMdLGg*6.602715759615876+<br />
0.949405043 2 40<br />
95 23158c_ AIPmVQt*0.738833729895370<br />
y=-9.028650724880719+<br />
lIMdLGg*6.601183808052042+<br />
0.949450328 2 40<br />
96 23158c_ AiPmVQt*0.738839898477699<br />
y=7.413062019927823+<br />
iIMdLGg*-29.203947244192070+<br />
0.949451061 2 40<br />
97 23158c_ AsPmVQt*7.376749884182984<br />
y=7.483477154220049+<br />
iIMdLGg*-29.525257834273594+<br />
0.950945432 2 40<br />
98 23158c_ AIPmVQt*0.737465221651949<br />
y=7.481885945863868+<br />
iIMdLGg*-29.518679478761894+<br />
0.951085814 2 40<br />
99 23158c_ AiPmVQt*0.737471789565067<br />
y=6.372537492476300+<br />
IBMrkGg*-92.371378276225190+<br />
0.951086994 2 40<br />
100 23158c_ IsPmVQt*-7.281656762147562<br />
y = 3.5140+<br />
iNMRJQt*3.9523e-2+<br />
iSDRkQt*-9.1485+<br />
LsPrDQt*5.7624e-1+<br />
0.955679462 2 40<br />
101 31572_ IADRSHg*-1.1986e-1<br />
y = -10.573+<br />
IIMmSCg*63.140+<br />
0.958313838 4 24<br />
102 31572_ lIMRVCg*-5.1308<br />
y = 3.9864+<br />
LsPrDQt*6.4877e-1+<br />
0.830588637 2 24<br />
103 31572_ IADRSHg*-1.2942e-1<br />
y=3.309258874208278+<br />
ABmrtQg*-14.191657164410053+<br />
0.811092657 2 24<br />
104 23110_ iGPrfHt*0.960433156574692<br />
y=3.255577576284918+<br />
ABmrsQg*-9.655480534462673+<br />
0.870389569 2 69<br />
105 23110_ iGPrfHt*1.003843270199119<br />
y=3.468032235802128+<br />
ABmrtQg*-14.109591667547505+<br />
iGPrfHt*1.000897643171127+<br />
iImrfQt*-0.000035842320734+<br />
0.870762905 2 69<br />
106 23110_ aHDRdQt*-0.019679357321205<br />
y=3.649903008444890+<br />
IBDMWQt*0.668182102284062+<br />
iIPmWHt*0.139974134207539+<br />
IMPrkQg*0.000238539437306+<br />
0.923419436 4 69<br />
107 23110_ aHPMwQt*-0.000458937750242<br />
y=3.635644435882568+<br />
ABDmtQg*-11.895344734191895+<br />
ISDRLQt*0.000576242397074+<br />
0.922112869 4 69<br />
108 23110_ iIPrwHt*0.130846872925758<br />
0.901068389 3 69<br />
212
y=3.463929176330566+<br />
ABDmtQg*-13.019453048706056+<br />
iHPrwHt*1.618527054786682+<br />
109 23110_ aIPMwQt*-0.000028133128581<br />
0.902104378 3 69<br />
y=3.494592428207398+<br />
ABDmtQg*-13.096261978149414+<br />
iHPmwHt*1.626412868499756+<br />
110 23110_ aIPMwQt*-0.000028470527468<br />
0.902782798 3 69<br />
y=3.821168899536133+<br />
aHPMwQt*-0.000338123209076+<br />
iIPmWHt*0.132829502224922+<br />
111 23110_ IBPMWQt*0.756949245929718<br />
0.904430389 3 69<br />
y=3.719008207321167+<br />
aHPMwQt*-0.000501490896568+<br />
iIPmWHt*0.142897620797157+<br />
IBPMWQt*0.778551995754242+<br />
iFMMfGt*-0.000000000418976+<br />
112 23110_ IMPrkQg*0.000253266363870<br />
0.936299264 5 69<br />
113 23110_<br />
y=3.719301223754883+<br />
aHPMwQt*-0.000501317554154+<br />
iIPmWHt*0.142888113856316+<br />
IBPMWQt*0.778867542743683+<br />
iFmRFMt*-0.000000309545300+<br />
IMPrkQg*0.000253249396337<br />
y=3.937699079513550+<br />
iSPRtQg*0.051902804523706+<br />
0.936396182 5 69<br />
114 23167_ imDrkQt*-5.906542778015137<br />
y=3.934797048568726+<br />
aSPRtQg*0.051960568875074+<br />
0.861876726 2 31<br />
115 23167_ imDrkQt*-5.895822048187256<br />
y=3.937698841094971+<br />
imDrkQt*-5.906543731689453+<br />
0.860438466 2 31<br />
116 23167_ iSPRtQg*0.051902808248997<br />
y=3.934797048568726+<br />
imDrkQt*-5.895823001861572+<br />
0.861882389 2 31<br />
117 23167_ aSPRtQg*0.051960572600365<br />
y=3.832609653472900+<br />
IsMRKQg*-8.327919006347656+<br />
0.860438466 2 31<br />
118 23167_ AHPROQg*0.280586481094360<br />
0.8681795 2 31<br />
y=4.057913303375244+<br />
imDrkQt*-4.935928344726563+<br />
LHDROQg*0.097806222736835+<br />
119 23167_ aSPRtQg*0.059412382543087<br />
0.938799143 3 31<br />
120 23167_<br />
y=4.060825824737549+<br />
imDrkQt*-4.952915191650390+<br />
LHDROQg*0.097219981253147+<br />
iSPRtQg*0.059157751500607<br />
y=1.742758248357947+<br />
inPRlQg*0.100852680149301+<br />
0.939431727 3 31<br />
121 408461_ lPDMqMg*0.003099560484118<br />
0.80557016 2 40<br />
122 408461_<br />
y=1.139803152319389+<br />
inPRlQg*0.087893430183274+<br />
0.917551726 4 40<br />
213
lPDMoMg*0.003517539776609+<br />
iAMRqQg*2.431579364841151+<br />
inMRkQt*1.038853874815755<br />
y=-4.447927898225615+<br />
imDdSCg*2.435295979512419+<br />
123 408462_ iiMrqQg*0.094635156307397<br />
0.785285688 2 40<br />
124 408462_<br />
y=-9.985955210032028+<br />
imDdSCg*4.564366234578961+<br />
isDrqQg*0.002945010877990+<br />
IIMDQQg*5.203670331019382+<br />
lmMrsGg*1.483206222543829<br />
y=0.802847494580493+<br />
inPRlQg*0.111337641528975+<br />
0.903722129 4 40<br />
125 408464_ iHMMTQt*0.000000009980546<br />
0.75212455 2 40<br />
126 408464_<br />
y=0.624897025648112+<br />
inPRlQg*0.105048221495900+<br />
iHMMTQt*0.000000009918681+<br />
IHMDTQg*-9.248476294178811+<br />
InPdJQg*1.727457275576125<br />
y=2.567506668233360+<br />
ibDMFHt*-1.471170216670452+<br />
0.920210241 4 40<br />
127 Dipepti<strong>de</strong>s_ ISPdlMg*0.117473661385305<br />
y=4.581803041430724+<br />
IHMdKEg*-0.039915577766273+<br />
0.84794137 2 58<br />
128 Dipepti<strong>de</strong>s_ IBPmpGg*0.639122246849638<br />
0.849074656 2 58<br />
y=2.208486080169678+<br />
IbMmjHg*0.248430266976357+<br />
IbPdPHg*0.020541135221720+<br />
129 Dipepti<strong>de</strong>s_ IBMRQCg*-0.265679538249969<br />
0.879454732 3 58<br />
y=15.605128288269043+<br />
ibDMFHt*-1.721762657165527+<br />
ISPdlMg*0.124963581562042+<br />
imDmFEt*-166.574951171875008+<br />
130 Dipepti<strong>de</strong>s_ ImPrSEt*-0.121208801865578<br />
0.903556645 4 58<br />
131 Dipepti<strong>de</strong>s_<br />
y=-7.197427749633789+<br />
IbMmjHg*0.236571803689003+<br />
IbPdPHg*0.020058955997229+<br />
IBMRQCg*-0.236558765172958+<br />
ImDmEEt*2.080404758453369+<br />
ImDrFEt*-0.038597311824560<br />
y=3.120874910401321+<br />
IIDDKGg*-0.441475190602858+<br />
0.925133169 5 58<br />
132 PCB_lkow_ IHDRKEg*0.044664834835730<br />
0.889745045 2 206<br />
y=3.039301324572242+<br />
IIDDKGg*-0.420795249377539+<br />
IHDRKEg*0.044187988743215+<br />
aHMmjQt*0.069692154874390+<br />
133 PCB_lkow_ aSMMjQg*-37.502291360990682 0.916807642 4 206<br />
134 PCB_lkow_<br />
y=-12.993183460296381+<br />
aHMmjQt*0.073027271465754+<br />
aSMMjQg*-41.685504895336179+<br />
iBMmwHg*1195.953967146027040+ 0.92728403 6 206<br />
214
iBMmwHg*1195.781250000000000+<br />
iFPMECg*0.000000000046040+<br />
inPRjQt*-0.053628481878679<br />
y=5.085278949837590+<br />
imMrFHt*-357.296321414089600+<br />
135 PCB_rrf_ iHDdFHg*2.156138113196185<br />
0.692921683 2 209<br />
136 PCB_rrf_<br />
y=6.055340736461524+<br />
imMrFHt*-416.942003738513088+<br />
iHDdFHg*2.313956389789302+<br />
iMMMjQg*1.829475297508006+<br />
iAMrVQg*-0.002506945942322<br />
y=5.522010734067013+<br />
iSMMWHg*-8112.253036635951360+<br />
0.736793462 4 209<br />
137 Triazines_ iSMmEQt*194.350344691394656 0.975281158 2 30<br />
y=1.741930263231576+<br />
iSMMWHg*-9261.099477423027200+<br />
iAMdEHg*10.338581077497056+<br />
138 Triazines_ INDRLQg*3.891633816915113<br />
0.983012783 3 30<br />
y=5.660616397857666+<br />
iSMmEQt*200.968338012695296+<br />
iSMMWHg*-9010.562500000001280+<br />
LHmrPQg*0.060792036354542+<br />
139 Triazines_ INPRJQg*2.838208675384522<br />
0.988145828 4 30<br />
y=5.753315448760986+<br />
iSMmEQt*198.759780883789088+<br />
iSMMWHg*-9006.287109375000320+<br />
LADmkQt*-0.071008183062077+<br />
140 Triazines_ INPRJQg*2.863457918167114<br />
0.988538325 4 30<br />
141 Triazines_<br />
y=5.974672317504883+<br />
iSMmEQt*197.155532836914080+<br />
iSMMWHg*-9045.324218750000640+<br />
LBDmkQt*-0.069745272397995+<br />
INPRJQg*2.900454759597779<br />
y=-5.989828784974575+<br />
ISDmsHt*0.023998570742623+<br />
0.98857367 4 30<br />
142 PCB_rrt_ lADrtHg*-1.022659619437935<br />
y=8.908911583895442E+000+<br />
liPRLCg*5.130496472711478E+000+<br />
0.997201518 2 209<br />
143 34121_ IAPRVQg*-4.006474847883577E+001<br />
y=3.184913714944090E+000+<br />
iAPrWCt*-7.367710068568820E+001+<br />
0.530525286 2 76<br />
144 34121_ imPdlMg*2.743775705121285E+000<br />
y=1.394098640420996E+001+<br />
lBDDPQg*4.455875932852346E+000+<br />
0.539820496 2 76<br />
145 34121_ IbPDPQg*-9.162168698947033E+000 0.548704368 2 76<br />
y=1.186554369769341E+001+<br />
imMRjQg*-3.194956703543156E-001+<br />
INMMwQg*2.201541664377901E+003+<br />
lBDDPQg*3.723218963557573E+000+<br />
146 34121_ IbPDPQg*-7.692180382738973E+000 0.67843743 4 76<br />
147 34121_<br />
y=1.121850860583595E+001+<br />
imMRjQg*-3.744935336220445E-001+ 0.697382796 4 76<br />
215
148 34121_<br />
imDDKQg*7.994101026398718E-001+<br />
lBDDPQg*4.758667402431983E+000+<br />
IbPDPQg*-7.950113079258346E+000<br />
y=1.094115134180832E+001+<br />
imMRjQg*-3.710272139159518E-001+<br />
imPDKQg*8.467292793176487E-001+<br />
lBDDPQg*4.730475798631939E+000+<br />
IbPDPQg*-7.809163830375249E+000<br />
y=9.353880712342770E-001+<br />
IHMdpMg*2.405448896100415E+002+<br />
0.714731788 4 76<br />
149 JCCS2001_ IHMdOMg*-9.877864464810714E-002<br />
y=1.031856753982042E+000+<br />
IHMdoMg*4.817499113970195E+001+<br />
0.883683364 2 47<br />
150 JCCS2001_ IHMdOCg*-3.550966400040491E+000 0.88733564 2 47<br />
y=2.021528030038608E+000+<br />
iAPMLHg*-2.119616905782861E+001+<br />
aAPrwQt*-1.683039388077890E-004+<br />
IHMdoMg*4.587595185744087E+001+<br />
151 JCCS2001_ IHMdOCg*-3.404948579625964E+000 0.937366326 4 47<br />
y=2.628600269530879E+000+<br />
iAPMLHg*-2.670560915091208E+001+<br />
imDrDQg*-5.893439946409806E+000+<br />
IHMdpMg*2.156046225910141E+002+<br />
152 JCCS2001_ IHMdOMg*-9.297899627956369E-002 0.940027138 4 47<br />
y=8.140489476203218E-001+<br />
lmDRsQg*-5.205699955284682E-002+<br />
iAPrtQg*1.837718043971574E-003+<br />
IHMdpMg*2.408973139743459E+002+<br />
153 JCCS2001_ IHMdOMg*-9.638490508381616E-002 0.940331599 4 47<br />
y=-8.200569073048715E+000+<br />
lmPrsCg*-9.942578337233752E-001+<br />
IIMdPQg*1.475164370718451E+002+<br />
154 3300_ IHDrFHt*7.958746115790257E-001 0.941640524 3 34<br />
155 3300_<br />
y=-7.395268591280339E+000+<br />
lmPrVQt*-2.344557159714253E-001+<br />
iNMMkQg*-2.851107205952929E-002+<br />
lmPrsCg*-1.112393160040784E+000+<br />
IIMdPQg*1.932535706999829E+002+<br />
IHDrFHt*7.483860535215806E-001<br />
y=-62.361371746820275+<br />
lSDmwMt*6.372504386827629+<br />
0.975828003 5 34<br />
156 15aacidsCHI_ iHPDEQg*0.058693170881799<br />
y=-62.361371746820275+<br />
lSDmwMt*6.372504386827629+<br />
0.99 3 15<br />
157 15aacidsDM_ iHPDEQg*0.058693170881799<br />
y=-62.361371746820275+<br />
lSDmwMt*6.372504386827629+<br />
0.99 3 15<br />
158 15aacidsEHu_ iHPDEQg*0.058693170881799<br />
y=-62.361371746820275+<br />
lSDmwMt*6.372504386827629+<br />
0.99 3 15<br />
159 15aacidsHTH_ iHPDEQg*0.058693170881799<br />
0.99 3 15<br />
160 15aacidsHyE_ y=-62.361371746820275+ 0.99 3 15<br />
216
161 15aacidsHyd_<br />
lSDmwMt*6.372504386827629+<br />
iHPDEQg*0.058693170881799<br />
y=-62.361371746820275+<br />
lSDmwMt*6.372504386827629+<br />
iHPDEQg*0.058693170881799<br />
y=-62.361371746820275+<br />
lSDmwMt*6.372504386827629+<br />
0.99 3 15<br />
162 15aacidsKDH_ iHPDEQg*0.058693170881799<br />
y=-62.361371746820275+<br />
lSDmwMt*6.372504386827629+<br />
0.99 3 15<br />
163 15aacidsLPH_ iHPDEQg*0.058693170881799<br />
y=-62.361371746820275+<br />
lSDmwMt*6.372504386827629+<br />
0.99 3 15<br />
164 15aacidsLac_ iHPDEQg*0.058693170881799<br />
y=-62.361371746820275+<br />
lSDmwMt*6.372504386827629+<br />
0.99 3 15<br />
165 15aacidsLogP_ iHPDEQg*0.058693170881799<br />
y=-62.361371746820275+<br />
lSDmwMt*6.372504386827629+<br />
0.99 3 15<br />
166 15aacidsMR_ iHPDEQg*0.058693170881799<br />
y=-62.361371746820275+<br />
lSDmwMt*6.372504386827629+<br />
0.99 3 15<br />
167 15aacidsPol_ iHPDEQg*0.058693170881799<br />
y=-62.361371746820275+<br />
lSDmwMt*6.372504386827629+<br />
0.99 3 15<br />
168 15aacidsRef_ iHPDEQg*0.058693170881799<br />
y=-62.361371746820275+<br />
lSDmwMt*6.372504386827629+<br />
0.99 3 15<br />
169 15aacidsSlb_ iHPDEQg*0.058693170881799<br />
y=-3.899995456511689E+000+<br />
iHDMkMg*5.656940765236902E-002+<br />
0.99 3 15<br />
170 cqdmdfv_ IHDDfMg*5.237900484407559E-002<br />
y=-3.863052189141237E+000+<br />
iHDMkMg*5.685380086944401E-002+<br />
0.791717722 2 37<br />
171 cqdmdfv_ IHDDFMg*5.119539422851146E-002<br />
y=4.983642390909260E+000+<br />
IiDDFMg*1.095693192033933E+000+<br />
0.792894457 2 37<br />
172 cqdmdfv_ IGPRSHg*-2.866877787558061E+000 0.837765633 2 37<br />
y=8.729908076844302E+000+<br />
IfMmkEt*-3.193361463363008E+002+<br />
iFPDJQg*7.052011286452327E-003+<br />
IHDMkMg*-6.940338868451494E+002+<br />
173 cqdmdfv_ IHDDFMg*5.265590211048012E-002 0.902243362 4 37<br />
y=9.114670320012248E+000+<br />
IFMmkEg*-1.075642411355964E+004+<br />
ifPDJQg*1.326584216201407E-002+<br />
IHDMkMg*-7.437831566808608E+002+<br />
174 cqdmdfv_ IHDDFMg*5.301240391684132E-002 0.90226774 4 37<br />
175 cqdmdfv_<br />
y=7.867373431327034E+000+<br />
IHMmlHt*2.253830286409211E+000+<br />
IHDDfHg*2.173108607718223E+000+<br />
IHDMkMg*-1.281502744982768E+003 0.873686181 3 37<br />
217
y=1.003396546771776E+001+<br />
IHMmlHt*2.269406814666561E+000+<br />
lHDDfHg*2.658929646993912E+000+<br />
176 cqdmdfv_ IHDMkMg*-1.287456019297492E+003 0.878203069 3 37<br />
y=8.198277549218441E+000+<br />
IFMMwHt*-4.060849064392680E-006+<br />
iGMdKQg*-3.223920991936599E-001+<br />
IHDMlGg*4.022926700181765E+001+<br />
iGPDJQg*3.428375813105643E+000+<br />
177 cqdmdfv_ IHDMkMg*-2.863067426695822E+003 0.932284995 5 37<br />
y=8.196619870093642E+000+<br />
IFMRwHt*-4.090535037179962E-006+<br />
iGMdKQg*-3.223966410814169E-001+<br />
IHDMlGg*4.024536545952987E+001+<br />
iGPDJQg*3.428953982552353E+000+<br />
178 cqdmdfv_ IHDMkMg*-2.863886206931033E+003 0.932302619 5 37<br />
y=7.875540309968831E+000+<br />
iGMdKQg*-3.178216723715206E-001+<br />
IFDrfHt*-3.712320549172804E-004+<br />
IHDMlGg*4.300507686737912E+001+<br />
iGPDJQg*3.467470958104024E+000+<br />
179 cqdmdfv_ IHDMkMg*-2.995984495901780E+003 0.93235562 5 37<br />
y=1.017765046541389E+001+<br />
IGDMlQt*1.033819008180921E+000+<br />
IbMDpHg*9.506440434006870E-003+<br />
IHMmlHt*2.986180487676706E+000+<br />
lHDDfHg*3.120537844300812E+000+<br />
180 cqdmdfv_ IHDMkMg*-1.693877987674947E+003 0.930544951 5 37<br />
y=1.021449314660090E+001+<br />
lmMmEHg*-2.768917870643550E+000+<br />
imMmsHg*-1.332239024874281E+001+<br />
IHDMlGg*6.254578659016686E+001+<br />
iGPDJQg*2.557922177945907E+000+<br />
181 cqdmdfv_ IHDMkMg*-3.682822869950283E+003 0.9361187 5 37<br />
182 cqdmdfv_<br />
Legendă:<br />
y=9.437272554095401E+000+<br />
ImMmEHg*-7.326534943461503E-001+<br />
imMmtHg*-7.887482194328009E+000+<br />
IHDMlGg*5.981435730123702E+001+<br />
iGPDJQg*2.221188846182277E+000+<br />
IHDMkMg*-3.478875295297901E+003 0.936874282 5 37<br />
÷ Nr: număr current;<br />
÷ Set: <strong>de</strong>numirea setului <strong>de</strong> molecule investigat;<br />
÷ Mo<strong>de</strong>l: mo<strong>de</strong>lul QSAR obţinut;<br />
÷ r2: coeficientul <strong>de</strong> <strong>de</strong>terminare între activitatea observată şi valoarea sa prezisă<br />
<strong>de</strong> ecuaţia <strong>de</strong> regresie folosind <strong>de</strong>scriptorii <strong>de</strong> structură MDF calculaţi<br />
÷ v: numărul <strong>de</strong> <strong>de</strong>scriptori <strong>de</strong> structură folosiţi <strong>de</strong> mo<strong>de</strong>lul QSAR obţinut;<br />
÷ m: munărul <strong>de</strong> molecule din setul supus investigaţiei.<br />
2009A5. Obţinerea relaţiilor (semi)Cantitative Structură-Activitate, sQSARs<br />
218
Relaţii semicantitative structură-activitate s-au obţinut pe parcursul <strong>de</strong>sfăşurării cercetării atât în<br />
2008 cât şi în 2009, fiind cuprinse şi astfel valorificate în publicaţii.<br />
S-a <strong>de</strong>zvoltat şi documentat o aplicaţie bazată pe algoritm genetic pentru obţinerea relaţiilor<br />
semicantitative structură-activitate; aplicaţia constituie subiectul unei lucrări care este în prezent sub<br />
formă <strong>de</strong> manuscript <strong>de</strong>pozitat online (ArXiv http://arxiv.org/abs/0906.4846) fiind trimis spre<br />
publicare la o revistă <strong>de</strong> specialitate.<br />
Analiza cu privire la obţinerea relaţiilor (semi)cantitative structură-activitate, sQSARs s-a efectuat<br />
pe un set voluminos <strong>de</strong> date (206 compuşi) pentru a evita selecţia bazată pe şansă.<br />
Rolul algoritmului genetic se regăseşte prin următoarea analogie. Conceptul <strong>de</strong> familie este Species<br />
comun în biologie, organismele vii fiind clasificate după o structură arborescentă, una<br />
dintre acestea fiind ilustrată alăturat.<br />
Genus<br />
Şi în ceea ce priveşte compuşii chimici, relaţiile <strong>de</strong> înrudire între aceştia sunt exprimate<br />
Family<br />
prin intermediul apartenenţei la o clasă sau alta, aici însă existând mai multe sisteme <strong>de</strong><br />
clasificare, în funcţie <strong>de</strong> prezenţa unui atom sau grupe <strong>de</strong> atomi în moleculă, <strong>de</strong><br />
Or<strong>de</strong>r<br />
proprietăţile fizico-chimice sau biologice ale acestora.<br />
O clasificare a compuşilor organici după grupările funcţionale pe care aceştia le posedă este Class<br />
ilustrată alăturat.<br />
Este astfel justificat să presupunem că construcţia şi utilizarea <strong>de</strong> familii <strong>de</strong> <strong>de</strong>scriptori Phylum<br />
pentru obţinerea <strong>de</strong> ecuaţii qSPAR este calea naturală <strong>de</strong> urmat. Analiza topologică a unei<br />
structuri moleculare ne conduce în mod inevitabil la familii <strong>de</strong> <strong>de</strong>scriptori moleculari, Kingdom<br />
având la dispoziţie o serie <strong>de</strong> matrici pătratice care cumulează caracteristici moleculare<br />
<strong>de</strong>rivate din structură (Matricea <strong>de</strong> Adiacenţă, Matricea <strong>de</strong> Inci<strong>de</strong>nţă, Matricea <strong>de</strong> Distanţă, Domain<br />
Matricea <strong>de</strong> Detur, Matrici combinatoriale, Szeged, Cluj, şi altele) şi o serie <strong>de</strong> modalităţi<br />
<strong>de</strong> cumulare a valorilor conţinute în aceste matrici (indici pe matrici pătratice).<br />
Trei familii <strong>de</strong> <strong>de</strong>scriptori fac subiectul cercetării:<br />
÷ FPIF (Fragmental Property In<strong>de</strong>x Family);<br />
÷ MDF (Molecular Descriptors Family);<br />
÷ MDFV (Molecular Descriptors Family Vertex).<br />
FPIF (Jäntschi şi Diu<strong>de</strong>a, 2000) este o metodă matriceală bazată pe matrice pătratice <strong>de</strong> proprietăţi<br />
<strong>de</strong>rivate din structură. Astfel foloseşte: topologia moleculară (dA(b,c) - distanţa topologică în<br />
structura `A` <strong>de</strong> la atomul `b` la atomul `c`; δA(b,c) - <strong>de</strong>turul - i.e. cea mai lungă cale - topologică în<br />
structura `A` <strong>de</strong> la atomul `b` la atomul `c`; WA(b,c) - mulţimea drumurilor în structura `A` <strong>de</strong> la<br />
atomul `b` la atomul `c`; PA(b,c) - mulţimea căilor în structura `A` <strong>de</strong> la atomul `b` la atomul `c`;<br />
DA(b,c) - mulţimea căilor distanţă în structura `A` <strong>de</strong> la atomul `b` la atomul `c`; ΔA(b,c) - mulţimea<br />
căilor <strong>de</strong>tur în structura `A` <strong>de</strong> la atomul `b` la atomul `c`; A\p - structura ce rezultă din înlăturarea<br />
atomilor conţinuţi în calea `p` şi legăturilor pe care aceştia le formează în structura A exceptând<br />
capetele căii) pentru a obţine pentru fiecare pereche <strong>de</strong> atomi un set <strong>de</strong> atomi vecini utilizând în<br />
acest scop un set <strong>de</strong> 6 criterii (FC - criteriu fragmentare): Sz: SzDi - Szi,j={x | x Atom} un<strong>de</strong><br />
dMoleculă(x,i)
IP1 - semi-suma elementelor din matrice; IP2 - semi-suma pătratelor elementelor din matrice; IE1 -<br />
semi-suma elementelor din matricea ce rezultă din înmulţirea matricei <strong>de</strong> proprietate cu matricea <strong>de</strong><br />
adiacenţă; IE2 - semi-suma pătratelor elementelor din matricea ce rezultă din înmulţirea matricei <strong>de</strong><br />
proprietate cu matricea <strong>de</strong> adiacenţă; operator <strong>de</strong> linearizare (LO): I - funcţia i<strong>de</strong>ntitate f(x)=x; R -<br />
reciproca f(x)=1/x; L - logaritmul f(x)=ln(x);<br />
Astfel, familia FPIF este constituită dintr-un număr <strong>de</strong> membrii egal cu înmulţirea tuturor<br />
posibilităţilor <strong>de</strong> alegere <strong>de</strong> mai sus (2·2·4·8·6·5·4·3 = 46080), astfel:<br />
÷ FPIF = IM×DM×AP×PD×FC×SM×MI×LO<br />
÷ IM = {R, D};<br />
÷ DM = {T, G};<br />
÷ AP = {M, E, C, Q};<br />
÷ PD = {p, d, 1/p, 1/d, pd, p/d, p/d 2 , p 2 /d 2 };<br />
÷ FC = {SzDi, SzDe, CjDi, CjDe, CfDi, CfDe};<br />
÷ SM = {S, P, A, G, H};<br />
÷ MI = {IP1, IP2, IE1, IE2};<br />
÷ LO = {I, R, L}.<br />
MDF (Jäntschi, 2004) este o metodă bazată pe fragmente moleculare obţinute din perechi <strong>de</strong><br />
vârfuri. În mod similar cu metoda FPIF, metoda MDF foloseşte doi operatori <strong>de</strong> distanţă (DO):<br />
topologică (t) şi geometrică (g), şase proprietăţi atomice (AP): cardinalitate (C), număr <strong>de</strong> atomi <strong>de</strong><br />
hidrogen direct legaţi (H), masa atomică relativă (M), electronegativitatea (E), electronegativitatea<br />
<strong>de</strong> grup (G) şi sarcina atomică parţială (Q), douăzeci şi patru <strong>de</strong> <strong>de</strong>scriptori <strong>de</strong> interacţiune (ID):<br />
D(d), d(1/d), O(p1), o(1/p1), P(p1p2), p(1/p1p2), Q(√p1p2), q(1/√p1p2), J(p1d), j(1/p1d), K(p1p2d),<br />
k(1/p1p2d), L(d√p1p2), l(1/d√p1p2), V(p1/d), E(p1/d2), W(p1 2 /d), w(p1p2/d), F(p1 2 /d 2 ), f(p1p2/d 2 ),<br />
S(p1 2 /d 3 ), s(p1p2/d 3 ), T(p1 2 /d 4 ), t(p1p2/d 4 ), şase modalităţi <strong>de</strong> interacţiune (IM): `R` şi `r` - mo<strong>de</strong>le<br />
rare, `M` şi `m` - mo<strong>de</strong>le medii, şi `D` şi `d` - mo<strong>de</strong>le <strong>de</strong>nse - fiecare dintre ele relativ la primul<br />
atom al fragmentului şi respectiv la atomul referinţă exterior fragmentului, patru meto<strong>de</strong> <strong>de</strong><br />
fragmentare (FC): `m` - minimale, `M` - maximale, `D` - Szeged, `P` - Cluj pe căi, nouăsprezece<br />
modalităţi <strong>de</strong> suprapunere globală a interacţiunii fragmentelor (SF - formula <strong>de</strong> suprapunere): grupul<br />
<strong>de</strong> mărimi ( `m` - selectează cea mai mică valoare; `M` - cea mai mare valoare; `n` - cea mai mică<br />
valoare absolută; `N` - cea mai mare valoare absolută); grupul <strong>de</strong> medii ( `S` - suma; `A` - media<br />
aritmetică după numărul <strong>de</strong> proprietăţi <strong>de</strong> fragmente; `a` - media aritmetică după numărul <strong>de</strong><br />
fragmente; `B` - media aritmetică după numărul <strong>de</strong> atomi; `b` - media aritmetică după numărul <strong>de</strong><br />
legături); grupul geometric (`P` - multiplicare; `G` - medie geometrică după numărul <strong>de</strong> proprietăţi<br />
<strong>de</strong> fragmente; `g` - medie geometrică după numărul <strong>de</strong> fragmente; `F` - medie geometrică după<br />
numărul <strong>de</strong> atomi; `f`` - media geometrică după numărul <strong>de</strong> legături); grupul armonic (`s` - suma<br />
armonică; `H` - medie armonică după numărul <strong>de</strong> proprietăţi <strong>de</strong> fragmente; `h` - medie armonică<br />
după numărul <strong>de</strong> fragmente; `I` - medie armonică după numărul <strong>de</strong> atomi; `i` - media armonică<br />
după numărul <strong>de</strong> legături), şi şase operatori <strong>de</strong> linearizare (LO): `I` - i<strong>de</strong>ntitate (f(x)=x), `i` - inversa<br />
(f(x)=1/x), `A` - valoare absolută (f(x)=|x|), `a` - inversul valorii absolute (f(x)=1/|x|), `L` - logaritm<br />
(f(x)=ln(x)), şi `l` - logaritmul valorii absolute (f(x)=ln(|x|)).<br />
Astfel, familia MDF este constituită dintr-un număr <strong>de</strong> membrii egal cu înmulţirea tuturor<br />
posibilităţilor <strong>de</strong> alegere <strong>de</strong> mai sus (2·6·6·24·4·19·6 = 787968), astfel:<br />
÷ MDF = DM×AP×ID×IM×FC×SM×LO<br />
÷ DM = {t, g};<br />
÷ AP = {C, H, M, E, G, Q};<br />
÷ PD = {d, 1/d, p1, 1/p1, p1p2, 1/p1p2, √p1p2, 1/√p1p2, p1d, 1/p1d, p1p2d, 1/p1p2d, d√p1p2, 1/d√p1p2,<br />
p1/d, p1/d2, p1 2 /d, p1p2/d, p1 2 /d 2 , p1p2/d 2 , p1 2 /d 3 , p1p2/d 3 , p1 2 /d 4 , p1p2/d 4 };<br />
÷ IM = {r, R, m, M, d, D}<br />
÷ FC = {m, M, D, P};<br />
÷ SF = {m, M, n, N, S, A, a, B, b, P, G, g, F, f, s, H, h, I, i};<br />
÷ LO = {I, i, A, a, L, l}.<br />
220
MDFV (Jäntschi şi Bolboacă, 2008) este o metodă bazată pe vârfuri în locul perechilor <strong>de</strong><br />
vârfuri, în care sunt implementate două valori pentru operatorul <strong>de</strong> distanţă (DO), şapte proprietăţi<br />
atomice (AP), cincizeci şi opt <strong>de</strong> <strong>de</strong>scriptori <strong>de</strong> interacţiune (ID), şapte meto<strong>de</strong> <strong>de</strong> suprapunere la<br />
nivel <strong>de</strong> fragment (SF) şi la nivel <strong>de</strong> moleculă (SM), zece tipuri <strong>de</strong> interacţiune (IT), două unităţi <strong>de</strong><br />
exprimare (EU - unitate <strong>de</strong> <strong>de</strong>scriptor molecular `D` şi unitate <strong>de</strong> distanţă (coordonată centru)<br />
<strong>de</strong>scriptor molecular `d`), şi trei operatori <strong>de</strong> linearizare (LO: I - i<strong>de</strong>ntitate, R - reciproc, L -<br />
logaritm).<br />
Astfel, familia MDF este constituită dintr-un număr <strong>de</strong> membrii egal cu înmulţirea tuturor<br />
posibilităţilor <strong>de</strong> alegere <strong>de</strong> mai sus (2·7·58·7·7·10·2·3 = 2387280), astfel:<br />
÷ MDFV = DO×AP×ID×SF×SM×IT×EU×LO;<br />
÷ DO = {T, G};<br />
÷ AP = {C, H, M, E, Q, L, A};<br />
÷ ID = {J, j, O, o, P, p, Q, q, R, r, K, k, L, l, M, m, N, n, W, w, X, x, Y, y, Z, z, S, s, T, t, U, u, V,<br />
v, F, f, G, g, H, h, I, i, A, a, B, b, C, c, D, d, 0, 1, 2, 3, 4, 5, 6, 7};<br />
÷ SF = {A, a, I, i, F, P, C};<br />
÷ SM = {A, a, I, i, F, P, C};<br />
÷ IT = {f, F, c, C, p, P, a, A, i, I};<br />
÷ EU = {D, d};<br />
÷ LO = {I, R, L}<br />
Obţinerea unei ecuaţii qSPAR cu membrii ai unei familii <strong>de</strong> <strong>de</strong>scriptori este o problemă simplă<br />
atunci când se caută regresii liniare simple, tot ceea ce trebuie făcut rezumându-se la calcularea<br />
valorilor pentru fiecare membru al familiei şi efectuarea regresiei liniare între valorile acestuia<br />
pentru fiecare moleculă în parte şi valorile măsurate ale proprietăţii/activităţii observate.<br />
Problema regresiei liniare multiple cu doi membrii ai unei familii <strong>de</strong> <strong>de</strong>scriptori este o problemă<br />
relativ simplă, când trebuie să se caute care este cea mai bună ecuaţie <strong>de</strong> regresie ce conţine o<br />
pereche <strong>de</strong> <strong>de</strong>scriptori moleculari. Complexitatea problemei însă începe să apară, numărul <strong>de</strong><br />
combinaţii din spaţiul <strong>de</strong> căutare fiind <strong>de</strong>ja aici semnificativ pentru o căutare sistematică <strong>de</strong> fiecare<br />
cu fiecare (presupunând că toţi <strong>de</strong>scriptorii sunt valizi, numărul total <strong>de</strong> combinaţii este <strong>de</strong> 1.1·10 9<br />
pentru FPIF, 3.1·10 11 pentru MDF, şi 2.8·10 12 pentru MDFV).<br />
Începând cu trei <strong>de</strong>scriptori şi continuând cu valorile superioare ale acestuia problema regresiei<br />
liniare multiple cu membrii ai unei familii <strong>de</strong> <strong>de</strong>scriptori este o problemă dificilă, spaţiul <strong>de</strong> căutare<br />
crescând exponenţial cu numărul <strong>de</strong> <strong>de</strong>scriptori implicaţi în regresie multiplă şi timpul <strong>de</strong> execuţie<br />
ieşind din timpul real.<br />
Implementarea şi utilizarea unui algoritm genetic conferă avantajul unei căutări euristice în locul<br />
unei căutări sistematice care ar implica explorarea întregului număr <strong>de</strong> posibilităţi <strong>de</strong> combinare a<br />
<strong>de</strong>scriptorilor pentru a forma ecuaţia <strong>de</strong> regresie liniară.<br />
Construcţia unui <strong>de</strong>scriptor membru al unei familii <strong>de</strong> <strong>de</strong>scriptori poate fi privită ca execuţia unui<br />
cod genetic <strong>de</strong>finit <strong>de</strong> numele <strong>de</strong>scriptorului (FPIF = IM×DM×AP×PD×FC×SM×MI×LO; MDF =<br />
DM×AP×ID×IM×FC×SM×LO; MDFV = DO×AP×ID×SF×SM×IT×EU×LO) ceea ce înseamnă că familia <strong>de</strong><br />
<strong>de</strong>scriptori <strong>de</strong>fineşte materialul genetic al populaţiei, în timp ce valorile pe care le capătă un<br />
<strong>de</strong>scriptor pentru setul <strong>de</strong> molecule investigat <strong>de</strong>fineşte un individ al populaţiei.<br />
Tăria (scorul) unui individ se asociază cu performanţa acestuia într-o ecuaţie qSPAR care îl conţine,<br />
şi obiectivul evoluţiei este obţinerea unei cât mai bune ecuaţii <strong>de</strong> regresie.<br />
Obiectivul căutării <strong>de</strong>vine astfel găsirea submulţimii {Xi}1≤i≤n a mulţimii {Xi}1≤i≤N care asigură cea<br />
mai mare semnificaţie statistică pentru ecuaţia <strong>de</strong> regresie (1) sau (2) prin intermediul<br />
semnificaţiilor date <strong>de</strong> coeficientul <strong>de</strong> corelaţie (ecuaţia 5) fie prin intermediul semnificaţiei date <strong>de</strong><br />
valorile Stu<strong>de</strong>nt t (ecuaţia 17).<br />
40 41<br />
Fiecare genă [ ] codifică câte un operator folosit în construcţia cromozomului [ ] unui <strong>de</strong>scriptor<br />
[ 40 ] genă = una din valorile <strong>de</strong> pe coloana Gene a Tabelului 36; ex. IM pentru FPIF<br />
[ 41 ] cromozom = secvenţa <strong>de</strong> gene a unei familii în Tabelul 36; ex. DMAPIDIMFCSMLO pentru MDF<br />
221
molecular. Fiecare <strong>de</strong>scriptor al unei familii <strong>de</strong> <strong>de</strong>scriptori este un genotip [ 42 ] şi toţi împreună<br />
constituie materialul genetic [ 43 ] al familiei respective.<br />
Spaţiul <strong>de</strong> căutare al familiilor <strong>de</strong> <strong>de</strong>scriptori moleculari<br />
Familie Gene Genom<br />
FPIF<br />
(©2000)<br />
MDF<br />
(©2005)<br />
MDFV<br />
(©2008)<br />
SAPF<br />
(©2009)<br />
IM R D<br />
DM T G<br />
AP M E C Q<br />
PD __p__ __d__ _1/p_ _1/d_ _p*d_ _p/d_ _p/d2 p2/d2<br />
FC si se ji je fi fe<br />
SM S P A G H<br />
MI P_ P2 E_ E2<br />
LO I R L<br />
DM t g<br />
AP C H M E G Q<br />
ID D d O o P p Q q J j K k L l V E W w F f S s T t<br />
IM r R m M d D<br />
FC m M D P<br />
SM m M n N S A a B b P G g F f s H h I i<br />
LO I i A a L l<br />
DO T G<br />
AP C H M E Q L A<br />
ID<br />
J j O o P p Q q R r K k L l M m N n W w X x Y y Z z S s T<br />
t U u V v F f G g H h I i A a B b C c D d 0 1 2 3 4 5 6 7<br />
SF A a I i F P C<br />
SM A a I i F P C<br />
IT f F c C p P a A i I<br />
EU D d<br />
LO I R L<br />
CF D P C<br />
DO T G<br />
AP C H M E A<br />
DP I E H G A Q S<br />
PP I E H G A Q S<br />
OM S M<br />
MP I E H G A Q S<br />
LO I A S T Q R L<br />
Numărul <strong>de</strong> valori pe care le codifică fiecare genă variază <strong>de</strong> la 2 valori (în cazul genei ce codifică<br />
tipul <strong>de</strong> metrică <strong>de</strong> distanţă - topologică şi geometrică - DM pentru FPIF şi MDF şi DO pentru<br />
MDFV şi SAPF) până la 58 <strong>de</strong> valori în cazul <strong>de</strong>scriptorului <strong>de</strong> interacţiune ID al familiei MDFV.<br />
Volumul materialului genetic variază şi Tabelul 37 sumarizează aceste variaţii:<br />
Volumele familiilor <strong>de</strong> <strong>de</strong>scriptori moleculari<br />
Familie Gene Volum (N)<br />
FPIF (©2000) IM:2 DM:2 AP:4 PD:8 FC:6 SM:5 MI:4 LO:3 46080<br />
MDF (©2005) DM:2 AP:6 ID:6 IM:24 FC:4 SM:19 LO:6 787968<br />
MDFV (©2008) DO:2 AP:7 ID:58 SF:7 SM:7 IT:10 EU:2 LO:3 2387280<br />
[ 42 ] genotip = o concretizare posibilă a valorilor fiecărei gene a unui cromozom; ex. TCJtAAfDI pentru MDFV<br />
[ 43 ] material genetic = mulţimea tuturor combinaţiilor posibile <strong>de</strong> valori <strong>de</strong> pe coloana Genom în tabelul 36; ex. {D, P,<br />
C} × {T,G} × {C,H,M,E,A} × {I,E,H,G,A,Q,S} × {S,M} × {I,E,H,G,A,Q,S} × {I,E,H,G,A,Q,S} × {I,A,S,T,Q,R,L}<br />
pentru SAPF<br />
222
SAPF (©2009) CF:3 DO:2 AP:5 DP:6 PP:6 OM:2 MP:6 LO:6 77760<br />
Mărimea spaţiului <strong>de</strong> căutare (VS) se calculează în funcţie <strong>de</strong> volumul familiei <strong>de</strong> <strong>de</strong>scriptori<br />
moleculari (N) şi ordinul <strong>de</strong> multiplicitate al regresiei multiple (`n`) cu formula:<br />
n N − j+<br />
1 ⎛ N⎞<br />
VS<br />
= ∏ = ⎜ ⎟<br />
(20)<br />
j=<br />
1 j ⎝ n ⎠<br />
Volumul spaţiului <strong>de</strong> căutare dat <strong>de</strong> ecuaţia (20) permite exprimarea complexităţii calcului necesar<br />
pentru a parcurge întreg spaţiul <strong>de</strong> căutare, această valoare fiind dublată <strong>de</strong>oarece căutarea se poate<br />
face pe baza ecuaţiei (1) sau ecuaţiei (2), ecuaţii care folosesc expresii diferite <strong>de</strong> calcul al<br />
parametrilor ecuaţiei <strong>de</strong> regresie.<br />
Metodologia algoritmilor genetici presupune prelevarea iniţială (întâmplător sau <strong>de</strong>terministic) a<br />
unui eşantion [ 44 ] <strong>de</strong> cromozomi din materialul genetic format dintr-un şir <strong>de</strong> <strong>de</strong>scriptori X1, ..., Xp<br />
45 46<br />
care este supus procesului <strong>de</strong> evoluţie [<br />
] în cultivar [ ]. Algoritmul genetic [ 47 ] operează astfel<br />
asupra eşantionului care suferă modificări în fiecare generaţie [ 48 ]. Fiecare mulţime <strong>de</strong> `n`<br />
<strong>de</strong>scriptori distincţi reprezintă un punct în spaţiul <strong>de</strong> căutare [<br />
ilă [ ].<br />
49 ] şi în acelaşi timp o soluţie<br />
50<br />
posib<br />
Operatorii <strong>de</strong> bază ai unui algoritm genetic sunt încrucişarea şi mutaţia cromozomilor. Încrucişarea<br />
[ 51 ] a două genotipuri presupune alegerea unei porţiuni <strong>de</strong> încrucişat <strong>de</strong>-a lungul şirului <strong>de</strong> gene<br />
(întâmplător sau <strong>de</strong>terministic) şi valorile celor două porţiuni <strong>de</strong> şiruri sunt schimbate între ele, când<br />
rezultă doi <strong>de</strong>scen<strong>de</strong>nţi. Mutaţia [ 52 ] unui genotip presupune modificarea unei valori a unei gene a<br />
cromozomului cu o altă valoare din lista valorilor posibile pentru gena respectivă. Rezultatul<br />
încrucişării şi al mutaţiei este obţinerea <strong>de</strong> <strong>de</strong>scen<strong>de</strong>nţi [ 53 ] sau fii.<br />
··· ··· ···<br />
site încrucişare părinţi<br />
··· ··· ···<br />
recombinare fii<br />
··· ··· ···<br />
··· ··· ···<br />
··· ··· părinte<br />
mutaţie<br />
genă supusă mutaţiei<br />
genă mutantă<br />
··· ··· fiu<br />
Încrucişare Mutaţie<br />
Selecţia [ 54 ] genotipurilor este operaţia prealabilă necesară încrucişării şi mutaţiei şi se face pe baza<br />
unui scor <strong>de</strong> selecţie [ 55 ]. Cel puţin o parte a <strong>de</strong>scen<strong>de</strong>nţilor reprezintă <strong>de</strong>scriptori viabili [ 56 ] putând<br />
[ 44 ] eşantion = submulţime a materialului genetic al familiei <strong>de</strong> <strong>de</strong>scriptori moleculari; ex. {DTCIISII, DTCIESII,<br />
DTCGISII} reprezintă un eşantion <strong>de</strong> volum 3 al materialului genetic al SAPF<br />
[ 45 ] evoluţie = proces genetic complex care implică procese <strong>de</strong> selecţie, încrucişare şi mutaţie<br />
[ 46 ] cultivar = spaţiu (<strong>de</strong> memorie, virtual) în care genotipurile sunt transformate în fenotipuri prin aplicarea operatorilor<br />
<strong>de</strong>finiţi <strong>de</strong> valorile genelor pentru întreg setul <strong>de</strong> `m` molecule supus studiului; fenotipul asociat genotipului este astfel<br />
un şir <strong>de</strong> `m` valori numerice (câte una pentru fiecare moleculă a setului)<br />
[ 47 ] algoritm genetic = algoritm care <strong>de</strong>scrie prin instrucţiuni procesul <strong>de</strong> evoluţie asupra eşantionului<br />
[ 48 ] generaţie = una din iteraţiile algoritmului genetic<br />
[ 49 ] spaţiul <strong>de</strong> căutare = mulţimea posibilităţilor <strong>de</strong> selecţie a `n` <strong>de</strong>scriptori din `VS` posibilităţi (relaţia 20)<br />
[ 50 ] soluţie posibilă = o ecuaţie <strong>de</strong> regresie cu `n` <strong>de</strong>scriptori distincţi <strong>de</strong>finită <strong>de</strong> relaţia (1) sau (2)<br />
[ 51 ] încrucişarea = procesul prin care o porţiune a materialului genetic al unui cromozom este înlocuită <strong>de</strong> porţiunea<br />
corespunzătoare a altui cromozom şi viceversa; încrucişarea este făcută în speranţa că dacă se recombină porţiuni <strong>de</strong><br />
genotipuri <strong>de</strong> succes, atunci acest proces este probabil să producă <strong>de</strong>scen<strong>de</strong>nţi chiar mai buni <strong>de</strong>cât părinţii din care<br />
provin<br />
[ 52 ] Mutaţie = operatorul care introduce modificări noi (inexistente în eşantionul unei generaţii); ceea ce este<br />
caracteristic în general mutaţiei şi implicit şi operatorului acesteia corespon<strong>de</strong>nt în algoritmii genetici este că ea se<br />
petrece cu o probabilitate scăzută, fiind <strong>de</strong>ci aplicată cu o probabilitate scăzută<br />
[ 53 ] Descen<strong>de</strong>nţi = genotipurile obţinute din încrucişarea şi eventual mutaţia indivizilor din eşantion<br />
[ 54 ] Selecţie = operatorul cu ajutorul căruia se extrage din eşantion mai mulţi indivizi care participă la înmulţire<br />
[ 55 ] Scor <strong>de</strong> selecţie = valoare numerică asociată individului din eşantion calculată pe baza (sau exprimată din) tăriei<br />
fenotipului în cultivar<br />
223
face atunci parte din soluţii candidate ale generaţiilor următoare. Descen<strong>de</strong>nţii viabili înlocuiesc o<br />
parte corespunzătoare a indivizilor din eşantion în urma unui proces <strong>de</strong> supravieţuire [ 57 ] aplicat<br />
indivizilor din eşantion pe baza unui scor <strong>de</strong> supravieţuire [ 58 ]. Un alt parametru al algoritmului<br />
59 60<br />
genetic îl reprezintă obiectivul evoluţiei [ ] care este urmărit pe baza unei funcţii obiectiv [ ].<br />
Urmărirea obiectivului evoluţiei se face odată la fiecare generaţie selectând din eşantion acei<br />
indivizi care maximizează sau, după caz minimizează valoarea funcţiei obiectiv (acei indivizi care<br />
fac parte din cea mai bună ecuaţie <strong>de</strong> regresie obţinută pe baza indivizilor din cultivar). Se poate<br />
opta ca indivizii care ating obiectivul evoluţiei într-o generaţie să fie păstraţi în eşantion, caz în care<br />
acestora nu li se mai aplică procesul <strong>de</strong> supravieţuire, ei fiind automat incluşi în eşantionul<br />
generaţiei următoare.<br />
Aşa cum rezultă din aplicarea procesului <strong>de</strong> supravieţuire, nu toţi indivizii unei generaţii<br />
supravieţuiesc şi sunt incluşi în generaţia următoare. Motivul acestui fapt este păstrarea unui număr<br />
constant <strong>de</strong> genotipuri în eşantionul <strong>de</strong>zvoltat în cultivar, astfel încât numărul <strong>de</strong> indivizi înlocuiţi<br />
din eşantion este egal cu numărul <strong>de</strong> <strong>de</strong>scen<strong>de</strong>nţi viabili obţinuţi în urma selecţiei, încrucişării şi<br />
mutaţiei.<br />
Selecţia şi supravieţuirea având la bază scorurile <strong>de</strong> selecţie şi <strong>de</strong> supravieţuire se realizează<br />
folosind o modalitate <strong>de</strong> selecţie şi supravieţuire [ 61 ]. Tabelul următor redă modalităţile <strong>de</strong> selecţie<br />
şi supravieţuire folosite.<br />
Selecţie (şi supravieţuire) în algoritmii genetici<br />
Metodă Expresia funcţiei <strong>de</strong> scor Selecţie Comentarii<br />
Proporţional pi=fi/Σifi Şansa <strong>de</strong> selecţie este proporţională cu<br />
scorul (utilizând probabilitatea pi în<br />
selecţie)<br />
Deterministic i | fi = max. Selecţia indivizilor este făcută pe baza celui<br />
fi=Fitness(Cromozom_i) sau min. mai tare (sau celui mai slab) individ<br />
(elitism)<br />
Turnir (fi,fj) Perechi <strong>de</strong> indivizi concurează între ei<br />
max. sau pentru selecţie (din nou este selectat cel<br />
min. mai tare sau cel mai slab)<br />
Normalizare gi=(fi-N0)(fmax.-fmin.)/(N1- pi=gi/Σigi O scală fixă [N0,N1] normalizează scorul<br />
[ 56 ] Viabilitatea (unui <strong>de</strong>scriptor molecular) = referă potenţialul acestuia <strong>de</strong> a fi folosit în regresii; un <strong>de</strong>scriptor este<br />
viabil dacă (ceea ce urmează referă fenotipul acestuia, viabilitatea referind astfel manifestarea fenotipică) cel puţin are<br />
valori reale şi finite pentru toate moleculele din set şi nu are toate valorile i<strong>de</strong>ntice; suplimentar i se pot impune şi alte<br />
condiţii, cum ar fi o variabilitate rezonabilă (prin intermediul unui coeficientul <strong>de</strong> variaţie), o abatere <strong>de</strong> la normalitate<br />
rezonabilă (prin intermediul unui test <strong>de</strong> normalitate cum este Jarque-Bera) şi o capacitate <strong>de</strong> explicare a proprietăţii<br />
măsurate rezonabilă (prin intermediul coeficientului <strong>de</strong> <strong>de</strong>terminare din regresia liniară simplă cu proprietatea<br />
măsurată).<br />
[ 57 ] Supravieţuire = operatorul cu ajutorul căruia se extrage din eşantion mai mulţi indivizi care vor fi înlocuiţi în<br />
eşantion <strong>de</strong> către <strong>de</strong>scen<strong>de</strong>nţi<br />
[ 58 ] Scor <strong>de</strong> supravieţuire = valoare numerică asociată individului din eşantion care poate fi o valoare obţinută atât pe<br />
baza caracteristicilor genotipice ale individului (asociind o măsură a similarităţii acestuia cu alte genotipuri din cultivar<br />
în scopul menţinerii diversităţii materialului genetic) cât şi pe baza trăsăturilor fenotipice ale individului (asociind o<br />
măsură a similarităţii acestuia cu alte fenotipuri din cultivar în scopul menţinerii diversităţii fenotipice)<br />
[ 59 ] Obiectivul evoluţiei = parametrul sau caracteristica (unei ecuaţii <strong>de</strong> regresie) care constituie subiectul optimizării<br />
(minimizare - ex. suma pătratelor diferenţelor între (erorilor) valoarea măsurată şi cea explicată <strong>de</strong> mo<strong>de</strong>l; maximizare -<br />
ex. coeficientul <strong>de</strong> <strong>de</strong>terminare)<br />
[ 60 ] Funcţia obiectiv = algoritmul (procedura) <strong>de</strong> calcul al parametrului sau caracteristicii ce constituie obiectivul<br />
evoluţiei eşantionului.<br />
[ 61 ] modalitate <strong>de</strong> selecţie şi modalitate <strong>de</strong> supravieţuire = metodă <strong>de</strong> extragere a unui individ din eşantion ce foloseşte<br />
drept parametru valorile scorurilor (<strong>de</strong> selecţie şi respectiv <strong>de</strong> supravieţuire) ale indivizilor ce compun eşantionul; ceea<br />
ce Tabelul 38 prezintă în mod formal exprimă faptul că se folosesc trei alternative <strong>de</strong> selecţie (proporţional,<br />
<strong>de</strong>terministic şi turnir) care se pot aplica valorilor scorurilor sau rangurilor scorurilor (când selecţia e bazată pe valorile<br />
rangurilor în locul valorilor scorurilor); <strong>de</strong> asemenea, valoarea scorului poate fi supusă unui proces <strong>de</strong> normalizare care<br />
corectează (ajustează relativ) scorurile indivizilor din cultivar în raport cu două valori (una <strong>de</strong> minim şi alta <strong>de</strong> maxim)<br />
care se actualizează global în fiecare generaţie pe parcursul întregii evoluţii a eşantionului în cultivar<br />
224
N0) fenotipurilor între generaţii diferite<br />
Ranguri hi=Rank(fi)(fmax.-fmin.)/Size pi=hi/Σihi Şansa este proporţională cu rangul scorului<br />
un<strong>de</strong>: Rank(·): rangul; Size: volum genom<br />
Următoarele remarci cu privire la utilizarea unui algoritm genetic <strong>de</strong>finesc cadrul <strong>de</strong> operare al<br />
acestuia:<br />
÷ Utilizând doar selecţia nu va reuşi <strong>de</strong>cât să copieze (cloneze) cel mai bun individ al său în<br />
întregul eşantion;<br />
÷ Utilizând doar mutaţia nu va reuşi <strong>de</strong>cât să parcurgă întâmplător spaţiul <strong>de</strong> căutare;<br />
÷ Utilizând doar selecţia urmată <strong>de</strong> încrucişare va reuşi să conveargă către o soluţie bună (un<br />
optim local) dar nu sub-optimală (în apropierea celei optime);<br />
÷ Utilizând doar selecţia urmată <strong>de</strong> mutaţie se creează algoritmi paraleli, toleranţi la perturbaţii în<br />
căutarea <strong>de</strong> punctelor <strong>de</strong> maxim local (în terminologia în engleză: hill-climbing);<br />
÷ Utilizarea selecţiei urmate <strong>de</strong> mutaţie şi încrucişare asigură toate caracteristicile <strong>de</strong> <strong>de</strong>finire ale<br />
unui algoritm genetic;<br />
Se poate verifica că ecuaţia (20) <strong>de</strong>fineşte o problemă dificilă [ ]. Astfel, reprezentând grafic<br />
ecuaţia (20) pentru diferite valori ale volumului familiei <strong>de</strong> <strong>de</strong>scriptori moleculari (`N`) date în<br />
Tabelul 37 şi pentru diferite ordine <strong>de</strong> multiplicitate (`n`) se obţin reprezentările <strong>de</strong> mai jos care<br />
susţin faptul că ecuaţia (20) <strong>de</strong>fineşte o problemă dificilă.<br />
1.E+40<br />
1.E+35<br />
1.E+30<br />
1.E+25<br />
1.E+20<br />
1.E+15<br />
1.E+10<br />
1.E+05<br />
1.E+00<br />
VS = VS(46080(FPIF),n)<br />
y = 18.844e 8.8472n<br />
R 2 = 0.9995<br />
1 2 3 4 5 6 7 8 9 10<br />
2.E+18<br />
1.E+18<br />
0.E+00<br />
62<br />
VS = VS(N,3)<br />
y = 0.166N 3<br />
R 2 = 1<br />
0.E+00 1.E+06 2.E+06<br />
Complexitatea exponenţială a regresiilor multiple cu familii <strong>de</strong> <strong>de</strong>scriptori moleculari<br />
Pentru a rezolva o problemă dificilă un algoritm genetic generează întâmplător (sau iniţiază cu<br />
valori pre<strong>de</strong>finite) un eşantion <strong>de</strong> un volum dat <strong>de</strong> genotipuri (volum ce va fi păstrat constant pe<br />
toată durata evoluţiei).<br />
Algoritmul genetic evoluează astfel:<br />
÷ Repetă<br />
Pasul_1: Utilizând operatorul <strong>de</strong> selecţie selectează perechi <strong>de</strong> cromozomi;<br />
Pasul_2: Calculează scorul <strong>de</strong> selecţie al genotipurilor; calculează scorul <strong>de</strong><br />
supravieţuire al genotipurilor; calculează funcţia obiectiv a fenotipurilor şi obţine grupul<br />
<strong>de</strong>scriptorilor din eşantion ce întrunesc obiectivul în generaţie şi eventual inclu<strong>de</strong> în<br />
generaţia următoare automat genotipurile din acest grup;<br />
Pasul_3: Cu o mică probabilitate şi utilizând o funcţie discretă <strong>de</strong> probabilitate uniformă<br />
alege porţiunea <strong>de</strong> mutat şi mută genotipurile selectate (părinţi);<br />
Pasul_4: Utilizând o funcţie discretă <strong>de</strong> probabilitate uniformă alege porţiunea <strong>de</strong><br />
încrucişat şi produce <strong>de</strong>scen<strong>de</strong>nţi ai acestora (<strong>de</strong>scen<strong>de</strong>nţi);<br />
Pasul_5: Cu o mică probabilitate şi utilizând o funcţie discretă <strong>de</strong> probabilitate uniformă<br />
alege porţiunea <strong>de</strong> mutat şi mută genotipurile <strong>de</strong>scen<strong>de</strong>nţilor (fii);<br />
Pasul_6: Utilizând operatorul <strong>de</strong> supravieţuire înlocuieşte o parte din părinţi cu fii;<br />
[ 62 ] problemă dificilă = problemă a cărei rezolvare <strong>de</strong> către cel mai bun algoritm (care ar putea fi imaginat) necesită un<br />
timp <strong>de</strong> execuţie care creşte exponenţial în funcţie <strong>de</strong> volumul datelor problemei (şi în acelaşi timp <strong>de</strong> intrare ale<br />
algoritmului); <strong>de</strong>numirea <strong>de</strong> probleme dificile vine <strong>de</strong> la faptul că <strong>de</strong>oarece chiar şi cel mai bun algoritm (care ar putea<br />
fi imaginat) va fi probabil ineficient pe date <strong>de</strong> intrare reale (din practică)<br />
225
÷ Până când (condiţie care reprezintă condiţia <strong>de</strong> sfârşit a algoritmului)<br />
Se satisface o condiţie impusă cu privire la valoarea funcţiei obiectiv (atinge o valoare<br />
impusă) sau se realizează un număr dat <strong>de</strong> iteraţii (evoluţii).<br />
t+1<br />
cel mai bun fenotip<br />
selecţie<br />
scor<br />
t+1<br />
scor<br />
Ilustrarea unui algoritm genetic<br />
În implementarea algoritmului s-a ţinut seama <strong>de</strong> următoarele consi<strong>de</strong>rente:<br />
÷ Calculele necesare pentru obţinerea valorilor unui <strong>de</strong>scriptor molecular sunt complexe,<br />
implicând fragmentarea grafului molecular, calcularea distanţelor topologice şi geometrice în<br />
moleculă, aplicare <strong>de</strong> mo<strong>de</strong>le <strong>de</strong> suprapunere a interacţiunilor, fiecare necesitând un timp <strong>de</strong><br />
execuţie şi o memorie <strong>de</strong> lucru consi<strong>de</strong>rabile, astfel încât populaţia <strong>de</strong> <strong>de</strong>scriptori trebuie<br />
generată şi stocată în prealabil execuţiei algoritmului genetic; este stocată într-o bază <strong>de</strong> date<br />
pentru MDF şi MDFV; este stocată în fişiere text cu format impus pentru FPIF şi SAPF.<br />
÷ Volumul <strong>de</strong> informaţie al populaţiei <strong>de</strong> <strong>de</strong>scriptori este consi<strong>de</strong>rabil (ex. tabela<br />
`PCB_lkow_tmpx` care stochează a şasea parte din <strong>de</strong>scriptorii MDF (131328) calculaţi pentru<br />
206 PCBs - din totalul <strong>de</strong> 209 - pentru care există măsurat în aceleaşi condiţii experimentale<br />
coeficientul <strong>de</strong> partiţie octanol-apă ocupă peste 200Mb - atât în stocare fizică pe disc cât şi în<br />
memoria internă) astfel încât manipularea acestui volum <strong>de</strong> informaţie ridică serioase provocări<br />
<strong>de</strong> optimizare a memoriei <strong>de</strong> lucru şi vitezei <strong>de</strong> calcul; alegerea mediului <strong>de</strong> programare a ţinut<br />
seama <strong>de</strong> aceste consi<strong>de</strong>rente; s-a ales drept mediu <strong>de</strong> implementare FreePascal [ 63 ] un mediu <strong>de</strong><br />
programare freeware multi-platformă bazat pe limbajul Pascal, recunoscut pentru viteza <strong>de</strong><br />
calcul şi economia <strong>de</strong> memorie.<br />
÷ Întrucât evoluţia algoritmului genetic se doreşte a fi rapidă, accesul şi interogarea repetată a<br />
bazei <strong>de</strong> date pentru obţinerea valorilor unui <strong>de</strong>scriptor molecular la moleculele din setul <strong>de</strong><br />
lucru încetineşte consi<strong>de</strong>rabil viteza <strong>de</strong> lucru, astfel încât soluţia aleasă a fost stocarea în<br />
memoria internă a imaginii bazei <strong>de</strong> date, cu cost suplimentar în ceea ce priveşte memoria <strong>de</strong><br />
lucru, dar cu câştig <strong>de</strong>osebit în ceea ce priveşte viteza <strong>de</strong> lucru.<br />
÷ Nu toţi <strong>de</strong>scriptorii din familie (una dintre FPIF, MDF, MDFV sau SAPF) întrunesc condiţiile<br />
reale <strong>de</strong> existenţă (să aibă valori reale şi finite pentru toate moleculele din setul consi<strong>de</strong>rat; să nu<br />
aibă valori banale - i<strong>de</strong>ntice pentru toate moleculele din set); mai mult, impunerea <strong>de</strong> condiţii<br />
suplimentare cu privire la variabilitate, capacitate <strong>de</strong> explicare şi normalitate reduce şi mai mult<br />
setul <strong>de</strong> <strong>de</strong>scriptori candidaţi în regresii multiple pentru setul <strong>de</strong> molecule consi<strong>de</strong>rat; stocarea<br />
valorilor acestor <strong>de</strong>scriptori în memoria internă ar fi lipsită <strong>de</strong> sens, şi astfel s-a impus realizarea<br />
acestei selecţii în preambulul execuţiei efective a algoritmului genetic, introducând o variabilă<br />
care conţine două valori <strong>de</strong> a<strong>de</strong>văr (T/F) pentru validitatea <strong>de</strong>scriptorului molecular la setul <strong>de</strong><br />
molecule consi<strong>de</strong>rat; mai mult, practic stocarea unei fracţii din totalul <strong>de</strong>scriptorilor moleculari<br />
(fapt valabil pentru toate familiile <strong>de</strong> <strong>de</strong>scriptori) s-a făcut pe seama renunţării la o genă din<br />
secvenţa cromozomului familiei - operatorul <strong>de</strong> linearizare - fapt care însă trebuie compensat în<br />
execuţia algoritmului genetic; astfel s-au mai introdus un număr <strong>de</strong> variabile cu două valori <strong>de</strong><br />
[ 63 ] FreePascal, http://freepascal.org<br />
selecţie<br />
t<br />
încrucişare<br />
226<br />
t+1<br />
mutaţie
a<strong>de</strong>văr (T/F) pentru fiecare operator <strong>de</strong> linearizare (câte 6 pentru MDF şi SAPF şi câte 3 pentru<br />
FPIF şi MDFV), fiecare conţinând valoarea <strong>de</strong> a<strong>de</strong>văr a validităţii <strong>de</strong>scriptorului molecular<br />
respectiv în urma linearizării - numit în continuare fenotip; astfel, variabila globală <strong>de</strong>finită<br />
pentru fracţia <strong>de</strong> <strong>de</strong>scriptori stocată intern a căpătat o nouă semnificaţie, şi anume a<strong>de</strong>vărat (T)<br />
dacă cel puţin unul dintre fenotipurile sale este valid.<br />
÷ O serie <strong>de</strong> parametrii <strong>de</strong> statistică <strong>de</strong>scriptivă sunt esenţiali (şi implicaţi în mod repetat) pentru<br />
analiza <strong>de</strong> regresie (valori medii, momente) astfel încât s-a impus calcularea prealabilă a<br />
acestora pentru fenotipurile vali<strong>de</strong> incluse în eşantion.<br />
÷ Programul evolutiv [ 64 ] rezultat trebuie să fie gândit astfel încât să poată lucra cu oricare<br />
familie <strong>de</strong> <strong>de</strong>scriptori moleculari (incluzând <strong>de</strong>sigur cele 4 familii expuse mai sus - FPIF, MDF,<br />
MDFV, SAPF) şi să poată fi parametrizat; soluţia <strong>de</strong> implementare aleasă este crearea şi<br />
utilizarea <strong>de</strong> fişiere <strong>de</strong> configurare.<br />
Programul evolutiv foloseşte un fişier <strong>de</strong> configurare pentru conexiunea la baza <strong>de</strong> date ce<br />
stochează familia <strong>de</strong> <strong>de</strong>scriptori moleculari, conform schemei <strong>de</strong> mai jos:<br />
Staţie <strong>de</strong> lucru<br />
Server<br />
└ Program evolutiv<br />
└ Bază <strong>de</strong> date<br />
└ Tabelă măsurători experimentale<br />
└ Tabelă <strong>de</strong>scriptori moleculari<br />
Conexiunea la serverul ce stochează baza <strong>de</strong> date a familiei <strong>de</strong> <strong>de</strong>scriptori moleculari<br />
O conexiune la un server <strong>de</strong> baze <strong>de</strong> date impune protocoale <strong>de</strong> securitate. De asemenea execuţia<br />
efectivă a programului impune cunoaşterea numelui bazei <strong>de</strong> date şi a tabelelor, în ipoteza asumată<br />
că structura tabelelor este aceeaşi şi in<strong>de</strong>pen<strong>de</strong>ntă <strong>de</strong> familia <strong>de</strong> <strong>de</strong>scriptori moleculari şi setul <strong>de</strong><br />
molecule consi<strong>de</strong>rat.<br />
Astfel, fişierul <strong>de</strong> configurare <strong>de</strong>numit `c_galg.cfg` conţinutul redat în Tabelul 39 exemplificând<br />
pentru familia MDF, setul PCB.<br />
Programul implementat foloseşte o librărie dinamică (`mysql4.dll`) ce implementează protocoalele<br />
<strong>de</strong> securitate necesare (SHA256) pentru a se conecta la serverul ce conţine baza <strong>de</strong> date <strong>de</strong> interes<br />
folosind valorile date în fişierul <strong>de</strong> configurare pentru aprametrii `Host=`, `User=` şi `Pass=` astfel:<br />
se citeşte conţinutul fişierului <strong>de</strong> configurare cu procedura `g_mydb` (Algoritmul 1) şi se realizează<br />
conexiunea cu procedura `c_to` (Algoritmul 2).<br />
Structura fişierului <strong>de</strong> configurare `c_galg.cfg`<br />
Parametru Valoare Comentarii<br />
Host= 172.27.211.5 Adresa IP a serverului<br />
User= **** Numele şi parola utilizatorului cu drept <strong>de</strong> citire pe baza <strong>de</strong> date<br />
Pass= ******** ce conţine valorile <strong>de</strong>scriptorilor moleculari pentru setul <strong>de</strong><br />
molecule supus investigaţiei<br />
Mydb= MDFSARs Numele bazei <strong>de</strong> date<br />
TabE= PCB_lkow_data Numele tabelei conţinând datele experimentale<br />
TabM= PCB_lkow_tmpx Numele tabelei conţinând familia <strong>de</strong> <strong>de</strong>scriptori moleculari<br />
Algoritmul 1. Citirea fişierului <strong>de</strong> configurare `c_galg.cfg`<br />
Antet procedure g_mydb(var d:S0T);<br />
Procedură var f:text;i:I0T;<br />
begin<br />
SetLength(d,6);<br />
assign(f,mfi[0]);<br />
{$I-}reset(f);{$I+}<br />
if(ioresult0)then m_exit('Err cfg File '+mfi[0]+' N/A!');<br />
for i:=0 to 5 do g_finf(f,myc[i],d[i]);<br />
close(f);<br />
end;<br />
Date <strong>de</strong> Variabilele globale<br />
intrare ÷ mfi[0]=`c_galg.cfg`<br />
÷ myc[0..5]=(`Host`, `User`, `Pass`, `Mydb`, `TabE`, `TabM`)<br />
[ 64 ] program evolutiv = în accepţiunea generală este un program ce implementează un algoritm genetic<br />
227
Date <strong>de</strong><br />
ieşire<br />
d:array[0..5]of string;<br />
Algoritm ÷ Se alocă memorie pentru valorile ce urmează a fi citite din<br />
fişierul <strong>de</strong> configurare<br />
÷ Se verifică accesibilitatea fişierului <strong>de</strong> configurare; în caz<br />
afirmativ se <strong>de</strong>schi<strong>de</strong>, in caz contrar se produce ieşirea din<br />
program prin afişarea unui mesaj<br />
÷ Se citeşte fiecare valoare a parametrilor din fişier<br />
Algoritmul 2. Conexiunea la o bază <strong>de</strong> date MySQL<br />
Antet function c_to(var q:TMYSQL;var s:PMYSQL;var m:S0T):B_T;<br />
Procedură begin<br />
mysql_init(PMySQL(@q));<br />
s:=mysql_real_connect(PMysql(@q),pch(m[0]),pch(m[1]),pch(m[2]),nil,0,nil,0);<br />
if(s=Nil)then begin<br />
Writeln(st<strong>de</strong>rr,'NR MySQLd:',mysql_errno(@q),' ',mysql_error(@q));<br />
c_to:=FALSE;exit;<br />
end;<br />
if(mysql_select_db(s,pch(m[3]))
S5 String[255] Şir <strong>de</strong> maxim 255 caractere<br />
S9 String[99] Şir <strong>de</strong> maxim 99 caractere<br />
C8 array[0..12]of S3 Şir <strong>de</strong> 13 şiruri <strong>de</strong> 13 caractere<br />
S0T Array of S9 Şir (<strong>de</strong> număr variabil) <strong>de</strong> şiruri <strong>de</strong> maxim 9 caractere<br />
B1T Array of B0T Şir <strong>de</strong> numere întregi (max. 255)<br />
I1T Array of I0T Şir <strong>de</strong> numere întregi (max. 32767)<br />
L1T Array of L0T Şir <strong>de</strong> numere întregi (max. 2147483647)<br />
B2T Array of B1T Şir <strong>de</strong> şiruri <strong>de</strong> numere întregi (max. 255)<br />
R1T Array of R0T Şir <strong>de</strong> valori reale (Descriptor)<br />
R2T Array of R1T Şir <strong>de</strong> şiruri <strong>de</strong> valori reale (Familie)<br />
R3T Array of R2T Şir <strong>de</strong> şiruri <strong>de</strong> şiruri <strong>de</strong> valori reale (Clică)<br />
BAT Array of Array[0..6]of B_T Şir <strong>de</strong> (maxim) 7 şiruri <strong>de</strong> valori <strong>de</strong> a<strong>de</strong>văr<br />
Programul foloseşte o serie <strong>de</strong> constante globale (accesibile din orice secvenţă <strong>de</strong> program), care<br />
sunt redate în tabelul următor.<br />
Constante <strong>de</strong>finite în programul evolutiv `ga_v2_0p.exe`<br />
Constantă Expresie <strong>de</strong> <strong>de</strong>finire Comentarii<br />
mfi array[0..3]of S3=( 'c_galg.cfg', 'c_galg.cgt', 'c_galg.cga', Denumiri fişiere <strong>de</strong><br />
'c_galg.txt' )<br />
configurare<br />
mfo array[0..6]of S3=( {0}'cfg.txt', {1}'reg.txt', {2}'phe.txt', Denumiri fişiere <strong>de</strong> rezultate<br />
{3}'sam.txt', {4}'gen.txt', {5}'fit.txt', {6}'evo.txt' )<br />
myc array[0..5]of S3=( 'Host', 'User', 'Pass', 'Mydb', 'TabE',<br />
'TabM' )<br />
Denumiri parametrii <strong>de</strong><br />
configurare pentru baza <strong>de</strong><br />
date<br />
gda array[0..1]of S3=( 'Genes', 'Addre' ) Denumiri parametrii <strong>de</strong><br />
configurare ai codului<br />
genetic<br />
nys array[0..1]of S3=( 'No', 'Yes' ) Denumiri valori <strong>de</strong> a<strong>de</strong>văr<br />
sps C8=( 'r2', 'se', 'Mt', 'Hr', 'dr', 'me', 'dt', '', '', '', '', '', '' ) Denumiri funcţii obiectiv<br />
sos C8=( 'min', 'max', 'avg', '', '', '', '', '', '', '', '', '', '' ) Denumiri obiective<br />
sss C8=( 'proportional', '<strong>de</strong>terministic', 'tournament', '', '', '', Denumiri meto<strong>de</strong> <strong>de</strong> selecţie<br />
'', '', '', '', '', '', '' )<br />
şi supravieţuire<br />
ses C8=( 'nalive', 'r2_min', 'se_min', 'Mt_min', 'Hr_min', Denumiri funcţii <strong>de</strong> selecţie<br />
'r2_max', 'se_max', 'Mt_max', 'Hr_max', 'r2_avg',<br />
'se_avg', 'Mt_avg', 'Hr_avg' )<br />
sds C8=( 'm0', 'm1', 'm2', 'm3', 'm4', 'mx', 'my', 'v0', 'g1', 'g2', Denumiri parametrii statistici<br />
'jb', 'r1', 'r2' )<br />
<strong>de</strong>scriptivi<br />
col array[0..5]of Char=( 'I'{x}, 'A'{|x|}, 'l'{ln(x)}, Denumiri operatori <strong>de</strong><br />
'L'{ln(abs(x)}, 'i'{1/x}, 'a'{1/|x|} )<br />
linearizare<br />
max_real 1e90 Valoare reală maximă<br />
min_real 1e-90 Valoare nenulă minimă<br />
Programul evolutiv implementat (aflat în forma actuală - Martie 2009 - la a 3-a versiune a sa,<br />
stabilă) foloseşte o singură clasă (sau obiect) pentru toate datele şi operaţiile necesare algoritmului<br />
genetic. O serie <strong>de</strong> proceduri se află însă în exteriorul acestei clase (cum este cazul celor expuse în<br />
Algoritmul 1 şi Algoritmul 2), fiind prealabile procesului evolutiv şi având ca scop doar<br />
iniţializarea variabilelor necesare. Algoritmii exteriori clasei alţii <strong>de</strong>cât cei <strong>de</strong> mai sus sunt redaţi<br />
împreună în Algoritmi 3. Secvenţa <strong>de</strong> program principal este redată în Algoritm 4.<br />
Algoritmi 3. Alte operaţii cu baza <strong>de</strong> date şi fişiere <strong>de</strong> configurare<br />
Antet şi procedure g_finf(var f:Text;s:S9;var o:S9);var i:I0T;<br />
procedură begin<br />
readln(f,o);i:=pos('=',o);if(i=0)then m_exit('Err cfg VAR=VAL found:'+o);<br />
g_finf if(copy(o,1,i-1)s)then m_exit('Err cfg Exp '+s+'=VAL found:'+o);<br />
<strong>de</strong>lete(o,1,i);if(length(o)
Algoritm Verifică existenţa şi în caz <strong>de</strong> succes citeşte o linie din fişierul<br />
g_finf <strong>de</strong> configurare transmis ca parametru<br />
Antet şi procedure q_exe(var s:PMYSQL;Q:S5);<br />
procedură begin<br />
if(mysql_query(s,pch(Q))0)do begin if(j>99)then m_exit('MydB err-1');<br />
my_re s[j+1]:=b[i][j];j:=j+1;end;if(j=0)then s:='' else s[0]:=chr(j);<br />
val(s,r,j);if(j0)then m_exit('MydB err-2');my_re:=r;<br />
end;<br />
Algoritm Preia caracter cu caracter o valoare reală din baza <strong>de</strong> date şi o<br />
my_re converteşte la număr real în precizie extinsă<br />
Antet şi procedure p_y0(var r:PMYSQL_RES;var d:R1T;nm:L0T);var i:L0T;b:TMYSQL_ROW;<br />
procedură begin<br />
for i:=0 to nm do begin b:=mysql_fetch_row(r);d[i]:=my_re(b,0);end;<br />
p_y0 mysql_free_result(r);<br />
end;<br />
Algoritm Preia din baza <strong>de</strong> date şirul <strong>de</strong> valori experimentale pentru setul<br />
p_y0 <strong>de</strong> molecule<br />
Antet şi procedure p_xx(var r:PMYSQL_RES;var d:R2T;nm,ni:L0T);var j,i:L0T;b:TMYSQL_ROW;<br />
procedură begin<br />
for j:=0 to ni do begin b:=mysql_fetch_row(r);<br />
p_xx for i:=0 to nm do d[j][i]:=my_re(b,i);<br />
if(j mod 10000=0)then write(j div 1000,'K ');<br />
end;<br />
mysql_free_result(r);write(ni+1,' ');<br />
end;<br />
Algoritm Preia din baza <strong>de</strong> date matricea conţinând valorile <strong>de</strong>scriptorilor<br />
p_xx moleculari pentru setul <strong>de</strong> molecule<br />
Antet şi function pch(var s:S9):PChar;<br />
procedură begin<br />
if(s[length(s)]chr(0))then s:=s+chr(0);pch:=@s[1];<br />
pch end;<br />
Algoritm Converteşte un tip String (şir <strong>de</strong> caractere cu lungime fixă) la tip<br />
pch PChar (şir <strong>de</strong> caractere cu lungime variabilă)<br />
Antet şi procedure sch(var s:S9);<br />
procedură begin<br />
if(s[length(s)]=chr(0))then <strong>de</strong>lete(s,length(s),1);<br />
sch end;<br />
Algoritm Converteşte un tip PChar (şir <strong>de</strong> caractere cu lungime variabilă) la<br />
sch tip String (şir <strong>de</strong> caractere cu lungime fixă)<br />
Antet şi procedure m_exit(s:string[255]);<br />
procedură begin<br />
writeln(s);readln;halt;<br />
m_exit end;<br />
Algoritm Produce ieşirea din program prin afişarea unui mesaj <strong>de</strong> eroare<br />
m_exit<br />
Algoritm 4. Programul principal al aplicaţiei `ga_v2_0p.exe`<br />
Variabile qmysql:TMYSQL;sock:PMYSQL;recbuf:PMYSQL_RES;<br />
t:B_T;qr:QWord;qc:DWord;My_Data:S0T;MDF:SAR_Fam;<br />
Procedură begin g_mydb(My_Data);MDF.CF_Ge;<br />
repeat t:=c_to(qmysql,sock,My_Data);sleep(1500);until(t);<br />
q_exe(sock,'SELECT * FROM `'+My_Data[4]+'`');q_ret(sock,recbuf,qr,qc);<br />
with(MDF)do begin<br />
m0n:=qr;m1n:=m0n-1;SetLength(y_v,m0n);SetLength(x_v,i0n);<br />
for qc:=i1n downto 0 do SetLength(x_v[qc],m0n);p_y0(recbuf,y_v,m1n);<br />
end;<br />
write('n_pop=',MDF.i0n,' m0n=',MDF.m0n);write(' SELECT Y Ok. ');<br />
q_exe(sock,'SELECT * FROM `'+My_Data[5]+'`');<br />
q_ret(sock,recbuf,qr,qc);p_xx(recbuf,MDF.x_v,MDF.m1n,MDF.i1n);<br />
writeln('SELECT X''s Ok.');mysql_close(sock);<br />
with(MDF)do begin<br />
CF_Cu(My_Data);if(d_c>0)then DC0(My_Data);if(d_r+d_p+d_s+d_g+d_t+d_e>0)then D0;<br />
230
end;<br />
with(MDF)do<br />
repeat<br />
CF_Rs;SA_Frst;<br />
repeat<br />
FT_PH;FT_SA;SL_Fit;SL_Mak;SV_Fit;SV_Mak;<br />
if(d_t>0)then DF1;SA_Next;if(d_t>0)then DF2;<br />
until(e1i>e1n);<br />
if(d_c>0)then DC2;<br />
until(e0i>e0n);<br />
write('Done.');readln;<br />
end.<br />
Algoritm ÷ Citeşte fişierul <strong>de</strong> configurare al conexiunii la baza <strong>de</strong> date<br />
÷ Citeşte codul genetic al familiei <strong>de</strong> <strong>de</strong>scriptori moleculari<br />
÷ Alocă spaţiu <strong>de</strong> memorie pentru codul genetic<br />
÷ Construieşte tablouri <strong>de</strong> conversie adresă cod genetic<br />
÷ Conectează la baza <strong>de</strong> date şi selectează informaţia din tabela cu<br />
valori experimentale (ce dă şi numărul <strong>de</strong> molecule din set)<br />
÷ Alocă spaţiu <strong>de</strong> memorie pentru valorile experimentale şi valorile<br />
<strong>de</strong>scriptorilor familiei; citeşte valorile experimentale din baza<br />
<strong>de</strong> date<br />
÷ Afişează volumul populaţiei <strong>de</strong> <strong>de</strong>scriptori (pe baza calcului din<br />
codul genetic) şi numărul <strong>de</strong> molecule din set<br />
÷ Selectează şi citeşte valorile <strong>de</strong>scriptorilor pentru moleculele<br />
din set<br />
÷ Citeşte fişierul <strong>de</strong> configurare al cultivarului (`c_galg.cga`)<br />
÷ Creează fişierele <strong>de</strong> ieşire necesare (<strong>de</strong>finite mai sus)<br />
÷ Repetă<br />
o Iniţializează valorile <strong>de</strong> minim şi maxim global<br />
o Creează prima generaţie a evoluţiei<br />
o Repetă<br />
Construieşte fenotipurile; calculează parametrii <strong>de</strong><br />
statistică <strong>de</strong>scriptivă; face toate ecuaţiile <strong>de</strong><br />
regresie multiplă posibile cu fenotipuri din cultivar<br />
şi păstrează parametrii <strong>de</strong> regresie; cumulează<br />
scorurile <strong>de</strong> selecţie ale fenotipurilor; iniţializează<br />
scorurile <strong>de</strong> selecţie ale genotipurilor<br />
Calculează scorurile <strong>de</strong> selecţie ale genotipurilor pe<br />
baza scorurilor obţinute <strong>de</strong> la fenotipuri în pasul<br />
anterior<br />
Extrage scorul <strong>de</strong> selecţie (cel <strong>de</strong>finit în fişierul <strong>de</strong><br />
configurare) din lista scorurilor <strong>de</strong> selecţie<br />
calculate pentru genotipuri; normalizează scorurile<br />
(dacă normalizarea este activată în fişierul <strong>de</strong><br />
configurare); converteşte scorurile la ranguri <strong>de</strong><br />
scoruri (dacă opţiunea ranguri este activată în<br />
fişierul <strong>de</strong> configurare)<br />
Face selecţia unui număr <strong>de</strong>finit <strong>de</strong> genotipuri (număr<br />
par) folosind metoda specificată în fişierul <strong>de</strong><br />
configurare<br />
Calculează scorul <strong>de</strong> supravieţuire al genotipurilor<br />
Construieşte noua generaţie astfel:<br />
• mută părinţi cu probabilitatea <strong>de</strong>finită în<br />
fişierul <strong>de</strong> configurare<br />
• încrucişează perechi <strong>de</strong> părinţi în număr <strong>de</strong>finit<br />
în fişierul <strong>de</strong> configurare<br />
• mută fii cu probabilitatea <strong>de</strong>finită în fişierul<br />
<strong>de</strong> configurare<br />
• numără <strong>de</strong>scen<strong>de</strong>nţii adaptaţi<br />
• înlocuieşte părinţi cu <strong>de</strong>scen<strong>de</strong>nţi folosind<br />
metoda <strong>de</strong> supravieţuire <strong>de</strong>finită în fişierul <strong>de</strong><br />
configurare<br />
o Până când numărul <strong>de</strong> generaţii impus în fişierul <strong>de</strong><br />
231
configurare este atins<br />
÷ Până când numărul <strong>de</strong> repetiţii ale execuţiei algoritmului genetic<br />
specificat în fişierul <strong>de</strong> configurare este atins<br />
Fişierul `c_galg.cga` conţine configuraţia <strong>de</strong> execuţie a programului.<br />
Configuraţia <strong>de</strong> execuţie a programului evolutiv `ga_v2_0p.exe`<br />
Parametru Valoare Comentarii<br />
a_v_ADAPT_Variance= 0 ≤ a_v Valoarea minimă impusă unui fenotip<br />
(real) (Xi) pentru a fi consi<strong>de</strong>rat adaptat la<br />
cultivar; calculată cu expresia:<br />
m<br />
m ⎛<br />
⎞<br />
∑⎜Xi, j −∑Xi,<br />
k m⎟<br />
j=<br />
1 ⎝ k=<br />
1<br />
AD(Xi)=<br />
⎠<br />
2<br />
⎛ m ⎞<br />
⎜ | Xi,<br />
j | ⎟<br />
⎜∑<br />
⎟<br />
⎝ j=<br />
1 ⎠<br />
ajb_ADAPT_JarqueBera= 0 ≤ ajb Valoarea maximă a abaterii relative <strong>de</strong><br />
(real) la normalitate impusă unui fenotip;<br />
calculată cu expresia:<br />
2<br />
2<br />
JB(<br />
Xi<br />
) 4g1<br />
( Xi<br />
) + g 2(<br />
Xi<br />
)<br />
rJB(Xi)= = 2<br />
2<br />
JB(<br />
Y)<br />
4g<br />
( Y)<br />
+ g ( Y)<br />
1<br />
2<br />
a_c_ADAPT_Correlation= 0 ≤ a_c ≤ 1 Valoarea minimă a <strong>de</strong>terminării impusă<br />
unui fenotip; calculată cu expresia:<br />
r 2 (Xi,Y) - ecuaţia (5)<br />
sn0_SAMPLE_Size= rn0 ≤ sn0 Volumul eşantionului <strong>de</strong> material<br />
genetic supus înmulţirii în cultivar<br />
rn0_REGRESSION_Multiple= 1 ≤ rn0 Ordinul <strong>de</strong> multiplicitate al regresiei<br />
e1n_GENERATIONS_max= 1 ≤ e1n Numărul <strong>de</strong> generaţii în care materialul<br />
genetic evoluează în cultivar (întreg;<br />
zeci, sute <strong>de</strong> mii)<br />
g_r_GENERATIONS_first_rich= Yes/No Dacă procesului <strong>de</strong> selecţie aleatorie a<br />
materialului genetic iniţial i se impune<br />
să colecteze doar genotipuri viabile<br />
cn0_CROSSOVER_Pairs= 1 ≤ cn0 Numărul <strong>de</strong> perechi (<strong>de</strong> părinţi) care se<br />
încrucişează într-o generaţie<br />
m_m_MUTATION_Genes= 1 ≤ m_m Numărul <strong>de</strong> gene care se mută atunci<br />
când mutaţia apare<br />
mpp_MUTATION_Parent_probability= 0 ≤ mpp < 1 Probabilitatea <strong>de</strong> apariţie a mutaţiei<br />
înainte <strong>de</strong> încrucişare<br />
mcp_MUTATION_Child_probability= 0 ≤ mcp < 1 Probabilitatea <strong>de</strong> apariţie a mutaţiei<br />
după încrucişare<br />
b_p_SELECTION_parameter= r2/se/Mt/Hr Funcţia obiectiv<br />
÷ r2=r 2 (Y,Ŷ): coeficientul <strong>de</strong><br />
<strong>de</strong>terminare dat <strong>de</strong> ecuaţia (5)<br />
÷ se=<br />
m<br />
∑<br />
j=<br />
1<br />
− Y ) ˆ ( Y<br />
n ⎛ 1 p ⎞<br />
÷ Mt= ⎜ ∑= t ( Xi<br />
) ⎟ ; p=fMt<br />
⎝ n i 1 ⎠<br />
2p<br />
2 p<br />
log2<br />
( r + ( 1−<br />
r ) )<br />
÷ Hr=<br />
; p = fHr<br />
1−<br />
p<br />
b_o_SELECTION_objective= max/min Obiectivul funcţiei obiectiv<br />
232<br />
i<br />
i<br />
2<br />
1/<br />
p<br />
2
sfs_FITNESS_strategy= proportional/ Metoda (strategia) <strong>de</strong> selecţie a<br />
<strong>de</strong>terministic/ genotipurilor candidate la încrucişare şi<br />
tournament mutaţie<br />
sfn_FITNESS_normalized= Yes/No Dacă scorurile <strong>de</strong> selecţie sunt<br />
normalizate între generaţii<br />
sfr_FITNESS_ranks= Yes/No Dacă se folosesc rangurile scorurilor <strong>de</strong><br />
selecţie în locul scorurilor <strong>de</strong> selecţie<br />
sfa_FITNESS_accuracy= 1000 ≤ sfa Dă numărul <strong>de</strong> cifre semnificative la<br />
care se rotunjesc scorurile <strong>de</strong> selecţie<br />
sff_FITTEST_function= nalive/ Valoarea scorului <strong>de</strong> selecţie;<br />
r2_min/ ÷ nalive - numărul <strong>de</strong> ecuaţii <strong>de</strong> regresie<br />
se_min/ ce conţin fenotipuri ale genotipului;<br />
Mt_min/ ÷ XX_min - cea mai mică valoare a lui<br />
Hr_min/ XX care apare într-o ecuaţie <strong>de</strong><br />
r2_max/ regresie validă ce conţine un fenotip<br />
se_max/ al genotipului;<br />
Mt_max/ ÷ XX_max - cea mai mare valoare a lui<br />
Hr_max/ XX care apare într-o ecuaţie <strong>de</strong><br />
r2_avg/ regresie validă ce conţine un fenotip<br />
se_avg/ al genotipului;<br />
Mt_avg/ ÷ XX_avg - valoarea medie a lui XX<br />
Hr_avg obţinută din toate ecuaţiile <strong>de</strong> regresie<br />
vali<strong>de</strong> ce conţin un fenotip al<br />
genotipului;<br />
Ecuaţie <strong>de</strong> regresie validă - ecuaţie care:<br />
÷ este unic <strong>de</strong>terminată;<br />
÷ are estimator viabil (Ŷ verifică <strong>de</strong><br />
asemenea condiţiile impuse<br />
fenotipurilor ce compun ecuaţia)<br />
÷ toţi coeficienţii ecuaţiei sunt<br />
semnificativi statistic (≠0) la nivel <strong>de</strong><br />
semnificaţie <strong>de</strong> 95% (Stu<strong>de</strong>nt t)<br />
r2 = r Y) ; p=p(fr2) ˆ 2p<br />
( Y,<br />
m<br />
i − Yˆ se =∑ | Y<br />
j=<br />
1<br />
i<br />
|<br />
p<br />
; p=p(fse)<br />
Mt şi Hr au aceeaşi semnificaţie ca în<br />
formula <strong>de</strong> <strong>de</strong>finiţie a lui b_p<br />
sfo_FITTEST_objective= min/max Obiectivul scorului <strong>de</strong> selecţie<br />
fr2_FITTEST_r2_p= real (1.0) puterea la care se ridică coeficientul <strong>de</strong><br />
<strong>de</strong>terminare ca scor <strong>de</strong> selecţie<br />
fse_FITTEST_se_p= real (1.0) puterea sumelor modulelor diferenţelor<br />
între măsurat şi estimat ca scor <strong>de</strong><br />
selecţie<br />
fMt_FITTEST_Mt_p= real (1.0) puterea din formula mediei Minkowski<br />
a valorilor Stu<strong>de</strong>nt t ai coeficienţilor<br />
ecuaţiei <strong>de</strong> regresie ca scor <strong>de</strong> selecţie<br />
fHr_FITTEST_Hr_p= real (1.0) puterea din formula entropiei Renyi a<br />
clasificării cantitate explicată (r 2 ) vs.<br />
cantitate ne-explicată (1-r 2 ) <strong>de</strong> ecuaţia<br />
<strong>de</strong> regresie ca scor <strong>de</strong> selecţie<br />
p din SVP(Xi,Xj)=|Fit(Xi)-Fit(Xj)| p v_p_SURVIVAL_phenotyping_p= real (1.0)<br />
,<br />
233
v_g_SURVIVAL__genotyping_p= real (1.0)<br />
un<strong>de</strong> Fit(Phe) este valoare scorului <strong>de</strong><br />
selecţie al fenotipului Phe<br />
p<br />
⎛ NCD(<br />
Xi<br />
, X j)<br />
⎞<br />
p în SVG(Xi,Xj)= ⎜<br />
NC ⎟ ,<br />
⎝<br />
⎠<br />
un<strong>de</strong> NC numărul <strong>de</strong> gene din<br />
cromozom iar NCD(Xi,Xj) numărul <strong>de</strong><br />
valori diferite ale genelor lui Xi faţă <strong>de</strong><br />
vfs_SURVIVAL_strategy= proportional/ Metoda (strategia) <strong>de</strong> supravieţuire a<br />
<strong>de</strong>terministic/ genotipurilor candidate la înlocuire <strong>de</strong><br />
tournament către <strong>de</strong>scen<strong>de</strong>nţi aplicată pe expresia:<br />
2<br />
SVP(<br />
Xi<br />
, X j)<br />
+ SVG(<br />
Xi<br />
, X j)<br />
vfr_SURVIVAL_ranks= Yes/No Dacă se folosesc rangurile scorurilor <strong>de</strong><br />
supravieţuire în locul scorurilor <strong>de</strong><br />
supravieţuire<br />
d_d_SHOW_<strong>de</strong>scriptive_m0= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
parametrul statistic <strong>de</strong>scriptiv m0<br />
(media modulelor)<br />
j 1<br />
m0(Xi)=<br />
m<br />
d_d_SHOW_<strong>de</strong>scriptive_m1= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
parametrul statistic <strong>de</strong>scriptiv m1<br />
(media aritmetică)<br />
Xi,<br />
j<br />
j 1<br />
m1(Xi)=<br />
m<br />
d_d_SHOW_<strong>de</strong>scriptive_m2= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
parametrul statistic <strong>de</strong>scriptiv m2<br />
(momentul central <strong>de</strong> ordin 2)<br />
j 1<br />
m2(Xi)=<br />
m<br />
d_d_SHOW_<strong>de</strong>scriptive_m3= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
parametrul statistic <strong>de</strong>scriptiv m3<br />
(momentul central <strong>de</strong> ordin 3)<br />
Xj<br />
m<br />
∑<br />
=<br />
m<br />
∑<br />
=<br />
m<br />
∑<br />
=<br />
| X<br />
( X<br />
i,<br />
j<br />
i,<br />
j<br />
|<br />
−<br />
m1(<br />
X<br />
m1(<br />
X<br />
j 1<br />
m3(Xi)=<br />
m<br />
d_d_SHOW_<strong>de</strong>scriptive_m4= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
parametrul statistic <strong>de</strong>scriptiv m4<br />
(momentul central <strong>de</strong> ordin 4)<br />
j 1<br />
m4(Xi)=<br />
m<br />
d_d_SHOW_<strong>de</strong>scriptive_mx= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
234<br />
m<br />
∑<br />
=<br />
m<br />
∑<br />
=<br />
( X<br />
( X<br />
i,<br />
j<br />
i,<br />
j<br />
−<br />
−<br />
m1(<br />
X<br />
i<br />
i<br />
i<br />
))<br />
))<br />
))<br />
2<br />
3<br />
4
parametrul statistic <strong>de</strong>scriptiv mx<br />
(media pătratelor valorilor)<br />
X<br />
j= 1<br />
mx(Xi)=<br />
m<br />
d_d_SHOW_<strong>de</strong>scriptive_my= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
parametrul statistic <strong>de</strong>scriptiv my<br />
(media produselor cu valorile măsurate)<br />
Xi,<br />
jYj<br />
j= 1<br />
my(Xi)=<br />
m<br />
d_d_SHOW_<strong>de</strong>scriptive_v0= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
parametrul statistic <strong>de</strong>scriptiv v0<br />
(varianţa relativă la valorile absolute)<br />
m<br />
2<br />
∑( Xi,<br />
j − m1(<br />
Xi<br />
))<br />
j=<br />
1<br />
v0(Xi)=<br />
2<br />
m0<br />
( Xi<br />
)<br />
d_d_SHOW_<strong>de</strong>scriptive_g1= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
parametrul statistic <strong>de</strong>scriptiv g1<br />
(asimetria observabilei)<br />
m3( Xi<br />
)<br />
g1(Xi)= 3/<br />
2<br />
m2 ( Xi<br />
)<br />
d_d_SHOW_<strong>de</strong>scriptive_g2= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
parametrul statistic <strong>de</strong>scriptiv g1<br />
(excesul <strong>de</strong> boltire al observabilei)<br />
m4(<br />
Xi<br />
)<br />
g2(Xi)= 2<br />
m2<br />
( Xi<br />
)<br />
d_d_SHOW_<strong>de</strong>scriptive_jb= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
parametrul statistic <strong>de</strong>scriptiv jb<br />
(valoarea X 2 a testului Jarque-Bera)<br />
2<br />
2<br />
g1 ( Xi<br />
) + g2<br />
( Xi<br />
) 4<br />
jb(Xi)=<br />
6<br />
d_d_SHOW_<strong>de</strong>scriptive_r1= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
parametrul statistic <strong>de</strong>scriptiv r1<br />
(coeficientul <strong>de</strong> corelaţie cu valorile<br />
măsurate)<br />
r1(Xi)=r(Xi,Y) - ecuaţia (5)<br />
d_d_SHOW_<strong>de</strong>scriptive_r2= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
parametrul statistic <strong>de</strong>scriptiv r1<br />
(coeficientul <strong>de</strong> <strong>de</strong>terminare cu valorile<br />
măsurate)<br />
r2(Xi)=r 2 (Xi,Y)<br />
d_f_SHOW_fitness_nalive= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
valoarea scorului <strong>de</strong> selecţie nalive<br />
d_f_SHOW_fitness_r2_min= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
valoarea scorului <strong>de</strong> selecţie r2_min<br />
d_f_SHOW_fitness_se_min= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
valoarea scorului <strong>de</strong> selecţie se_min<br />
235<br />
m<br />
∑<br />
m<br />
∑<br />
2<br />
i,<br />
j
d_f_SHOW_fitness_Mt_min= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
valoarea scorului <strong>de</strong> selecţie Mt_min<br />
d_f_SHOW_fitness_Hr_min= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
valoarea scorului <strong>de</strong> selecţie Hr_min<br />
d_f_SHOW_fitness_r2_max= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
valoarea scorului <strong>de</strong> selecţie r2_max<br />
d_f_SHOW_fitness_se_max= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
valoarea scorului <strong>de</strong> selecţie se_max<br />
d_f_SHOW_fitness_Mt_max= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
valoarea scorului <strong>de</strong> selecţie Mt_max<br />
d_f_SHOW_fitness_Hr_max= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
valoarea scorului <strong>de</strong> selecţie Hr_max<br />
d_f_SHOW_fitness_r2_avg= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
valoarea scorului <strong>de</strong> selecţie r2_avg<br />
d_f_SHOW_fitness_se_avg= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
valoarea scorului <strong>de</strong> selecţie se_avg<br />
d_f_SHOW_fitness_Mt_avg= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
valoarea scorului <strong>de</strong> selecţie Mt_avg<br />
d_f_SHOW_fitness_Hr_avg= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
valoarea scorului <strong>de</strong> selecţie Hr_avg<br />
d_c_SHOW_configuration= Yes/No Dacă se generează fişier <strong>de</strong> ieşire<br />
conţinând valorile parametrilor <strong>de</strong><br />
configuraţie<br />
d_m_SHOW_mols= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />
valorile <strong>de</strong>scriptorilor pentru fiecare<br />
moleculă a setului <strong>de</strong> date<br />
d_r_SHOW_regressions= Yes/No Dacă se generează fişier <strong>de</strong> ieşire<br />
conţinând toate ecuaţiile <strong>de</strong> regresie<br />
vali<strong>de</strong> pentru fiecare generaţie<br />
d_p_SHOW_phenotypes= Yes/No Dacă se scriu în fişierele <strong>de</strong> ieşire<br />
valorile corespunzătoare pentru fiecare<br />
d_s_SHOW_genotypes= Yes/No fenotip/genotip din generaţie<br />
d_t_SHOW_fittests= Yes/No Dacă se scriu în fişierele <strong>de</strong> ieşire<br />
valorile scorurilor <strong>de</strong> selecţie<br />
d_g_SHOW_generations= Yes/No Dacă se generează fişier <strong>de</strong> ieşire<br />
conţinând generaţiile unei evoluţii<br />
d_e_SHOW_evolutions= Yes/No Dacă se generează fişier <strong>de</strong> ieşire<br />
conţinând evoluţiile unei execuţii<br />
e0n_RUNS_number= 2 Numărul <strong>de</strong> execuţii in<strong>de</strong>pen<strong>de</strong>nte<br />
b_k_RUNS_kepp_best_in_sample= Yes/No Dacă păstrează genotipurile<br />
fenotipurilor din cea mai bună regresie<br />
în eşantion<br />
b_f_RUNS_get_best_from_file= Yes/No Dacă se preiau (parţial sau total)<br />
genotipurile primei generaţii din fişier<br />
<strong>de</strong> intrare (`c_galg.txt`)<br />
Tipul abstract <strong>de</strong> date `SAR_Fam` conţine toate datele, procedurile şi funcţiile necesare<br />
algoritmului genetic pentru evoluţie şi sunt redate în Algoritm 5.<br />
Algoritm 5. Tipul abstract <strong>de</strong> date SAR_Fam: date şi operaţii pentru regresii multiple pe familii<br />
<strong>de</strong> <strong>de</strong>scriptori moleculari folosind algoritm genetic<br />
Variabile Semnificaţii<br />
f:Text; Pointer către fişier <strong>de</strong> intrare sau ieşire<br />
236
d_n:S9; Variabilă folosită la pentru adăugarea la <strong>de</strong>numirea unui fişier <strong>de</strong> ieşire a<br />
unui număr aleatoriu pentru a face distincţie între 2 execuţii consecutive<br />
pe acelaşi set <strong>de</strong> molecule<br />
g0s,g1s:S9; Conţin valorile configurate în fişierul <strong>de</strong> configurare `c_galg.cgt` prin<br />
parametrii `Genes=` şi `Addre=`<br />
g2a:S0T; Genele cromozomului sub formă <strong>de</strong> şir <strong>de</strong> şiruri <strong>de</strong> caractere<br />
g3a:S0T; Adresele materialului genetic sub formă <strong>de</strong> şir <strong>de</strong> şiruri <strong>de</strong> caractere<br />
g4a:S0T; Codul genetic sub formă <strong>de</strong> şir <strong>de</strong> şiruri <strong>de</strong> caractere<br />
b_n:B_T; Variabilă conţinând o valoare <strong>de</strong> a<strong>de</strong>văr (nu are semnificaţie asociată)<br />
d_m, d_r, d_p, d_s,<br />
d_g, d_e, d_c, d_t,<br />
g_r, b_p, b_o, sfn,<br />
sfr, sfs, vfr, vfs,<br />
sff, sfo, b_k,<br />
b_f:B0T;<br />
Valori <strong>de</strong> a<strong>de</strong>văr conţinând opţiunile sub formă <strong>de</strong> valori numerice întregi<br />
între 0 şi 255 citite din fişierul <strong>de</strong> configurare `c_galg.cga` - vezi Tabelul<br />
45<br />
x_b:BAT; Şir <strong>de</strong> şiruri <strong>de</strong> valori <strong>de</strong> a<strong>de</strong>văr referind viabilitatea genotipurilor [0] şi<br />
fenotipurilor asociate [1..6]<br />
s0c:B2T; Şir <strong>de</strong> şiruri <strong>de</strong> întregi reprezentând şirul codurilor genetice în eşantion<br />
c0c:B2T; Şir <strong>de</strong> şiruri <strong>de</strong> întregi reprezentând şirul codurilor genetice <strong>de</strong>scen<strong>de</strong>nţi<br />
e0i,e0n:I0T; Numărul execuţiei in<strong>de</strong>pen<strong>de</strong>nte şi numărul total <strong>de</strong> execuţii planificate<br />
e2i:I0T; Ultima generaţie în care s-a produs evoluţie<br />
gn0,gn1:I0T; Numărul <strong>de</strong> gene în cromozom (şi numărul <strong>de</strong> gene minus 1)<br />
cn0,cn1,cn2:I0T; Numărul <strong>de</strong> încrucişări într-o generaţie; cn1=cn0-1; cn2=2·cn0-1<br />
m_m:I0T; Numărul <strong>de</strong> gene supuse mutaţiei într-o mutaţie<br />
sn0,sn1:I0T; Volumul eşantionului (numărul <strong>de</strong> genotipuri)<br />
sn2,sn3:I0T; Numărul <strong>de</strong> genotipuri viabile (într-un moment dat al execuţiei)<br />
pn0,pn1:I0T; Numărul <strong>de</strong> fenotipuri (<strong>de</strong> şase ori numărul <strong>de</strong> genotipuri); pn1=pn0-1<br />
pn2,pn3:I0T; Numărul <strong>de</strong> fenotipuri viabile (într-un moment dat al execuţiei)<br />
rn0,rn1,rnp:I0T; Ordinul <strong>de</strong> multiplicitate al regresiei; rn1=rn0-1; rnp=rn0+1<br />
sdn:I0T; Numărul <strong>de</strong> scoruri <strong>de</strong> selecţie distincte<br />
v_n:I0T; Număr <strong>de</strong> genotipuri viabile în supravieţuire<br />
vdn:I0T; Numărul <strong>de</strong> scoruri <strong>de</strong> supravieţuire distincte<br />
e1i,e1n:L0T; Numărul generaţiei şi numărul total <strong>de</strong> generaţii într-o execuţie<br />
m0n,m1n:L0T; Numărul <strong>de</strong> molecule în setul investigat; m1n=m0n-1<br />
i0n,i1n:L0T; Numărul <strong>de</strong> <strong>de</strong>scriptori în familie (volumul populaţiei <strong>de</strong> <strong>de</strong>scriptori)<br />
sfa:L0T; Număr folosit la rotunjirea scorurilor <strong>de</strong> selecţie (cifre semnificative)<br />
t_0,t_1:R0T; Valorile Stu<strong>de</strong>nt t ale pragurilor la semnificaţie <strong>de</strong> 95% probabilitate <strong>de</strong><br />
succes pentru regresia liniară multiplă după mo<strong>de</strong>lul ecuaţiei (1) - t_0 şi<br />
ecuaţiei (2) - t_1; aproximate cu funcţia ST_t025(df:I0T)<br />
m2n:R0T; Numărul <strong>de</strong> molecule în setul investigat (ca valoare reală); n2n=m0n<br />
a_v,ajb,a_c:R0T; Valorile pentru adaptare preluate din fişierul `c_galg.cga`<br />
fr2,fse:R0T; Valorile parametrului p din formula <strong>de</strong> scor <strong>de</strong> selecţie pentru r2 şi se<br />
fMt,fHr:R0T; Valorile parametrului p din formula <strong>de</strong> scor <strong>de</strong> selecţie pentru Mt şi Hr<br />
mpp,mcp:R0T; Probabilităţile <strong>de</strong> mutaţie înainte (mmp) şi după (mcp) încrucişare<br />
v_p,v_g:R0T; Valorile p din expresiile scorurilor <strong>de</strong> supravieţuire (fenotip, genotip)<br />
e0v,e1v:R0T; Valori din expresia <strong>de</strong> normalizare a scorului <strong>de</strong> selecţie (min, max)<br />
g5a,g6a,g7a:B1T; Şiruri pentru conversia genotip ↔ adresă<br />
d_f,d_d:B1T; Şiruri <strong>de</strong> valori <strong>de</strong> a<strong>de</strong>văr <strong>de</strong>finind afişarea statisticilor <strong>de</strong>scriptive şi<br />
scorurilor <strong>de</strong> selecţie<br />
r0o,b0o:B1T; Operatorii fenotipurilor implicate în regresia: curentă şi cea mai bună<br />
p0o:B1T; Adresele fenotipurilor din cultivar (legături către genotipuri)<br />
r0i:I1T; Indicii fenotipurilor regresiei curente: (0,1,2,...) → (...,m-2,m-1,m)<br />
237
0p,b0s:I1T; Adresele fenotipurilor implicate în regresia: curentă şi cea mai bună<br />
r0p:I1T; Operatorii fenotipurilor din cultivar (legături către genotipuri)<br />
p0i,s0i:I1T; Scoruri <strong>de</strong> selecţie pentru fenotipuri şi genotipuri<br />
v1i:I1T; Scoruri <strong>de</strong> supravieţuire pentru genotipuri<br />
g8a:L1T; Şir auxiliar în conversia genotip ↔ adresă<br />
s0a,c0a:L1T; Adrese (absolute) ale genotipurilor din eşantion şi ale <strong>de</strong>scen<strong>de</strong>nţilor<br />
f1f,f1d,f1c:L1T; Scoruri <strong>de</strong> selecţie şi supravieţuire rotunjite; şirul valorilor lor distincte;<br />
v1f,v1d,v1c:L1T;<br />
numărul <strong>de</strong> valori i<strong>de</strong>ntice pentru fiecare valoare distinctă<br />
f1r:L1T; Şir suplimentar necesar în înlocuirea valorilor cu rangurile acestora<br />
f1s,v2s:L1T; Şirurile părinţilor din eşantion în procesul <strong>de</strong> selecţie şi supravieţuire<br />
y_v,y_d:R1T; Valori experimentale şi statistica <strong>de</strong>scriptivă a acestora<br />
r_b,r_t:R1T; Coeficienţii din ecuaţia <strong>de</strong> regresie, valorile Stu<strong>de</strong>nt t asociate acestora<br />
r0r:R1T; (r2,se,tr,Hr,df_r,me,df_t) pentru regresia curentă<br />
y_e,r_d:R1T; Valori experimentale şi statistica <strong>de</strong>scriptivă a acestora<br />
f0r,f0f,f0g:R1T; Scorurile <strong>de</strong> selecţie pentru regresia, fenotipul şi genotipul curente<br />
v0p,v0g:R1T; Scorurile <strong>de</strong> supravieţuire din similaritatea fenotipică şi genotipică<br />
v0s,v1s:R1T; Scorurile <strong>de</strong> supravieţuire cumulate şi valori distincte ale acestora<br />
x_v:R2T; Familia <strong>de</strong> <strong>de</strong>scriptori moleculari<br />
r0a,r0c:R2T; Matricea sistemului <strong>de</strong> ecuaţii în regresia multiplă şi inversa sa<br />
rmx:R2T; Valorile mediilor M(Xi,Xj) între valorile fenotipice<br />
b_r:R2T; Memorează parametrii celei mai bune regresii (obiectivul algoritmului)<br />
f0s:R2T; Scorurile <strong>de</strong> selecţie pentru fiecare genotip al eşantionului<br />
p0v,p0d,f0p:R3T; Valorile, statistica <strong>de</strong>scriptivă, scoruri <strong>de</strong> selecţie pentru fiecare fenotip<br />
Operaţii Descriere<br />
function ST_Out0<br />
(z:R0T):B_T;<br />
Testează dacă un număr real se află sub limita inferioară (min_real) în<br />
vecinătatea lui 0<br />
function ST_Out1<br />
(z:R0T):B_T;<br />
Testează dacă un număr real se află peste limita superioară (max_real)<br />
procedure ST0Aliv<br />
;<br />
Obţine valorile <strong>de</strong> a<strong>de</strong>văr ale viabilităţii fenotipurilor şi genotipurilor<br />
familiei <strong>de</strong> <strong>de</strong>scriptori moleculari<br />
function ST_XX<br />
(var x,y:R1T):R0T;<br />
Calculează media M(Xi,Xj) a două fenotipuri<br />
function ST_t025<br />
(df:I0T):R0T;<br />
Aproximează cu o formulă dublu exponenţială Stu<strong>de</strong>nt t din numărul <strong>de</strong><br />
gra<strong>de</strong> <strong>de</strong> libertate<br />
procedure ST0Desc Calculează simultan 13 parametrii <strong>de</strong> statistică <strong>de</strong>scriptivă: m0, m1, m2,<br />
(var y,s:R1T);<br />
m3, m4, mx, my, v0, g1, g2, jb, r1, r2<br />
function ST_Desc Calculează cei 13 parametrii <strong>de</strong> statistică <strong>de</strong>scriptivă şi obţine răspuns cu<br />
(var y,s:R1T):B_T;<br />
privire la viabilitatea fenotipului<br />
procedure CF_Ge Citeşte codul genetic al familiei <strong>de</strong> <strong>de</strong>scriptori moleculari din fişierul<br />
;<br />
`c_galg.cgt`<br />
procedure CF_Cu Citeşte configuraţia <strong>de</strong> execuţie a programului evolutiv din fişierul<br />
(var d:S0T);<br />
`c_galg.cga`<br />
procedure CF_Cd Verifică consistenţa şi prelucrează o linie <strong>de</strong> <strong>de</strong>finiţie (`Genes=` sau<br />
(s:S9;var x:S0T);<br />
`Addre=`) din fişierul <strong>de</strong> <strong>de</strong>finire a codului genetic<br />
procedure CF_Rs; Iniţializează valorile <strong>de</strong> minim şi maxim pentru funcţia obiectiv asigurând<br />
astfel in<strong>de</strong>pen<strong>de</strong>nţa între execuţiile succesive ale algoritmului genetic<br />
function CF_St<br />
(s:S9):S3;<br />
Citeşte secvenţa <strong>de</strong> <strong>de</strong>finire a unei gene din fişierul <strong>de</strong> <strong>de</strong>finire a codului<br />
genetic<br />
function CF_Ar Citeşte o opţiune <strong>de</strong> tip şir <strong>de</strong> opţiuni (<strong>de</strong>finite în Tabelul 42 şi<br />
(s:S9;var<br />
l:C8):B0T;<br />
exemplificate în Tabelul 45) din fişierul <strong>de</strong> configurare a execuţiei<br />
programului evolutiv<br />
function CF_NY Citeşte o opţiune <strong>de</strong> tip Yes/No (menţionate în Tabelul 45) din fişierul <strong>de</strong><br />
238
(s:S9):B0T; configurare a execuţiei programului evolutiv<br />
function CF_In<br />
(s:S9):I0T;<br />
function CF_Lo<br />
(s:S9):L0T;<br />
Citeşte o valoare întreagă din fişierul <strong>de</strong> configurare a execuţiei<br />
programului evolutiv<br />
function CF_RT<br />
(s:S9):R0T;<br />
Citeşte o valoare reală din fişierul <strong>de</strong> configurare a execuţiei programului<br />
evolutiv<br />
procedure GC_GS<br />
(var g:B1T;var<br />
s:S3);<br />
Converteşte cod genetic (secvenţă <strong>de</strong> numere) în şir <strong>de</strong> caractere<br />
procedure GC_SG<br />
(var s:S3;var<br />
g:B1T);<br />
Converteşte şir <strong>de</strong> caractere în cod genetic (secvenţă <strong>de</strong> numere)<br />
procedure GC_PG<br />
(i:I0T);<br />
Converteşte o adresă <strong>de</strong> genotip în cod genetic corespunzător<br />
procedure GC_GP<br />
(i:I0T);<br />
Converteşte un cod genetic în adresa genotipului corespunzător<br />
procedure GC_Cr<br />
(l:I0T);<br />
Încrucişează al `l`-lea cu al `l+1`-lea genotip<br />
procedure GC_Mu<br />
(j:I0T);<br />
Mută al `j`-le genotip<br />
procedure GC_GG<br />
(var s,d:B1T);<br />
Copiază codul genetic al genotipului `s` în genotipul `d`<br />
procedure GC_CA; Calculează adresa unui genotip<br />
procedure RG_PH;<br />
function<br />
RG_do:B_T;<br />
Obţine adresele şi operatorii fenotipurilor selectate pentru regresia curentă<br />
Pentru toate combinaţiile unice posibile <strong>de</strong> n (numărul <strong>de</strong> fenotipuri<br />
viabile în cultivar) câte p (ordinul <strong>de</strong> multiplicitate al regresiei multiple)<br />
încearcă obţinerea unei regresii multiple cu coeficienţi semnificativi<br />
statistic <strong>de</strong> tipul (eq.1); dacă rezultatul încercării eşuează datorită obţinerii<br />
unui coeficient liber nesemnificativ statistic atunci încearcă obţinerea unei<br />
regresii multiple cu coeficienţi semnificativi statistic <strong>de</strong> tipul (eq.2)<br />
procedure RG_M0; Construieşte matricea sistemului ([a]), matricea coeficienţilor ([b]) şi<br />
matricea unitate ([c]) în ve<strong>de</strong>rea obţinerii soluţiei (în [b]) şi matricei<br />
inverse (în [c]) pentru calculul semnificaţiilor coeficienţilor (în [t]) pentru<br />
ecuaţia <strong>de</strong> regresie <strong>de</strong>finită <strong>de</strong> (eq.1):<br />
⎛M(<br />
Y)<br />
⎞<br />
⎜ ⎟<br />
⎜M(<br />
X1Y)<br />
⎟<br />
b= ⎜...<br />
⎟<br />
⎜ ⎟<br />
⎜ ⎟<br />
⎝M(<br />
XnY)<br />
⎠<br />
⎛1<br />
⎜<br />
⎜M(<br />
X1)<br />
a= ⎜...<br />
⎜<br />
⎝M(<br />
Xn<br />
)<br />
M(<br />
X1)<br />
M(<br />
X1X1)<br />
...<br />
M(<br />
XnX<br />
1)<br />
...<br />
...<br />
...<br />
...<br />
⎛1/<br />
m<br />
⎜<br />
⎜0<br />
c= ⎜... ⎜<br />
⎝0<br />
0<br />
1/<br />
m<br />
...<br />
0<br />
...<br />
...<br />
...<br />
...<br />
0 ⎞<br />
⎟<br />
0 ⎟<br />
... ⎟<br />
⎟<br />
1/<br />
m⎟<br />
⎠<br />
M(<br />
Xn<br />
) ⎞<br />
⎟<br />
M(<br />
X1Xn<br />
) ⎟<br />
... ⎟<br />
⎟<br />
M(<br />
X X ) ⎟<br />
n n ⎠<br />
procedure RG_M1; Construieşte matricea sistemului ([a]), matricea coeficienţilor ([b]) şi<br />
matricea unitate ([c]) în ve<strong>de</strong>rea obţinerii soluţiei (în [b]) şi matricei<br />
inverse (în [c]) pentru calculul semnificaţiilor coeficienţilor (în [t]) pentru<br />
ecuaţia <strong>de</strong> regresie <strong>de</strong>finită <strong>de</strong> (eq.2):<br />
⎛ ⎞<br />
⎜ ⎟<br />
⎜M(<br />
X1Y)<br />
⎟<br />
b= ⎜...<br />
⎟<br />
⎜ ⎟<br />
⎜ ⎟<br />
⎝ M(<br />
XnY)<br />
⎠<br />
⎛<br />
⎜<br />
⎜<br />
a= ⎜<br />
⎜<br />
⎝<br />
( X1X1)<br />
...<br />
M(<br />
XnX<br />
1)<br />
239<br />
...<br />
...<br />
...<br />
⎞<br />
⎟<br />
M(<br />
X1X<br />
) ⎟<br />
... ⎟<br />
⎟<br />
M(<br />
X X ) ⎟<br />
n n ⎠<br />
M n
function<br />
RG_G0:B_T;<br />
function<br />
RG_G1:B_T;<br />
function<br />
RG_Es:B_T;<br />
function<br />
RG_Ov:B_T;<br />
⎛<br />
⎞<br />
⎜<br />
⎟<br />
⎜ 1/<br />
m ... 0 ⎟<br />
c= ⎜ ... ... ... ⎟<br />
⎜<br />
⎟<br />
⎜<br />
⎟<br />
⎝ 0 ... 1/<br />
m⎠<br />
Aplică algoritmul <strong>de</strong> rezolvare Gauss pentru sistemul <strong>de</strong> (p+1) ecuaţii<br />
calculat <strong>de</strong> funcţia RG_M0: [b][a][c] → [coef][I][c -1 ]<br />
Aplică algoritmul <strong>de</strong> rezolvare Gauss pentru sistemul <strong>de</strong> (p) ecuaţii<br />
calculat <strong>de</strong> funcţia RG_M1: [b][a][c] → [coef][I][c -1 ]<br />
Calculează Ŷ după eq. (1) sau eq. (2)<br />
Calculează valorile Stu<strong>de</strong>nt t utilizând ecuaţiile (20) şi (21)<br />
Calculează r2, se, Mt şi Hr<br />
Construieşte combinaţiile posibile a n elemente luate câte p (toate<br />
regresiile posibile luate o singură dată cu fenotipuri din cultivar) după<br />
schema din exemplu:<br />
Fie următoarele fenotipuri viabile în cultivar:<br />
÷ X8; X23; X47; X112; X145<br />
Acestea au indicii:<br />
÷ 8; 23; 47; 112; 145<br />
Iar indici <strong>de</strong> indici sunt în total <strong>de</strong> 5 (n=5 în ecuaţiile <strong>de</strong> mai sus):<br />
÷ 1(8); 2(23); 3(47); 4(112); 5(145)<br />
Presupunând că se caută regresii multiple <strong>de</strong> ordin <strong>de</strong> multiplicitate 3<br />
(p=3), combinaţiile posibile <strong>de</strong> indici <strong>de</strong> indici sunt:<br />
÷ 1; 2; 3 ÷ 1; 3; 4 ÷ 2; 3; 4<br />
÷ 1; 2; 4 ÷ 1; 3; 5 ÷ 2; 3; 5<br />
÷ 1; 2; 5 ÷ 1; 4; 5 ÷ 3; 4; 5<br />
Indicii <strong>de</strong>scriptorilor fiind:<br />
÷ 8; 23; 47 ÷ 8; 47; 112 ÷ 23; 47; 112<br />
÷ 8; 23; 112 ÷ 8; 47; 145 ÷ 23; 47; 145<br />
÷ 8; 23; 145 ÷ 8; 112; 145 ÷ 47; 112; 145<br />
Iar ecuaţiile <strong>de</strong> regresie <strong>de</strong> căutat fiind:<br />
Ŷ=a0+a1X8+a2X23+a3X47; Ŷ=a0X8+a1X23+a2X47;<br />
Ŷ=a0+a1X8+a2X23+a3X112; Ŷ=a0X8+a1X23+a2X112;<br />
Ŷ=a0+a1X8+a2X23+a3X145; Ŷ=a0X8+a1X23+a2X145;<br />
Ŷ=a0+a1X8+a2X47+a3X112; Ŷ=a0X8+a1X47+a2X112;<br />
Ŷ=a0+a1X8+a2X47+a3X145; Ŷ=a0X8+a1X47+a2X145;<br />
Ŷ=a0+a1X8+a2X112+a3X145; Ŷ=a0X8+a1X112+a2X145;<br />
Ŷ=a0+a1X23+a2X47+a3X112; Ŷ=a0X23+a1X47+a2X112;<br />
Ŷ=a0+a1X23+a2X47+a3X145; Ŷ=a0X23+a1X47+a2X145;<br />
Ŷ=a0+a1X47+a2X112+a3X145; Ŷ=a0X47+a1X112+a2X145;<br />
procedure SA_PIni<br />
(i:I0T);<br />
Transformă genotipurile la fenotipuri în cultivar folosind operatorii <strong>de</strong><br />
linearizare <strong>de</strong>finiţi (Tabelul 42 constanta `col`)<br />
procedure SA_PAli<br />
;<br />
Numără fenotipurile viabile din cultivar<br />
procedure SA_SAli<br />
;<br />
Numără genotipurile distincte asociate fenotipurilor viabile din cultivar<br />
procedure SA_Frst<br />
;<br />
Construieşte prima generaţie <strong>de</strong> genotipuri (primul eşantion al populaţiei<br />
<strong>de</strong> <strong>de</strong>scriptori moleculari) folosind selecţia întâmplătoare eventual (dacă<br />
este impus în fişierul <strong>de</strong> configurare) impunând viabilitatea genotipurilor<br />
şi eventual (dacă este impus în fişierul <strong>de</strong> configurare) impunând un set <strong>de</strong><br />
genotipuri (preluate din fişier)<br />
procedure SA_Next Construieşte noua generaţie astfel:<br />
240
; ÷ mută părinţi cu probabilitatea <strong>de</strong>finită în fişierul <strong>de</strong> configurare<br />
÷ încrucişează perechi <strong>de</strong> părinţi în număr <strong>de</strong>finit în fişierul <strong>de</strong><br />
configurare<br />
÷ mută fii cu probabilitatea <strong>de</strong>finită în fişierul <strong>de</strong> configurare<br />
÷ numără <strong>de</strong>scen<strong>de</strong>nţii adaptaţi<br />
÷ înlocuieşte părinţi cu <strong>de</strong>scen<strong>de</strong>nţi folosind metoda <strong>de</strong> supravieţuire<br />
<strong>de</strong>finită în fişierul <strong>de</strong> configurare<br />
procedure SL_SV Înlocuieşte părinţi selectaţi <strong>de</strong> metoda <strong>de</strong> supravieţuire cu <strong>de</strong>scen<strong>de</strong>nţi<br />
(l:B0T;var i:B0T);<br />
viabili rezultaţi în urma procesului <strong>de</strong> selecţie, încrucişare şi mutaţie<br />
procedure SL_Fit ÷ Calculează scorul <strong>de</strong> selecţie al genotipurilor<br />
;<br />
÷ Nomalizează scorurile (dacă e activată normalizarea în fişierul <strong>de</strong><br />
configurare)<br />
÷ Rotunjeşte valorile la numărul <strong>de</strong>finit (în fişierul <strong>de</strong> configurare) <strong>de</strong><br />
cifre semnificative<br />
÷ Construieşte rangurile şi înlocuieşte valorile cu ranguri (dacă sunt<br />
activate rangurile în fişierul <strong>de</strong> configurare)<br />
÷ Sortează valorile<br />
procedure SL_Pro Date <strong>de</strong> intrare:<br />
;<br />
÷ FS_Array - Şirul scorurilor <strong>de</strong> selecţie;<br />
procedure SL_Det<br />
;<br />
(partea comună)<br />
÷ N_Sel - Număr <strong>de</strong> selecţii (dublul numărului <strong>de</strong> perechi <strong>de</strong> încrucişat);<br />
Algoritm (Construcţia claselor <strong>de</strong> frecvenţe):<br />
÷ Pune valorile distincte din FS_Array în FSD_Array;<br />
÷ Pune numărul <strong>de</strong> apariţii ale valorilor din FS_Array în FSC_Array;<br />
÷ Sortează ascen<strong>de</strong>nt după FSD_Array ambele FSD_Array şi FSC_Array;<br />
÷ Partea distinctă (vezi mai jos)<br />
Date <strong>de</strong> ieşire:<br />
÷ Genotipurile selectate în variabila Selected_Genotypes_Array<br />
procedure SL_Pro Face selecţia proporţională după scorurile <strong>de</strong> selecţie astfel:<br />
;<br />
÷ Atribuie Empty la Selected_Genotypes_Array (→)<br />
÷ Pentru fiecare selecţie <strong>de</strong> la 1 la N_Sel:<br />
o Calculează suma scorurilor <strong>de</strong> selecţie pentru genotipurile care nu au<br />
fost selectate încă → FS_Sum<br />
o Generează întâmplător (distribuţie uniformă) un număr între 0 şi<br />
FS_Sum (inclusiv) şi → FS_Freq<br />
o Găseşte primul indice Group din FSD_Array pentru care FS_Freq ≤<br />
Σi≤GroupFSD_Array[i]*FSC_Array[i]<br />
o Generează un număr întâmplător (distribuţie uniformă) între 1 şi<br />
FSC_Array[i] şi → FSD_Next<br />
o Pune valoarea FSD_Array[Group] situată pe poziţia FSD_Next în<br />
FS_Array dintre cele care nu au fost selectate încă →<br />
Selected_Genotypes_Array<br />
o Sca<strong>de</strong> o unitate din FSC_Array[Group] corespunzătoare valorii<br />
selectate<br />
procedure SL_Det Face selecţia <strong>de</strong>terministă după scorurile <strong>de</strong> selecţie astfel:<br />
;<br />
÷ Atribuie Empty la Selected_Genotypes_Array (→)<br />
÷ Zero → Already_Selected<br />
÷ Volumul eşantionului → Group (are cea mai mare valoare <strong>de</strong> selecţie în<br />
FSD_Array)<br />
÷ Cât timp Already_Selected + FSC_Array[Group]
o Sca<strong>de</strong> o unitate din Group<br />
÷ Cât timp Already_Selected
procedure SL_QSr<br />
(i,j:I0T);<br />
procedure SL_SrQ<br />
(l,r:I0T);<br />
şi respectiv<br />
procedure SV_QSr<br />
(i,j:I0T);<br />
procedure SV_SrQ<br />
(l,r:I0T);<br />
function SV_MGe<br />
(i,j:I0T):R0T;<br />
function SV_MPh<br />
(i,j:I0T):R0T;<br />
procedure SV_Fit<br />
;<br />
procedure SV_Pro<br />
;<br />
procedure SV_Det<br />
;<br />
65 66<br />
Sortează folosind algoritmul QuickSort [ , ] un şir <strong>de</strong> numere<br />
(necesitând 2·[log2(n)] încrucişări) ca în următorul exemplu:<br />
Poziţii 0 1 2 3 4 5 6 7 8 9<br />
Calculează similaritatea genotipică (a două genotipuri) cu formula<br />
SG(Xi,Xj)=(g_dif(Xi,Xj)/g_tot) p Şir iniţial<br />
Încrucişare<br />
3 1 4 1 5 9 2 6 5 5<br />
Pasul 1<br />
Încrucişare<br />
3 1 4 1 5 5 2 6 9 5<br />
Pasul 2<br />
Încrucişare<br />
1 1 4 3 5 5 2 6 9 5<br />
Pasul 3<br />
Încrucişare<br />
1 1 4 3 2 5 5 6 9 5<br />
Pasul 4<br />
Încrucişare<br />
1 1 2 3 4 5 5 6 9 5<br />
Pasul 5<br />
Încrucişare<br />
1 1 2 3 4 5 5 6 5 9<br />
Pasul 6 1 1 2 3 4 5 5 5 6 9<br />
Şir ordonat 1 1 2 3 4 5 5 5 6 9<br />
un<strong>de</strong> g_dif(Xi,Xj) = numărul <strong>de</strong> gene care<br />
au valori diferite în Xi vs. Xj, g_tot = numărul total <strong>de</strong> gene din cromozom,<br />
p = parametrul similarităţii genotipice <strong>de</strong>finit în fişierul <strong>de</strong> configurare<br />
`c_galg.cga`<br />
Calculează similaritatea fenotipică (a două fenotipuri) cu formula<br />
SP(Xi,Xj)=(fit(X1)-fit(X2)) p un<strong>de</strong> fit(X1) = scorul relativ (subunitar) <strong>de</strong><br />
selecţie al primului fenotip, fit(X2) = scorul relativ (subunitar) <strong>de</strong> selecţie<br />
al celui <strong>de</strong>-al doilea fenotip, p = parametrul similarităţii fenotipice <strong>de</strong>finit<br />
în fişierul <strong>de</strong> configurare `c_galg.cga`<br />
÷ Calculează scorul <strong>de</strong> similaritate genotipică (SSG) şi scorul <strong>de</strong><br />
similaritate fenotipică (SSP) folosind formulele:<br />
SSG(Xi)= min SG(<br />
X , X )) ; SSP(Xi)= min SP(<br />
X , X ))<br />
( i j<br />
j≠i<br />
( i j<br />
j≠i<br />
÷ Calculează scorul <strong>de</strong> supravieţuire (diversitate) cu formula:<br />
2<br />
SS(Xi)=<br />
SSG(<br />
Xi<br />
) + SSP(<br />
Xi<br />
)<br />
÷ Normalizează valorile (relativ la minimul şi maximul obţinut în<br />
generaţiile anterioare) dacă opţiunea <strong>de</strong> normalizare a fost activată în<br />
fişierul <strong>de</strong> configurare<br />
÷ Rotunjeşte valorile la precizia <strong>de</strong>finită în fişierul <strong>de</strong> configurare<br />
÷ Înlocuieşte valorile cu ranguri dacă opţiunea ranguri a fost activată în<br />
fişierul <strong>de</strong> configurare<br />
÷ Sortează valorile<br />
Date <strong>de</strong> intrare:<br />
÷ FV_Array - Şirul scorurilor <strong>de</strong> supravieţuire;<br />
÷ N_Srv - Număr <strong>de</strong> selecţii (numărul <strong>de</strong> <strong>de</strong>scen<strong>de</strong>nţi viabili);<br />
[ 65 ] (Sir) Charles A. R. HOARE. 1962. Quicksort. Computer Journal 5(1):10-15.<br />
[ 66 ] http://en.wikipedia.org/wiki/File:Sorting_quicksort_anim.gif<br />
243
(partea comună) Algoritm (Construcţia claselor <strong>de</strong> frecvenţe):<br />
÷ Pune valorile distincte din FV_Array în FVD_Array;<br />
÷ Pune numărul <strong>de</strong> apariţii ale valorilor din FV_Array în FVC_Array;<br />
÷ Sortează ascen<strong>de</strong>nt după FVD_Array ambele FVD_Array şi<br />
FVC_Array;<br />
÷ Partea distinctă (vezi mai jos)<br />
Date <strong>de</strong> ieşire:<br />
÷ Genotipurile selectate în variabila Ceased_Genotypes_Array<br />
procedure SV_Pro SV_Pro i<strong>de</strong>m cu SL_Pro pentru FV_Array, N_Srv, FVD_Array,<br />
;<br />
FVC_Array şi Ceased_Genotypes_Array în loc <strong>de</strong> FS_Array, N_Sel,<br />
FSD_Array, FSC_Array şi Selected_Genotypes_Array<br />
procedure SV_Det SV_Det i<strong>de</strong>m cu SL_Det pentru FV_Array, N_Srv, FVD_Array,<br />
;<br />
FVC_Array şi Ceased_Genotypes_Array în loc <strong>de</strong> FS_Array, N_Sel,<br />
FSD_Array, FSC_Array şi Selected_Genotypes_Array<br />
procedure SV_Tur SV_Tur i<strong>de</strong>m cu SL_Tur pentru FV_Array, N_Srv şi<br />
;<br />
Ceased_Genotypes_Array în loc <strong>de</strong> FS_Array, N_Sel şi<br />
Selected_Genotypes_Array<br />
procedure SV_Rnk Înlocuieşte valorile scorurilor <strong>de</strong> selecţie cu rangurile acestora; SV_Rnk<br />
;<br />
i<strong>de</strong>m cu SL_Rnk pentru FV_Array şi N_Srv în loc <strong>de</strong> FS_Array, N_Sel<br />
procedure SV_Mak În funcţie <strong>de</strong> opţiunea <strong>de</strong>finită în fişierul <strong>de</strong> configurare `c_galg.cga`<br />
;<br />
pentru metoda <strong>de</strong> supravieţuire aplică una dintre supravieţuirea<br />
proporţională, supravieţuirea <strong>de</strong>terministă şi supravieţuirea în turnir<br />
procedure FT_Ini Iniţializează scorurile <strong>de</strong> selecţie ale unui individ (din şirul <strong>de</strong> evoluţii, din<br />
(var x:R1T);<br />
şirul <strong>de</strong> generaţii, din şirul <strong>de</strong> genotipuri, din şirul <strong>de</strong> fenotipuri, din şirul<br />
<strong>de</strong> fenotipuri în regresie) cu valori limită (XX_min - un<strong>de</strong> XX una dintre<br />
r2, se, Mt sau Hr - cu max_real; XX_max cu min_real şi respectiv<br />
XX_avg cu 0)<br />
procedure FT_Set Aplică operatorii minim (pentru XX_min), maxim (pentru XX_max) şi<br />
(var s,d:R1T);<br />
sumă (pentru XX_avg) pentru doi indivizi cumulând numărul <strong>de</strong> indivizi<br />
procedure FT_Avg Împarte suma (pentru XX_avg) la numărul <strong>de</strong> indivizi<br />
(var x:R1T);<br />
procedure FT_Sav; Salvează în variabiele b_r, b0o şi b0s parametrii celei mai bune regresii<br />
(celui mai bun obiectiv) adică:<br />
÷ b_r[0]=(r2, se, Mt, Hr, df_r, me, df_t)<br />
o r2 - coeficientul <strong>de</strong> <strong>de</strong>terminare r 2 (Y,Ŷ)<br />
o se - suma pătratelor erorilor <strong>de</strong> explicare Σ(Y-Ŷ) 2<br />
o Mt - media Minkwski a semnificaţiilor date <strong>de</strong> parametrii Stu<strong>de</strong>nt t ai<br />
regresiei<br />
o df_r - numărul <strong>de</strong> gra<strong>de</strong> <strong>de</strong> libertate ai mo<strong>de</strong>lului (regresiei) - `p+1`<br />
pentru ecuaţia (1) şi `p` pentru ecuaţia (2)<br />
o me - eroarea medie <strong>de</strong> explicare (se/df_t)<br />
o df_t - gra<strong>de</strong>le <strong>de</strong> libertate ale observabilei (m-df_r)<br />
÷ b_r[1]=(m0, m1, m2, m3, m4, mx, my, v0, g1, g2, jb, ox, r2)<br />
o m0, m1, m2, m3, m4, mx, my, v0, g1, g2, jb, şi r2 cu semnificaţiile<br />
<strong>de</strong>finite în Tabelul 45; ox = 1 (ox = 0 semnifică că regresia nu are toţi<br />
parametrii semnificativi statistic sau sistemul <strong>de</strong> ecuaţii asociat nu<br />
admite soluţie unică; ox = 0 nu poate fi salvată drept soluţie care<br />
satisface obiectivul evoluţiei)<br />
÷ b_r[2]=(n_aliv, r2_min, se_min, Mt_min, Hr_min, r2_max, se_max,<br />
Mt_max, Hr_max, r2_avg, se_avg, Mt_avg, Hr_avg)<br />
o valorile referă regresia şi sunt <strong>de</strong>generate astfel:<br />
n_aliv = 1<br />
244
XX_min = XX_max = XX_avg = XX (XX = r2, se, Mt, Hr)<br />
÷ b_r[3]=(coef(0), coef(X1), ..., coef(Xp)) - ecuaţia (1) sau (2)<br />
o coef(0)=0.000 pentru ecuaţia (2)<br />
÷ b_r[4]=(t(0), t(X1), ..., t(Xp)) - ecuaţia (20) şi (21)<br />
o t(0)=0.000 pentru ecuaţia (2)<br />
÷ b0o = Şirul operatorilor <strong>de</strong> linearizare care au condus la transformarea<br />
genotipurilor în fenotipurile X1, ..., Xp<br />
÷ b0p = Şirul adreselor genotipurilor transformate în fenotipurile X1, ...,<br />
function FT_r2<br />
:R0T;<br />
Xp<br />
Calculează scorul <strong>de</strong> selecţie după formula (p=fr2 Tabelul 45):<br />
FT_r2(Y,Ŷ)=(r 2 (Y,Ŷ)) p<br />
function FT_se<br />
:R0T;<br />
Calculează scorul <strong>de</strong> selecţie după formula (p=fse Tabelul 45):<br />
FT_se(Y,Ŷ)=Σ|Y-Ŷ| p<br />
function FT_Mt<br />
:R0T;<br />
Calculează scorul <strong>de</strong> selecţie după formula (p=fMt Tabelul 45):<br />
n<br />
1/<br />
p<br />
⎛ 1 p ⎞<br />
FT_Mt(Y,Ŷ)= ⎜ ∑= t ( Xi<br />
) ⎟<br />
⎝ n i 1 ⎠<br />
function FT_Hr Calculează scorul <strong>de</strong> selecţie după formula (p=fHr Tabelul 45):<br />
:R0T; 2p<br />
2 p<br />
log ( r + ( 1−<br />
r ) )<br />
FT_Hr(Y,Ŷ)= 2<br />
1−<br />
p<br />
procedure FT_RG<br />
;<br />
Calculează parametrii {r2p, sep, Mtp, Hrp} pentru o regresie şi aplică<br />
operatorii {min, max, sum} pentru a obţine parametrii {n_aliv, r2_min,<br />
se_min, Mt_min, Hr_min, r2_max, se_max, Mt_max, Hr_max, r2_avg,<br />
se_avg, Mt_avg, Hr_avg} pentru o regresie<br />
procedure FT_PH<br />
;<br />
÷ Obţine şirul fenotipurilor viabile din cultivar<br />
÷ Efectuează toate regresiile posibile şi cumulează scoruri <strong>de</strong> selecţie<br />
pentru fenotipuri<br />
÷ Cumulează scoruri <strong>de</strong> selecţie pentru genotipuri<br />
÷ Cumulează scoruri <strong>de</strong> selecţie pentru generaţie<br />
procedure FT_SA<br />
;<br />
Transformă scorurile <strong>de</strong> selecţie cumulate pentru genotipuri în valori<br />
medii (pentru scorurile <strong>de</strong> tipul XX_avg)<br />
procedure D0<br />
;<br />
Creează (iniţializează) acele fişierele <strong>de</strong> ieşire pentru rezultate care au fost<br />
<strong>de</strong>finite în fişierul <strong>de</strong> configurare<br />
procedure DRY<br />
;<br />
Scrie într-un fişier <strong>de</strong> ieşire (dacă opţiunea d_r este activată în fişierul <strong>de</strong><br />
configurare) o linie <strong>de</strong> informaţii pentru valorile măsurate conţinând<br />
informaţiile activate pentru afişare în fişierul <strong>de</strong> configurare<br />
procedure DR1<br />
;<br />
Scrie în fişierul <strong>de</strong> ieşire (dacă opţiunea d_r este activată în fişierul <strong>de</strong><br />
configurare) o linie <strong>de</strong> informaţii pentru o ecuaţie <strong>de</strong> regresie conţinând<br />
informaţiile activate pentru afişare în fişierul <strong>de</strong> configurare<br />
procedure DPSG<br />
;<br />
Scrie în fişierele <strong>de</strong> ieşire informaţiile (activate pentru afişare în fişierul <strong>de</strong><br />
configurare) corespunzător fenotipurilor şi genotipurilor unei generaţii şi<br />
respectiv informaţia cumulată caracterizând generaţia<br />
procedure DE1<br />
;<br />
Scrie în fişierul <strong>de</strong> ieşire pentru evoluţii (dacă opţiunea d_e este activată în<br />
fişierul <strong>de</strong> configurare) o linie <strong>de</strong> informaţii pentru valorile măsurate<br />
conţinând informaţiile activate pentru afişare în fişierul <strong>de</strong> configurare<br />
procedure DF1<br />
;<br />
Scrie în fişierul <strong>de</strong> ieşire (dacă opţiunea d_f este activată în fişierul <strong>de</strong><br />
configurare) linii <strong>de</strong> informaţii conţinând genotipurile cu scorurile <strong>de</strong><br />
selecţie şi supravieţuire înainte <strong>de</strong> aplicarea mutaţiei şi încrucişării<br />
procedure DF2<br />
;<br />
Scrie în fişierul <strong>de</strong> ieşire (dacă opţiunea d_f este activată în fişierul <strong>de</strong><br />
configurare) linii <strong>de</strong> informaţii conţinând genotipurile cu scorurile <strong>de</strong><br />
selecţie şi supravieţuire după <strong>de</strong> aplicarea mutaţiei şi încrucişării<br />
245
procedure DC0 Scrie în fişierul <strong>de</strong> ieşire starea tuturor parametrilor <strong>de</strong> configurare <strong>de</strong>finiţi<br />
(var d:S0T);<br />
(în fişierele <strong>de</strong> configurare) la lansarea în execuţie a programului evolutiv<br />
procedure DC1 Produce un mesaj <strong>de</strong> panică cu privire la starea cultivarului dacă în timpul<br />
(s:S9);<br />
evoluţiei conţinutul acestuia se sărăceşte în asemenea măsură încât nu mai<br />
există suficiente fenotipuri viabile pentru a construi o ecuaţie <strong>de</strong> regresie;<br />
în acest caz se re-iniţializează cultivarul reconstruind prima sa generaţie<br />
(procedura SA_Frst)<br />
procedure DC2 Scrie o linie <strong>de</strong> informaţii în fişierul <strong>de</strong> ieşire ce caracterizează funcţia<br />
;<br />
obiectiv la sfârşitul unei execuţii in<strong>de</strong>pen<strong>de</strong>nte a algoritmului genetic<br />
2009A6. Validarea mo<strong>de</strong>lelor (TvT - Training versus Test, cv-loo - cross validation leave-one-out,<br />
CCA - Correlated Correlations Analysis)<br />
Validarea mo<strong>de</strong>lelor este unul din subiectele <strong>de</strong> actualitate (Bolboacă & Jäntschi, 2006-SPMA;<br />
Bolboacă & Jäntschi, 2007-SMMV; Bolboacă & Jäntschi, 2007-DMRM; Bolboacă & Jäntschi,<br />
2007-DMRM) oferind o arie <strong>de</strong> manifestare largă. Derularea activităţii a permis valorificarea unei<br />
serii <strong>de</strong> rezultate noi în ceea ce priveşte evaluarea capacităţii <strong>de</strong> estimare pentru mo<strong>de</strong>le având<br />
înglobate polinoame caracteristice (Bolboacă & Jäntschi, 2007-HGCP), metodologia <strong>de</strong> aplicare a<br />
instrumentelor statistice în evaluarea mo<strong>de</strong>lelor (Bolboacă & Jäntschi, 2008-SMMV), analiza <strong>de</strong><br />
aglomerare ca tehnică <strong>de</strong> validare (Bolboacă & Jäntschi, 2008-ICPT), cazuistica evaluării relaţiilor<br />
structură-activitate (Bolboacă & Jäntschi, 2008-SASA), cazuistica evaluării mo<strong>de</strong>lelor <strong>de</strong><br />
compoziţie chimică a amestecurilor (Bolboacă & others, 2008-SASM), măsuri statistice eficiente în<br />
evaluarea relaţiilor structură-activitate (Bolboacă & others, 2008-SqsV).<br />
Următoarele proceduri au fost implementate pe parcursul <strong>de</strong>rulării activităţii.<br />
Testul Grubbs <strong>de</strong> i<strong>de</strong>ntificare a abaterilor grosolane <strong>de</strong> la normalitate a fost implementat ca aplicaţie<br />
online care se găseşte la adresa şi foloseşte librării statistice pentru calculul distribuţiei Stu<strong>de</strong>nt t:<br />
http://l.aca<strong>de</strong>micdirect.org/Statistics/tests/Grubbs/<br />
if(array_key_exists("data",$_POST))<br />
$data=$_POST["data"];<br />
elseif(array_key_exists("data",$_GET))<br />
$data=$_GET["data"];<br />
else<br />
die("No data!");<br />
$Y=explo<strong>de</strong>("\r\n",$data);<br />
$tab=strpos("\t",$Y[0]);<br />
$m=count($Y);<br />
if(!($tab===FALSE)){<br />
$Z=explo<strong>de</strong>("\t",$Y[0]);$n=count($Z);<br />
for($i=0;$i
$p_max[$i]=1.0*$m-1.0*$m*$tdist->_getCDF($t_max[$i]);<br />
$p_all[$i]=2.0*$m-2.0*$m*$tdist->_getCDF($t_all[$i]);<br />
}<br />
echo("");<br />
echo("Parameter");for($i=0;$i0))die();<br />
if((strpos($_POST["file"],"/")>0))die();<br />
if((strpos($_POST["file"],"..")>0))die();<br />
$a=explo<strong>de</strong>("\r\n",file_get_contents($_POST["file"]));<br />
$y=array();<br />
for($i=0;$i
}else{<br />
$h[$l]++;<br />
}<br />
}$zn=count($z);<br />
array_multisort($z,SORT_ASC,$h);<br />
$hh=array();$hhs=0;<br />
for($i=0;$i
$d[$i][$k++]=$c[$i][$j];<br />
for($i=0;$i<br />
<br />
<br />
<br />
}<br />
function calc_eq(&$coef,&$val,&$rez){//predictie pentru fiecare molecula<br />
for($i=0;$i
for($i=0;$i
$coef_F=coef_F($y,$y_pred,count($c)-1);<br />
echo("Fisher test value F = ".spalare($coef_F)."");<br />
$coef_pF=coef_pF(count($c)-1,count($y)-1,$coef_F);<br />
echo("Probability of wrong (from F) pF = ".sprintf("%1.5f",$coef_pF*100)." % (".$coef_pF.")");<br />
for($i=1;$i<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
mat_means($n,$m,$y,$x,$ma,$mb);<br />
red_gauss($mb,$ma,$n);<br />
echo("yy=".$mb[0]);<br />
for($i=1;$i
}<br />
function mat_means($n,$m,&$y,&$x,&$ma,&$mb){<br />
$ma[0][0] = 1;<br />
$mb[0] = m1($y,$m);<br />
for($k1=1;$k10)echo("YY");<br />
if($nyyy>0)echo("YYY");<br />
for($j=0;$j0)echo("".$yy[$j]);<br />
if($nyyy>0)echo("".$yyy[$j]);<br />
}<br />
echo("");<br />
}<br />
<strong>de</strong>fine("char160",chr(160));<br />
<strong>de</strong>fine("char13",chr(13));<br />
function find_first_local(&$s,&$a){<br />
$i=strlen($s)+1;<br />
if($i==1)return array(-1,0);<br />
$first_special=-1;<br />
for($j=0;$j$k){<br />
$first_special=$j;<br />
$i=$k;<br />
}<br />
}<br />
}<br />
return array($first_special,$i);<br />
}<br />
function preg_split_local($s,$a=array(' ','\t','\f')){//char160,char13<br />
$t=array();<br />
while(1){<br />
$i=strlen($s)+1;<br />
if($i==1)break;<br />
$first_special_pos=find_first_local($s,$a);<br />
while($first_special_pos[1]==0){<br />
list($r,$s)=explo<strong>de</strong>($a[$first_special_pos[0]],$s,2);<br />
254
}<br />
if(strlen($s)>0)<br />
$t[]=$s;<br />
return $t;<br />
$first_special_pos=find_first_local($s,$a);<br />
}<br />
if($first_special_pos[0]complementaryError($Z/SQRT2);<br />
$E=$Gauss->error($Z/SQRT2);<br />
echo("P(z ≤ -Z) + P(Z ≤ z) = ");<br />
if($CE= 0.0 ? $x : -$x);<br />
if($abs_x
}<br />
}elseif($abs_xerror($abs_x);<br />
}elseif($abs_x > 28.0){ $retval=0.0;<br />
}else{//1.25$accuracy)&&($i++NDist_CDF($x)-$prob;//Apply Newton-Raphson step<br />
if($errorNDist_PDF($x);<br />
if($pdf!=0.0){//Avoid division by zero<br />
$dx=$error/$pdf;<br />
$xNew=$x-$dx;<br />
}<br />
if(($xNew$xHi)||($pdf==0.0)){<br />
$xNew=($xLo+$xHi)/2.0;<br />
$dx=$xNew-$x;<br />
}<br />
$x=$xNew;<br />
}<br />
return $x;<br />
}<br />
2010A1. Aplicarea procedurilor QSAR şi colectarea informaţiei<br />
Ca rezultat al colectării informaţiei din aplicarea procedurilor QSAR o serie <strong>de</strong> rezultate noi au fost<br />
obţinute în cadrul proiectului (Bolboacă & Jäntschi, 2009-CCqD; Jäntschi & others, 2010-DqCC;<br />
Bolboacă & Jäntschi, 2010-DqPM; Bolboacă & others, 2011-DDNR).<br />
Pentru ca rezultatele observaţiei să capete consistenţă în ceea ce priveşte interpretarea statistică, mai<br />
256
este necesar ca să se asume ipoteza <strong>de</strong> convergenţă la normalitate asupra valorilor observate în<br />
eşantionul seriei <strong>de</strong> compuşi, spaţiul complet al acestora fiind în acest caz un exemplu tipic <strong>de</strong><br />
populaţie finită distribuită normal.<br />
O serie <strong>de</strong> măsuri statistice ce caracterizează o populaţie şi un eşantion sunt redate în următoarele<br />
două tabele.<br />
Măsuri statistice pentru caracterizarea variabilelor cantitative<br />
Măsură Referă Expresie Interpretare<br />
Suma valorilor Σ(·) -<br />
Numărul <strong>de</strong> valori Un şir |·| -<br />
Valoarea medie <strong>de</strong> numere E(·) = Σ(·)/|·| Valoarea aşteptată<br />
Ek(·) = E((X-E(X)) k Moment central <strong>de</strong> ordin k, k>1 ) -<br />
Media caracteristicii X O populaţie μ = μ(X) = E(X)<br />
Media observabilei Y Un eşantion m = m(Y) = E(Y) Tendinţa<br />
Estimatorul mediei<br />
caracteristicii X<br />
O populaţie M(Y) = m(Y)<br />
centrală<br />
Var(X) = E((X-μ) 2 Varianţa caracteristicii X ) Împrăştierea<br />
Deviaţia standard a<br />
caracteristicii X<br />
O populaţie<br />
σ = σ(X) = Var( X)<br />
Dispersia<br />
var = var(Y) = E((Y-E(Y)) 2 Varianţa observabilei Y ) Împrăştierea<br />
Deviaţia standard a<br />
observabilei Y<br />
Estimatorul varianţei<br />
caracteristicii X<br />
Estimatorul <strong>de</strong>viaţiei standard a<br />
caracteristicii X<br />
Un eşantion<br />
O populaţie<br />
s = s(Y) = var( Y)<br />
Dispersia<br />
VAR(Y) =<br />
| Y |<br />
| Y | −1 var(Y) Împrăştierea<br />
| Y |<br />
S = S(Y) = s(Y) Dispersia<br />
| Y | −1<br />
Statistici pentru caracterizarea <strong>de</strong>părtării <strong>de</strong> normalitate a variabilelor cantitative<br />
Simbol şi măsură Referă Expresie Mărimi care intervin<br />
γ1 = μ3/μ2 3/2<br />
γ1, Asimetria caracteristicii X<br />
β2, Boltirea caracteristicii X β2 = μ4/μ2 2<br />
γ2, Excesul <strong>de</strong> boltire al<br />
caracteristicii X<br />
O<br />
populaţie<br />
γ2 = β2-3<br />
μk = Ek(X), k>1<br />
g1 = m3/m2 3/2<br />
g1, Asimetria observabilei Y<br />
b2 = m4/m2 2<br />
b2, Boltirea observabilei Y<br />
g2, Excesul <strong>de</strong> boltire al<br />
observabilei Y<br />
Un<br />
eşantion<br />
g2 = b2-3<br />
mk = Ek(Y), k>1<br />
Estimatorul asimetriei<br />
caracteristicii X<br />
G1 =<br />
n Y ( n Y −1) M3/M2<br />
( n Y − 2)<br />
3/2<br />
Estimatorul boltirii<br />
caracteristicii X<br />
( n Y −1)(<br />
n Y + 1)<br />
B2 =<br />
M4/M2<br />
( n Y − 2)(<br />
n Y − 3)<br />
2<br />
nY = |Y|<br />
O<br />
populaţie<br />
n Y<br />
Mk =<br />
n Y −1 Estimatorul excesului <strong>de</strong><br />
boltire a caracteristicii X<br />
2<br />
( n Y −1)<br />
G2 = B2 - 3·<br />
( n Y − 2)(<br />
n Y − 3)<br />
Ek(Y),<br />
k>1<br />
Extragerea repetată <strong>de</strong> eşantioane (<strong>de</strong> volum dat) dintr-o populaţie face ca valorile obţinute să<br />
urmeze o distribuţie, numită distribuţia <strong>de</strong> eşantionare. Tabelul următor prezintă rezultatele care se<br />
obţin pentru varianţa mărimilor statistice prin extragerea repetată <strong>de</strong> eşantioane dintr-o populaţie.<br />
Când valorile parametrilor statistici ai populaţiei nu sunt cunoscute, dar se poate face presupunerea<br />
că distribuţia populaţiei se comportă suficient <strong>de</strong> bine [67], aceştia pot fi aproximaţi cu ajutorul<br />
[ 67 ] Teorema Limită Centrală<br />
÷ Cronologia contribuţiilor majore:<br />
257
estimatorilor acestora. Formulele <strong>de</strong> calcul aproximativ ale mediei şi varianţei pentru medie şi<br />
varianţă sunt redate în tabelul următor. Dacă se pot asuma ipoteze cu privire la distribuţia<br />
caracteristicii X în populaţie, atunci se pot obţine formule <strong>de</strong> calcul pentru parametrii statistici (ai<br />
populaţiei).<br />
Medii şi varianţe ale mediei şi varianţei observabilei Y ce rezultă din distribuţia <strong>de</strong> eşantionare<br />
din populaţia cu caracteristica X<br />
Mărime şi notaţie Valoare<br />
Media mediei, μ μ = μ(<br />
m(<br />
Y))<br />
= μ(<br />
X)<br />
Y<br />
Y<br />
Varianţa mediei,<br />
2<br />
σ Y<br />
Media varianţei, μ(s 2 )<br />
Varianţa varianţei, σ 2 (s 2 )<br />
σ<br />
2<br />
Y<br />
= σ<br />
2<br />
2<br />
μ(<br />
s ) = μ(<br />
s<br />
( m(<br />
Y))<br />
2<br />
( Y))<br />
2<br />
σ ( X)<br />
=<br />
n<br />
Y<br />
( n Y −1)<br />
2<br />
= σ<br />
n<br />
2 2 2 2 ( n<br />
σ ( s ) = σ ( s ( Y))<br />
=<br />
Y<br />
−1)<br />
Y<br />
3<br />
n Y<br />
( X)<br />
2<br />
μ<br />
4<br />
( X)<br />
−<br />
( n<br />
Y<br />
−1)(<br />
n<br />
n<br />
Y<br />
3<br />
Y<br />
− 3)<br />
μ<br />
Valori aproximative pentru mediile şi varianţele mediei şi varianţei observabilei Y în ipotezele<br />
teoremei limită centrale<br />
Mărime şi notaţie Aproximare<br />
Media mediei, μ μ ≅ m(<br />
Y)<br />
Y<br />
Y<br />
2<br />
Varianţa mediei, σ Y<br />
s ( Y)<br />
σ ≅ Y<br />
( n Y −1)<br />
2<br />
2<br />
Media varianţei, μ(s 2 )<br />
2 2<br />
μ ( s ) ≅ s ( Y)<br />
Varianţa varianţei, σ 2 (s 2 )<br />
2 2<br />
σ ( s ) ≅<br />
n Y −1)<br />
( n Y − 3)<br />
m4<br />
( Y)<br />
− m<br />
2<br />
n<br />
n ( n −1)<br />
( 2<br />
2<br />
Y<br />
Y Y<br />
( Y)<br />
Tabelele 1-19 dau expresiile acestor mărimi statistice (valabile pentru populaţie).<br />
Tabelul 1. Mărimi statistice ale distribuţiei discrete uniforme<br />
Mărime statistică Expresie <strong>de</strong> calcul<br />
Suport k ∈ {a, a+1, ..., b-1, b}<br />
Minim; Maxim<br />
Funcţia <strong>de</strong> probabilitate<br />
a; b<br />
1 ( b − a + 1)<br />
Funcţia <strong>de</strong> repartiţie ( [ k]<br />
− a + 1)<br />
( b − a + 1)<br />
Media şi mediana; varianţa<br />
a + b<br />
2<br />
2 ; ( b − a + 1)<br />
−1<br />
12<br />
( )<br />
( )<br />
o Abraham DE MOIVRE. 1733. Approximatio ad Summam Terminorum Binomii (a+b) n in Seriem expansi. In:<br />
Abraham DE MOIVRE. The Doctrine of Chance: or The Method of Calculating the Probability of Events in<br />
Play. W. Pearforn 1738: 235-243.<br />
o Joseph L. LAGRANGE. 1776. Mémoire sur l’utilité <strong>de</strong> la métho<strong>de</strong> <strong>de</strong> prendre le milieu entre les résultats <strong>de</strong><br />
plusieurs observations; dans lequel on examine les avantages <strong>de</strong> cette métho<strong>de</strong> par le calcul <strong>de</strong>s probabilités; et<br />
où l’on résoud différents problèmes relat ifs à cette matière. Miscellanea Taurinensia 5:167-232.<br />
o Pierre S. LAPLACE. 1812. Théorie Analytique <strong>de</strong>s Probabilités. Courcier, 465 p.<br />
o Aleksandr M. LIAPUNOV. 1901. Nouvelle forme du théoreme sur la limite <strong>de</strong>s probabilités. Mémoires <strong>de</strong><br />
l'Académie Impériale <strong>de</strong>s Sciences <strong>de</strong> St. Pétersbourg 12(5):1-24.<br />
÷ Enunţul teoremei (fie (Xn)n≥1 variabile in<strong>de</strong>pen<strong>de</strong>nte şi ∃δ>0 a.î. μ2+δ(Xn)
6((<br />
b − a + 1)<br />
Asimetria; excesul <strong>de</strong> boltire 0; −<br />
5((<br />
b − a + 1)<br />
Tabelul 2. Mărimi statistice ale distribuţiei discrete Bernoulli<br />
Mărime statistică Expresie <strong>de</strong> calcul<br />
Suport k ∈ {0,1}; p ∈ (0,1)<br />
Minim; Maxim 0; 1<br />
Funcţia <strong>de</strong> probabilitate (1-p), k = 0 p, k = 1<br />
Funcţia <strong>de</strong> repartiţie (1-p), k ∈ [0,1)<br />
1, 1 ≤ k<br />
Media; varianţa p; p(1-p)<br />
Asimetria; excesul <strong>de</strong> boltire 6p 6p<br />
1 p(<br />
1 p)<br />
2<br />
− + −<br />
2<br />
2<br />
+ 1)<br />
−1)<br />
0; ( ) ( )<br />
Tabelul 3. Mărimi statistice ale distribuţiei discrete binomiale<br />
Mărime statistică Expresie <strong>de</strong> calcul<br />
Suport k ∈ {0, ..., n}; p ∈ (0,1)<br />
Minim; Maxim 0; n<br />
Funcţia <strong>de</strong> probabilitate<br />
n!<br />
k n−k<br />
p ( 1−<br />
p)<br />
k!<br />
⋅(<br />
n − k)!<br />
Funcţia <strong>de</strong> repartiţie<br />
k n!<br />
i n−i<br />
∑ p ( 1−<br />
p)<br />
i=<br />
0 i!<br />
( n − i)!<br />
Media; varianţa np; np(1-p)<br />
Asimetria; excesul <strong>de</strong> boltire ( 1− 2p)<br />
1−<br />
6p(<br />
1−<br />
p)<br />
np(<br />
1−<br />
p)<br />
;<br />
np(<br />
1−<br />
p)<br />
Tabelul 4. Mărimi statistice ale distribuţiei discrete Poisson<br />
Mărime statistică Expresie <strong>de</strong> calcul<br />
Suport k = 0, 1, ...; λ ≥ 0<br />
Minim; Maxim 0; ∞<br />
Funcţia <strong>de</strong> probabilitate<br />
−λ<br />
k<br />
e λ k!<br />
Funcţia <strong>de</strong> repartiţie ∑ =<br />
i<br />
k<br />
0<br />
e<br />
−λ i<br />
λ<br />
Media; varianţa λ; λ<br />
Asimetria; excesul <strong>de</strong> boltire 1 λ ; 1 λ<br />
Tabelul 5. Mărimi statistice ale distribuţiei continue uniforme<br />
Mărime statistică Expresie <strong>de</strong> calcul<br />
Suport x ∈ [a, b]<br />
Minim; Maxim a; b<br />
Funcţia <strong>de</strong> probabilitate 1/(b-a)<br />
Funcţia <strong>de</strong> repartiţie (x-a)/(b-a)<br />
Media şi mediana; varianţa<br />
i!<br />
(a+b)/2; (b-a) 2 /12<br />
Asimetria; excesul <strong>de</strong> boltire 0; -6/5<br />
Tabelul 6. Mărimi statistice ale distribuţiei continue Cauchy-<strong>Lorentz</strong><br />
Mărime statistică Expresie <strong>de</strong> calcul<br />
Suport x ∈ (-∞,∞); x0 ∈ (-∞,∞); γ ∈ (0,∞)<br />
Minim; Maxim -∞; ∞<br />
1<br />
Funcţia <strong>de</strong> probabilitate<br />
259<br />
⎛<br />
⎜ ⎛ x − x<br />
γπ 1+<br />
⎜<br />
⎜<br />
⎝ ⎝ γ<br />
0<br />
2<br />
⎞<br />
⎟<br />
⎠<br />
⎞<br />
⎟<br />
⎟<br />
⎠
Funcţia <strong>de</strong> repartiţie<br />
1 ⎛ x − x 0 ⎞<br />
arctan⎜<br />
⎟ +<br />
π ⎝ γ ⎠<br />
Mediana şi moda x0<br />
Tabelul 7. Mărimi statistice ale distribuţiei continue Stu<strong>de</strong>nt t<br />
Mărime statistică Expresie <strong>de</strong> calcul<br />
Suport x ∈ (-∞,∞); ν ∈ (0,∞)<br />
Minim; Maxim -∞; ∞<br />
Funcţia <strong>de</strong> probabilitate<br />
⎛ ν + 1⎞<br />
Γ⎜<br />
⎟ 2<br />
⎝ 2 ⎠ ⎛ t ⎞<br />
⎜<br />
⎜1+<br />
⎟<br />
⎛ ν ⎞ ⎝ ν<br />
νπΓ⎜<br />
⎟<br />
⎠<br />
⎝ 2 ⎠<br />
⎛ ν+<br />
1 ⎞<br />
−⎜<br />
⎟<br />
⎝ 2 ⎠<br />
2 ( − x / ν)<br />
1<br />
2<br />
, Γ(<br />
z)<br />
=<br />
n<br />
∞<br />
∫<br />
0<br />
t<br />
e<br />
z−1<br />
−t<br />
Funcţia <strong>de</strong> repartiţie<br />
n<br />
+ 1⎞<br />
⎟⋅∑<br />
∏ 2 ⎠ n≥0<br />
n!<br />
i<br />
−<br />
Media; mediana; moda; varianţa<br />
1<br />
1 ⎛ ν<br />
( 1+<br />
2i)(<br />
ν + 1+<br />
2i)<br />
+ xΓ⎜<br />
2 ⎝<br />
= 0 2(<br />
3 + 2i)<br />
0 (ν > 1); 0; 0; ν ( ν − 2)<br />
, ν > 2<br />
Asimetria; excesul <strong>de</strong> boltire 0, ν > 3; 6 ( ν − 4)<br />
, ν > 4<br />
Tabelul 8. Mărimi statistice ale distribuţiei continue Fisher-Sne<strong>de</strong>cor F<br />
Mărime statistică Expresie <strong>de</strong> calcul<br />
Suport x ∈ [0,∞); d1,d2 ∈ (0,∞)<br />
Minim; Maxim 0; ∞<br />
Funcţia <strong>de</strong> probabilitate<br />
d 2 d<br />
( ( d1<br />
+ d2<br />
) 2)<br />
( d1)<br />
( d2<br />
)<br />
( d 2)<br />
Γ(<br />
d 2)<br />
( d x + d )<br />
Γ<br />
Γ<br />
1<br />
2<br />
1 2 2 d1<br />
2−1<br />
x<br />
1<br />
2<br />
( ) 2 d d +<br />
1<br />
2<br />
, Γ ( z)<br />
=<br />
Funcţia <strong>de</strong> repartiţie<br />
⎛ d<br />
⎞<br />
1x<br />
d1<br />
d2<br />
IB ⎜ , , ⎟<br />
⎝ d1x<br />
+ d2<br />
2 2 ⎠<br />
⎛ d1<br />
d2<br />
⎞<br />
IB⎜1,<br />
, ⎟ , IB(<br />
z,<br />
a,<br />
b)<br />
=<br />
⎝ 2 2 ⎠<br />
Media; moda<br />
d 2 d1<br />
− 2 d2<br />
, d2 > 2; , d1 > 2<br />
d − 2 d d + 2<br />
Varianţa; asimetria<br />
Excesul <strong>de</strong> boltire<br />
2<br />
1<br />
2<br />
2<br />
1<br />
2<br />
∞<br />
∫<br />
0<br />
t<br />
e<br />
z−1<br />
−t<br />
z<br />
∫<br />
0<br />
t<br />
dt<br />
a−1<br />
dt<br />
( 1−<br />
t)<br />
2<br />
2d2<br />
( d1<br />
+ d2<br />
− 2)<br />
( 2d1<br />
+ d2<br />
− 2)<br />
8(<br />
d2<br />
− 4)<br />
, d2 > 4;<br />
, d2 > 6<br />
2<br />
d ( d − 2)<br />
( d − 4)<br />
( d2<br />
− 6)<br />
d ( d + d − 2)<br />
3d<br />
3<br />
2<br />
+ ( 5d1<br />
−8)<br />
d2<br />
+ ( 5d1<br />
− 32 d1<br />
+ 20)<br />
d 2 − 22d1<br />
d ( d − 6)(<br />
d − 8)(<br />
d + d − 2)<br />
/ 12<br />
Tabelul 9. Mărimi statistice ale distribuţiei continue χ 2<br />
Mărime statistică Expresie <strong>de</strong> calcul<br />
Suport x ∈ [0,∞); d ∈ (0,∞)<br />
Minim; Maxim 0; ∞<br />
Funcţia <strong>de</strong> probabilitate<br />
1<br />
2<br />
2<br />
2<br />
2<br />
d 2 d 2−1<br />
−x<br />
2<br />
( 1 2)<br />
x e Γ(<br />
d 2)<br />
x 2<br />
∫ t<br />
0<br />
d 2−1<br />
−t<br />
Funcţia <strong>de</strong> repartiţie e dt Γ(<br />
d 2)<br />
1<br />
2<br />
1<br />
1<br />
2<br />
2<br />
, Γ ( z)<br />
=<br />
b−1 dt<br />
+ 44d1<br />
−16<br />
, d2 > 8<br />
∞<br />
∫<br />
0<br />
t<br />
e<br />
z−1<br />
−t<br />
Media; mediana; moda; varianţa d; ≅ d − 2 3 ; d - 2, d > 2; 2d<br />
asimetria; excesul <strong>de</strong> boltire 8 d ; 12 d<br />
Tabelul 10. Mărimi statistice ale distribuţiei continue exponenţiale<br />
Mărime statistică Expresie <strong>de</strong> calcul<br />
Suport x ∈ [0,∞); λ ∈ (0,∞)<br />
260<br />
dt
Minim; Maxim 0; ∞<br />
Funcţia <strong>de</strong> probabilitate<br />
x<br />
e λ −<br />
λ<br />
Funcţia <strong>de</strong> repartiţie<br />
−λx<br />
1−<br />
e<br />
Media; mediana; moda; varianţa; asimetria; excesul <strong>de</strong> boltire<br />
2<br />
1 λ ; ln( 2)<br />
λ ; 0; 1 λ ; 2; 6<br />
Tabelul 11. Mărimi statistice ale distribuţiei continue Weibull<br />
Mărime statistică Expresie <strong>de</strong> calcul<br />
Suport x ∈ [0,∞); λ, k ∈ (0,∞)<br />
Minim; Maxim 0; ∞<br />
Funcţia <strong>de</strong> probabilitate; −(xλ)<br />
1−<br />
e<br />
k<br />
funcţia <strong>de</strong> repartiţie<br />
k<br />
k−1<br />
−(<br />
x λ)<br />
kx e<br />
k<br />
λ ;<br />
μ = λΓ<br />
1+ 1<br />
1 k<br />
1 k<br />
; λ ln( 2)<br />
; λ ( k −1)<br />
k , k > 1<br />
Media; mediana; moda ( k ) ( ) ( )<br />
Varianţa; asimetria<br />
Excesul <strong>de</strong> boltire<br />
2 2<br />
2<br />
3<br />
σ = λ Γ(<br />
1+ 2 k)<br />
− μ ; γ 1 = Γ(<br />
+ 3 k)<br />
λ<br />
4<br />
3 2 2 4<br />
γ = λ Γ(<br />
+ 4 k)<br />
− 4γ<br />
σ μ − 6μ<br />
σ − μ<br />
2<br />
2 3<br />
( − 3μσ<br />
− μ )<br />
4<br />
( 1 ) σ<br />
1<br />
1 σ<br />
Tabelul 12. Mărimi statistice ale distribuţiei continue Log-normale<br />
Mărime statistică Expresie <strong>de</strong> calcul<br />
Suport x ∈ [0,∞); μ ∈ (-∞,∞); σ ∈ (0,∞)<br />
Minim; Maxim 0; ∞<br />
2 ( ln( x)<br />
−μ)<br />
−<br />
Funcţia <strong>de</strong> probabilitate 2<br />
2σ<br />
e ( xσ<br />
2π)<br />
Funcţia <strong>de</strong> repartiţie<br />
Media; mediana; moda; varianţa<br />
( ln( x)<br />
− μ (<br />
) )) = ∫ π<br />
−<br />
z<br />
1+ erf<br />
σ 2<br />
2<br />
t<br />
; erf ( z)<br />
2 e dt<br />
2<br />
2<br />
μ+ σ 2 μ μ−σ<br />
σ<br />
e ; e ; e ; ( e −<br />
2<br />
2<br />
Asimetria; excesul <strong>de</strong> boltire σ<br />
σ<br />
( e + 2)<br />
e −1<br />
; e<br />
2<br />
2<br />
2<br />
4σ<br />
1)<br />
e<br />
+ 2e<br />
2<br />
2μ+<br />
σ<br />
2<br />
3σ<br />
+ 3e<br />
Tabelul 13. Mărimi statistice ale distribuţiei continue Birnbaum-Saun<strong>de</strong>rs (a vieţii obosite)<br />
Mărime statistică Expresie <strong>de</strong> calcul<br />
Suport μ, β, γ ∈ (0,∞); x ∈ (μ,∞)<br />
Minim; Maxim μ; ∞<br />
Funcţia <strong>de</strong> probabilitate<br />
x − μ β<br />
+<br />
β x − μ<br />
N<br />
2γ(<br />
x − μ)<br />
0,<br />
1<br />
⎛⎛<br />
⎜⎜<br />
⎜⎜<br />
⎝⎝<br />
x<br />
− μ<br />
β<br />
x + 1/<br />
x<br />
Funcţia <strong>de</strong> probabilitate standard N , 1 ( x − 1/<br />
x ) γ)<br />
2γ(<br />
x − μ)<br />
Funcţia <strong>de</strong> repartiţie standard<br />
( x − 1/<br />
x ) γ)<br />
N0 , 1<br />
2<br />
2<br />
Media; varianţa (standard) 1 + γ 2;<br />
γ 1+<br />
5γ<br />
4<br />
−<br />
2<br />
2σ<br />
0<br />
− 6<br />
β ⎞<br />
⎟<br />
x − μ ⎟<br />
⎠<br />
N<br />
( z)<br />
=<br />
⎞<br />
γ⎟<br />
⎟<br />
⎠<br />
0 , 0,<br />
1 ∫<br />
−∞<br />
Tabelul 14. Mărimi statistice ale distribuţiei continue Gamma<br />
Mărime statistică Expresie <strong>de</strong> calcul<br />
Suport k, θ ∈ (0,∞); x ∈ [0,∞)<br />
Minim; Maxim 0; ∞<br />
Funcţia <strong>de</strong> probabilitate<br />
Funcţia <strong>de</strong> repartiţie<br />
x<br />
∫<br />
k 1 x k<br />
e θ − θ − −<br />
x θ<br />
k−1<br />
−t<br />
0<br />
t<br />
e<br />
dt<br />
Γ(<br />
k)<br />
, Γ(<br />
z)<br />
=<br />
∞<br />
∫<br />
0<br />
t<br />
e<br />
k−1<br />
−t<br />
261<br />
dt<br />
∞<br />
∫<br />
0<br />
t<br />
e<br />
z−1<br />
−t<br />
dt<br />
3<br />
z 2<br />
−t<br />
/ 2<br />
e<br />
dt<br />
2π
Media; moda; varianţa kθ; (k-1)θ, k > 1; kθ 2<br />
Asimetria; excesul <strong>de</strong> boltire 2 k ; 6 k<br />
Tabelul 15. Mărimi statistice ale distribuţiei continue Laplace (dublu exponenţială)<br />
Mărime statistică Expresie <strong>de</strong> calcul<br />
Suport b ∈ (0,∞); μ, x ∈ (-∞,∞)<br />
Minim; Maxim -∞; ∞<br />
Funcţia <strong>de</strong> probabilitate<br />
−|<br />
x−μ|<br />
b<br />
e 2b<br />
Funcţia <strong>de</strong> repartiţie<br />
( x−μ<br />
) b<br />
e 2 , x < μ<br />
−(<br />
x−μ<br />
) b<br />
1−<br />
e 2 , μ ≤ x<br />
μ; μ; μ; 2b 2<br />
Media; mediana; moda; varianţa<br />
Asimetria; excesul <strong>de</strong> boltire 0; 3<br />
Tabelul 16. Mărimi statistice ale distribuţiei continue Gumbel (log-Weibull)<br />
Mărime statistică Expresie <strong>de</strong> calcul<br />
Suport β ∈ (0,∞); μ, x ∈ (-∞,∞)<br />
Minim; Maxim -∞; ∞<br />
exp − exp − ( x − μ)<br />
β β exp − ( x − μ)<br />
β<br />
Funcţia <strong>de</strong> probabilitate ( ( ) ) ( ) β<br />
Funcţia <strong>de</strong> repartiţie exp( − exp(<br />
− ( x − μ)<br />
β))<br />
Media; mediana; moda; varianţa<br />
μ+βγ; μ-β·ln(ln(2)); μ; π 2 β 2 /6<br />
Asimetria; excesul <strong>de</strong> boltire<br />
12 6ς(<br />
3)<br />
≅ 1.<br />
14 ; 12/5<br />
3<br />
π<br />
Tabelul 17. Mărimi statistice ale distribuţiei continue Beta<br />
Mărime statistică Expresie <strong>de</strong> calcul<br />
Suport α, β ∈ (0,∞); x ∈ [0,1]<br />
Minim; Maxim 0; 1<br />
α−1<br />
β−1<br />
Funcţia <strong>de</strong> probabilitate x ( 1−<br />
x)<br />
IB(<br />
1,<br />
α,<br />
β)<br />
;<br />
IB(<br />
z,<br />
a,<br />
b)<br />
=<br />
z<br />
∫<br />
0<br />
t<br />
a−1<br />
( 1−<br />
t)<br />
Funcţia <strong>de</strong> repartiţie IB( x,<br />
α, β) IB(<br />
1,<br />
α, β)<br />
Media; moda; varianţa<br />
α α −1 αβ<br />
; , α, β > 1;<br />
2<br />
α + β α + β − 2 ( α + β)<br />
( α + β + 1)<br />
Asimetria; excesul <strong>de</strong> boltire<br />
2(<br />
β − α)<br />
α + β + 1 α<br />
;<br />
( α + β + 2)<br />
αβ<br />
3<br />
b−1<br />
dt<br />
2<br />
− ( 2β<br />
−1)<br />
α − 2αβ(<br />
β + 2)<br />
+ ( β + 1)<br />
β<br />
αβ(<br />
α + β + 2)(<br />
α + β + 3)<br />
/ 6<br />
Tabelul 18. Mărimi statistice ale distribuţiei continue Gauss (normale)<br />
Mărime statistică Expresie <strong>de</strong> calcul<br />
Suport σ ∈ (0,∞); μ, x ∈ (-∞,∞)<br />
Minim; Maxim -∞; ∞<br />
2<br />
exp − ( x − μ)<br />
σ 2 σ 2π<br />
( ) ( )<br />
( 1 erf ( x − μ)<br />
( σ 2 ) 2 ; erf<br />
Funcţia <strong>de</strong> probabilitate ( )<br />
Funcţia <strong>de</strong> repartiţie<br />
μ; μ; μ; σ 2<br />
Media; moda; varianţa<br />
Asimetria; excesul <strong>de</strong> boltire 0; 0<br />
+ = ∫ π<br />
−t<br />
( z)<br />
2 e dt<br />
Tabelul 19. Alte mărimi statistice ale distribuţiei continue Gauss (normale)<br />
Mărime Populaţie (finită) <strong>de</strong> volum nX Eşantion <strong>de</strong> volum nY Estimator<br />
m; s 2 Media<br />
2<br />
μ = m; σ<br />
/(nY-1)<br />
μ = μ; X<br />
2<br />
σ = σ X<br />
2 /nX = s 2 /nY<br />
Y<br />
Y<br />
262<br />
z<br />
0<br />
2<br />
2
Varianţa<br />
Var γ1<br />
(nX-1)σ 2 /nX<br />
2<br />
2<br />
( n X −1)<br />
( n X −1)<br />
μ2<br />
−<br />
3 −1<br />
3<br />
n μ n ( n − 3)<br />
( n<br />
X<br />
X<br />
4<br />
X<br />
X<br />
6n<br />
X ( n X −1)<br />
− 2)(<br />
n + 1)(<br />
n<br />
X<br />
X<br />
−1<br />
+ 3)<br />
(nY-1)s 2 /nY<br />
2<br />
( n Y −1)<br />
( n Y −1)<br />
m2<br />
−<br />
3 −1<br />
3<br />
n m n ( n − 3)<br />
( n<br />
Y<br />
Y<br />
4<br />
Y<br />
Y<br />
6n<br />
Y ( n Y 1)<br />
− 2)(<br />
n + 1)(<br />
n<br />
Y<br />
Y<br />
2<br />
−1<br />
+ 3)<br />
s 2<br />
( n Y −1)<br />
m4<br />
( n Y − 3)<br />
m2<br />
− 2<br />
n n Y ( n Y −1)<br />
Y<br />
4<br />
4<br />
2σ<br />
( n Y −1)<br />
2s<br />
=<br />
≅<br />
n −1<br />
n 2<br />
Y<br />
− c4 2 ·var(g1)<br />
Y<br />
c4 - Vezi Tabelul 29<br />
2<br />
−1<br />
2<br />
−1<br />
24n<br />
X ( n X −1)<br />
( n X − 3)<br />
24n<br />
Y ( n Y −1)<br />
( n Y − 3)<br />
c4<br />
Var γ2<br />
( n X − 2)(<br />
n X + 3)(<br />
n X + 5)<br />
( n Y − 2)(<br />
n Y + 3)(<br />
n Y + 5)<br />
2 ·var(g2)<br />
c4 - Vezi Tabelul 29<br />
Pentru ca rezultatele observaţiei să capete consistenţă în ceea ce priveşte interpretarea statistică, mai<br />
este necesar ca să se asume ipoteza <strong>de</strong> convergenţă la normalitate asupra valorilor observate în<br />
eşantionul seriei <strong>de</strong> compuşi, spaţiul complet al acestora fiind în acest caz un exemplu tipic <strong>de</strong><br />
populaţie finită distribuită normal.<br />
Măsura apropierii unui şir <strong>de</strong> date <strong>de</strong> legea <strong>de</strong> distribuţie normală poate fi evaluată statistic folosind<br />
testul <strong>de</strong> normalitate Z. Practic testul Z se poate aplica pe orice statistică S a eşantionului pentru a<br />
verifica dacă se poate accepta (sau respinge) ipoteza (cu un anumit nivel <strong>de</strong> semnificaţie) că<br />
estimatorul acesteia aparţine unei populaţii distribuite normal.<br />
Tabelul 20 redă utilizarea testului Z pentru verificarea ipotezei <strong>de</strong> normalitate a populaţiei din care<br />
provine eşantionul. Testul Z măsoară care este diferenţa (în termeni <strong>de</strong> probabilitate statistică) între<br />
o statistică S (a eşantionului) şi parametrul statistic Σ (al populaţiei).<br />
Tabelul 20. Testul Z pentru verificarea ipotezei <strong>de</strong> normalitate<br />
Test Z Formule <strong>de</strong> calcul<br />
Z-statistică (S) S − Σ n X S − Σ n Y<br />
z =<br />
=<br />
σ(<br />
Σ)<br />
n −1<br />
σ(<br />
S)<br />
n −1<br />
Z-medie<br />
Z-varianţă<br />
Z-dispersie<br />
Z-asimetrie<br />
Z-exces-boltire<br />
z =<br />
z =<br />
z<br />
m − μ<br />
σ(<br />
m)<br />
( n<br />
( n<br />
Y<br />
−<br />
n<br />
E(<br />
s)<br />
− σ<br />
n<br />
X<br />
Y<br />
2<br />
n Y m − μ n Y m − μ<br />
=<br />
≅ n Y<br />
Y −1<br />
s n Y −1<br />
s<br />
−1)<br />
s<br />
/ n<br />
− σ<br />
n<br />
−1)<br />
s<br />
2<br />
2<br />
2 2<br />
Y<br />
2<br />
1)<br />
m4<br />
3<br />
Y<br />
Y<br />
2<br />
( n Y − 3)<br />
m2<br />
− 3<br />
n Y /( n Y −1)<br />
Y =<br />
n Y −1<br />
Y<br />
Y n<br />
2<br />
Y<br />
3<br />
( n Y −1)<br />
m4<br />
− ( n Y − 3)<br />
m2<br />
c s − σ<br />
c<br />
s<br />
−1<br />
4<br />
4<br />
= = = σ , c<br />
( s)<br />
2<br />
2<br />
4<br />
σ σ 1−<br />
c4<br />
1−<br />
c4<br />
E(<br />
g1)<br />
− γ<br />
z =<br />
σ(<br />
g )<br />
1<br />
E(<br />
g2<br />
) − γ<br />
z =<br />
σ(<br />
g )<br />
2<br />
1<br />
2<br />
= g<br />
=<br />
1<br />
( n<br />
+ 1)(<br />
n Y + 3)<br />
6(<br />
n − 2)<br />
Y<br />
Y<br />
( ( n + 1)<br />
g − 3(<br />
n −1)<br />
)<br />
Y<br />
2<br />
Y<br />
( n<br />
( ( n −1)<br />
2)<br />
− σ<br />
2<br />
Γ(<br />
n 2)<br />
=<br />
n −1<br />
(Cohran)<br />
Γ<br />
( n Y + 3)(<br />
n Y + 5)<br />
24n<br />
( n − 2)(<br />
n − 3)<br />
În aceste ipoteze, <strong>de</strong> înrudire a compuşilor atât sub aspect structural cât şi sub aspect al<br />
proprietăţii/activităţii măsurate, şi <strong>de</strong> distribuire normală a valorilor observate, se pot formula şi<br />
verifica (cu ajutorul testelor statistice) ipoteze <strong>de</strong> inferenţă (<strong>de</strong>pen<strong>de</strong>nţă) între structură şi<br />
activitatea/proprietatea măsurată.<br />
Relaţiile structură-activitate (SAR) şi respectiv relaţiile structură-proprietate (SPR) stabilesc<br />
legături funcţionale între structura compuşilor chimici şi proprietăţile măsurate <strong>de</strong> natură biologică<br />
(SAR) şi fizico-chimică (SPR) ale acestora.<br />
Relaţiile cantitative (q) care se stabilesc între structură şi activitate (qSAR) sau respectiv proprietate<br />
263<br />
Y<br />
Y<br />
Y<br />
n<br />
2
(qSPR) se exprimă prin intermediul unor ecuaţii care au un domeniu <strong>de</strong> aplicabilitate <strong>de</strong>finit cel mai<br />
frecvent <strong>de</strong> seria <strong>de</strong> compuşi pe care au fost obţinute şi <strong>de</strong> proprietatea sau activitatea supusă<br />
observaţiei.<br />
Unul din avantajele majore pe care le conferă obţinerea unei relaţii cantitative structurăactivitate/proprietate<br />
(qSPAR) este posibilitatea efectuării <strong>de</strong> predicţii cu privire la<br />
proprietatea/activitatea unor compuşi congeneri cu cei din seria pe care s-a obţinut relaţia qSPAR.<br />
De cele mai multe ori, o relaţie qSPAR are asociată, pe lângă domeniul <strong>de</strong> aplicabilitate şi o<br />
semnificaţie statistică. Cu cât semnificaţia statistică a unei relaţii qSPAR este mai mare, cu atât<br />
predicţia activităţii/proprietăţii pentru compuşi congeneri cu cei ai seriei pe care s-a obţinut relaţia<br />
qSPAR are şanse <strong>de</strong> reuşită mai mari.<br />
Aşa cum un singur atom sau o singură regiune a moleculei nu este singura responsabilă pentru<br />
manifestarea unei proprietăţi moleculare, nici relaţiile qSPAR nu se exprimă cu ajutorul unui singur<br />
<strong>de</strong>scriptor <strong>de</strong> structură. În mod frecvent în expresia unei ecuaţii qSPAR intră 2 sau mai mulţi<br />
<strong>de</strong>scriptori <strong>de</strong> structură. Este important însă <strong>de</strong> ştiut că odată cu creşterea numărului <strong>de</strong> <strong>de</strong>scriptori<br />
într-o ecuaţie qSPAR sca<strong>de</strong> şi semnificaţia statistică a parametrilor acesteia. Astfel, pe lângă<br />
căutarea celei mai potrivite ecuaţii sub aspectul maximizării <strong>de</strong>terminării statistice a<br />
proprietăţii/activităţii măsurate, mai apare şi problema minimizării numărului <strong>de</strong> variabile ce intră<br />
în această ecuaţie.<br />
Ecuaţia qSPAR este o ecuaţie <strong>de</strong> regresie multiplă între <strong>de</strong>scriptorii <strong>de</strong> structură asupra cărora se<br />
face ipoteza că nu sunt afectaţi <strong>de</strong> erori întâmplătoare (atâta vreme cât structura compusului<br />
respectiv este <strong>de</strong> asemenea o certitudine) şi proprietatea/activitatea măsurată (care este variabila<br />
<strong>de</strong>pen<strong>de</strong>ntă şi în acelaşi timp supusă erorii experimentale întâmplătoare).<br />
Ecuaţiile <strong>de</strong> regresie liniară (multiplă) au avantajul <strong>de</strong>scompunerii (liniare) a varianţei<br />
experimentale observate în varianţe aditive pentru (asociate) fiecare variabilă in<strong>de</strong>pen<strong>de</strong>ntă a<br />
ecuaţiei. Existenţa a două sau mai multe variabile in<strong>de</strong>pen<strong>de</strong>nte nu presupune absenţa corelaţiei<br />
liniare între acestea, corelaţia putând fi pusă pe seama întâmplării, sau, mai exact, pe seama<br />
măsurării (sau exprimării unei măsuri) a două sau mai multe mărimi parţial corelate.<br />
Dacă variabilele ce <strong>de</strong>scriu structura nu sunt corelate liniar cu proprietatea măsurată se preferă<br />
linearizarea acestora şi exprimarea unei ecuaţii <strong>de</strong> regresie liniare cu aceste variabile ce <strong>de</strong>scriu<br />
structura transformate (linearizate) corespunzător.<br />
O ecuaţie <strong>de</strong> regresie multiplă <strong>de</strong>scriind o relaţie qSPAR este semnificativă statistic dacă toţi<br />
parametrii (coeficienţii) acesteia sunt semnificativ statistic diferiţi <strong>de</strong> zero (în caz contrar expresia<br />
ecuaţiei se reduce corespunzător prin eliminarea variabilelor ale căror coeficienţi nu sunt<br />
semnificativ diferiţi <strong>de</strong> zero) şi coeficientul <strong>de</strong> corelaţie este <strong>de</strong> asemenea semnificativ diferit <strong>de</strong><br />
zero (în caz contrar respingându-se întreaga ecuaţie <strong>de</strong> regresie). Aprecierea semnificaţiei<br />
parametrilor ecuaţiei <strong>de</strong> regresie se face prin raportarea valorii parametrului la varianţa acestuia,<br />
folosind pentru interpretare testul Stu<strong>de</strong>nt t.<br />
O ecuaţie <strong>de</strong> regresie liniară multiplă qSPAR implicând o familie <strong>de</strong> <strong>de</strong>scriptori <strong>de</strong> structură este o<br />
ecuaţie <strong>de</strong> forma:<br />
b0 + b1X1 + ... +bnXn = Ŷ ~ Y (1)<br />
un<strong>de</strong> Y reprezintă şirul măsurătorilor proprietăţii/activităţii la `m` molecule (|Y|=m) iar {X1, ..., Xn}<br />
reprezintă o submulţime a familiei <strong>de</strong> <strong>de</strong>scriptori {Xi}1≤i≤N.<br />
Pentru ca ecuaţia (1) să admită soluţie unică este necesar (nu însă şi suficient) ca n ≤ m-1. Pentru ca<br />
parametrii ecuaţiei <strong>de</strong> regresie (bi)0≤i≤n să aibă şi semnificaţie statistică este necesar (nu însă şi<br />
suficient) ca n ≤ m-6.<br />
În absenţa semnificaţiei statistice pentru coeficientul b0, ecuaţia (1) se poate restrânge la:<br />
b1X1 + ... +bnXn = Ŷ ~ Y (2)<br />
Se asumă ipoteza <strong>de</strong> distribuţie normală a valorilor Y şi X1, ..., Xn şi ipoteza că şirul Y este rezultat<br />
dintr-o măsurătoare experimentală a cărei eroare <strong>de</strong> măsură este întâmplătoare şi distribuită normal<br />
în timp ce şirurile X sunt X1, ..., Xn sunt valori cunoscute care sunt <strong>de</strong> asemenea normal distribuite<br />
dar nu sunt afectate <strong>de</strong> erori. În aceste ipoteze problema <strong>de</strong>terminării coeficienţilor (bi) ale ecuaţiei<br />
(1) sau (2) se rezolvă prin minimizarea sumei erorilor observat vs. cunoscut:<br />
264
Σ1≤i≤m(Ŷi-Yi) 2 → min. (3)<br />
Rezolvarea ecuaţiei (3) presupune rezolvarea unui sistem <strong>de</strong> ecuaţii liniar şi omogen ale cărei<br />
necunoscute sunt coeficienţii (bi).<br />
În ipoteza că sistemul (3) admite o soluţie unică pentru ecuaţia (1) sau (2), ipotezele asumate permit<br />
şi obţinerea semnificaţiilor statistice ale parametrilor (bi) folosind distribuţia Stu<strong>de</strong>nt t:<br />
ti=t(bi), 0 ≤ i ≤ n pentru (1) şi 1 ≤ i ≤ n pentru (2) (4)<br />
Coeficientul <strong>de</strong> corelaţie oferă o măsură a legăturii liniare între două variabile (Y şi Ŷ) şi se<br />
calculează pe baza formulei (un<strong>de</strong> E este estimatorul valoare medie <strong>de</strong>finit în Tabelul 6):<br />
r(Y,Ŷ) =<br />
Y) ˆ<br />
Y) s(<br />
Y)<br />
s(<br />
ˆ cov( Y,<br />
=<br />
⋅<br />
E(<br />
Y<br />
Yˆ E(<br />
Y<br />
2<br />
) − E<br />
) − E(<br />
Y)<br />
⋅ E<br />
2<br />
( Y)<br />
Yˆ E(<br />
Yˆ (<br />
2<br />
)<br />
Y) ˆ 2<br />
) − E (<br />
Testul χ 2 (Pearson) este folosit în testarea agrementului între observaţie şi ipoteză, testarea<br />
in<strong>de</strong>pen<strong>de</strong>nţei şi a omogenităţii.<br />
Testarea agrementului între observaţie şi ipoteză se realizează prin divizarea observaţiilor într-un<br />
număr <strong>de</strong>finit <strong>de</strong> intervale (`n`), pentru care se calculează expresia X 2 (un<strong>de</strong> `s` este numărul <strong>de</strong><br />
parametrii ai distribuţiei teoretice):<br />
n<br />
2<br />
2 ( Oi<br />
− Ei<br />
) 2<br />
X = ∑ ≈ χ ( n − s −1)<br />
(6)<br />
i= 1 Ei<br />
din care pe baza distribuţiei teoretice χ 2 (Tabelul 18) se calculează probabilitatea <strong>de</strong> respingere a<br />
ipotezei <strong>de</strong> agrement. Uzual ipoteza <strong>de</strong> agrement este acceptată dacă probabilitatea <strong>de</strong> respingere a<br />
ipotezei <strong>de</strong> agrement este mai mică <strong>de</strong> 5%.<br />
Testarea in<strong>de</strong>pen<strong>de</strong>nţei / omogenităţii între valorile unui tabel cu `r` linii şi `c` coloane se face<br />
calculând expresia:<br />
E<br />
i,<br />
j<br />
r<br />
∑<br />
O<br />
∑∑<br />
i=<br />
1 j=<br />
1<br />
c<br />
∑<br />
i,<br />
k<br />
= k=<br />
1<br />
r<br />
k=<br />
1<br />
c<br />
O<br />
O<br />
i,<br />
j<br />
k,<br />
j<br />
(5)<br />
r c<br />
2<br />
( Oi,<br />
j − E )<br />
2<br />
i,<br />
j 2<br />
; X = ∑∑<br />
≈ χ (( r −1)(<br />
c −1))<br />
(7)<br />
E<br />
i=<br />
1 j= 1 i,<br />
j<br />
Testarea individuală a omogenităţii valorilor dintr-o clasă (linie sau coloană în tabel) şi în acelaşi<br />
timp crearea unei ierarhii a iregularităţilor se obţine <strong>de</strong>scompunând expresia lui X 2 în:<br />
r<br />
2<br />
c<br />
2<br />
2 ( Oi,<br />
c − Ei,<br />
c)<br />
( O<br />
2<br />
r,<br />
j − E )<br />
2<br />
r,<br />
j 2<br />
X c = ∑ ≈ χ ( r −1)<br />
; X r<br />
≈ χ ( c −1)<br />
(8)<br />
E<br />
E<br />
i= 1 i,<br />
c<br />
= ∑<br />
j= 1 r,<br />
j<br />
Descompunerea varianţelor în ipoteza omogenităţii permite estimarea erorii experimentale [ ].<br />
Pentru tabelul cu `r` linii şi `c` coloane ecuaţia <strong>de</strong> <strong>de</strong>scompunere a varianţelor porneşte <strong>de</strong> la ipoteza<br />
că efectul încrucişat al parametrilor <strong>de</strong>signului experimental se exprimă sub formă <strong>de</strong> produs în<br />
mărimea observată (altfel spus: dacă pentru creşterea unei plante e nevoie atât <strong>de</strong> apă cât şi <strong>de</strong> soare,<br />
atunci efectul în creştere este exprimat proporţional <strong>de</strong> ambii factori):<br />
r c<br />
2<br />
⎛ ∂S<br />
⎞ ⎛ S ⎞<br />
min.<br />
0 ; ⎜<br />
∂<br />
S = ∑∑ ( O<br />
= 0⎟<br />
⎜<br />
a ⎟<br />
i , j − a ib<br />
j)<br />
= ⇒ =<br />
(9)<br />
⎜ b ⎟<br />
i=<br />
1 j=<br />
1<br />
⎝ ∂ i ⎠ ≤ ≤ ⎝ ∂<br />
1 i r<br />
j ⎠1≤<br />
j≤c<br />
Ecuaţia (12) admite acele soluţii care verifică ecuaţiile:<br />
c<br />
∑<br />
j=<br />
1<br />
a i = c<br />
∑<br />
j=<br />
1<br />
b x<br />
j<br />
b<br />
i,<br />
j<br />
2<br />
j<br />
, i<br />
= 1..<br />
r ;<br />
r<br />
∑<br />
a ix<br />
i,<br />
j<br />
i=<br />
1 b j = r<br />
2<br />
a<br />
, j = 1..<br />
c<br />
(10)<br />
∑<br />
i=<br />
1<br />
i<br />
Matematic se poate <strong>de</strong>monstra că ecuaţiile (10) admit o infinitate <strong>de</strong> soluţii. Astfel, pentru r=2 şi<br />
c=3 coeficienţii (ai)1≤i≤2 sunt parametrizaţi <strong>de</strong> relaţia:<br />
[ 68 ] Ronald A FISHER. 1923. Studies in Crop Variation. II. The Manurial Response of Different Potato Varieties.<br />
Journal of Agricultural Science 13:311-320.<br />
265<br />
68
2<br />
2<br />
2<br />
2<br />
2<br />
⎛ a ⎞ 2 ⎜<br />
⎟<br />
a ⎟<br />
⎝ 1 ⎠<br />
( x1,<br />
1<br />
+<br />
+ x1,<br />
2 + x1,<br />
3 ) − ( x 2,<br />
1 + x 2,<br />
2 + x 2,<br />
3 ) ⎛ a ⎞ 2 ⎜ ⎟ −1<br />
= 0<br />
( x1,<br />
1x<br />
2,<br />
1 + x1,<br />
2x<br />
2,<br />
2 + x1,<br />
3x<br />
2,<br />
3)<br />
⎜ a ⎟<br />
⎝ 1 ⎠<br />
(11)<br />
Întrucât rezolvarea sistemului (10) pentru cazul general este dificilă, o soluţie mai simplă este<br />
obţinerea soluţiei prin aproximaţii succesive. Din nou, se poate <strong>de</strong>monstra matematic că soluţia<br />
optimă a sistemului (10) se află în vecinătatea valorilor date <strong>de</strong> ecuaţia:<br />
r<br />
c ⎛ ⎞⎛<br />
⎞<br />
ai⋅bj=<br />
⎜∑<br />
Oi,<br />
k ⎟⎜∑<br />
O k,<br />
j ⎟<br />
⎝ k=<br />
1 ⎠⎝<br />
k=<br />
1 ⎠<br />
Într-un mod similar, se poate arăta că:<br />
r c<br />
∑∑Oi,<br />
j<br />
i=<br />
1 j=<br />
1<br />
(12)<br />
c<br />
2<br />
x<br />
r<br />
2<br />
i,<br />
j<br />
xi,<br />
j<br />
r c 2 ∑ ( Oi,<br />
j − a ib<br />
j)<br />
2 j= 1 b ∑<br />
j 2 i= 1 a i<br />
X = ∑∑ = min.<br />
→ a i = ; b = c<br />
j r<br />
i= 1 j= 1 a ib<br />
j<br />
b<br />
a<br />
(13)<br />
a cărei soluţie optimă exactă se află din nou în vecinătatea valorilor date <strong>de</strong> ecuaţiile (12).<br />
Astfel, folosind datele din [68] redate în Tabelul 21, valorile sugerate <strong>de</strong> ecuaţiile (12) pentru<br />
produsele (aibj)1≤i≤6;1≤j≤12 sunt redate în Tabelul 22 iar valorile ce rezultă după rezolvarea exactă a<br />
sistemului (10) sunt redate în Tabelul 23.<br />
Tabelul 21. Valori experimentale în tratamentul roşiilor<br />
TV UD KK KP TP ID GS AJ BQ ND EP AC DY Suma<br />
DS 25.3 28 23.3 20 22.9 20.8 22.3 21.9 18.3 14.7 13.8 10 241.3<br />
DC 26 27 24.4 19 20.6 24.4 16.8 20.9 20.3 15.6 11 11.8 237.8<br />
DB 26.5 23.8 14.2 20 20.1 21.8 21.7 20.6 16 14.3 11.1 13.3 223.4<br />
US 23 20.4 18.2 20.2 15.8 15.8 12.7 12.8 11.8 12.5 12.5 8.2 183.9<br />
UC 18.5 17 20.8 18.1 17.5 14.4 19.6 13.7 13 12 12.7 8.3 185.6<br />
UB 9.5 6.5 4.9 7.7 4.4 2.3 4.2 6.6 1.6 2.2 2.2 1.6 53.7<br />
Suma 128.8 122.7 105.8 105 101.3 99.5 97.3 96.5 81 71.3 63.3 53.2 1125.7<br />
Legendă:<br />
÷ T_V: Tratament vs. Varietate<br />
÷ UD, KK, KP, TP, ID, GS, AJ, BQ, ND, EP, AC, DY: varietăţi <strong>de</strong> roşii (UD: Up to Date; KK: K<br />
of K; KP: Kerr's Pink; TP: Tinwald Perfection; ID: Iron Duke; GS: Great Scott; AJ: Ajax; BQ:<br />
British Queen; ND: Nithsdale; EP: Epicure; AC: Arran Comra<strong>de</strong>; DY: Duke of York)<br />
÷ DS, DC, DB, US, UC, UB: tratamente (D* - cu fertilizant natural; U* - fără; S - sol fertilizat cu<br />
sulfat; C - sol fertilizat cu cloruri; B - sol fertilizat cu baze)<br />
Tabelul 22. Valorile produselor (aibj)1≤i≤6;1≤j≤12 calculate cu relaţia (12)<br />
TV UD KK KP TP ID GS AJ BQ ND EP AC DY<br />
DS 27.61 26.30 22.68 22.51 21.71 21.33 20.86 20.69 17.36 15.28 13.57 11.40<br />
DC 27.21 25.92 22.35 22.18 21.40 21.02 20.55 20.39 17.11 15.06 13.37 11.24<br />
DB 25.56 24.35 21.00 20.84 20.10 19.75 19.31 19.15 16.07 14.15 12.56 10.56<br />
US 21.04 20.04 17.28 17.15 16.55 16.25 15.90 15.76 13.23 11.65 10.34 8.69<br />
UC 21.24 20.23 17.44 17.31 16.70 16.41 16.04 15.91 13.35 11.76 10.44 8.77<br />
UB 6.14 5.85 5.05 5.01 4.83 4.75 4.64 4.60 3.86 3.40 3.02 2.54<br />
Tabelul 23. Valorile optimizate ale produselor (aibj)1≤i≤6;1≤j≤12 folosind relaţiile (10)<br />
TV UD KK KP TP ID GS AJ BQ ND EP AC DY<br />
DS 27.07 26.42 22.64 21.85 21.85 21.94 20.94 20.63 17.93 15.48 13.54 11.61<br />
DC 26.66 26.02 22.29 21.52 21.52 21.60 20.62 20.32 17.66 15.24 13.33 11.43<br />
DB 24.91 24.32 20.83 20.11 20.11 20.19 19.27 18.99 16.50 14.25 12.46 10.69<br />
US 20.64 20.15 17.26 16.66 16.66 16.73 15.96 15.73 13.67 11.80 10.32 8.85<br />
UC 20.58 20.09 17.21 16.61 16.61 16.68 15.92 15.69 13.63 11.77 10.29 8.83<br />
UB 6.29 6.14 5.26 5.08 5.08 5.10 4.86 4.79 4.17 3.60 3.14 2.70<br />
266<br />
2<br />
∑<br />
j=1<br />
j<br />
2<br />
∑ =1<br />
i<br />
i
Tabelul 24. Valorile optimizate ale produselor (aibj)1≤i≤6;1≤j≤12 folosind relaţiile (13)<br />
TV UD KK KP TP ID GS AJ BQ ND EP AC DY<br />
DS 27.64 26.19 22.85 22.60 21.59 21.44 20.98 20.71 17.49 15.24 13.67 11.47<br />
DC 27.35 25.91 22.61 22.36 21.36 21.22 20.76 20.50 17.30 15.08 13.52 11.35<br />
DB 25.74 24.40 21.28 21.05 20.11 19.97 19.55 19.29 16.29 14.20 12.73 10.68<br />
US 21.17 20.06 17.50 17.31 16.53 16.42 16.07 15.87 13.39 11.68 10.47 8.78<br />
UC 21.40 20.28 17.69 17.50 16.71 16.60 16.25 16.04 13.54 11.80 10.58 8.88<br />
UB 6.57 6.23 5.43 5.37 5.13 5.10 4.99 4.93 4.16 3.63 3.25 2.73<br />
Tabelul 25 centralizează rezultatele obţinute pe cele 3 căi:<br />
Tabelul 25. Valori comparative: observat vs. eq. (12), vs. eq. (10), şi vs. eq. (13)<br />
Categorie<br />
Σ(Oi,j-aibj) 2 Σ(Oi,j-aibj) 2 /(aibj)<br />
vs. eq.(12) vs. eq.(10) vs. eq.(13) vs. eq.(12) vs. eq.(10) vs. eq.(13)<br />
DS 23.376 18.784 24.098 1.098 0.939 1.127<br />
DC 59.778 48.411 59.877 3.078 2.494 3.053<br />
DB 69.796 66.811 71.482 3.784 3.599 3.795<br />
US 41.532 49.046 41.710 2.721 3.191 2.713<br />
UC 57.536 59.000 56.510 3.460 3.660 3.339<br />
UB 37.417 40.067 37.094 7.882 8.291 7.651<br />
UD 30.256 26.301 28.172 2.649 2.354 2.140<br />
KK 15.333 13.446 15.744 0.761 0.641 0.733<br />
KP 62.906 62.767 64.029 3.104 3.155 3.135<br />
TP 34.252 31.394 33.265 2.792 2.693 2.366<br />
ID 3.430 3.925 3.998 0.205 0.271 0.282<br />
GS 26.141 25.591 26.956 2.289 2.447 2.517<br />
AJ 44.954 46.997 45.320 2.555 2.712 2.601<br />
BQ 21.503 20.359 20.938 1.925 1.712 1.666<br />
ND 18.358 17.860 19.105 2.136 2.284 2.348<br />
EP 2.881 3.225 3.323 0.535 0.635 0.660<br />
AC 18.273 18.773 18.762 1.759 1.867 1.839<br />
DY 11.149 11.478 11.158 1.313 1.401 1.390<br />
TOTAL 289.435 282.117 290.771 22.022 22.172 21.676<br />
După cum se observă din Tabelul 25, fiecare dintre meto<strong>de</strong>le <strong>de</strong>finite <strong>de</strong> ecuaţiile (10) şi respectiv<br />
(13) îmbunătăţeşte valoarea sumei obiectiv în raport cu expresia <strong>de</strong>finită <strong>de</strong> formula clasică (12) şi<br />
reprezintă corecţii ale acesteia. Astfel, relaţiile (10) îmbunătăţesc relaţiile (12) în ipoteza erorii<br />
experimentale uniform distribuite între clase, în timp ce relaţiile (10) îmbunătăţesc relaţiile (12) în<br />
ipoteza erorii experimentale proporţionale cu magnitudinea fenomenului observat; mai exact<br />
relaţiile (10) minimizează eroarea experimentală absolută în timp ce relaţiile (13) minimizează<br />
eroarea experimentală relativă.<br />
Soluţiile <strong>de</strong> optimizare propuse <strong>de</strong> ecuaţiile (10) şi (13) sunt relativ dificile necesitând cel puţin<br />
iteraţii succesive folosind metoda indirectă pornind <strong>de</strong> la soluţia propusă <strong>de</strong> ecuaţiile (12). Mai<br />
mult, calculul exact din ecuaţiile (10) pentru o tabelă <strong>de</strong> contingenţă 2X2 a dus la o ecuaţie <strong>de</strong><br />
gradul II în exprimarea raportului dintre constantele mo<strong>de</strong>lului (relaţiile 11), în timp ce calcul exact<br />
din ecuaţiile (13) pentru o aceeaşi tabelă <strong>de</strong> contingenţă 2X2 duce la o ecuaţie <strong>de</strong> gradul V, care<br />
necesită ulterior şi i<strong>de</strong>ntificarea optimului global:<br />
x<br />
2<br />
1,<br />
1<br />
x<br />
+ 2x<br />
1,<br />
2<br />
2<br />
1,<br />
1<br />
2<br />
2<br />
x<br />
( x<br />
1,<br />
2<br />
2<br />
1,<br />
1<br />
2<br />
4<br />
( x<br />
− x<br />
2,<br />
2<br />
2<br />
1,<br />
2<br />
2<br />
2<br />
− x<br />
( a 2<br />
5 4 2 4 2<br />
a1)<br />
+ ( x1,<br />
1 x 2,<br />
2 − x1,<br />
2 x 2,<br />
1 ) ( a 2<br />
4<br />
a1)<br />
+<br />
2<br />
2,<br />
1 ) ( a 2<br />
3 2 2 2 2<br />
a1)<br />
+ 2x<br />
2,<br />
1 x 2,<br />
2 ( x1,<br />
2 − x1,<br />
1 ) ( a 2 a1)<br />
4<br />
) ( a a ) + x<br />
2<br />
x<br />
2<br />
( x<br />
2<br />
− x<br />
2<br />
) = 0<br />
)<br />
+ ( x1,<br />
2 x 2,<br />
1 − x1,<br />
1 x 2,<br />
2 2 1 2,<br />
2 2,<br />
1 2,<br />
1 2,<br />
2<br />
Testul t este aplicat pentru eşantioane mici, în care abaterile <strong>de</strong> la ipoteza <strong>de</strong> normalitate a<br />
267<br />
2<br />
(14)
69<br />
distribuţiei valorilor în eşantion sunt majore. Testul t a fost introdus în 1908 [ ] pentru a compara<br />
două eşantioane provenite din populaţii distribuite normal cu varianţă egală, extins pentru calculul<br />
intervalului <strong>de</strong> încre<strong>de</strong>re al coeficienţilor unei ecuaţii <strong>de</strong> regresie în 1922 [ 70 ] şi a fost generalizat<br />
pentru compararea a două eşantioane provenite din populaţii distribuite normal cu varianţă diferită<br />
în 1947 [ 71 ].<br />
Probabilitatea asociată valorii medii obţinută dintr-un eşantion cu valoarea medie cunoscută a<br />
populaţiei din care provine se face din distribuţia Stu<strong>de</strong>nt t cu formula:<br />
⎛<br />
⎞<br />
⎜<br />
⎟<br />
⎜ m1<br />
− μ1<br />
t , n −1⎟<br />
(15)<br />
⎜ m ⎟<br />
2<br />
⎜<br />
⎟<br />
⎝ n −1 ⎠<br />
Probabilitatea asociată diferenţei a două valori medii obţinute din două eşantioane (Y1 şi Y2) se face<br />
similar cu formula:<br />
⎛<br />
⎞<br />
⎜<br />
⎟<br />
2<br />
2<br />
2<br />
⎜ m<br />
( ) ⎟<br />
1(<br />
Y1<br />
) − m1(<br />
Y2<br />
) m2<br />
( Y1<br />
) n(<br />
Y1<br />
) + m2<br />
( Y2<br />
) n(<br />
Y2<br />
)<br />
t ⎜<br />
,<br />
4<br />
4 ⎟<br />
(16)<br />
2<br />
2<br />
⎜ m2<br />
( Y1<br />
) m2<br />
( Y2<br />
) m2<br />
( Y1)<br />
m2<br />
( Y2<br />
)<br />
+<br />
+<br />
⎟<br />
3<br />
3<br />
⎜<br />
Y − ( n(<br />
Y −<br />
− ⎟<br />
2)<br />
1<br />
1)<br />
1)<br />
( n(<br />
Y2<br />
) 1)<br />
⎝ n(<br />
Y1<br />
) −1<br />
n(<br />
⎠<br />
⎛<br />
3 2<br />
2 2<br />
( ) ⎞<br />
⎜ m1<br />
( Y1<br />
) − m1(<br />
Y2<br />
) ( n −1)<br />
m2<br />
( Y1)<br />
+ m2<br />
( Y2<br />
)<br />
t n −1<br />
,<br />
⎟ , n = n(Y1) = n(Y2)<br />
⎜<br />
2<br />
2<br />
2 4<br />
4<br />
+ ⎟<br />
⎝ m ( Y ) + m ( Y ) n m2<br />
( Y1)<br />
m2<br />
( Y2<br />
)<br />
2 1 2 1<br />
⎠<br />
Probabilităţile asociate valorilor parametrilor ecuaţiei <strong>de</strong> regresie se obţin din:<br />
⎜<br />
⎟<br />
⎝<br />
Y) ⎠<br />
ˆ<br />
⎛<br />
⎞<br />
⎜<br />
bi<br />
m−<br />
| B |<br />
⎟<br />
⎧ n + 1,<br />
( eq1)<br />
m<br />
2<br />
t<br />
, m−<br />
| B | B | = ⎨<br />
= ∑ i − Yi )<br />
s( bi<br />
) SE(<br />
Y,<br />
⎩n,<br />
( eq2)<br />
i=<br />
1<br />
ˆ<br />
Y) ( Y ˆ<br />
; | ; SE ( Y,<br />
(17)<br />
un<strong>de</strong> valorile varianţei parametrilor B = (bi)i≥ se obţin odată cu parametrii estimaţi folosind formula,<br />
în care X este matricea <strong>de</strong>scriptorilor (în formulare matriceală Ŷ=X·B):<br />
T −1<br />
s(<br />
bi<br />
) = ( X ⋅X)<br />
i,<br />
i<br />
(18)<br />
Analiza <strong>de</strong> varianţă este o tehnică care constă în separarea varianţei totale a datelor în componente<br />
logic asociate cu surse specifice <strong>de</strong> variaţie. Ipoteza <strong>de</strong> analiză este că erorile sunt in<strong>de</strong>pen<strong>de</strong>nte,<br />
i<strong>de</strong>ntice şi distribuite normal: ε ~ N(0,σ 2 ).<br />
Pentru un set <strong>de</strong> observaţii grupate pe categorii (Oi,j)1≤i≤m;1≤j≤n un<strong>de</strong> m este numărul <strong>de</strong> categorii şi n<br />
numărul <strong>de</strong> observaţii din fiecare categorie, următorul tabel (Tabelul 26) cumulează analiza <strong>de</strong><br />
varianţă:<br />
Tabelul 26. Analiza <strong>de</strong> varianţă în observaţii grupate pe categorii<br />
Parametru Gra<strong>de</strong> <strong>de</strong> Suma pătratelor Varianţă Valoarea F<br />
libertate<br />
total m·n-1<br />
2<br />
m ⎛ n<br />
m n 1 1 ⎞<br />
SST MSA<br />
SST = ∑⎜∑∑ ∑ ⎟<br />
⎜<br />
Oi,<br />
j − O<br />
MST =<br />
≈<br />
i,<br />
j ⎟<br />
i=<br />
1 ⎝ j=<br />
1 m i=<br />
1 n<br />
m ⋅n<br />
−1<br />
MSE<br />
j=<br />
1 ⎠<br />
F(<br />
m −1,<br />
n)<br />
mo<strong>de</strong>l m-1<br />
2<br />
2<br />
m ⎛ n ⎞<br />
m n 1 ⎛ ⎞<br />
SSA<br />
(m×n)<br />
SSA = ⎜ O ⎟ i,<br />
j − ⎜ O ⎟ MSA =<br />
∑∑ ⎜ ⎟<br />
i,<br />
j<br />
i 1 j 1 m ⎜∑∑<br />
⎟<br />
n(<br />
m −1)<br />
= ⎝ = ⎠ ⎝ i=<br />
1 j=<br />
1 ⎠<br />
[ 69 ] Stu<strong>de</strong>nt (William S. GOSSET). 1908. The Probable Error of a Mean. Biometrika 6(1):1-25.<br />
[ 70 ] Ronald A. FISHER. 1922. The Goodness of Fit of Regression Formulae and the Distribution of Regression<br />
Coefficients. Journal of the Royal Statistical Society 85:597-612.<br />
[ 71 ] Bernard L. WELCH 1947. The generalization of "stu<strong>de</strong>nt's" problem when several different population variances<br />
are involved. Biometrika 34(1):28-35.<br />
268
eroare m(n-1)<br />
2<br />
m ⎛ n ⎛<br />
n ⎞<br />
∑∑ ⎜<br />
1 ⎞<br />
SSE = ⎜ ∑ ⎟⎟<br />
⎜ ⎜<br />
Oi,<br />
j − Oi,<br />
j ⎟⎟<br />
i=<br />
1 ⎝ j=<br />
1 ⎝ n j=<br />
1 ⎠⎠<br />
SSE<br />
MSE =<br />
m(<br />
n −1)<br />
Testul Fisher F poate fi folosit pentru obţinerea semnificaţiei coeficientului <strong>de</strong> <strong>de</strong>terminare, caz în<br />
care valoarea F se obţine cu formula:<br />
2<br />
var( reg)<br />
r n<br />
⎧ n + 1,<br />
( eq1)<br />
F ( r)<br />
= =<br />
; | B | =<br />
2<br />
⎨<br />
var( rez)<br />
( 1−<br />
r ) ( m−<br />
| B | −1)<br />
⎩ n , ( eq2)<br />
(19)<br />
2010A2. Construirea librăriilor <strong>de</strong> compuşi chimici virtuali (chimie combinatorială)<br />
Librăriile <strong>de</strong> compuşi chimici virtuali au fost create (baza <strong>de</strong> date MDFV <strong>de</strong>pozitează şi structura<br />
3D a compuşilor chimici) şi conţin peste 1000 <strong>de</strong> compuşi.<br />
În figura următoare se dau reprezentările 3D ale mo<strong>de</strong>lelor <strong>de</strong> geometrie moleculară ale <strong>de</strong>rivaţilor<br />
<strong>de</strong> carbochinolină (37 <strong>de</strong> compuşi).<br />
Aceştia pot fi vizualizaţi folosind Intervet Explorer şi având aplicaţia CHIME instalată, pe calea<br />
(când aplicaţia CHIME permite răsucirea moleculelor):<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDFV/?set=cqd&pdb=<br />
aşa cum rezultă în continuare:<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd01<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd02<br />
269<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd03<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd04
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd05<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd06<br />
270<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd07<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd08
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd12<br />
V/?set=cqd&pdb=cqd09<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd10<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd11<br />
271<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd13<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd14
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd15<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd16<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd17<br />
272<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd18<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd19
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd20<br />
V/?set=cqd&pdb=cqd23<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd21<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd22<br />
273<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd24
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd25<br />
V/?set=cqd&pdb=cqd27<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd26 http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd28<br />
274
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd29<br />
V/?set=cqd&pdb=cqd32<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd30 http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd33<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd31<br />
275<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd34
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd35<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
276<br />
V/?set=cqd&pdb=cqd36<br />
http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />
V/?set=cqd&pdb=cqd37<br />
2010A3. Interogarea bazelor <strong>de</strong> date internaţionale (Cambridge SDb, Protein Db, Visual Mol.<br />
Dyn., MMDB - Mol. Mod. Db, PubChem Comp., PubChem Subst.), colectare informaţii,<br />
elaborarea mo<strong>de</strong>lelor moleculare compuşi virtuali (chimie computaţională)<br />
Structurile celor peste 1000 <strong>de</strong> compuşi au fost obţinute din bazele <strong>de</strong> date, PubChem şi<br />
ChemSpi<strong>de</strong>r, au urmat procedurile <strong>de</strong> optimizare a structurii moleculare cu HyperChem, şi<br />
rezultatele au fost <strong>de</strong>pozitate în baza <strong>de</strong> date MDFV.<br />
Mo<strong>de</strong>larea structurii moleculare este condiţia obligatorie pentru o analiză structură-activitate. Realizarea<br />
unui mo<strong>de</strong>l tridimensional (3D) se impune pentru cazurile când <strong>de</strong>scriptorii calculaţi uzează <strong>de</strong> geometria<br />
moleculară, ceea ce este cazul aici.<br />
Obţinerea mo<strong>de</strong>lului 3D se poate realiza folosind un program <strong>de</strong> mo<strong>de</strong>lare moleculară cum ar fi:<br />
HyperChem, Spartan, Gaussian, Molecular Mo<strong>de</strong>lling Pro, Mopac. În mo<strong>de</strong>larea structurii PCBs s-a<br />
folosit programul <strong>de</strong> mo<strong>de</strong>lare moleculară HyperChem (licenţă v. 8.0/2007).<br />
Obţinerea informaţiei <strong>de</strong> structură 3D presupune parcurgerea unei serii <strong>de</strong> paşi, care cuprin<strong>de</strong> <strong>de</strong>finirea<br />
unui mo<strong>de</strong>l <strong>de</strong> mecanică moleculară (a fost <strong>de</strong>finit AMBER [ 72 ]), optimizarea geometriei moleculare până<br />
[ 72 ] AMBER (acronim pentru Assisted Mo<strong>de</strong>l Building with Energy Refinement - este o familie <strong>de</strong> câmpuri <strong>de</strong> forţă<br />
pentru dinamica moleculară a biomoleculelor <strong>de</strong>zvoltat <strong>de</strong> succesorii grupului lui Peter Kollman la University of<br />
California, San Francisco. http://ambermd.org/
73<br />
la convergenţă folosind un algoritm <strong>de</strong> optimizare (a fost folosit POLAK-RIBIERE [ ]), <strong>de</strong>finirea unei<br />
meto<strong>de</strong> semiempirice <strong>de</strong> calcul energetic (a fost <strong>de</strong>finită AM1 [ 74 ]) şi obţinerea unei serii <strong>de</strong> parametrii<br />
energetici ce caracterizează optimul împreună cu sarcinile electrice parţiale.<br />
Rezultatul optimizării şi calcului energetic este salvat în fişierul ce <strong>de</strong>fineşte structura chimică a moleculei<br />
al cărui mo<strong>de</strong>l a fost construit. În cazul HyperChem, fişierele sunt cu extensia *.hin, având o structură cu<br />
mai multe linii, câte o linie pentru fiecare atom al moleculei cuprinzând numărul, numele, sarcina parţială,<br />
coordonatele spaţiale, numărul <strong>de</strong> legături pe care le formează şi lista legăturilor împreună cu tipul<br />
acestora.<br />
Aceste fişiere (pentru fiecare moleculă în parte) reprezintă datele <strong>de</strong> intrare în analiza <strong>de</strong> structură realizată.<br />
Uzual metodologia <strong>de</strong> analiză structură-activitate foloseşte structurile moleculare în care atomii <strong>de</strong><br />
hidrogen sunt neglijaţi (şterşi). O sumă <strong>de</strong> motive stau la baza acestei alegeri:<br />
÷ activităţile biologice în mod uzual <strong>de</strong>terminate in vivo au ca mediu <strong>de</strong> analiză mediul apos, în care au<br />
loc procese <strong>de</strong> disociere (parţială) în care atomii <strong>de</strong> hidrogen trec sub formă <strong>de</strong> protoni în soluţie,<br />
părăsind locul pe care îl ocupă în structura moleculară, <strong>de</strong>ci o formă <strong>de</strong>pletizată <strong>de</strong> hidrogen îşi găseşte<br />
corespon<strong>de</strong>ntul în starea <strong>de</strong> fapt a experimentului;<br />
÷ atomii <strong>de</strong> hidrogen pot forma o singură legătură; aceştia sunt singurii şterşi, <strong>de</strong>ci exceptând poziţia<br />
geometrică a acestora informaţia poate fi oricând reconstruită; mai mult, fiindcă formează o singură<br />
legătură, ei nu contribuie la complexitatea moleculară (nu creează lanţuri şi ramificaţii, sunt doar<br />
terminatori <strong>de</strong> structură) şi din acest punct <strong>de</strong> ve<strong>de</strong>re nu aduc informaţie care să caracterizeze<br />
suplimentar o structură în raport cu informaţia care a fost <strong>de</strong>ja produsă <strong>de</strong> ceilalţi atomi;<br />
÷ nu în ultimul rând se reduce consi<strong>de</strong>rabil volumul <strong>de</strong> calcule pe o structură fără atomi <strong>de</strong> hidrogen;<br />
consi<strong>de</strong>rând doar un alcan cu formula generală CnH2n+2 se observă că volumul <strong>de</strong> calcule se reduce la<br />
aproape o treime (în ipoteza i<strong>de</strong>ală că volumul <strong>de</strong> calcule e proporţional cu dimensiunea moleculei,<br />
ceea ce <strong>de</strong> cele mai multe ori este nerealist, reducerea fiind şi mai drastică, existând <strong>de</strong>pen<strong>de</strong>nţe<br />
pătratice sau chiar exponenţiale în timp <strong>de</strong> execuţie cu volumul molecular) dacă atomii <strong>de</strong> hidrogen<br />
sunt eliminaţi.<br />
Seria <strong>de</strong> fişiere (cu extensia `hin`) conţinând mo<strong>de</strong>lele structurilor 3D ale moleculelor reprezintă date <strong>de</strong><br />
intrare în analiza structură-activitate realizată.<br />
Figura următoare ilustrează 4 baze <strong>de</strong> date în care informaţiile colectate au fost <strong>de</strong>pozitate.<br />
[ 73 ] Polak-Ribiere este o metodă <strong>de</strong> optimizare ce foloseşte gradienţi conjugaţi (Polak B, Ribiere G, 1969. Note surla<br />
convergence <strong>de</strong>s métho<strong>de</strong>s <strong>de</strong> directions conjuguées. Rev. Fr. Imform. Rech. Oper 16:35-43).<br />
[ 74 ] AM1: Austin Mo<strong>de</strong>l 1 (<strong>de</strong>zvoltată <strong>de</strong> Dewar & alţii) în mod similar cu metoda tradiţională MNDO <strong>de</strong> aproximare a<br />
integralelor <strong>de</strong> doi electroni dar foloseşte o expresie modificată pentru repulsia nucleu-nucleu (Dewar MJS, Zoebisch<br />
EG, Healy EF, Stewart JJP, 1985. AM1: A New General Purpose Quantum Mechanical Molecular Mo<strong>de</strong>l. J Am Chem<br />
Soc 107:3902-3909).<br />
277
În fiecare dintre aceste baze <strong>de</strong> date sunt <strong>de</strong>pozitate mai multe seturi <strong>de</strong> molecule. În tabelul următor<br />
se redă conţinutul bazei <strong>de</strong> date MDFV (având peste 1000 <strong>de</strong> molecule stocate):<br />
Tabela Număr <strong>de</strong> molecule Spaţiul <strong>de</strong> stocare al populaţiei <strong>de</strong> <strong>de</strong>scriptori (_mdfv)<br />
bbb_data 535 9.6Gb<br />
cqd_data 37 727Mb<br />
cycl_data 19 399Mb<br />
dipep_data 58 1.1Gb<br />
drugs166_data 166 3.0Gb<br />
estro_data 144 2.6Gb<br />
nitro_data 39 767Mb<br />
ordnance_data 8 199Mb<br />
sulfon18_data 18 381Mb<br />
sulfon45_data 45 873Mb<br />
taxoids_data 34 673Mb<br />
triph_data 25 509Mb<br />
2010A4. Obţinerea (Q)SRR, (Q)SPR, (Q)PAR, şi (Q)AAR (chimie farmaceutică)<br />
Eficienţa obţinerii <strong>de</strong> (Q)SRR, (Q)SPR, (Q)PAR, şi (Q)AAR s-a studiat sistematic folosind o<br />
familie <strong>de</strong> <strong>de</strong>scriptori, un set <strong>de</strong> compuşi şi o activitate măsurată date şi diferite valori ale<br />
parametrilor <strong>de</strong> evoluţie. O serie <strong>de</strong> rezultate, toate noi, au fost obţinute din parcursul acestei<br />
activităţi (Jäntschi, 2009-GASI; Jäntschi & others, 2009-DF4; Jäntschi & Bălan, 2009-DF7;<br />
Jäntschi & others, 2010-MHqR; Jäntschi & others, 2010-REGA; Jäntschi & others, 2010-RESG;<br />
Jäntschi & others, 2010-SGAE; Jäntschi & others, 2010-ATGA; Jäntschi & others, 2010-ATGP;<br />
Jäntschi & others, 2010-ATGG; Jäntschi & others, 2010-TESG; Jäntschi, 2010-GAEG).<br />
Familia <strong>de</strong> <strong>de</strong>scriptori aleasă pentru evaluarea performanţelor algoritmului genetic realizat este<br />
MDF (Molecular Descriptors Family) pornind <strong>de</strong> la următoarele raţionamente:<br />
75<br />
÷ Este în totalitate <strong>de</strong>zvoltată şi documentată <strong>de</strong> autor, propusă în 2004 [ ];<br />
÷ Sistemul <strong>de</strong> generare, stocare şi interogare este un sistem mo<strong>de</strong>rn, bazat pe aplicaţii <strong>de</strong> tip<br />
client-server, la care procesarea paralelă (execuţie simultană pe aceleaşi date) este posibilă şi<br />
constituie un avantaj major în accelerarea execuţiei [ 76 ];<br />
÷ Metoda este stabilă, fiind revizuită şi complect documentată în 2005 [ ];<br />
÷ Prezintă avantajul disponibilităţii online atât în ceea ce priveşte modalitatea <strong>de</strong> obţinere a<br />
membrilor familiei cât şi a rezultatelor obţinute pe diferite seturi <strong>de</strong> compuşi [ 78 ];<br />
÷ Metoda a dovedit eficienţă în predicţia proprietăţilor fizico-chimice şi biologice la peste 50 <strong>de</strong><br />
seturi <strong>de</strong> compuşi chimici investigaţi [ 79 ].<br />
Setul <strong>de</strong> molecule ales pentru investigare este seria bifenililor policloruraţi (PCBs) o serie formată<br />
din 209 compuşi al cărui studiu este <strong>de</strong> o <strong>de</strong>osebită importanţă pentru impactul acestora asupra<br />
ecosistemului.<br />
[ 75 ] <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>. 2004. MDF - A New QSAR/QSPR Molecular Descriptors Family. Leonardo Journal of<br />
Sciences 3(4):68-85.<br />
[ 76 ] <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>. 2004. Delphi Client - Server Implementation of Multiple Linear Regression Findings: a<br />
QSAR/QSPR Application. Applied Medical Informatics 15(3-4):48-55.<br />
[ 77 ] <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>. 2005. Molecular Descriptors Family on Structure Activity Relationships 1. Review of the<br />
Methodology. Leonardo Electronic Journal of Practices and Technologies 4(6):76-98.<br />
[ 78 ] <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>. 2007. ©February. http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs/MDF_SARs/<br />
[ 79 ] <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ. 2007. Results from the Use of Molecular Descriptors Family on<br />
Structure Property/Activity Relationships, International Journal of Molecular Sciences 8(3):189-203.<br />
278<br />
77
Cl(n)<br />
Cl (n)<br />
PCBs: Seria bifenililor policloruraţi<br />
Astfel, o scurtă incursiune în istoria acestor compuşi ne arată că aceştia şi-au găsit utilizări sub<br />
formă <strong>de</strong> lichi<strong>de</strong> dielectrice în transformatoare şi con<strong>de</strong>nsatoare, ca agenţi <strong>de</strong> răcire şi ungere,<br />
aditivi stabilizatori la lipiturile <strong>de</strong> ţevi PVC pentru reţelele electrice, în componente electronice, ca<br />
agenţi <strong>de</strong> diluare ale pestici<strong>de</strong>lor, uleiuri <strong>de</strong> răcire pentru scule <strong>de</strong> tăiere, flui<strong>de</strong> hidraulice, agenţi <strong>de</strong><br />
protecţie şi lustruire, a<strong>de</strong>zivi, lacuri (<strong>de</strong> parchet), vopsele, agenţi <strong>de</strong> curăţare şi chiar ca alternativă la<br />
hârtia <strong>de</strong> celuloză [ 80 ].<br />
Chiar dacă producţia <strong>de</strong> PCB a fost stopată în 1970 datorită toxicităţii ridicate a celor mai mulţi<br />
congeneri ai familiei PCB, efectele acestora sunt încă prezente în mediu, datorită faptului că PCBs<br />
sunt poluanţi organici persistenţi (clasificaţi ca atare [ 81 ]) care se acumulează (bioacumulare) în<br />
animale.<br />
Coeficientul <strong>de</strong> partiţie octanol/apă (Kow) este raportul concentraţiilor unui compus chimic între<br />
octanol şi apă aflate în contact la o anumită temperatură. Este un parametru adimensional (fiind un<br />
raport <strong>de</strong> concentraţii) care frecvent se exprimă pe scară logaritmică (logKow sau mai simplu lkow).<br />
Această proprietate fizico-chimică este utilizată în multe studii <strong>de</strong> mediu în <strong>de</strong>terminarea efectului<br />
compuşilor chimici în mediu, un exemplu fiind utilizarea acestuia pentru prezicerea magnitudinii <strong>de</strong><br />
bioacumulare în peşti [ 82 ].<br />
Valorile activităţii măsurate se bazează pe un studiu datat în 1996 [ ] şi care sintetizează rezultatele<br />
obţinute şi raportate în literatura <strong>de</strong> specialitate în studiul PCBs <strong>de</strong> mai mulţi autori.<br />
84<br />
Studiul anterior al lkow cu familia <strong>de</strong> <strong>de</strong>scriptori moleculari [ ] a arătat că se poate obţine o ecuaţie<br />
<strong>de</strong> regresie liniară multiplă în 4 variabile care să explice activitatea măsurată în procent <strong>de</strong> 91%,<br />
ecuaţie care însă nu respectă toate condiţiile impuse <strong>de</strong> viabilitate fenotipică menţionate mai sus<br />
(variabilitate, abatere <strong>de</strong> la normalitate, şi <strong>de</strong>terminare rezonabile), în fapt 2 dintre genotipurile<br />
acestei ecuaţii eşuând la acest test <strong>de</strong> viabilitate: HMmjQt şi SMMjQg. Oricum, ecuaţia obţinută în<br />
[84] poate constitui un element <strong>de</strong> referinţă în ceea ce priveşte performanţa algoritmului genetic,<br />
fiind redată în continuare:<br />
Ŷ = 3.04 - 0.42·IIDDKGg + 0.04·IHDRKEg + 0.07·aHMmjQt - 37.5·aSMMjQg<br />
r 2 (Y,Ŷ) ≈ 0.91, F=554 (24)<br />
Măsurătorile experimentale ale coeficientului <strong>de</strong> partiţie octanol/apă ale unei serii <strong>de</strong> 206 PCBs (din<br />
totalul <strong>de</strong> 209), exprimate în scară logaritmică (lkow=ln(KOW)) aşa cum au fost ele raportate în [83]<br />
sunt redate în tabelul următor.<br />
[ 80 ] UNEP Chemicals. 1999. Gui<strong>de</strong>lines for the I<strong>de</strong>ntification of PCBs and Materials Containing PCBs. United Nations<br />
Environment Programme. http://www.chem.unep.ch/pops/pdf/PCBi<strong>de</strong>nt/pcbid1.pdf.<br />
[ 81 ] Office of International Affairs. 2002. Persistent Organic Pollutants: A Global Issue, A Global Response.<br />
Environmental Protection Agency. http://www.epa.gov/oia/toxics/pop.pdf.<br />
[ 82 ] U.S. Geological Survey. 2008. Octanol-Water Partition Coefficient (KOW). U.S. Department of the Interior.<br />
http://toxics.usgs.gov/<strong>de</strong>finitions/kow.html (Page Last Modified: Thursday, 13-Mar-2008 13:25:59 EDT).<br />
[ 83 ] Ronald EISLER, André A. BELISLE. 1996. Planar PCB Hazards to Fish, Wildlife, and Invertebrates: A Synoptic<br />
Review. Contaminant Hazard Reviews. Biological Report 31.<br />
[ 84 ] <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ. 2006. Molecular Descriptors Family on Structure Activity<br />
Relationships 6. Octanol-Water Partition Coefficient of Polychlorinated Biphenyls, Leonardo Electronic Journal of<br />
Practices and Technologies 5(8):71-86.<br />
279<br />
83
Coeficienţi <strong>de</strong> partiţie octanol/apă pentru PCBs<br />
Moleculă Structură lkow<br />
PCB015 Cl<br />
PCB001<br />
PCB002<br />
Cl<br />
PCB003 Cl<br />
PCB004<br />
PCB006<br />
PCB007<br />
PCB008<br />
PCB009<br />
PCB010<br />
PCB011<br />
Cl<br />
Cl<br />
Cl<br />
PCB012 Cl<br />
PCB014<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
4.601<br />
4.421<br />
4.401<br />
5.023<br />
5.021<br />
5.15<br />
5.301<br />
5.18<br />
5.311<br />
5.343<br />
5.295<br />
5.404<br />
280<br />
Cl<br />
Cl Cl<br />
Cl<br />
5.335<br />
PCB016 5.311<br />
Cl Cl<br />
PCB017 5.761<br />
Cl<br />
PCB018<br />
PCB019<br />
Cl<br />
Cl<br />
Cl Cl<br />
Cl Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.551<br />
5.481<br />
PCB020 5.577<br />
Cl<br />
Cl<br />
Cl<br />
PCB021 5.517<br />
Cl<br />
Cl<br />
PCB022 5.421<br />
PCB023<br />
PCB024<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.577<br />
5.671<br />
PCB025 5.677<br />
Cl<br />
PCB026<br />
Cl<br />
Cl<br />
Cl<br />
5.667
PCB027<br />
Cl<br />
Cl<br />
Cl<br />
5.447<br />
PCB028<br />
Cl<br />
Cl<br />
Cl<br />
5.691<br />
PCB029<br />
Cl<br />
Cl<br />
Cl<br />
5.743<br />
PCB030<br />
Cl<br />
Cl<br />
Cl<br />
5.504<br />
PCB031<br />
Cl<br />
Cl<br />
Cl<br />
5.677<br />
PCB032<br />
Cl<br />
Cl<br />
Cl<br />
5.751<br />
PCB033<br />
Cl<br />
Cl<br />
Cl<br />
5.572<br />
PCB034<br />
Cl<br />
Cl<br />
Cl<br />
5.667<br />
PCB035<br />
Cl<br />
Cl<br />
Cl<br />
5.827<br />
PCB036<br />
Cl<br />
Cl<br />
Cl<br />
4.151<br />
PCB037<br />
Cl<br />
Cl<br />
Cl<br />
4.941<br />
PCB038<br />
Cl<br />
Cl<br />
Cl<br />
5.767<br />
PCB039<br />
Cl<br />
Cl<br />
Cl<br />
5.897<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
PCB040 5.561<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
PCB041 6.111<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
PCB042 5.767<br />
PCB043<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.757<br />
PCB044<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.811<br />
PCB045<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.537<br />
PCB046<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.537<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
PCB047 6.291<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
PCB048 5.787<br />
281
PCB049<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.221<br />
PCB050<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.637<br />
PCB051<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.637<br />
PCB052<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.091<br />
PCB053<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.627<br />
PCB054<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.904<br />
PCB055<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.117<br />
PCB056<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.117<br />
PCB057<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.177<br />
PCB058<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.177<br />
PCB059<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.957<br />
PCB060<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.452<br />
PCB061<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.943<br />
PCB062<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.897<br />
PCB063<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.177<br />
PCB064<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.957<br />
PCB065<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.867<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
PCB066 5.452<br />
PCB067<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.207<br />
PCB068<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.267<br />
PCB069<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.047<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.231<br />
PCB070<br />
282
PCB071<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.987<br />
PCB072<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.267<br />
PCB073<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.047<br />
PCB074<br />
Cl<br />
Cl<br />
Cl<br />
Cl 6.671<br />
PCB075<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.057<br />
PCB076<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.137<br />
PCB077<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.523<br />
PCB078<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.357<br />
PCB079<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.427<br />
PCB080<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.583<br />
PCB081<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.367<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
PCB082 6.142<br />
PCB083<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.267<br />
PCB084<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.041<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
PCB085 6.611<br />
PCB086<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.204<br />
PCB087<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.371<br />
PCB088<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.516<br />
PCB089<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.077<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
PCB090 6.367<br />
283
PCB091<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.137<br />
PCB092<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.357<br />
PCB093<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.047<br />
PCB094<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.137<br />
PCB095<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.137<br />
PCB096<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.717<br />
PCB097<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.671<br />
PCB098<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.137<br />
PCB099<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.211<br />
PCB100<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.237<br />
PCB101<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.071<br />
PCB102<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.167<br />
PCB103<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.227<br />
PCB104<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
5.817<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
PCB105 6.657<br />
PCB106<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.647<br />
PCB107<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.717<br />
PCB108<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.717<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.487<br />
PCB109<br />
284
PCB110<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.532<br />
PCB111<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.767<br />
PCB112<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.457<br />
PCB113<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.547<br />
PCB114<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.657<br />
PCB115<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.497<br />
PCB116<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.304<br />
PCB117<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.467<br />
PCB118<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.121<br />
PCB119<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.587<br />
PCB120<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.797<br />
PCB121<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.647<br />
PCB122<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.647<br />
PCB123<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.747<br />
PCB124<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.737<br />
PCB125<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.517<br />
PCB126<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.897<br />
PCB127<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.957<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
PCB128 6.961<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
PCB129 7.321<br />
285
PCB130<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.391<br />
PCB131<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.587<br />
PCB132<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.587<br />
PCB133<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.867<br />
PCB134<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.304<br />
PCB135<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.151<br />
PCB136<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.511<br />
PCB138<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.441<br />
PCB139<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.677<br />
PCB140<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.677<br />
PCB141<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.592<br />
PCB142<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.517<br />
PCB143<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.607<br />
PCB144<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.677<br />
PCB145<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.257<br />
PCB146<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.897<br />
PCB147<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.647<br />
PCB148<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.737<br />
PCB149<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.281<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.327<br />
PCB150<br />
286
PCB151<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.647<br />
PCB152<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.227<br />
PCB153<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.751<br />
PCB154<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.767<br />
PCB155<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.123<br />
PCB156<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.187<br />
PCB157<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.187<br />
PCB158<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.027<br />
PCB159<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.247<br />
PCB160<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.937<br />
PCB161<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.087<br />
PCB162<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.247<br />
PCB163<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.997<br />
PCB164<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.027<br />
PCB165<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.057<br />
PCB166<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.937<br />
PCB167<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.277<br />
PCB168<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.117<br />
PCB169<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.427<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.277<br />
PCB170<br />
287
PCB171<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.704<br />
PCB172<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.337<br />
PCB173<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.027<br />
PCB174<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.117<br />
PCB175<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.177<br />
PCB176<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.767<br />
PCB177<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.087<br />
PCB178<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.147<br />
PCB179<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.737<br />
PCB180<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.367<br />
PCB181<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.117<br />
PCB182<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.207<br />
PCB183<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.207<br />
PCB184<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.857<br />
PCB185<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.933<br />
PCB186<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.697<br />
PCB187<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.177<br />
PCB188<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
6.827<br />
PCB189<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.717<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
PCB190 7.467<br />
288
PCB191<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.557<br />
PCB192<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.527<br />
PCB193<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.527<br />
PCB194<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
8.683<br />
PCB195<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.567<br />
PCB196<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.657<br />
PCB197<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.307<br />
PCB198<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.627<br />
PCB199<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.207<br />
PCB200<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.277<br />
PCB201<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.627<br />
PCB202<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
8.423<br />
PCB203<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.657<br />
PCB204<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.307<br />
PCB205<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
8.007<br />
PCB206<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
9.143<br />
PCB207<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
7.747<br />
PCB208<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
8.164<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
Cl<br />
9.603<br />
PCB209<br />
289
Pe lângă alegerea familiei <strong>de</strong> <strong>de</strong>scriptori (MDF), a setului <strong>de</strong> molecule (206 PCBs), şi a proprietăţii<br />
măsurate (coeficientul <strong>de</strong> partiţie octanol/apă în unităţi logaritmice lkow) execuţia programului<br />
evolutiv a impus alegerea unei serii <strong>de</strong> parametrii intrinseci <strong>de</strong> funcţionare a algoritmului genetic,<br />
aşa cum a fost expus până în acest moment.<br />
Fişierul <strong>de</strong> configurare a execuţiei algoritmului genetic excluzând opţiunile <strong>de</strong> afişare numără nu<br />
mai puţin <strong>de</strong> 30 <strong>de</strong> parametrii dintre care parametrii ordinali un număr <strong>de</strong> 19 şi dintre care<br />
parametrii cu valori dintr-o listă <strong>de</strong> valori impuse (finită şi <strong>de</strong>finită) un număr <strong>de</strong> 12.<br />
Un simplu calcul matematic efectuat asupra parametrilor din urmă, cu valori dintr-o listă finită şi<br />
<strong>de</strong>finită, dă numărul total posibil <strong>de</strong> combinaţii <strong>de</strong> investigat <strong>de</strong> 134784, fără a socoti că pentru<br />
fiecare dintre aceste combinaţii, există practic o infinitate <strong>de</strong> posibilităţi <strong>de</strong> configurare pentru<br />
parametrii rămaşi, în număr <strong>de</strong> 18.<br />
Argumentele <strong>de</strong> mai sus pot părea <strong>de</strong>scurajatoare în ceea ce priveşte posibilităţile <strong>de</strong> investigare<br />
sistematică a rezultatelor obţinute prin execuţia algoritmului genetic. Trebuie însă văzută partea<br />
favorabilă a situaţiei, şi anume că se oferă practic o diversitate foarte mare <strong>de</strong> stări algoritmului<br />
genetic prin care se asigură variabilitatea acestuia, care este benefică atâta timp cât algoritmul<br />
genetic este menit să investigheze activităţi biologice şi proprietăţi fizico-chimice şi ele cu o<br />
variabilitate foarte mare, atât sub aspectul provenienţei măsurătorilor (din observaţii umane,<br />
instrumentale), scări absolute şi relative <strong>de</strong> măsură, variabile discrete şi continue observate.<br />
Opţiuni <strong>de</strong> configurare pentru algoritmul genetic realizat<br />
Parametru Tip (şi valori pentru listă)<br />
a_v_ADAPT_Variance Real<br />
ajb_ADAPT_JarqueBera Real<br />
a_c_ADAPT_Correlation Real<br />
sn0_SAMPLE_Size Întreg (natural)<br />
rn0_REGRESSION_Multiple Întreg (natural)<br />
e1n_GENERATIONS_max Întreg (natural)<br />
g_r_GENERATIONS_first_rich Listă: {Yes, No}<br />
cn0_CROSSOVER_Pairs Întreg (natural)<br />
m_m_MUTATION_Genes Întreg (natural)<br />
mpp_MUTATION_Parent_probability Real<br />
mcp_MUTATION_Child_probability Real<br />
b_p_SELECTION_parameter Listă: {r2, se, Mt, Hr}<br />
b_o_SELECTION_objective Listă: {min, max}<br />
sfs_FITNESS_strategy Listă: {proportional, <strong>de</strong>terministic, tournament}<br />
sfn_FITNESS_normalized Listă: {Yes, No}<br />
sfr_FITNESS_ranks Listă: {Yes, No}<br />
sfa_FITNESS_accuracy Întreg (natural)<br />
sff_FITTEST_function Listă: {nalive, r2_min, se_min, Mt_min, Hr_min, r2_max,<br />
se_max, Mt_max, Hr_max, r2_avg, se_avg, Mt_avg, Hr_avg}<br />
sfo_FITTEST_objective {min, max}<br />
fr2_FITTEST_r2_p Real<br />
fse_FITTEST_se_p Real<br />
fMt_FITTEST_Mt_p Real<br />
fHr_FITTEST_Hr_p Real<br />
v_p_SURVIVAL_phenotyping_p Real<br />
v_g_SURVIVAL__genotyping_p Real<br />
vfs_SURVIVAL_strategy Listă: {proportional, <strong>de</strong>terministic, tournament}<br />
vfr_SURVIVAL_ranks Listă: {Yes, No}<br />
e0n_RUNS_number Întreg (natural)<br />
b_k_RUNS_kepp_best_in_sample Listă: {Yes, No}<br />
b_f_RUNS_get_best_from_file Listă: {Yes, No} + listă genotipuri în fişier c_galg.txt<br />
290
O altă remarcă se poate face cu privire la valorile parametrilor <strong>de</strong> configurare. Astfel, nu toţi<br />
parametrii pot lua orice valori (cum e cazul pentru sn0_SAMPLE_Size care în mod obligatoriu<br />
trebuie să fie cel puţin cât rn0_REGRESSION_Multiple în timp ce cn0_CROSSOVER_Pairs nu<br />
poate <strong>de</strong>păşi jumătate din sn0_SAMPLE_Size) în timp ce <strong>de</strong>finirea valorilor altor parametrii este<br />
restricţionată la un domeniu <strong>de</strong> valori pentru simplul fapt că efectul <strong>de</strong>finirii unei valori din afara<br />
domeniului este fie lipsită <strong>de</strong> sens (<strong>de</strong> exemplu <strong>de</strong>finirea unei valori întregi negative pentru<br />
e0n_RUNS_number sau pentru e1n_GENERATIONS_max face ca algoritmul genetic să nu mai fie<br />
executat), fie nu produce nici un fel <strong>de</strong> efecte diferite <strong>de</strong> o anumită valoare din domeniu (atribuirea<br />
unei valori negative pentru a_c_ADAPT_Correlation este similară cu atribuirea valorii 0 şi<br />
semnificând că nu există valoare minimă impusă pentru coeficientul <strong>de</strong> <strong>de</strong>terminare între<br />
fenotipurile ce compun o ecuaţie <strong>de</strong> regresie şi proprietatea măsurată), fie nu poate duce la atingerea<br />
obiectivului (atribuirea unei valori mai mari ca unitatea pentru a_c_ADAPT_Correlation este<br />
similară cu atribuirea valorii 1 şi are ca efect impunerea <strong>de</strong>terminării <strong>de</strong> 100%, ceea ce pe cale <strong>de</strong><br />
consecinţă face lipsită <strong>de</strong> sens căutarea <strong>de</strong> regresii multiple atâta timp cât ar exista un <strong>de</strong>scriptor<br />
molecular capabil să explice singur în proporţie <strong>de</strong> 100% proprietatea măsurată), în timp valorile <strong>de</strong><br />
configurare a unor parametrii impune valorile altora (<strong>de</strong> exemplu b_p_SELECTION_parameter=r2<br />
impune b_o_SELECTION_objective=max, pentru simplul fapt că obţinerea unei ecuaţii <strong>de</strong> regresie<br />
cu cel mai mic coeficient <strong>de</strong> <strong>de</strong>terminare nu poate constitui un obiectiv <strong>de</strong> interes, tot aşa cum<br />
b_p_SELECTION_parameter=se impune b_o_SELECTION_objective=min), în timp ce limitele<br />
valorilor unor parametrii sunt impuse doar <strong>de</strong> soluţia <strong>de</strong> memorare aleasă la implementare (<strong>de</strong><br />
exemplu e1n_GENERATIONS_max admite ca valoare maximă 2147483647 impusă <strong>de</strong> tipul <strong>de</strong> dată<br />
LongInt în care este stocată valoarea, dar care poate fi însă modificat fără dificultate la tip <strong>de</strong> dată<br />
Int64 cu limita superioară <strong>de</strong> 9223372036854775807.<br />
În evaluarea algoritmului genetic s-a consi<strong>de</strong>rat <strong>de</strong> importanţă teoretică şi practică compararea<br />
performanţelor obţinute pentru doi parametrii <strong>de</strong>finitorii ai procesului <strong>de</strong> evoluţie şi anume<br />
modalitatea <strong>de</strong> selecţie a indivizilor pentru încrucişare şi selecţie şi modalitatea <strong>de</strong> selecţie a<br />
indivizilor pentru înlocuire <strong>de</strong> către <strong>de</strong>scen<strong>de</strong>nţi (supravieţuire).<br />
Aceşti doi parametrii, metoda <strong>de</strong> selecţie (parametrul sfs_FITNESS_strategy) şi metoda <strong>de</strong><br />
supravieţuire (parametrul vfs_SURVIVAL_strategy) au constituit obiectul investigaţiei. Tabelul <strong>de</strong><br />
mai jos redă schema <strong>de</strong> execuţie (<strong>de</strong>signul experimentului realizat):<br />
Modalităţi <strong>de</strong> selecţie şi supravieţuire: <strong>de</strong>sign experimental<br />
Supravieţuire Proporţional (P) Deterministic (D) Turnir (T)<br />
Selecţie<br />
Proporţional (P) P:P (1) P:D (2) P:T (3)<br />
Deterministic (D) D:P (4) D:D (5) D:T (6)<br />
Turnir (T) T:P (7) T:D (8) T:T (9)<br />
Ceilalţi parametrii ce configurează execuţia algoritmului genetic au primit valori care au fost<br />
păstrate pe toată durata experimentului aceleaşi. Valorile acestora (care au fost date ţinând seama <strong>de</strong><br />
consi<strong>de</strong>rentele menţionate mai sus) sunt redate mai jos.<br />
Valori <strong>de</strong>finite şi păstrate pe toată durata experimentului pentru parametrii rămaşi<br />
Parametru Valoare<br />
a_v_ADAPT_Variance 0.1<br />
ajb_ADAPT_JarqueBera 0.1<br />
a_c_ADAPT_Correlation 0.1<br />
sn0_SAMPLE_Size 12<br />
rn0_REGRESSION_Multiple 4<br />
e1n_GENERATIONS_max 20000<br />
g_r_GENERATIONS_first_rich Yes<br />
cn0_CROSSOVER_Pairs 2<br />
m_m_MUTATION_Genes 2<br />
mpp_MUTATION_Parent_probability 5%<br />
mcp_MUTATION_Child_probability 5%<br />
291
_p_SELECTION_parameter r2<br />
b_o_SELECTION_objective max<br />
sfn_FITNESS_normalized No<br />
sfr_FITNESS_ranks No<br />
sfa_FITNESS_accuracy 10000<br />
sff_FITTEST_function r2_min<br />
sfo_FITTEST_objective max<br />
fr2_FITTEST_r2_p 1.0<br />
fse_FITTEST_se_p 1.0<br />
fMt_FITTEST_Mt_p 1.0<br />
fHr_FITTEST_Hr_p 1.0<br />
v_p_SURVIVAL_phenotyping_p 1.0<br />
v_g_SURVIVAL__genotyping_p 1.0<br />
vfr_SURVIVAL_ranks No<br />
e0n_RUNS_number 46<br />
b_k_RUNS_kepp_best_in_sample Yes<br />
b_f_RUNS_get_best_from_file No<br />
Performanţa algoritmului genetic a fost evaluată prin prisma rezultatelor colectate în fişierele <strong>de</strong><br />
ieşire. Configuraţia parametrilor <strong>de</strong> ieşire este redată mai jos.<br />
Configuraţii <strong>de</strong> afişare în experiment<br />
Parametru Valoare<br />
d_d_SHOW_<strong>de</strong>scriptive_XX Yes<br />
(XX = m0, m1, m2, m3, m4, mx, my, v0, g1, g2, jb, r1, r2)<br />
d_f_SHOW_fitness_YY Yes<br />
(YY = nalive, r2_min, se_min, Mt_min, Hr_min, r2_max, se_max,<br />
Mt_max, Hr_max, r2_avg, se_avg, Mt_avg, Hr_avg)<br />
d_c_SHOW_configuration Yes<br />
d_m_SHOW_mols No<br />
d_r_SHOW_regressions No<br />
d_p_SHOW_phenotypes No<br />
d_s_SHOW_genotypes No<br />
d_t_SHOW_fittests No<br />
d_g_SHOW_generations No<br />
d_e_SHOW_evolutions Yes<br />
Execuţia programului evolutiv s-a făcut pe calculatoare din generaţia P6 (Dual P5) în perioada<br />
Ianuarie - Februarie 2009 şi rezultatele au fost salvate <strong>de</strong> program în fişierele <strong>de</strong> date şi sunt<br />
disponibile pentru <strong>de</strong>scărcare <strong>de</strong> la adresa:<br />
http://l.aca<strong>de</strong>micdirec.org/Horticulture/GAs/MLR_MDF_selection_vs_survival/<br />
Fişiere rezultat (configurare şi evoluţie) după <strong>de</strong>signul <strong>de</strong> mai sus<br />
Selecţie Supravieţuire Configurare Evoluţie<br />
Proporţional Proporţional PCB_4044_cfg.txt PCB_4044_evo.txt<br />
Proporţional Deterministic PCB_2441_cfg.txt PCB_2441_evo.txt<br />
Proporţional Turnir PCB_9878_cfg.txt PCB_9878_cfg.txt<br />
Deterministic Proporţional PCB_5108_cfg.txt PCB_5108_evo.txt<br />
Deterministic Deterministic PCB_6369_cfg.txt PCB_6369_evo.txt<br />
Deterministic Turnir PCB_6690_cfg.txt PCB_6690_evo.txt<br />
Turnir Proporţional PCB_5828_cfg.txt PCB_5828_evo.txt<br />
Turnir Deterministic PCB_4872_cfg.txt PCB_4872_evo.txt<br />
Turnir Turnir PCB_1758_cfg.txt PCB_1758_evo.txt<br />
Frecvenţa <strong>de</strong> apariţie a genotipurilor în eşantion <strong>de</strong>-a lungul evoluţiilor permite aprecieri cu privire<br />
la capacitatea <strong>de</strong> adaptare a acestora, şi în acelaşi timp o măsură a variabilităţii materialului genetic<br />
292
al eşantionului pe care o induc metoda <strong>de</strong> selecţie şi metoda <strong>de</strong> supravieţuire. Următorul tabel<br />
prezintă această informaţie.<br />
Cele mai frecvente genotipuri prezente în generaţii care au produs evoluţii în 46 <strong>de</strong> execuţii<br />
in<strong>de</strong>pen<strong>de</strong>nte ale programului evolutiv<br />
Selecţie Supravieţuire Genotipuri Număr Apariţii Participanţi în regresii<br />
Proporţional Proporţional Top 23 apariţii 13 406 389<br />
mMdlHg 1 46 43<br />
MDMKHt 1 40 39<br />
nDRLHt 1 40 39<br />
iPDKCg 1 39 39<br />
ADDJCg 1 35 35<br />
mDdjGg 1 31 30<br />
bDDDGg 1 28 19<br />
bDDJCg 1 27 27<br />
sDdLHg 1 25 25<br />
BDDDGg 1 24 22<br />
bDMLEg 1 24 24<br />
bDMLGg<br />
MMDPMt<br />
1<br />
1<br />
24<br />
23<br />
24<br />
23<br />
Total 6760 16788 15902<br />
Deterministic Top 23 apariţii 13 378 371<br />
iPMDHg 1 39 37<br />
bPRjCg 1 38 38<br />
IPMDEg 1 37 36<br />
mMdoHt 1 30 29<br />
IPRKCg 1 29 29<br />
MDRLHt 1 29 29<br />
MMdlHg 1 29 29<br />
MDmWHg 1 26 26<br />
BPRjCg 1 26 25<br />
NDRlHt 1 25 25<br />
iPMDCg 1 24 23<br />
bmrVCt<br />
IPMDCg<br />
1<br />
1<br />
23<br />
23<br />
23<br />
22<br />
Total 8070 18240 17797<br />
Turnir Top 23 apariţii 6 214 207<br />
MMdlHg 1 47 47<br />
mMdlHg 1 46 43<br />
sPDLEg 1 38 38<br />
AMdwGg 1 29 29<br />
IPMDHg 1 29 27<br />
mMdqGt 1 25 23<br />
Total 7466 16599 15739<br />
Deterministic Proporţional Top 23 apariţii 3 89 72<br />
MDRLHt 1 31 31<br />
ImrWCg 1 30 19<br />
ImrWHg 1 28 22<br />
Total 3922 10764 9742<br />
Deterministic Deterministic Top 23 apariţii 32 893 893<br />
gmdKHg 1 48 48<br />
iPDDGg 1 43 43<br />
bmRkHg 1 37 37<br />
gMdEQg 1 34 34<br />
sDRDGg 1 34 34<br />
HDmLQt 1 33 33<br />
MDMKHt 1 33 33<br />
mMdLMt 1 30 30<br />
MMmwCg 1 29 29<br />
bmdFEt 1 29 29<br />
hDDJCg 1 27 27<br />
293
hDDpCg 1 27 27<br />
hPmEMg 1 27 27<br />
sPmJMt 1 27 27<br />
NmdlQg 1 26 26<br />
SMMFEg 1 26 26<br />
bMddEg 1 26 26<br />
sPRDHt 1 26 26<br />
BDrsGt 1 25 25<br />
hDMKEg 1 25 25<br />
smdoQg 1 25 25<br />
AMMpHt 1 24 24<br />
GPmVCg 1 24 24<br />
SMMjEt 1 24 24<br />
BPMkHg 1 23 23<br />
GmmlQt 1 23 23<br />
bPmjMg 1 23 23<br />
hDDDHg 1 23 23<br />
hMdWGt 1 23 23<br />
hPmSEg 1 23 23<br />
hmddCt 1 23 23<br />
imMtGg 1 23 23<br />
Total 4385 13560 13316<br />
Deterministic Turnir Top 23 apariţii 5 152 152<br />
NDRkHt 1 37 37<br />
sDDEMg 1 30 30<br />
hMrkGg 1 29 29<br />
MDDKHt 1 28 28<br />
sMrLCg 1 28 28<br />
Total 4965 12504 11572<br />
Turnir Proporţional Top 23 apariţii 13 419 405<br />
sPDJEg 1 64 64<br />
mMdlHg 1 44 42<br />
MMdlHg 1 40 40<br />
MDdjEg 1 32 30<br />
sDMDMg 1 29 28<br />
mMdqGt 1 29 23<br />
sDDKCg 1 28 28<br />
sPDLEg 1 28 28<br />
aDDKEg 1 27 27<br />
sDRKCg 1 26 26<br />
sPRKGg 1 25 22<br />
sDMLGg 1 24 24<br />
MDRLHt 1 23 23<br />
Total 6537 16368 15317<br />
Deterministic Top 23 apariţii 21 714 687<br />
MDRLHt 1 88 87<br />
IPMJCg 1 46 45<br />
IPMDEg 1 42 38<br />
sDRJEg 1 41 39<br />
iPMKCg 1 36 36<br />
iPDJCg 1 35 33<br />
sPDLEg 1 34 34<br />
mDRlHt 1 33 33<br />
nDRLHt 1 32 31<br />
sDMLCg 1 31 29<br />
iPDDGg 1 31 28<br />
iPDDEg 1 29 27<br />
mDRkHt 1 28 28<br />
IPRKCg 1 27 26<br />
IPDJCg 1 27 25<br />
iPDKCg 1 27 25<br />
294
PmkEt 1 26 26<br />
sDDJEg 1 26 26<br />
MDDKHt 1 26 22<br />
IPDKCg 1 25 25<br />
sDDLHg 1 24 24<br />
Total 7964 17700 17331<br />
Turnir Top 23 apariţii 8 217 213<br />
IDRwHt 1 34 34<br />
mMdlHg 1 28 28<br />
nMRSEt 1 28 27<br />
mPRDHt 1 27 26<br />
MDRLHt 1 26 26<br />
smmLCt 1 26 24<br />
AMDEQt 1 24 24<br />
IDRwGt 1 24 24<br />
Total 7529 17100 16151<br />
Pentru a verifica ipoteza in<strong>de</strong>pen<strong>de</strong>nţei între meto<strong>de</strong>le <strong>de</strong> selecţie şi supravieţuire în ceea ce priveşte<br />
numărul <strong>de</strong> genotipuri se foloseşte testul χ 2 aplicat la o tabelă <strong>de</strong> contingenţă <strong>de</strong> 3X3 pentru fiecare<br />
serie <strong>de</strong> valori numerice din tabelul <strong>de</strong> mai sus. Rezultatele sunt redate în continuare.<br />
Sunt in<strong>de</strong>pen<strong>de</strong>nte metoda <strong>de</strong> selecţie faţă <strong>de</strong> metoda <strong>de</strong> supravieţuire în ceea ce priveşte numărul<br />
<strong>de</strong> genotipuri distincte din cultivar în generaţiile ce produc evoluţie? - NU<br />
X<br />
2<br />
(<br />
4)<br />
χ 2<br />
P T D Σ<br />
P 6760 (6665) 7466 (7726) 8070 (7904) 22296<br />
T 6537 (6586) 7529 (7634) 7964 (7810) 22030<br />
D 3922 (3968) 4965 (4599) 4385 (4705) 13272<br />
Σ 17219 19960 20419 57598<br />
2<br />
2 2 2<br />
2 2 2<br />
2 2<br />
95 260 166 49 105 154 46 366 320<br />
= + + + + + + + + ≅ 70 ;<br />
6665 7726 7904 6586 7634 7810 3968 4599 4705<br />
p ≅ 2⋅10<br />
Sunt in<strong>de</strong>pen<strong>de</strong>nte metoda <strong>de</strong> selecţie faţă <strong>de</strong> metoda <strong>de</strong> supravieţuire în ceea ce priveşte numărul<br />
total <strong>de</strong> genotipuri din cultivar în generaţiile ce produc evoluţie? - NU<br />
χ 2<br />
P T D Σ<br />
P 16788 (16240) 16599 (17084) 18240 (18303) 51627<br />
T 16368 (16095) 17100 (16932) 17700 (18140) 51168<br />
D 10764 (11585) 12504 (12187) 13560 (13056) 36828<br />
Σ 43920 46203 49500 139623<br />
X ( 4)<br />
135<br />
2<br />
−28<br />
≅ ; p ≅ 3⋅10<br />
Sunt in<strong>de</strong>pen<strong>de</strong>nte metoda <strong>de</strong> selecţie faţă <strong>de</strong> metoda <strong>de</strong> supravieţuire în ceea ce priveşte<br />
genotipurile participante la regresiile ce produc evoluţie? - NU<br />
χ 2<br />
P T D Σ<br />
P 15902 (15241) 15739 (16172) 17797 (18025) 49438<br />
T 15317 (15044) 16151 (15963) 17331 (17792) 48799<br />
D 9742 (10676) 11572 (11328) 13316 (12626) 34630<br />
Σ 40961 43462 48444 132867<br />
X ( 4)<br />
187<br />
2<br />
−39<br />
≅ ; p ≅ 2⋅10<br />
Sunt in<strong>de</strong>pen<strong>de</strong>nte metoda <strong>de</strong> selecţie faţă <strong>de</strong> metoda <strong>de</strong> supravieţuire în ceea ce priveşte numărul<br />
<strong>de</strong> genotipuri distincte din Top 23 în generaţiile ce produc evoluţie? - NU<br />
χ 2<br />
P T D Σ<br />
P 13 (8) 6 (5) 13 (19) 32<br />
T 13 (11) 8 (7) 21 (24) 42<br />
D 3 (10) 5 (7) 32 (23) 40<br />
Σ 29 19 66 114<br />
X ( 4)<br />
14.<br />
6<br />
2<br />
−3<br />
≅ ; p ≅ 6⋅10<br />
295<br />
−14
Sunt in<strong>de</strong>pen<strong>de</strong>nte metoda <strong>de</strong> selecţie faţă <strong>de</strong> metoda <strong>de</strong> supravieţuire în ceea ce priveşte numărul<br />
total <strong>de</strong> genotipuri din Top 23 în generaţiile ce produc evoluţie? - NU<br />
χ 2<br />
P T D Σ<br />
P 406 (262) 214 (167) 378 (569) 998<br />
T 419 (354) 217 (226) 714 (770) 1350<br />
D 89 (298) 152 (190) 893 (646) 1134<br />
Σ 914 583 1985 3482<br />
X ( 4)<br />
420<br />
2<br />
−89<br />
≅ ; p ≅ 1⋅10<br />
Sunt in<strong>de</strong>pen<strong>de</strong>nte metoda <strong>de</strong> selecţie faţă <strong>de</strong> metoda <strong>de</strong> supravieţuire în ceea ce priveşte<br />
genotipurile din Top 23 participante la regresiile ce produc evoluţie? - NU<br />
χ 2<br />
P T D Σ<br />
P 389 (247) 207 (163) 371 (557) 967<br />
T 405 (333) 213 (220) 687 (751) 1305<br />
D 72 (285) 152 (189) 893 (643) 1117<br />
Σ 866 572 1951 3389<br />
X ( 4)<br />
440<br />
2<br />
−94<br />
≅ ; p ≅ 6⋅10<br />
Se remarcă că confi<strong>de</strong>nţa în <strong>de</strong>pen<strong>de</strong>nţa dintre metoda <strong>de</strong> selecţie şi metoda <strong>de</strong> supravieţuire creşte<br />
în ordinea Număr <strong>de</strong> genotipuri distincte; Număr total <strong>de</strong> genotipuri; Număr <strong>de</strong> genotipuri<br />
participante la regresii în acelaşi timp cu faptul că numărul <strong>de</strong> observaţii nu creşte în aceeaşi ordine.<br />
În baza <strong>de</strong>pen<strong>de</strong>nţei remarcate între metoda <strong>de</strong> selecţie şi cea <strong>de</strong> supravieţuire pentru toţi parametrii<br />
ce caracterizează numărul <strong>de</strong> genotipuri pe parcursul evoluţiei, se impune o caracterizare a acestei<br />
<strong>de</strong>pen<strong>de</strong>nţe.<br />
La întrebarea "Există legătură între cele 3 serii <strong>de</strong> numere <strong>de</strong> genotipuri?" se răspun<strong>de</strong> calculând<br />
coeficientul <strong>de</strong> corelaţie (tabelul <strong>de</strong> mai jos).<br />
Există legătură între numărul <strong>de</strong> genotipuri distincte (NGD), numărul total <strong>de</strong> genotipuri (NTG)<br />
şi numărul <strong>de</strong> genotipuri participante la regresii (NGR)? - DA<br />
Serii Coeficient <strong>de</strong> <strong>de</strong>terminare Valoare F; probabilitate <strong>de</strong> a greşi<br />
924; 10 -15<br />
NGD vs. NTG 0.982 (y=ax)<br />
951; 10 -15<br />
NGD vs. NGR 0.982 (y=ax)<br />
16110; 10 -25<br />
NTG vs. NGR 0.999 (y=ax)<br />
Urmează obţinerea <strong>de</strong> evi<strong>de</strong>nţe că anumite asocieri între metoda <strong>de</strong> selecţie şi metoda <strong>de</strong><br />
supravieţuire sunt semnificativ diferite <strong>de</strong>cât celelalte aşa cum rezultă şi <strong>de</strong> mai jos:<br />
P T D<br />
Ceea ce se observă în figura <strong>de</strong> mai sus, poate fi pus în evi<strong>de</strong>nţă statistic. Astfel, tabelele <strong>de</strong> mai jos<br />
redau această analiză. Analiza se bazează pe calculul intervalului <strong>de</strong> încre<strong>de</strong>re pentru medie şi<br />
<strong>de</strong>viaţie standard în ipoteza că distribuţia <strong>de</strong> eşantionare induce o distribuţie normală a acestor<br />
statistici (ale eşantionului) în jurul parametrului statistic (al populaţiei) asociat. Aşa cum s-a arătat<br />
Teorema Limită Centrală [67] ne asigură că se pot folosi în această analiză statisticile valoare medie<br />
(m) şi abatere standard (s), pe baza cărora se poate exprima intervalul <strong>de</strong> încre<strong>de</strong>re al acestora din<br />
distribuţia Stu<strong>de</strong>nt t folosind relaţiile [ 85 P 13 6 13<br />
T 13 8 21<br />
D 3 5 32<br />
]:<br />
CI( 1−<br />
α,<br />
m)<br />
= m ± t(<br />
α / 2,<br />
N −1)<br />
s N<br />
(24)<br />
⎛<br />
( 1−<br />
α,<br />
s)<br />
= ⎜<br />
s<br />
⎝<br />
n −1<br />
, s<br />
χ ( α / 2,<br />
n −1)<br />
n −1<br />
⎞<br />
⎟<br />
χ (( 1−<br />
α)<br />
/ 2,<br />
n −1)<br />
⎟<br />
⎠<br />
CI (25)<br />
2 2<br />
[ 85 ] Ronald A. FISHER. 1956. Statistical Methods and Scientific Inference. Edinburgh: Oliver & Boyd. p. 178, pp. 32.<br />
296
86<br />
Abateri semnificative statistic (α=5%) în numărul <strong>de</strong> genotipuri [ ]<br />
Genotipuri Observabilă Medie CI(95%,Medie) În afara intervalului*<br />
Top 23 Num 12.7 6 20<br />
Top 23 Apar 387 182 592 (T,D), (D,D) > CIU; (D,P), (D,T) < CIL<br />
Top 23 Part 377 173 580<br />
Total Num 6400 5183 7617 (D,·) < CIL; (P,D), (T,D) > CIU<br />
Total Apar 15514 13522 17505 (D,P), (D,T) < CIL; (P,D), (T,D) > CIU<br />
Total Part 14763 12697 16829 (D,P), (D,T) < CIL; (P,D), (T,D) > CIU<br />
* (Sel,Srv) - Observaţia făcută folosind metoda <strong>de</strong> selecţie Sel şi <strong>de</strong> supravieţuire Srv<br />
(Sel,·) - Observaţiile făcute folosind metoda <strong>de</strong> selecţie Sel şi orice metodă <strong>de</strong> supravieţuire<br />
(·,Srv) - Observaţiile făcute folosind metoda <strong>de</strong> supravieţuire Srv şi orice metodă <strong>de</strong> selecţie<br />
CIL - Limita inferioară a intervalului <strong>de</strong> încre<strong>de</strong>re <strong>de</strong> 95%<br />
CIU - Limita superioară a intervalului <strong>de</strong> încre<strong>de</strong>re <strong>de</strong> 95%<br />
Rezultatele din tabel arată că:<br />
÷ Selecţia <strong>de</strong>terministă (D) face ca:<br />
o Indiferent <strong>de</strong> metoda <strong>de</strong> supravieţuire numărul total <strong>de</strong> genotipuri distincte să scadă<br />
semnificativ statistic;<br />
o Folosind supravieţuirea turnir (T) sau proporţională (P) se remarcă scă<strong>de</strong>re semnificativă<br />
statistic la toţi parametrii observaţi (Top 23 şi Total; Distincţi, Apariţii şi Participări în<br />
regresii) în timp ce folosind supravieţuirea <strong>de</strong>terministă (D) se remarcă creştere semnificativ<br />
statistică numai în ceea ce priveşte cele mai frecvente genotipuri pentru toţi parametrii<br />
(Distincţi, Apariţii şi Participări în regresii);<br />
÷ Supravieţuirea <strong>de</strong>terministă (D) face ca:<br />
o Folosind supravieţuirea turnir (T) sau proporţională (P) să mărească semnificativ numărul<br />
total <strong>de</strong> genotipuri pentru toţi parametrii (Distincţi, Apariţii şi Participări în regresii).<br />
Diferenţe semnificative statistic (α=5%) în numărul <strong>de</strong> genotipuri (medii, abateri)<br />
Geno Obs Grup: Medie; Deviaţie CI(95%,Medie) Dev CI(95%,Dev) În afara intervalului<br />
Top23 Num (P,·): 10.7; 4.0 6 20 9.10 6 17 Dev(P,·)<br />
Top23 Apar (P,·): 333; 104 182 592 266 180 510 Dev(P,·)<br />
Top23 Part (P,·): 322; 100 173 580 265 179 508 Dev(P,·)<br />
Total Num (P,·): 7432; 656 5183 7617 1583 1069 3033 Dev(P,·)<br />
Total Apar (P,·): 17209; 898 13522 17505 2591 1750 4963 Dev(P,·)<br />
Total Part (P,·): 16479; 1144 12697 16829 2687 1815 5148 Dev(P,·)<br />
Top23 Num (T,·): 14.0; 6.6 6 20 9.10 6 17 -<br />
Top23 Apar (T,·): 450; 250 182 592 266 180 510 -<br />
Top23 Part (T,·): 435; 238 173 580 265 179 508 -<br />
Total Num (T,·): 7343; 731 5183 7617 1583 1069 3033 Dev(T,·)<br />
Total Apar (T,·): 17056; 667 13522 17505 2591 1750 4963 Dev(T,·)<br />
Total Part (T,·): 16266; 1012 12697 16829 2687 1815 5148 Dev(T,·)<br />
Top23 Num (D,·): 13.3; 16.2 6 20 9.10 6 17 -<br />
Top23 Apar (D,·): 378; 447 182 592 266 180 510 -<br />
Top23 Part (D,·): 372; 453 173 580 265 179 508 -<br />
Total Num (D,·): 4424; 523 5183 7617 1583 1069 3033 Med(D,·); Dev(D,·)<br />
Total Apar (D,·): 12276; 1412 13522 17505 2591 1750 4963 Med(D,·); Dev(D,·)<br />
Total Part (D,·): 11543; 1787 12697 16829 2687 1815 5148 Med(D,·); Dev(D,·)<br />
Top23 Num (·,P): 9.7; 5.8 6 20 9.10 6 17 Dev(·,P)<br />
Top23 Apar (·,P): 305; 187 182 592 266 180 510 -<br />
Top23 Part (·,P): 289; 188 173 580 265 179 508 -<br />
Total Num (·,P): 5740; 1578 5183 7617 1583 1069 3033 -<br />
[ 86 ] Valori calculate cu STATISTICA v.8.0 (©1984-2008), StatSoft Inc. în baza formulelor (24) şi (25).<br />
297
Total Apar (·,P): 14640; 3363 13522 17505 2591 1750 4963 -<br />
Total Part (·,P): 13654; 3400 12697 16829 2687 1815 5148 -<br />
Top23 Num (·,T): 6.3; 1.5 6 20 9.10 6 17 Dev(·,T)<br />
Top23 Apar (·,T): 194; 37 182 592 266 180 510 Dev(·,T)<br />
Top23 Part (·,T): 191; 34 173 580 265 179 508 Dev(·,T)<br />
Total Num (·,T): 6653; 1462 5183 7617 1583 1069 3033 -<br />
Total Apar (·,T): 15401; 2521 13522 17505 2591 1750 4963 -<br />
Total Part (·,T): 14487; 2533 12697 16829 2687 1815 5148 -<br />
Top23 Num (·,D): 22.0; 9.5 6 20 9.10 6 17 Med(·,D)<br />
Top23 Apar (·,D): 662; 261 182 592 266 180 510 Med(·,D)<br />
Top23 Part (·,D): 650; 263 173 580 265 179 508 Med(·,D)<br />
Total Num (·,D): 6806; 2098 5183 7617 1583 1069 3033 -<br />
Total Apar (·,D): 16500; 2560 13522 17505 2591 1750 4963 -<br />
Total Part (·,D): 16148; 2464 12697 16829 2687 1815 5148 -<br />
Rezultatele din tabel arată că:<br />
÷ Supravieţuirea <strong>de</strong>terministă (D) îmbogăţeşte semnificativ statistic grupul celor mai frecvente<br />
genotipuri (Top23) din generaţiile ce produc evoluţie în timp ce selecţia <strong>de</strong>terministă (D)<br />
sărăceşte semnificativ statistic numărul total al genotipurilor din generaţiile care produc<br />
evoluţie;<br />
÷ Practic fiecare metodă <strong>de</strong> selecţie <strong>de</strong>fineşte câte o populaţie genotipică în generaţiile care<br />
produc evoluţie; argumentul este că oricare ar fi parametrul urmărit pentru numărul total <strong>de</strong><br />
genotipuri (Distincţi, Apariţii şi Participări în regresii), şi luând pentru exemplificare numărul <strong>de</strong><br />
genotipuri distincte (Num), avem:<br />
o Varianţa totală: 1583 2 cu intervalul <strong>de</strong> încre<strong>de</strong>re <strong>de</strong> 95%: [1069 2 , 3033 2 ];<br />
o Varianţa populaţiei produse <strong>de</strong> selecţia proporţională (P): 656 2 < 1069 2 ;<br />
o Varianţa populaţiei produse <strong>de</strong> selecţia turnir (T): 731 2 < 1069 2 ;<br />
o Varianţa populaţiei produse <strong>de</strong> selecţia proporţională (P): 523 2 < 1069 2 ;<br />
÷ Nu aceeaşi concluzie se poate trage cu privire la metoda <strong>de</strong> supravieţuire, pentru care se produce<br />
segregare populaţională doar pentru supravieţuirea <strong>de</strong>terministă (D), care creează o populaţie cu<br />
un număr mediu <strong>de</strong> genotipuri semnificativ statistic mai mare <strong>de</strong>cât supravieţuirea proporţională<br />
(P) şi respectiv turnir (T).<br />
Pe baza rezultatelor experimentale un alt parametru important al evoluţiei poate fi interpretat:<br />
numărul <strong>de</strong> generaţii care produc evoluţie în cursul execuţiei cu număr impus <strong>de</strong> generaţii (20000)<br />
ca măsură a capacităţii <strong>de</strong> adaptare <strong>de</strong>finită <strong>de</strong> combinaţia celor două meto<strong>de</strong> (<strong>de</strong> selecţie şi<br />
supravieţuire) precum şi valoarea medie a numerelor generaţiilor care produc evoluţie ca măsură a<br />
vitezei <strong>de</strong> adaptare.<br />
Rezultatele au fost prelucrate astfel: pentru fiecare execuţie in<strong>de</strong>pen<strong>de</strong>ntă a algoritmului genetic sau<br />
consemnat numerele consecutive ale generaţiilor care au produs îmbunătăţirea valorii funcţiei<br />
obiectiv, şi anume s-a obţinut o ecuaţie <strong>de</strong> regresie validă (toţi coeficienţii sunt semnificativi<br />
statistic) cu un coeficient <strong>de</strong> <strong>de</strong>terminare mai mare <strong>de</strong>cât cel obţinut în generaţiile anterioare. S-a<br />
calculat apoi valoarea medie a acestui număr (care tot<strong>de</strong>auna este mai mic <strong>de</strong>cât numărul maxim <strong>de</strong><br />
generaţii al unei execuţii) şi numărul <strong>de</strong> evoluţii distincte (numărul <strong>de</strong> valori), informaţii care sunt<br />
prezentate în tabel. Întrucât ambele valori (media şi numărul <strong>de</strong> valori) au fost obţinute printr-o<br />
repetare (<strong>de</strong> 46 <strong>de</strong> ori) a experimentului pentru fiecare pereche <strong>de</strong> meto<strong>de</strong> (selecţie, supravieţuire)<br />
valorile obţinute aproximează distribuţia <strong>de</strong> eşantionare, astfel încât s-a putut presupune<br />
aproximaţia la normalitate a acestora (atât ele ca valori ale eşantionului <strong>de</strong> 46 <strong>de</strong> observaţii) cât şi<br />
populaţia din care provin, care aşa cum s-a dovedit mai sus este caracteristică (distinctă) cel puţin<br />
după metoda <strong>de</strong> selecţie. Pentru a se realiza compararea perechilor <strong>de</strong> meto<strong>de</strong> (selecţie,<br />
supravieţuire) informaţiile din tabelul <strong>de</strong> mai jos au fost supuse unei analize statistice <strong>de</strong>scriptive,<br />
care a inclus calcularea valorilor medii şi a <strong>de</strong>viaţiilor standard, împreună cu intervalele <strong>de</strong><br />
încre<strong>de</strong>re la un nivel <strong>de</strong> semnificaţie <strong>de</strong> 95%, rezultate care sunt redate în continuare.<br />
298
Generaţii ce produc evoluţii (număr şi medie) pentru 46 <strong>de</strong> execuţii in<strong>de</strong>pen<strong>de</strong>nte<br />
run (T,T) (T,D) (T,P) (D,T) (D,D) (D,P) (P,T) (P,D) (P,P)<br />
1 17 3744 26 2884 12 412 12 2662 17 1424 7 2632 52 2840 22 1734 37 3423<br />
2 27 2096 27 4704 40 5115 13 3854 19 2295 25 2780 20 1565 36 4446 19 4916<br />
3 26 1134 32 3531 28 1545 30 2714 24 2099 13 1653 29 1808 30 4095 38 2499<br />
4 27 2746 18 241 16 413 17 2981 36 1084 26 3317 16 3952 27 5396 36 2856<br />
5 28 3299 42 1655 13 2314 32 3079 27 3133 22 4913 20 977 36 5462 23 817<br />
6 20 1717 49 2398 17 1704 25 1500 8 4697 25 3235 27 488 24 653 28 4255<br />
7 19 1059 38 2103 36 4749 34 6709 25 3382 20 4528 28 1764 39 2646 28 1710<br />
8 23 3173 38 1781 20 852 23 5272 23 8355 17 3865 35 2491 23 2060 20 2335<br />
9 37 1034 34 3449 44 3596 12 822.1 33 5814 21 3523 30 1485 28 3264 40 7250<br />
10 18 5046 39 5952 22 1762 14 3647 36 4260 19 5019 17 3345 38 7288 61 5790<br />
11 36 2516 19 3191 15 599 27 3174 11 2849 24 2135 31 564 33 2193 33 4844<br />
12 25 3190 35 4744 24 4942 27 2511 26 6400 24 4675 33 1795 38 4015 33 8315<br />
13 35 907 26 1479 38 2803 21 9086 6 32 14 6338 39 4880 49 5570 33 3103<br />
14 48 4672 20 3958 25 4738 15 8139 32 8734 5 718 22 5116 18 1607 43 3602<br />
15 36 1657 44 4893 39 2839 19 3227 32 5209 4 232 40 6560 20 2896 27 736<br />
16 21 991 24 246 36 1749 12 2503 20 1317 10 2984 34 11086 50 3292 28 3195<br />
17 56 6242 41 1806 27 1707 33 4121 29 6367 31 5316 26 1555 28 964 46 4860<br />
18 24 1773 33 4545 23 5670 18 4119 27 4520 28 3645 45 2394 49 7685 19 1589<br />
19 29 1059 19 6112 23 1141 23 5796 11 992 16 1458 36 4459 14 1378 21 5115<br />
20 23 3851 30 3557 28 710 23 1558 22 3669 6 3335 42 4816 45 3543 35 3731<br />
21 31 1928 25 1302 38 2767 17 5730 20 3094 18 8798 36 2526 18 2795 45 1216<br />
22 37 699 25 2320 31 4964 18 4596 29 5753 15 576 41 1993 17 790 33 3505<br />
23 37 2148 20 4900 14 2292 32 3934 42 5110 14 5037 47 8925 47 2020 34 3427<br />
24 31 5706 20 8773 26 555 10 2962 46 4439 19 3209 13 1954 24 1985 28 1930<br />
25 21 2297 35 2497 47 1827 17 2966 25 2590 14 3056 20 1558 40 2493 26 1915<br />
26 17 4759 29 2069 28 6925 21 5171 20 7232 24 6650 25 1430 46 3584 17 985<br />
27 37 5362 28 2554 29 6977 19 5248 32 4013 13 2644 31 4939 32 3002 36 5643<br />
28 18 2531 38 1395 34 1976 4 877 18 3256 24 10910 33 1617 32 1810 18 798<br />
29 50 3231 38 975 18 3132 22 2462 25 7589 34 6637 26 937 56 5874 32 3690<br />
30 37 3887 51 6828 43 6310 20 5512 18 4664 10 3450 44 1598 28 4147 26 3217<br />
31 23 3474 29 1921 20 1908 21 1825 26 4596 11 1884 34 2606 22 2664 14 1854<br />
32 18 1130 34 3467 20 353 35 7361 32 2518 6 15 32 2099 40 5477 12 931<br />
33 36 3597 20 1300 23 2535 15 1754 33 4615 25 5651 26 4976 19 12799 21 2169<br />
34 32 516 22 5830 30 3108 43 8655 6 4893 30 4578 27 4334 42 2904 13 4336<br />
35 27 3186 42 5272 64 3288 15 3252 31 5858 13 1222 32 3064 29 1348 30 2081<br />
36 36 4600 39 4125 22 4620 14 3278 14 3301 14 5456 57 4468 28 3003 32 3050<br />
37 30 5061 16 3154 31 1345 23 4881 28 5105 27 887 33 8163 35 8225 23 4708<br />
38 25 2055 40 4141 32 7258 24 4122 13 2382 22 2577 44 4311 20 819 38 4541<br />
39 27 1018 23 3269 17 2075 43 4545 18 5421 29 2232 35 6333 33 4784 40 853<br />
40 26 1039 46 1892 50 4306 24 5563 22 631 10 177 23 887 26 1155 8 792<br />
41 31 8549 20 1763 18 1954 15 3522 34 3061 21 6100 26 2593 29 360 25 4508<br />
42 19 2272 22 772 56 7329 21 2441 22 3782 14 5815 26 1904 35 3286 24 1084<br />
43 47 5746 23 3095 21 1484 13 2313 19 2516 23 6353 25 3230 44 1418 40 3994<br />
44 38 2142 39 6810 26 1454 36 4964 8 3765 10 2492 34 495 29 2954 34 3491<br />
45 34 1432 32 4117 30 2757 27 2673 24 6675 34 2471 38 6027 26 2764 31 4802<br />
46 39 4481 39 4332 24 1277 17 1635 15 6036 20 5650 33 944 30 758 25 2566<br />
299
Statistici ale evoluţiei algoritmului genetic în funcţie <strong>de</strong> selecţie şi supravieţuire<br />
Parametru Medie CI(95%,Medie) Deviaţie CI(95%,Deviaţie)<br />
m(D,D) 4120 3518 4722 2027 1681 2553<br />
m(D,T) 3907 3326 4488 1957 1623 2465<br />
m(D,P) 3714 3032 4396 2296 1904 2892<br />
m(P,D) 3335 2631 4039 2369 1965 2984<br />
m(T,D) 3307 2748 3866 1882 1561 2371<br />
m(P,T) 3214 2520 3908 2338 1939 2945<br />
m(P,P) 3196 2671 3722 1770 1468 2229<br />
m(T,T) 2929 2400 3458 1781 1478 2244<br />
m(T,P) 2916 2322 3510 2001 1660 2520<br />
n(P,D) 32.0 29.0 35.1 10.1 8.4 12.8<br />
n(P,T) 31.8 29.0 34.6 9.3 7.7 11.7<br />
n(T,D) 31.1 28.3 33.8 9.2 7.7 11.6<br />
n(T,T) 30.0 27.2 32.7 9.3 7.7 11.7<br />
n(P,P) 29.4 26.4 32.4 10.2 8.4 12.8<br />
n(T,P) 28.7 25.2 32.1 11.5 9.5 14.5<br />
n(D,D) 23.6 20.8 26.3 9.2 7.6 11.6<br />
n(D,T) 21.7 19.1 24.2 8.5 7.1 10.8<br />
n(D,P) 18.5 16.2 20.8 7.9 6.5 9.9<br />
Analizând valorile prezentate în tabelul <strong>de</strong> mai sus în ceea ce priveşte valorile medii şi intervalele<br />
<strong>de</strong> încre<strong>de</strong>re ale acestora pentru media generaţiilor care produc evoluţii, se remarcă că selecţia<br />
<strong>de</strong>terministă (şi cu atât mai mult însoţită <strong>de</strong> supravieţuirea <strong>de</strong>terministă) produce cele mai târzii<br />
evoluţii, în timp ce selecţia turnir (şi cu atât mai mult însoţită <strong>de</strong> supravieţuirea proporţională sau<br />
turnir) produce cele mai timpurii evoluţii (Figura 1).<br />
Analizând valorile în ceea ce priveşte numărul <strong>de</strong> evoluţii intervalele <strong>de</strong> încre<strong>de</strong>re ale acestora<br />
pentru generaţiile care produc evoluţii, se remarcă că selecţia proporţională (şi cu atât mai mult<br />
însoţită <strong>de</strong> supravieţuirea <strong>de</strong>terministă sau turnir) produce cele mai multe evoluţii, în timp ce<br />
selecţia <strong>de</strong>terministă (şi cu atât mai mult însoţită <strong>de</strong> supravieţuirea proporţională sau turnir) produce<br />
cele mai puţine evoluţii (Figura 2).<br />
De remarcat <strong>de</strong> asemenea că în ceea ce priveşte frecvenţa evoluţiilor (Figura 2) o selecţie<br />
proporţională aproape că nu face diferenţa între supravieţuirea <strong>de</strong>terministă şi supravieţuirea în<br />
turnir (medii 32 şi 31.8, cu intervale <strong>de</strong> încre<strong>de</strong>re rotunjite la întreg egale) în timp ce viteza<br />
evoluţiilor (Figura 1) aceeaşi selecţie proporţională nu face diferenţa între valoarea medie pentru<br />
supravieţuirea proporţională şi turnir (diferenţa <strong>de</strong> 150 între valorile medii reprezentând cel mult<br />
30% din lărgimea intervalului <strong>de</strong> încre<strong>de</strong>re la oricare dintre ele.<br />
(Deterministic, Deterministic)<br />
(Proporţional, Deterministic)<br />
(Turnir, Deterministic)<br />
(Proporţional, Turnir)<br />
(Proporţional, Proporţional)<br />
(Turnir, Turnir)<br />
(Turnir, Proporţional)<br />
(Deterministic, Turnir)<br />
(Deterministic, Proporţional)<br />
Timpuriu Târziu<br />
Figura 1. Cât <strong>de</strong> timpuriu se produc evoluţiile<br />
300
Rar<br />
(D, P)<br />
(D, T)<br />
Figura 2. Cât <strong>de</strong> frecvent se produc evoluţiile<br />
(P, D)<br />
(T, T)<br />
(P, P)<br />
Compact Dispers<br />
Figura 3. Cât <strong>de</strong> dispers se produc evoluţiile<br />
(T, P)<br />
(D, P)<br />
(D, T)<br />
(D, D)<br />
(P, T)<br />
(T, T)<br />
(T, D)<br />
(D, D)<br />
(D, D)<br />
(T, P)<br />
(D, T)<br />
(T, D)<br />
(P, P)<br />
(P, D)<br />
(P, T)<br />
(D, P)<br />
(P, P)<br />
(T, P)<br />
(T, T)<br />
(T, D)<br />
(P, D)<br />
(P, T)<br />
Predictibil<br />
Impredictibil<br />
Figura 4. Cât <strong>de</strong> predictibil se produc evoluţiile<br />
În ceea ce priveşte variabilitatea vitezei <strong>de</strong> evoluţie (Figura 3) se remarcă că meto<strong>de</strong>le produc<br />
rezultate relativ mai grupate (relativ la rezultatele pentru valori medii), cea mai bună constanţă a<br />
vitezei <strong>de</strong> evoluţie având perechile (selecţie proporţională, supravieţuire proporţională) şi (selecţie<br />
în turnir, supravieţuire în turnir) în timp ce cea mai mare inconstanţă se observă la selecţia<br />
proporţională şi supravieţuirea <strong>de</strong>terministă urmată în<strong>de</strong>aproape <strong>de</strong> selecţia <strong>de</strong>terministă şi<br />
supravieţuirea proporţională.<br />
În ceea ce priveşte variabilitatea frecvenţei evoluţiei (Figura 4) se remarcă că o serie <strong>de</strong> patru<br />
asocieri <strong>de</strong> meto<strong>de</strong> <strong>de</strong> selecţie şi supravieţuire produc rezultate similare sub aspectul variabilităţii<br />
frecvenţei <strong>de</strong> evoluţie: (D,D), (T,D), (T,T) şi (P,T); valori extreme ale variabilităţii frecvenţei<br />
301<br />
Des
evoluţiei obţin asocierea (selecţie <strong>de</strong>terministă, supravieţuire proporţională) - cu cea mai mică<br />
variabilitate a frecvenţei <strong>de</strong> evoluţie şi (selecţia în turnir, supravieţuirea proporţională) - cu cea mai<br />
mare variabilitate a frecvenţei <strong>de</strong> evoluţie.<br />
Diversitate<br />
Genotipuri [%]<br />
Consangvinizare<br />
36<br />
32<br />
28<br />
24<br />
20<br />
16<br />
12<br />
8<br />
4<br />
0<br />
N(Top23) A(Top23) P(Top23) N(Total) A(Total) P(Total)<br />
(D,D) (D,T) (D,P) (T,D) (T,T) (T,P) (P,D) (P,T) (P,P)<br />
(Selectie,Supravietuire)<br />
Legendă: Top23: lista genotipurilor cu cel puţin 23 <strong>de</strong> apariţii (50% din max. 46)<br />
Total: lista tuturor genotipurilor<br />
N(·): număr <strong>de</strong> genotipuri<br />
A(·): număr <strong>de</strong> apariţii<br />
P(·): număr <strong>de</strong> reprezentări în regresiile ce creează asocieri vali<strong>de</strong> între fenotipuri<br />
Figura 5. Diversitate în evoluţie<br />
Informaţiile cu privire la variabilitatea genotipică în cultivar în generaţiile ce produc<br />
evoluţie se poate obţine prelucrând informaţiile. Astfel, pentru fiecare din cei şase parametrii<br />
urmăriţi (număr <strong>de</strong> genotipuri cu 23 şi peste apariţii în 46 <strong>de</strong> execuţii in<strong>de</strong>pen<strong>de</strong>nte - N(Top23),<br />
număr <strong>de</strong> apariţii ale acestor genotipuri - A(Top23), număr <strong>de</strong> participări efective în ecuaţii <strong>de</strong><br />
regresie - P(Top23), număr total <strong>de</strong> genotipuri distincte prezente în generaţiile ce produc evoluţie -<br />
N(Total), număr <strong>de</strong> apariţii ale acestora în materialul genetic din cultivar - A(Total), şi număr <strong>de</strong><br />
participări efective ale acestora în ecuaţii <strong>de</strong> regresie - P(Total) - vezi Figura 5) transformând<br />
frecvenţele <strong>de</strong> apariţie observate în proporţii relative la cele nouă perechi <strong>de</strong> meto<strong>de</strong> (selecţie,<br />
supravieţuire) se observă că:<br />
÷ Cele mai mari discrepanţe între proporţiile numerelor <strong>de</strong> genotipuri sunt prezente pentru selecţia<br />
<strong>de</strong>terministă însoţită <strong>de</strong> o supravieţuire <strong>de</strong>terministă - perechea (D,D) - un<strong>de</strong> proporţia apariţiei<br />
genotipurilor în materialul genetic se cel puţin înjumătăţeşte <strong>de</strong> la Top23 către întregul conţinut<br />
al materialului genetic ceea ce sugerează că o evoluţie bazată pe selecţia <strong>de</strong>terministă însoţită <strong>de</strong><br />
o supravieţuire <strong>de</strong>terministă induce o înmulţire preferenţială a celor mai adaptate genotipuri; în<br />
acelaşi timp, situaţia este inversată dacă supravieţuirea se face proporţional sau în turnir -<br />
perechile (D,T) şi (D,P) - un<strong>de</strong> proporţia apariţiei genotipurilor în materialul genetic se cel puţin<br />
dublează <strong>de</strong> la Top23 către întregul conţinut al materialului genetic ceea ce sugerează că o<br />
evoluţie bazată pe selecţia <strong>de</strong>terministă însoţită <strong>de</strong> o supravieţuire proporţională sau în turnir<br />
induce o înmulţire preferenţială pentru un număr cât mai mare <strong>de</strong> genotipuri diferite;<br />
÷ În extrema opusă a situaţiei generate <strong>de</strong> selecţia <strong>de</strong>terministă se află selecţia proporţională; aşa<br />
cum se poate observa selecţia proporţională însoţită <strong>de</strong> supravieţuirea proporţională face ca<br />
proporţiile <strong>de</strong> apariţie ale celor mai frecvente genotipuri (Top23) să nu difere semnificativ <strong>de</strong><br />
proporţiile <strong>de</strong> apariţie pentru numărul total <strong>de</strong> genotipuri, ceea ce sugerează că genotipurile sunt<br />
prezente în mod uniform (distribuţie uniformă) în materialul genetic - fiecare având o aceeaşi<br />
şansă <strong>de</strong> apariţie.<br />
302
2010A5. Construirea bazei <strong>de</strong> date cu cunoştinţe Compus chimic - Mo<strong>de</strong>l cuantic 3D -<br />
Descriptori moleculari - Proprietăţi fizico-bio-chimice - Activităţi terapeutice<br />
S-a creat baza <strong>de</strong> cunoştinţe, strusctura şi proprietăţile aceastei fiind valorificate pe parcursul<br />
<strong>de</strong>rulării proiectului sub formă <strong>de</strong> postere (Bolboacă & Jäntschi, 2008-SASA) şi prezentări orale<br />
(Jäntschi & Bolboacă, 2008-MQMC) la conferinţe internaţionale şi respectiv publicaţii (Bolboacă &<br />
others, 2009-MDFV)<br />
Următoarea imagine redă structura bazei <strong>de</strong> cunoştinţe împreună cu acţiunile <strong>de</strong> maganement al<br />
cunoştinţelor care au fost <strong>de</strong>zvoltate.<br />
Baza <strong>de</strong> date cu cunoştinţe Compus chimic - Mo<strong>de</strong>l cuantic 3D - Descriptori moleculari -<br />
Proprietăţi fizico-bio-chimice - Activităţi terapeutice - din (Bolboacă & Jäntschi, 2008-SASA)<br />
Analiza cunoştinţelor stocate în sistem se realizează cu o serie <strong>de</strong> aplicaţii statistice <strong>de</strong>zvoltate în<br />
acest sens, figurile următoare ilustrând acest proces - adaptate după (Bolboacă & Jäntschi, 2008-<br />
SASA):<br />
(1) Simple correlation analysis; Inter-correlation (2) Qualitative vs. quantitative analysis<br />
analysis; Multiple correlation analysis<br />
303
(3) Leave-one-out cross-validation analysis (4) Training vs. test experiment<br />
(5) Correlated correlations analysis (6) MDF Predictor<br />
2010A6. Proiectarea portalului web, Implementarea algoritmilor <strong>de</strong> interogare, Publicarea<br />
portalului web<br />
Portalul web a fost publicat. Următoarele imagini sunt <strong>de</strong>monstrative în acest sens:<br />
Portalul "MDFV"<br />
304
Portalul "MDF"<br />
Portalul "Statistics"<br />
305
Livrabile<br />
Următoarea listă conţine referinţele raportului <strong>de</strong> <strong>cercetare</strong> între care se află şi livrabilele (marcate<br />
pe fond ver<strong>de</strong>) şi alte lucrări ştiinţifice care au rezultat pe perioada <strong>de</strong> <strong>de</strong>rulare a grantrului, sunt în<br />
inci<strong>de</strong>nţă cu activităţile <strong>de</strong>sfăşurate în acesta dar nu sunt datorate în mod neapărat <strong>de</strong>rulării<br />
activităţilor din proiect, astfel nefiind raportate ca livrabile.<br />
(Bălan & others, 2008-SRDI): Mugur C. BĂLAN, Mihai DAMIAN, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>,<br />
Preliminary Results on Design and Implementation of a Solar Radiation Monitoring System,<br />
Sensors, Molecular Diversity Preservation International, ISSN 1424-8220, Basel, Switzerland,<br />
8(2), p. 963-978, 2008.<br />
(Bălan & others, 2008-SRMS): Mugur BĂLAN, Mihai DAMIAN, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Solar<br />
Radiation Monitoring System, Proceedings of the 36-th international symposium on agricultural<br />
engineering: Actual Tasks on Agricultural Engineering, Agricultural Engineering Department,<br />
Faculty of Agriculture, University of Zagreb, ISSN 1333-2651, February 11-15, Opatija, Croatia,<br />
p. 507-517, 2008.<br />
(Bălan & others, 2010): Mugur C. BĂLAN, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Mihai<br />
DAMIAN, Assessment of Thermal Solar Collectors Behaviour in Transitory Regime, Polish<br />
Journal of Environmental Studies, Hard Publishing Company, ISSN 1230-1485, Olsztyn, Poland,<br />
19(1), p. 231-241, 2010.<br />
(Bolboacă & Jäntschi, 2005): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Molecular<br />
Descriptors Family on Structure Activity Relationships 2. Insecticidal Activity of Neonicotinoid<br />
Compounds, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233, www, Internet,<br />
4(6), p. 78-85, 2005.<br />
(Bolboacă & Jäntschi, 2005): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Molecular<br />
Descriptors Family on Structure Activity Relationships 3. Antituberculotic Activity of some<br />
Polyhydroxyxanthones, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233, www,<br />
Internet, 4(7), p. 58-64, 2005.<br />
(Bolboacă & Jäntschi, 2005-CILR): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Binomial<br />
Distribution Sample Confi<strong>de</strong>nce Intervals Estimation for Positive and Negative Likelihood Ratio<br />
Medical Key Parameters, Annual Symposium on Biomedical and Health Informatics [Special<br />
Issue: from Foundations to Applications to Policy (Proc. CD, October 22-26, Washington D.C.,<br />
USA)], American Medical Informatics Association, Bethesda, Maryland, USA, ISSN 1559-4076,<br />
Washington D.C., USA, #CD, p. 66-70, PMID: 16779003, 2005.<br />
(Bolboacă & Jäntschi, 2006): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Molecular Descriptors<br />
Family on Structure-Activity Relationships: Mo<strong>de</strong>ling Herbicidal Activity of Substituted<br />
Triazines Class, Bulletin of University of Agricultural Sciences and Veterinary Medicine -<br />
Agriculture, Aca<strong>de</strong>micPres, ISSN 1454-2382, Cluj-Napoca, Romania, 62, p. 35-40, 2006.<br />
(Bolboacă & Jäntschi, 2006-SPMA): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Activity<br />
Characterization of Triazines Analogues: Statistical Parameters for Mo<strong>de</strong>ls Assessment,<br />
International Symposium on Organic Chemistry, December 9-12, 2006, Avangard Prisma, ISBN<br />
954-323-243-1 & 978-954-323-243-7, Sofia, Bulgaria, p. 48-49 [Plenary oral presentation],<br />
December 9-12, 2006.<br />
(Bolboacă & Jäntschi, 2007): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Structure versus<br />
Biological Role of Substituted Thiadiazole- and Thiadiazoline- Disulfonami<strong>de</strong>s, Studii si<br />
Cercetari Stiintifice Universitatea Bacau Seria Biologie, Universitatea Bacau, ISSN 1224-919X,<br />
Bacau, Romania, 12(1), p. 50-56, 2007.<br />
(Bolboacă & Jäntschi, 2007): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mo<strong>de</strong>ling Analysis of<br />
Amino Acids Hydrophobicity, ChemMod 2007 - Chemical Graph Theory and Molecular<br />
Mo<strong>de</strong>ling Workshop, Faculty of Chemistry and Chemical Engineering of Babes-Bolyai<br />
University and European Society of Mathematical Chemistry, Oral Presentation #6, Cluj-Napoca,<br />
Romania, October 23-26, p. 6, 2007.<br />
306
(Bolboacă & Jäntschi, 2007-AAHS): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Is Amino<br />
Acids Hydrophobicity a Matter of Scale?, Recent Advances in Synthesys & Chemical Biology<br />
VI, Centre for Synthesis & Chemical Biology, University of Dublin, Symposium, 14th December<br />
2007, Dublin, Ireland, P2, 2007.<br />
(Bolboacă & Jäntschi, 2007-BCIO): Sorana-Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Are<br />
confi<strong>de</strong>nce intervals for binomial distributed samples an optimization meters?, Fourth<br />
International Conference of Applied Mathematics and Computing, August 12-18, 2007,<br />
University of Chemical Technology and Metallurgy Sofia & Technical University of Plovdiv,<br />
Invited lecture, presented on August 13, from 18.00 to 18.30, Plovdiv, Bulgaria, p. 47, 2007.<br />
(Bolboacă & Jäntschi, 2007-CRRF): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Communication<br />
of Results on Risk Factors Studies: Confi<strong>de</strong>nce Intervals, Leonardo Journal of Sciences,<br />
Aca<strong>de</strong>micDirect, ISSN 1583-0233, www, Internet, 6(10), p. 179-187, 2007.<br />
(Bolboacă & Jäntschi, 2007-DMRM): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Data Mining<br />
on Structure-Activity/Property Relationships Mo<strong>de</strong>ls, ECCC11- The 11th Electronic<br />
Computational Chemistry Conference, online, Monmouth University, New Jersey, USA, N/A,<br />
www, Internet, paper #29, Presentation located here, April 2-30, 2007.<br />
(Bolboacă & Jäntschi, 2007-DMRM): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Data Mining<br />
on Structure-Activity/Property Relationships Mo<strong>de</strong>ls, World Applied Sciences Journal, IDOSI<br />
Publications, ISSN 1818-4952, www, Internet & Faisalabad, Pakistan, 2(4), p. 323-332, 2007.<br />
(Bolboacă & Jäntschi, 2007-DoE): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Design of<br />
Experiments: Useful Orthogonal Arrays for Number of Experiments from 4 to 16, Entropy,<br />
Molecular Diversity Preservation International, ISSN 1099-4300, Basel & www, Switzerland &<br />
Internet, 9(4), p. 198-232, Zbl 1135.62359, 2007.<br />
(Bolboacă & Jäntschi, 2007-HGCP): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, How Good the<br />
Characteristic Polynomial Can Be for Correlations?, International Journal of Molecular Sciences,<br />
Molecular Diversity Preservation International, ISSN 1422-0067, www & Basel, Internet &<br />
Switzerland, 8(4), p. 335-345, CAN 147:276982, 2007.<br />
(Bolboacă & Jäntschi, 2007-MCSC): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mapping<br />
Cigarettes Similarities using Cluster Analysis Methods, International Journal of Environmental<br />
Research and Public Health, Molecular Diversity Preservation International, ISSN 1660-4601,<br />
www & Basel, Internet & Switzerland, 4(3), p. 233-242, PMID 17911663, CAN 148:303722,<br />
2007.<br />
(Bolboacă & Jäntschi, 2007-SAHZ): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Similarities<br />
Analysis on Hydroxyapatite-Zirconia Composites, Leonardo Journal of Sciences,<br />
Aca<strong>de</strong>micDirect, ISSN 1583-0233, www, Internet, 11(6), p. 153-164, CAN 148:61815, 2007.<br />
(Bolboacă & Jäntschi, 2007-SMMV): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>,<br />
Mo<strong>de</strong>ling the Property of Compounds from Structure: Statistical Methods for Mo<strong>de</strong>ls Validation,<br />
Institute of General and Inorganic Chemistry, Bulgarian Aca<strong>de</strong>my of Sciences<br />
[http://sizemat.igic.bas.bg], FP6: EC-INCO-CT-2005-016414 Specific Support Action, Plovdiv,<br />
Bulgaria, p. 71, April 19-21, 2007.<br />
(Bolboacă & Jäntschi, 2007-SPBP): Sorana-Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Structure-<br />
Property Based Mo<strong>de</strong>l Estimation of Alkanes Boiling Points, Fourth International Conference of<br />
Applied Mathematics and Computing, August 12-18, 2007, University of Chemical Technology<br />
and Metallurgy Sofia & Technical University of Plovdiv, Invited lecture, presented on August 13,<br />
from 18.30 to 19.00, Plovdiv, Bulgaria, p. 48, 2007.<br />
(Bolboacă & Jäntschi, 2008): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Structure Activity<br />
Relationships of Taxoids therein Molecular Descriptors Family Approach, Archives of Medical<br />
Science, Termedia sp. z o.o., ISSN 1734-1922; eISSN 1896-9151, Poznan, Poland, 4(1), p. 7-15,<br />
2008.<br />
(Bolboacă & Jäntschi, 2008): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Structure-Property<br />
Based Mo<strong>de</strong>l for Alkanes Boiling Points, International Journal of Pure and Applied Mathematics,<br />
Aca<strong>de</strong>mic Publications, ISSN 1311-8080, Sofia, Bulgaria, 47(1), p. 23-30, Zbl pre05492618,<br />
307
2008.<br />
(Bolboacă & Jäntschi, 2008-ABCI): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Assessment of<br />
Confi<strong>de</strong>nce Intervals used in Medical Studies, Aca<strong>de</strong>micPres & Aca<strong>de</strong>micDirect, ISBN 978-973-<br />
744-107-2 & ISBN 978-973-86211-2-1, Cluj-Napoca & www, Romania & Internet, p. 234 (+p.<br />
10 intro), 2008.<br />
(Bolboacă & Jäntschi, 2008-ICPT): Sorana D. BOLBOACA, <strong>Lorentz</strong> JANTSCHI, Homo Sapiens<br />
Type I Collagen: Patterns Analysis, Applied Medical Informatics, 22(1-2), 39-46, 2008.<br />
(Bolboacă & Jäntschi, 2008-OCIB): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Optimized<br />
Confi<strong>de</strong>nce Intervals for Binomial Distributed Samples, International Journal of Pure and<br />
Applied Mathematics, Aca<strong>de</strong>mic Publications, ISSN 1311-8080, Sofia, Bulgaria, 47(1), p. 1-8,<br />
Zbl pre05492615, 2008.<br />
(Bolboacă & Jäntschi, 2008-SASA): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Statistical<br />
Approach of Structure-Activity Relationships: A Case Study, Strasbourg Summer School on<br />
Chemoinformatics, Louis Pasteur University, June 22-25, Obernai, France, #3, 2008.<br />
(Bolboacă & Jäntschi, 2008-SMMV): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mo<strong>de</strong>lling the<br />
property of compounds from structure: statistical methods for mo<strong>de</strong>ls validation, Environmental<br />
Chemistry Letters, Springer, ISSN 1610-3653, eISSN 1610-3661, Berlin, Germany, 6(3), p. 175-<br />
181, DOI: 10.1007/s10311-007-0119-9, 2008.<br />
(Bolboacă & Jäntschi, 2009-CCqD): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Comparison of<br />
QSAR Performances on Carboquinone Derivatives, TheScientificWorldJOURNAL,<br />
TheScientificWorld, ISSN 1537-744X, Kirkkonummi, Finland, 9(10), p. 1148-1166, DOI:<br />
10.1100/tsw.2009.131, PMID: 19838601, 2009.<br />
(Bolboacă & Jäntschi, 2009-DF3): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Distribution<br />
Fitting 3. Analysis un<strong>de</strong>r normality assumption, Bulletin of University of Agricultural Sciences<br />
and Veterinary Medicine Cluj-Napoca. Horticulture, Aca<strong>de</strong>micPres, ISSN 1843-5254, eISSN<br />
1843-5394, Cluj-Napoca, Romania, 66(2), p. 698-705, 2009.<br />
(Bolboacă & Jäntschi, 2010-DqPM): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Diagnostic of a<br />
qSPR mo<strong>de</strong>l: aqueous solubility of drug-like compounds, Studia Universitatis Babeş-Bolyai.<br />
Series Chemia, in press (2010, pp. 1-8).<br />
(Bolboacă & others, 2003-PCAT): Sorana BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Andrei ACHIMAŞ<br />
CADARIU, Creating Etiology/Prognostic Critical Appraised Topics CATRom Original Software<br />
for Romanian Physicians, Applied Medical Informatics, SRIMA, ISSN 1224-5593, Cluj,<br />
Romania, 13(3-4), p. 11-16, 2003.<br />
(Bolboacă & others, 2003-SQL2): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Andrei<br />
ACHIMAŞ CADARIU, SQL by Example. 2. PHP and MySQL Web Application based on<br />
Tanner-Whitehouse Standard, Leonardo Electronic Journal of Practices and Technologies,<br />
Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 2(2), p. 37-52, 2003.<br />
(Bolboacă & others, 2003-TW2): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Andrei<br />
ACHIMAŞ CADARIU, PHP and MySQL Medical Application Based on Tanner Whitehouse<br />
Standard, UNITECH'03 International Scientific Conference, Technical University of Gabrovo,<br />
ISBN 954-683-167-0, Gabrovo, Bulgaria, 2003, p. 304-308, November 21-22, 2003.<br />
(Bolboacă & others, 2004-CATC): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Tudor<br />
DRUGAN, Andrei ACHIMAŞ CADARIU, Creating Therapy Studies Critical Appraised Topics.<br />
CATRom Original Software for Romanian Physicians, Applied Medical Informatics, SRIMA,<br />
ISSN 1224-5593, Cluj-Napoca, Romania, 15(3-4), p. 26-33, 2004.<br />
(Bolboacă & others, 2004-DCAT): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Andrei<br />
ACHIMAŞ CADARIU, Creating Diagnostic Critical Appraised Topics. CATRom Original<br />
Software for Romanian Physicians, Applied Medical Informatics, SRIMA, ISSN 1224-5593,<br />
Cluj-Napoca, Romania, 14(1-2), p. 27-34, 2004.<br />
(Bolboacă & others, 2005-EBGC): Sorana Daniela BOLBOACĂ, Andrei ACHIMAŞ CADARIU,<br />
<strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Evi<strong>de</strong>nce-Based Gui<strong>de</strong>lines Assisted Creation through Interactive Online<br />
308
Environment, Applied Medical Informatics, SRIMA, ISSN 1224-5593, Cluj-Napoca, Romania,<br />
17(3-4), p. 3-11, 2005.<br />
(Bolboacă & others, 2005-RIMC): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Andrei<br />
ACHIMAŞ CADARIU, Relational Information in Medicine: A Challenge, Roentgenologia &<br />
Radiologia, Bulgarian Association of Radiology, ISSN 0486-400X, Sofia, Bulgaria, XLIV(1), p.<br />
22-25, 2005.<br />
(Bolboacă & others, 2006): Sorana BOLBOACĂ, Claudia FILIP, Ştefan ŢIGAN, <strong>Lorentz</strong><br />
<strong>JÄNTSCHI</strong>, Antioxidant Efficacy of 3-Indolyl Derivates by Complex Information Integration,<br />
Clujul Medical, Editura Iuliu Hatieganu, ISSN 1222-2119, Cluj-Napoca, Romania, LXXIX(2), p.<br />
204-209, 2006.<br />
(Bolboacă & others, 2006): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mo<strong>de</strong>ling of<br />
Structure-Toxicity Relationship of Alkyl Metal Compounds by Integration of Complex Structural<br />
Information, Therapeutics: Pharmacology and Clinical Toxicology, RP Press, ISSN 1583-0012,<br />
Bucuresti, Romania, X(1), p. 110-114, 2006.<br />
(Bolboacă & others, 2006): Sorana Daniela BOLBOACĂ, Ştefan ŢIGAN, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>,<br />
Molecular Descriptors Family on Structure-Activity Relationships on anti-HIV-1 Potencies of<br />
HEPTA and TIBO Derivatives, Integrating Biomedical Information: From eCell to ePatient,<br />
European Fe<strong>de</strong>ration for Medical Informatics, ISBN 3-89838-0722-6 (Aka, Germany), ISBN 1-<br />
58603-614-9 (IOS Press, Holland), ISBN 973-625-303-1 (Politehnica Timişoara, Romania),<br />
Timisoara, Romania, p. 110-114, April 6-8, 2006.<br />
(Bolboacă & others, 2007): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mo<strong>de</strong>lling the Inhibitory<br />
Activity on Carbonic Anhydrase I of Some Substituted Thiadiazole- and Thiadiazoline-<br />
Disulfonami<strong>de</strong>s: Integration of Structure Information, ESCAPE17 - 17th European Symposium<br />
on Computer Ai<strong>de</strong>d Process Engineering, CAPE Working Party of the European Fe<strong>de</strong>ration of<br />
Chemical Engineering then Elsevier Netherlands & UK, ISBN 978-0-444-53157-5 & eISBN 0-<br />
444-53158-2, Bucharest, Romania then Amsterdam, Netherlands, T4-212 (oral presentation),<br />
May 27-30 then p. 965-970, 2007.<br />
(Bolboacă & others, 2007): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mo<strong>de</strong>lling the Inhibitory<br />
Activity on Carbonic Anhydrase I of Some Substituted Thiadiazole and Thiadiazoline-<br />
Disulfonami<strong>de</strong>s: Integration of Structure Information, Computer-Ai<strong>de</strong>d Chemical Engineering,<br />
Elsevier Netherlands & UK, eISSN 1570-7946, Amsterdam, Netherlands, 24(2007), p. 965-970,<br />
CAS-AN 2008:400595, 2007.<br />
(Bolboacă & others, 2008-RRAS): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>; Radu E.<br />
SESTRAŞ, Reporting Results and Associated Statistics in Quantitative Genetic Studies, Bulletin<br />
of University of Agricultural Sciences and Veterinary Medicine Cluj-Napoca. Horticulture,<br />
Aca<strong>de</strong>micPres, p-ISSN 1843-5254, e-ISSN 1843-5394, Cluj-Napoca, Romania, 65(1), p. 71-79,<br />
2008.<br />
(Bolboacă & others, 2008-SASM): Sorana D. BOLBOACĂ, Elena M. PICĂ, Claudia V.<br />
CIMPOIU, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Statistical Assessment of Solvent Mixtures Mo<strong>de</strong>ls Used for<br />
Separation of Biological Active Compounds, Molecules, Molecular Diversity Preservation<br />
International, ISSN 1420-3049, Basel, Switzerland, 13(8), p. 1617-1639, 2008.<br />
(Bolboacă & others, 2008-SqsV): Sorana D. BOLBOACĂ, Carmen E. STOENOIU, <strong>Lorentz</strong><br />
<strong>JÄNTSCHI</strong>, Statistics for QSAR Validation, Fifth International Conference of Applied<br />
Mathematics and Computing, University of Chemical Technology and Metallurgy Sofia &<br />
Technical University of Plovdiv, Invited lecture, presented on August 14, from 12.00 to 12.30,<br />
Plovdiv, Bulgaria, Proc Int Conf Appl Math Comput 2008 5(1), p. 83, 2008.<br />
(Bolboacă & others, 2009-AoV): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Radu E.<br />
SESTRAŞ, Statistical Approaches in Analysis of Variance: From Random Arrangements to Latin<br />
Square Experimental Design, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233,<br />
Cluj-Napoca, Romania, 8(15), p. 71-82, 2009.<br />
(Bolboacă & others, 2009-MDFV): Sorana D. BOLBOACĂ, Monica M. MARTA, Carmen E.<br />
STOENOIU, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Molecular Descriptors Family on Vertex Cutting:<br />
309
Relationships between Acelazolami<strong>de</strong> Structures and their Inhibitory Activity, Applied Medical<br />
Informatics, SRIMA, ISSN 1224-5593, Cluj-Napoca, Romania, 25(3-4), p. 65-74, 2009.<br />
(Bolboacă & others, 2010): Sorana D. BOLBOACĂ, Monica M. MARTA, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>,<br />
Binding Affinity of Triphenyl Acrylonitriles to Estrogen Receptors: Quantitative Structure-<br />
Activity Relationships, Folia medica, Christo G. Danov, ISSN 0204-8043, Plovdiv, Bulgaria,<br />
52(3), p. 37-45, 2010.<br />
(Bolboacă & others, 2010-GAAS): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mugur C.<br />
BĂLAN, Mircea V. DIUDEA, Radu E. SESTRAŞ. State of Art in Genetic Algorithms for<br />
Agricultural Systems, Notulae Botanicae Horti Agrobotanici Cluj-Napoca, 38(3):51-63, 2010.<br />
(Bolboacă & others, 2011-DDNR): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Radu E.<br />
SESTRAŞ, Depen<strong>de</strong>nce between <strong>de</strong>termination coefficient and number of regressors: a case<br />
study on retention times of mycotoxins, Studia Universitatis Babeş-Bolyai. Series Chemia, in<br />
press (2011, pp. 1-10).<br />
(Cosma & others, 2008-IMCC): Constantin COSMA, Ioan SUCIU, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D.<br />
BOLBOACĂ, Ion-Molecule Reactions and Chemical Composition of Emanated Gases from<br />
Herculane Spa Geothermal Sources, International Journal of Molecular Sciences, Molecular<br />
Diversity Preservation International, ISSN 1422-0067, Basel, Switzerland, 9(6), p. 1024-1033,<br />
DOI: 10.3390/ijms9061024, 2008.<br />
(Diu<strong>de</strong>a & others, 2001-MT): Mircea V. DIUDEA, Ivan GUTMAN, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>,<br />
Molecular Topology, Nova Science, ISBN 1-56072-957-0, Huntington, New York, USA, 332 p.,<br />
89$, 2001 - 1st ed., 2002 - 2nd ed., 2001.<br />
(Drugan & others, 2003-BCI1): Tudor DRUGAN, Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong><br />
<strong>JÄNTSCHI</strong>, Andrei ACHIMAŞ CADARIU, Binomial Distribution Sample Confi<strong>de</strong>nce Intervals<br />
Estimation 1. Sampling and Medical Key Parameters Calculation, Leonardo Electronic Journal of<br />
Practices and Technologies, Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 2(3), p. 45-74,<br />
2003.<br />
(Gligor & Jäntschi, 2005-PSEA): Delia Maria GLIGOR, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Periodic System of<br />
Elements Database and Its Applications, Ora<strong>de</strong>a University Annals, Chemistry Fascicle, Ora<strong>de</strong>a<br />
Univeristy Press, ISSN 1224-7626, Ora<strong>de</strong>a, Romania, 12, p. 180-194, CAN 147:211259, 2005.<br />
(Jäntschi & Avram, 2002-IBLD): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Dana AVRAM (c. LUPŞA), Internet,<br />
Browsers and Local Databases, International Conference on Quality Control, Automation and<br />
Robotics, Mediamira, ISBN 973-9357-11-1, Cluj-Napoca, Romania, 2, p. 516-521, May 23-25,<br />
2002.<br />
(Jäntschi & Bălan, 2009-DF7): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mugur C. BĂLAN, (Distribution Fitting 7.)<br />
Analysis of the genotypes number in different selection and survival strategies, Bulletin of<br />
University of Agricultural Sciences and Veterinary Medicine Cluj-Napoca. Horticulture,<br />
Aca<strong>de</strong>micPres, ISSN 1843-5254, eISSN 1843-5394, Cluj-Napoca, Romania, 66(1), p. 58-65,<br />
2009.<br />
(Jäntschi & Bolboacă, 2003-ACIA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana Daniela BOLBOACĂ, Applied<br />
Chemical and Instrumental Analysis (in Romanian), Aca<strong>de</strong>micDirect, ISBN 973-86211-6-X,<br />
www, Internet, 60 p., 2003.<br />
(Jäntschi & Bolboacă, 2005): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana Daniela BOLBOACĂ, Molecular<br />
Descriptors Family on Structure Activity Relationships 4. Molar Refraction of Cyclic<br />
Organophosphorus Compounds, Leonardo Electronic Journal of Practices and Technologies,<br />
Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 4(7), p. 55-102, 2005.<br />
(Jäntschi & Bolboacă, 2005): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana Daniela BOLBOACĂ, Molecular<br />
Descriptors Family on QSAR Mo<strong>de</strong>ling of Quinoline-based Compounds Biological Activities,<br />
The 10th Electronic Computational Chemistry Conference, Monmouth University, New Jersey,<br />
USA, Paper #4, www, Internet, April 1-30, 2005.<br />
(Jäntschi & Bolboacă, 2006): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana BOLBOACĂ, Molecular Descriptors<br />
Family on Structure Activity Relationships 6. Octanol-Water Partition Coefficient of<br />
Polychlorinated Biphenyls, Leonardo Electronic Journal of Practices and Technologies,<br />
310
Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 5(8), p. 71-86, 2006.<br />
(Jäntschi & Bolboacă, 2006): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana BOLBOACĂ, Molecular Descriptors<br />
Family on Structure Activity Relationships 5. Antimalarial Activity of 2,4-Diamino-6-<br />
Quinazoline Sulfonami<strong>de</strong> Derivates, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-<br />
0233, www, Internet, 5(8), p. 77-88, 2006.<br />
(Jäntschi & Bolboacă, 2006): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana BOLBOACĂ, Mo<strong>de</strong>lling the Inhibitory<br />
Activity on Carbonic Anhydrase IV of Substituted Thiadiazole- and Thiadiazoline-<br />
Disulfonami<strong>de</strong>s: Integration of Structure Information, Electronic Journal of Biomedicine, Red<br />
UniNet Spain, ISSN 1697-090X, www, Internet, 2006(2), p. 22-33, 2006.<br />
(Jäntschi & Bolboacă, 2006): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana-Daniela BOLBOACĂ, Mo<strong>de</strong>ling the<br />
Octanol-Water Partition Coefficient of Substituted Phenols: the Use of Structure Information,<br />
Third Humboldt Conference on Computational Chemistry, InnosLab Ltd. , ISBN 954-323-199-0<br />
& 978-954-323-199-7, Varna, Bulgaria, p. 65, June 24-28, 2006.<br />
(Jäntschi & Bolboacă, 2006-DDI): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana BOLBOACĂ, Auto-calibrated<br />
Online Evaluation: Database Design and Implementation, Leonardo Electronic Journal of<br />
Practices and Technologies, Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 5(9), p. 179-192,<br />
2006.<br />
(Jäntschi & Bolboacă, 2006-MDFR): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana Daniela BOLBOACĂ,<br />
Molecular Descriptors Family on Structure-Activity and Structure-Property Relationships:<br />
Results, SizeMat: Workshop on Size-Depen<strong>de</strong>nt Effects in Materials for Environmental<br />
Protection and Energy Application, Institute of General and Inorganic Chemistry, Bulgarian<br />
Aca<strong>de</strong>my of Sciences [http://sizemat.igic.bas.bg], FP6: EC-INCO-CT-2005-016414 Specific<br />
Support Action, Varna, Bulgaria, p. 14-15 [Plenary oral presentation], May 25-27, 2006.<br />
(Jäntschi & Bolboacă, 2006-OCPG): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana BOLBOACĂ, Organizing<br />
Gui<strong>de</strong>lines Mo<strong>de</strong>ls and Clinical Practice Gui<strong>de</strong>lines, 11th International Symposium for Health<br />
Information Management Research, Dalhousie University, ISBN 0-7703-9016-1, Halifax, Nova<br />
Scotia, Canada, p. 328-338, July 14-16, 2006.<br />
(Jäntschi & Bolboacă, 2006-OMDF): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana-Daniela BOLBOACĂ, Online<br />
System for Molecular Descriptors Family on Structure-Activity Relationships: Assessment and<br />
Characterization of Biologic Active Compounds, 6th European Conference on Computational<br />
Chemistry, European Association for Chemical and Molecular Sciences, Poster 47, Tale,<br />
Slovakia, September 3-7, 2006.<br />
(Jäntschi & Bolboacă, 2006-PSKC): Sorana BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Pearson Versus<br />
Spearman, Kendall's Tau Correlation Analysis on Structure-Activity Relationships of Biologic<br />
Active Compounds, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233, www,<br />
Internet, 5(9), p. 179-200, CAS-AN 2007:1026159, 2006.<br />
(Jäntschi & Bolboacă, 2007): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Antiallergic Activity<br />
of Substituted Benzami<strong>de</strong>s: Characterization, Estimation and Prediction, Clujul Medical, Editura<br />
Iuliu Hatieganu, ISSN 1222-2119, Cluj-Napoca, Romania, LXXX(1), p. 125-132, 2007.<br />
(Jäntschi & Bolboacă, 2007): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Triazines Herbicidal<br />
Assessed Activity, Studii si Cercetari Stiintifice Universitatea Bacau Seria Biologie,<br />
Universitatea Bacau, ISSN 1224-919X, Bacau, Romania, 12(1), p. 57-62, 2007.<br />
(Jäntschi & Bolboacă, 2007): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana-Daniela BOLBOACĂ, Mo<strong>de</strong>ling the<br />
Octanol-Water Partition Coefficient of Substituted Phenols by the Use of Structure Information,<br />
International Journal of Quantum Chemistry, Wiley InterScience, ISSN 0020-7608, eISSN 1097-<br />
461X, New York, NY, USA, Volume 107, Issue 8 (Special Issue: Proceedings from the 3rd<br />
Humboldt Conference on Computational Chemistry. Issue Edited by Georgi N. Vayssilov,<br />
Tzonka Mineva), p. 1736-1744, CAN 147:103053, 2007.<br />
(Jäntschi & Bolboacă, 2007-HADR): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, How to Asses<br />
Dose-Response Study Outcome: a Statistical Approach, Recent Advances in Synthesys &<br />
Chemical Biology VI, Centre for Synthesis & Chemical Biology, University of Dublin,<br />
Symposium, 14th December 2007, Dublin, Ireland, P36, 2007.<br />
311
(Jäntschi & Bolboacă, 2007-JLRR): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, The Jungle of<br />
Linear Regression Revisited, Leonardo Electronic Journal of Practices and Technologies,<br />
Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 6(10), p. 169-187, 2007.<br />
(Jäntschi & Bolboacă, 2007-MDFA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Molecular<br />
Descriptors Family Project and Their Application on Structure-Property/Activity Relationships,<br />
ChemMod 2007 - Chemical Graph Theory and Molecular Mo<strong>de</strong>ling Workshop, Faculty of<br />
Chemistry and Chemical Engineering of Babes-Bolyai University and European Society of<br />
Mathematical Chemistry, Poster #22, Cluj-Napoca, Romania, October 23-26, p. 22, 2007.<br />
(Jäntschi & Bolboacă, 2007-MDFC): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Molecular<br />
Descriptors Family on Chromatography, BBCAC-4 4th Black Sea Basin Conference on<br />
Analytical Chemistry, "St. Kliment Ohridski" University of Sofia, Poster P128, Sunny Beach,<br />
Bulgaria, September 19-23, 2007.<br />
(Jäntschi & Bolboacă, 2007-MDFE): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Structure-<br />
Activity Relationships on the Molecular Descriptors Family Project at the End, Leonardo<br />
Electronic Journal of Practices and Technologies, Aca<strong>de</strong>micDirect, ISSN 1583-1078, www,<br />
Internet, 6(11), p. 163-180, CAS-AN 2008:532878, 2007.<br />
(Jäntschi & Bolboacă, 2007-RMDF): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana BOLBOACĂ, Results from the<br />
Use of Molecular Descriptors Family on Structure Property/Activity Relationships, International<br />
Journal of Molecular Sciences, Molecular Diversity Preservation International, ISSN 1422-0067,<br />
www & Basel, Internet & Switzerland, 8(3), p. 189-203, CAN 147:317671, 2007.<br />
(Jäntschi & Bolboacă, 2008): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, A Structural Mo<strong>de</strong>lling<br />
Study on Marine Sediments Toxicity, Marine Drugs, Molecular Diversity Preservation<br />
International, ISSN 1660-3397, Basel, Switzerland, 6(2), p. 372-388, DOI:<br />
10.3390/md20080017, 2008.<br />
(Jäntschi & Bolboacă, 2008-EEVC): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Entropy and<br />
Energy of Substructures Obtained by Vertex Cutting in Regular Trees, Fifth International<br />
Conference of Applied Mathematics and Computing, University of Chemical Technology and<br />
Metallurgy Sofia & Technical University of Plovdiv, Invited lecture, presented on August 12,<br />
from 16.30 to 17.00, Plovdiv, Bulgaria, Proc Int Conf Appl Math Comput 2008 5(2), p. 216,<br />
2008.<br />
(Jäntschi & Bolboacă, 2008-EMGT): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Embed<strong>de</strong>d<br />
Molecular Geometry and Molecular Topology Approach for Structure - Activity Relationships,<br />
Strasbourg Summer School on Chemoinformatics, Louis Pasteur University, June 22-25,<br />
Obernai, France, #8, 2008.<br />
(Jäntschi & Bolboacă, 2008-MQMC): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, From<br />
Mathematical Chemistry to Quantum and Medicinal Chemistry, 17th European Symposium on<br />
Quantitative Structure-Activity Relationships & Omics Technologies and Systems Biology,<br />
Cheminformatics and QSAR Society, September 21-26, Uppsala, Swe<strong>de</strong>n, Oral presentation<br />
(Session 9: Emerging Technologies), Friday September 26th, 1010-1030, 2008.<br />
(Jäntschi & Bolboacă, 2009-CPRI): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Counting<br />
Polynomials on Regular Iterative Structures, Applied Medical Informatics, SRIMA, Applied<br />
Medical Informatics, Cluj-Napoca, Romania, 24(1-2), p. 67-95, 2009.<br />
(Jäntschi & Bolboacă, 2009-DF2): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Distribution<br />
Fitting 2. Pearson-Fisher, Kolmogorov-Smirnov, An<strong>de</strong>rson-Darling, Wilks-Shapiro, Kramer-von-<br />
Misses and Jarque-Bera statistics, Bulletin of University of Agricultural Sciences and Veterinary<br />
Medicine Cluj-Napoca. Horticulture, Aca<strong>de</strong>micPres, ISSN 1843-5254, eISSN 1843-5394, Cluj-<br />
Napoca, Romania, 66(2), p. 691-697, 2009.<br />
(Jäntschi & Bolboacă, 2009-EDFD): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Entropy due to<br />
Fragmentation of Dendrimers, Surveys in Mathematics and its Applications, University<br />
Constantin Brâncuşi of Târgu-Jiu, ISSN 1843-7265, eISSN 1842-6298, Targu Jiu, Romania, 4, p.<br />
168-176, 2009.<br />
(Jäntschi & Bolboacă, 2009-OvO): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Observation vs.<br />
312
Observable: Maximum Likelihood Estimations according to the Assumption of Generalized<br />
Gauss and Laplace Distributions, Leonardo Electronic Journal of Practices and Technologies,<br />
Aca<strong>de</strong>micDirect, eISSN 1583-1078, Cluj-Napoca, Romania, 8(15), p. 81-104, 2009.<br />
(Jäntschi & Bolboacă, 2010-EPCI): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Exact<br />
Probabilities on Confi<strong>de</strong>nce Limits for Binomial Samples: Applied to the Difference between<br />
Two Proportions, TheScientificWorldJOURNAL, TheScientificWorld, ISSN 1537-744X,<br />
Kirkkonummi, Finland, 10(5), p. 865-878, 2010.<br />
(Jäntschi & Bolboacă, 2010-REBP): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, The relationship<br />
between energy calculations and boiling points of n-alkanes, Studia Universitatis Babeş-Bolyai.<br />
Series Chemia, in press (2010, pp. 1-7).<br />
(Jäntschi & Diu<strong>de</strong>a, 2003-DM1): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mircea V. DIUDEA, Data Mining. 1.<br />
Glycine Content Estimation from Activity Coefficients Measurement, Leonardo Journal of<br />
Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233, www, Internet, 2(2), p. 53-63, 2003.<br />
(Jäntschi & Diu<strong>de</strong>a, 2006-SPV): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mircea V. DIUDEA, Subgraphs by Pairs of<br />
Vertices, TOPMOL2006 - 20 Years Anniversary of Molecular Topology at Cluj, Babes-Bolyai<br />
University, CEEx M3 PR-D11-PT00-41, Cluj-Napoca, Romania, p. 16 [Plenary oral<br />
presentation], September 25-30, 2006.<br />
(Jäntschi & Diu<strong>de</strong>a, 2009-sGPV): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mircea V. DIUDEA, Subgraphs of Pair<br />
Vertices, Journal of Mathematical Chemistry, Springer Verlag, ISSN 0259-9791, eISSN 1572-<br />
8897, Berlin, Germany, 45(2), p. 364-371, DOI: 10.1007/s10910-008-9411-6, 2009.<br />
(Jäntschi & Diu<strong>de</strong>a, 2011-C16V): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mircea V. DIUDEA, Centrality of some<br />
cubic graphs on 16 vertices, Journal of Indian Chemical Society, 87(12):1531-1537, 2011.<br />
(Jäntschi & Naşcu, 2002-FSD3): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Horea Iustin NAŞCU, Free Software<br />
Development. 3. Numerical Description of Soft Acid with Soft Base Titration, Leonardo Journal<br />
of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233, www, Internet, 1(1), p. 53-68, 2002.<br />
(Jäntschi & Naşcu, 2002-NDT): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Horea Iustin NAŞCU, Numerical Description<br />
of Titration, International Conference on Quality Control, Automation and Robotics, Mediamira,<br />
ISBN 973-9357-10-3, Cluj-Napoca, Romania, 1, p. 259-262, May 23-25, 2002.<br />
(Jäntschi & others, 2003-SQLA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mariana MARCU, Sorana Daniela<br />
BOLBOACĂ, SQL Application for Secondary School Leaving Examination, UNITECH'03<br />
International Scientific Conference, Technical University of Gabrovo, ISBN 954-683-167-0,<br />
Gabrovo, Bulgaria, 2003, p. 258-262, November 21-22, 2003.<br />
(Jäntschi & others, 2005-CSII): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mihaela Ligia UNGUREŞAN, Sorana Daniela<br />
BOLBOACĂ, Complex Structural Information Integration: Inhibitor Activity on Carbonic<br />
Anhydrase II of Substituted Disulfonami<strong>de</strong>s, Applied Medical Informatics, SRIMA, ISSN 1224-<br />
5593, Cluj-Napoca, Romania, 17(3-4), p. 12-21, 2005.<br />
(Jäntschi & others, 2006-GPAP): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Carmen Elena STOENOIU, Sorana Daniela<br />
BOLBOACĂ, Use of Graph Polynomials for Characterization of Alkanes Properties,<br />
International Symposium on Organic Chemistry, December 9-12, 2006, Avangard Prisma, ISBN<br />
954-323-243-1 & 978-954-323-243-7, Sofia, Bulgaria, p. 87-88, December 9-12, 2006.<br />
(Jäntschi & others, 2006-RPRD): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mădălina Ana VĂLEANU, Sorana Daniela<br />
BOLBOACĂ, Rapid Programming of Relational Databases Applications (in Romanian),<br />
Aca<strong>de</strong>micDirect & Aca<strong>de</strong>micPres, ISBN: 973-86211-5-1 & 978-973-86211-5-2<br />
(Aca<strong>de</strong>micDirect) && ISBN 973-744-044-7 & 978-973-744-044-0 (Aca<strong>de</strong>micPres), www &<br />
Cluj-Napoca, Internet & Romania, 233 p., 2006.<br />
(Jäntschi & others, 2007): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Mircea V. DIUDEA,<br />
Chromatographic Retention Times of Polychlorinated Biphenyls: from Structural Information to<br />
Property Characterization, International Journal of Molecular Sciences, Molecular Diversity<br />
Preservation International, ISSN 1422-0067, Basel & www, Switzerland & Internet, 8(11), p.<br />
1125-1157, CAS-AN 2008:423655, 2007.<br />
(Jäntschi & others, 2007-CCPN): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana-Daniela BOLBOACĂ, Cristina<br />
Maria FURDUI, Characteristic and Counting Polynomials on Mo<strong>de</strong>ling Nonane Isomers<br />
313
Properties, Fourth International Conference of Applied Mathematics and Computing, August 12-<br />
18, 2007, University of Chemical Technology and Metallurgy Sofia & Technical University of<br />
Plovdiv, Invited lecture, presented on August 15, from 12.20 to 13.00, Plovdiv, Bulgaria, p. 234,<br />
2007.<br />
(Jäntschi & others, 2007-FVCT): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Carmen Elena STOENOIU, Sorana-Daniela<br />
BOLBOACĂ, A Formula for Vertex Cuts in b-Trees, Fourth International Conference of Applied<br />
Mathematics and Computing, August 12-18, 2007, University of Chemical Technology and<br />
Metallurgy Sofia & Technical University of Plovdiv, Short communication, presented on August<br />
15, from 12.10 to 12.20, Plovdiv, Bulgaria, p. 233, 2007.<br />
(Jäntschi & others, 2007-NTCP): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Carmen E.<br />
STOENOIU, National Trends on Agricultural Crops Production: Cluster Analysis, Bulletin of<br />
University of Agricultural Sciences and Veterinary Medicine - Agriculture, 63-64:194-202, 2007.<br />
(Jäntschi & others, 2008): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Violeta POPESCU, Sorana D. BOLBOACĂ,<br />
Toxicity Caused by Para-Substituents of Phenole on Tetrahymena Pyriformis and Structure-<br />
Activity Relationships, Electronic Journal of Biotechnology, Pontificia Universidad Catolica <strong>de</strong><br />
Valparaiso, ISSN 0717-3458, Valparaiso, Chile, 11(3), fulltext 9, DOI: 10.2225/vol11-issue3fulltext-9,<br />
2008.<br />
(Jäntschi & others, 2008-FVCT): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Carmen E. STOENOIU, Sorana D.<br />
BOLBOACĂ, A Formula for Vertex Cuts in b-Trees, International Journal of Pure and Applied<br />
Mathematics, Aca<strong>de</strong>mic Publications, ISSN 1311-8080, Sofia, Bulgaria, 47(1), p. 17-22, Zbl<br />
pre05492617, 2008.<br />
(Jäntschi & others, 2008-IEbT): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Informational<br />
Entropy of b-ary Trees After a Vertex Cut, Entropy, Molecular Diversity Preservation<br />
International, ISSN 1099-4300, Basel, Switzerland, 10(4), p. 576-588, 2008.<br />
(Jäntschi & others, 2008-PTGS): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Radu E.<br />
SESTRAŞ, On about what Can Be Done and what Cannot Be Done with Genetic Algorithms in<br />
Phylogenetic Tree and Gene Sequence Analyses, Bulletin of University of Agricultural Sciences<br />
and Veterinary Medicine Cluj-Napoca. Horticulture, Aca<strong>de</strong>micPres, p-ISSN 1843-5254, e-ISSN<br />
1843-5394, Cluj-Napoca, Romania, 65(1), p. 63-70, 2008.<br />
(Jäntschi & others, 2009-CCPI): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Cristina M.<br />
FURDUI, Characteristic and Counting Polynomials: Mo<strong>de</strong>lling Nonane Isomers Properties,<br />
Molecular Simulation, Taylor & Francis Group, ISSN 0892-7022, eISSN 1029-0435, London,<br />
UK, 35(3), p. 220-227, DOI: 10.1080/08927020802398892, 2009.<br />
(Jäntschi & others, 2009-DF4): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Carmen E.<br />
STOENOIU, Mihaela IANCU, Monica M. MARTA, Elena M. PICĂ, Monica ŞTEFU, Adriana<br />
F. SESTRAŞ, Marcel M. DUDA, Radu E. SESTRAŞ, Ştefan ŢIGAN, Ioan ABRUDAN, Mugur<br />
C. BĂLAN, Distribution Fitting 4. Benford test on a sample of observed genotypes number from<br />
running of a genetic algorithm, Bulletin of University of Agricultural Sciences and Veterinary<br />
Medicine Cluj-Napoca. Agriculture, Aca<strong>de</strong>micPres, ISSN 1843-5246, eISSN 1843-5386, Cluj-<br />
Napoca, Romania, 66(1), p. 82-88, 2009.<br />
(Jäntschi & others, 2009-HPGS): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Radu E.<br />
SESTRAŞ, Hard Problems in Gene Sequence Analysis: Classical Approaches and Suitability of<br />
Genetic Algorithms, Biotechnology & Biotechnological Equipment, Diagnosis Press, ISSN 1310-<br />
2818, Sofia, Bulgaria, 23(2), p. 1275-1280, 2009.<br />
(Jäntschi & others, 2010-ATGA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Mircea V.<br />
DIUDEA, Radu E. SESTRAŞ, Average Trends over Millennia of Evolution Supervised by<br />
Genetic Algorithms. 3. Analysis of Phenotypes Associations, Bulletin of University of<br />
Agricultural Sciences and Veterinary Medicine Cluj-Napoca. Agriculture, Aca<strong>de</strong>micPres, ISSN<br />
1843-5246, eISSN 1843-5386, Cluj-Napoca, Romania, 67(1), p. 169-174, 2010.<br />
(Jäntschi & others, 2010-ATGG): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Mircea V.<br />
DIUDEA, Radu E. SESTRAŞ, Average Trends over Millennia of Evolution Supervised by<br />
Genetic Algorithms. 1. Analysis of Genotypes, Bulletin of University of Agricultural Sciences<br />
314
and Veterinary Medicine Cluj-Napoca. Horticulture, Aca<strong>de</strong>micPres, ISSN 1843-5254, eISSN<br />
1843-5394, Cluj-Napoca, Romania, 67(1), p. 72-79, 2010.<br />
(Jäntschi & others, 2010-ATGP): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Mircea V.<br />
DIUDEA, Radu E. SESTRAŞ, Average Trends over Millennia of Evolution Supervised by<br />
Genetic Algorithms. 2. Analysis of Phenotypes, Bulletin of University of Agricultural Sciences<br />
and Veterinary Medicine Cluj-Napoca. Agriculture, Aca<strong>de</strong>micPres, ISSN 1843-5246, eISSN<br />
1843-5386, Cluj-Napoca, Romania, 67(1), p. 161-168, 2010.<br />
(Jäntschi & others, 2010-CAGA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Radu E.<br />
SESTRAŞ, Classical Approaches of Genetic Algorithms and their Suitability, Asian Journal of<br />
Chemistry, Chemic Publishing Co., ISSN 0970-7077, Ghaziabad, India, 22(3), p. 2275-2284,<br />
2010.<br />
(Jäntschi & others, 2010-DqCC): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Mircea V.<br />
DIUDEA, Radu E. SESTRAŞ, Distribution of QSARs correlation coefficients, Visualization and<br />
Mo<strong>de</strong>ling in Chemistry, University of Split, October 29-31, Split, Croatia, p. 13-14, 2010.<br />
(Jäntschi & others, 2010-MHqR): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Radu E.<br />
SESTRAŞ, Meta-heuristics on quantitative structure-activity relationships: study on<br />
polychlorinated biphenyls, Journal of Molecular Mo<strong>de</strong>ling, Springer Verlag, ISSN 1610-2940 ,<br />
eISSN 0948-5023, Berlin, Germany, 6(2), p. 377-386, DOI: 10.1007/s00894-009-0540-z, PMID:<br />
19609578, 2010.<br />
(Jäntschi & others, 2010-REGA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Radu E.<br />
SESTRAŞ, Recording Evolution Supervised by a Genetic Algorithm for Quantitative Structure-<br />
Activity Relationship Optimization, Applied Medical Informatics, SRIMA, ISSN 1224-5593,<br />
Cluj-Napoca, Romania, 26(2), p. 89-100, 2010.<br />
(Jäntschi & others, 2010-RESG): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Mugur BĂLAN,<br />
Radu E. SESTRAŞ, Mircea V. DIUDEA, Results of Evolution Supervised by Genetic<br />
Algorithms, Notulae Scientia Biologicae, Aca<strong>de</strong>micPres, ISSN 2067-3205, eISSN 2067-3264,<br />
Cluj-Napoca, Romania, 2(3), p. 12-15, 2010.<br />
(Jäntschi & others, 2010-SGAE): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Radu E.<br />
SESTRAŞ, A Study of Genetic Algorithm Evolution on the Lipophilicity of Polychlorinated<br />
Biphenyls, Chemistry & Biodiversity, KGaA & Wiley-VCH Verlag, ISSN 1612-1872, eISSN<br />
1612-1880, Weinheim, Switzerland, 7(8), p. 1978-1989, DOI: 10.1002/cbdv.200900356, 2010.<br />
(Jäntschi & others, 2010-TESG): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Mugur C. BĂLAN,<br />
Radu E. SESTRAŞ, Ten<strong>de</strong>ncy of Evolution Supervised by Genetic Algorithms, Bulletin of<br />
University of Agricultural Sciences and Veterinary Medicine Cluj-Napoca. Horticulture,<br />
Aca<strong>de</strong>micPres, ISSN 1843-5254, eISSN 1843-5394, Cluj-Napoca, Romania, 67(1), p. 80-85,<br />
2010.<br />
(Jäntschi & Pică, 2002-NKC): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Elena Maria PICĂ, Numerical Kinetic<br />
Chemistry, International Conference on Quality Control, Automation and Robotics, Mediamira,<br />
ISBN 973-9357-10-3, Cluj-Napoca, Romania, 1, p. 263-268, May 23-25, 2002.<br />
(Jäntschi & Pică, 2003-CASS): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Elena Maria PICĂ, Coals Analysis by Sample<br />
Study, UNITECH'03 International Scientific Conference, Technical University of Gabrovo,<br />
ISBN 954-683-167-0, Gabrovo, Bulgaria, 2003, p. 263-266, November 21-22, 2003.<br />
(Jäntschi & Pică, 2003-NCDR): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Elena Maria PICĂ, Numerical Simulation of<br />
Concurent Diffusion and Reaction, Annals of West University of Timişoara, Series Chemistry,<br />
West University of Timişoara, ISSN 1224-9513, Timisoara, Romania, 12(3), p. 1107-1112, CAN<br />
142:266989, 2003.<br />
(Jäntschi & Pică, 2003-ORM): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Elena Maria PICĂ, New Approach of Well<br />
Known Oscilating Reaction Mo<strong>de</strong>ls, Annals of West University of Timişoara, Series Chemistry,<br />
West University of Timişoara, ISSN 1224-9513, Timisoara, Romania, 12(3), p. 1169-1176, 2003.<br />
(Jäntschi & Ungureşan, 2001-MKD): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mihaela Ligia UNGUREŞAN, Physical<br />
Chemistry. Molecular Kinetic and Dynamic (in Romanian), Mediamira, ISBN 973-9358-71-3,<br />
Cluj-Napoca, Romania, 159 p., 2001.<br />
315
(Jäntschi & Ungureşan, 2001-SCA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mihaela Ligia UNGUREŞAN, Special<br />
Chapters of Chemistry for Automatics (in Romanian), UTPres, ISBN 973-8335-15-9, Cluj-<br />
Napoca, Romania, 202 p., 2001.<br />
(Jäntschi & Ungureşan, 2002-PCEI): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mihaela Ligia UNGUREŞAN, Physical<br />
Chemistry. Experiments of Chemical and Instrumental Analysis (in Romanian), Amici, ISBN<br />
973-85727-0-3, Cluj-Napoca, Romania, 120 p., 2002.<br />
(Jäntschi & Zaharieva-Stoyanova, 2003-MLPM): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Elena ZAHARIEVA-<br />
STOYANOVA, MATHLab as tool for Process Mo<strong>de</strong>ling, International Conference on Materials<br />
Science and Engineering BRAMAT 2003, Transilvania University Press, ISBN 973-635-122-X<br />
& 973-635-125-4, Brasov, Romania, 3, p. 137-142, March 10-12, 2003.<br />
(Jäntschi & Zaharieva-Stoyanova, 2003-UFS): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Elena ZAHARIEVA-<br />
STOYANOVA, Upload a File to a Server. Case Study, UNITECH'03 International Scientific<br />
Conference, Technical University of Gabrovo, ISBN 954-683-167-0, Gabrovo, Bulgaria, 2003, p.<br />
274-276, November 21-22, 2003.<br />
(Jäntschi, 2002-ACRA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Property Investigations with an Automat Correlation<br />
Routine and Applications for a Set of Alloys, Acta Tehnica Napocensis, series Machines<br />
Building. Materials, UTPres, ISSN 1221-5872, Cluj-Napoca, Romania, 45(1), p. 296-301, 2002.<br />
(Jäntschi, 2002-ASSP): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Automat Server Si<strong>de</strong> Processing of Statistical Data,<br />
UNITECH'02 International Scientific Conference, Technical University of Gabrovo, ISBN 954-<br />
683-167-0, Gabrovo, Bulgaria, 2002, p. 185-189, November 21-22, 2002.<br />
(Jäntschi, 2002-CIA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Chemical and Instrumental Analysis (in Romanian),<br />
UTPres, ISBN 973-8335-19-1, Cluj-Napoca, Romania, 138 p., 2002.<br />
(Jäntschi, 2002-FSD1): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Free Software Development. 1. Fitting Statistical<br />
Regressions, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233, www, Internet,<br />
1(1), p. 31-52, 2002.<br />
(Jäntschi, 2002-TRPI): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Real Time Property Investigation in Sets of Alloys,<br />
International Conference on Advanced Materials and Structures, Editura Orizonturi Universitare,<br />
ISBN 973-8391-50-4, Timisoara, Romania, p. 189-194, September 19-21, 2002.<br />
(Jäntschi, 2003-CIA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Physical Chemistry. Chemical and Instrumental<br />
Analysis (in Romanian), Aca<strong>de</strong>micDirect, , ISBN 973-86211-7-8, www, Internet, 64 p., 2003.<br />
(Jäntschi, 2003-FBSD): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Installing and Testing a Server Operating System,<br />
Leonardo Electronic Journal of Practices and Technologies, Aca<strong>de</strong>micDirect, ISSN 1583-1078,<br />
www, Internet, 2(3), p. 1-30, 2003.<br />
(Jäntschi, 2003-I386): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, I386-Based Computer Architecture and Elementary<br />
Data Operations, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233, www,<br />
Internet, 2(3), p. 9-23, 2003.<br />
(Jäntschi, 2003-KB): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Kinetic Biochemistry, Leonardo Journal of Sciences,<br />
Aca<strong>de</strong>micDirect, ISSN 1583-0233, www, Internet, 2(2), p. 1-40, 2003.<br />
(Jäntschi, 2003-MME): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Metrology and Monitoring of Environment (in<br />
Romanian), Amici, ISBN 973-85727-2-X, Cluj-Napoca, Romania, 148 p., 2003.<br />
(Jäntschi, 2003-MTPS): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Microbiology and Toxicology. Phytochemistry<br />
Studies (in Romanian), Amici, ISBN 973-85727-3-8, Cluj-Napoca, Romania, 183 p., 2003.<br />
(Jäntschi, 2003-SQL1): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, SQL by Example. 1. Application for High School<br />
Bachelor Examination, Leonardo Electronic Journal of Practices and Technologies,<br />
Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 2(2), p. 20-36, 2003.<br />
(Jäntschi, 2004-DCS): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Delphi Client - Server Implementation of Multiple<br />
Linear Regression Findings: a QSAR/QSPR Application, Applied Medical Informatics, SRIMA,<br />
ISSN 1224-5593, Cluj-Napoca, Romania, 15(3-4), p. 48-55, 2004.<br />
(Jäntschi, 2004-MDF) <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, MDF - A New QSAR/QSPR Molecular Descriptors<br />
Family, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233, www, Internet, 3(4), p.<br />
68-85, 2004.<br />
(Jäntschi, 2004-PCB): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, QSPR on Estimating of Polychlorinated Biphenyls<br />
316
Relative Response Factor using Molecular Descriptors Family, Leonardo Electronic Journal of<br />
Practices and Technologies, Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 3(5), p. 67-84,<br />
2004.<br />
(Jäntschi, 2004-WAC): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Water Activated Carbon Organics Adsorption<br />
Structure - Property Relationships, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-<br />
0233, www, Internet, 3(5), p. 63-73, 2004.<br />
(Jäntschi, 2005-MDF1): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Molecular Descriptors Family on Structure Activity<br />
Relationships 1. Review of the Methodology, Leonardo Electronic Journal of Practices and<br />
Technologies, Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 4(6), p. 76-98, 2005.<br />
(Jäntschi, 2005-MTPS): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Microbiology and Toxicology and Phytochemistry<br />
Studies (in Romanian), Aca<strong>de</strong>micDirect, ISBN 973-86211-8-6, www, Internet, 75 p., 2005.<br />
(Jäntschi, 2007-CCPN): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Characteristic and Counting Polynomials of Nonane<br />
Isomers, Aca<strong>de</strong>micDirect, ISBN 973-86211-3-5 & ISBN 980-973-86211-3-8, www, Internet, p.<br />
101, 2007.<br />
(Jäntschi, 2009-DF1): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Distribution Fitting 1. Parameters Estimation un<strong>de</strong>r<br />
Assumption of Agreement between Observation and Mo<strong>de</strong>l, Bulletin of University of<br />
Agricultural Sciences and Veterinary Medicine Cluj-Napoca. Horticulture, Aca<strong>de</strong>micPres, ISSN<br />
1843-5254, eISSN 1843-5394, Cluj-Napoca, Romania, 66(2), p. 684-690, 2009.<br />
(Jäntschi, 2009-GASI): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, A genetic algorithm for structure-activity<br />
relationships: software implementation, ArXiv manuscript, http://arxiv.org/abs/0906.4846, 2009.<br />
(Jäntschi, 2010-GAEG): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Genetic algorithms: evolution in genetics and<br />
informatics, BioArta - Society and Perception of Biotechnology. Exploratory Workshop,<br />
UASVM Cluj-Napoca, Cluj-Napoca, Romania, 2010.<br />
(Naşcu & Jäntschi, 2004-MCE1): Horea Iustin NAŞCU, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Multiple Choice<br />
Examination System 1. Database Design and Implementation for General Chemistry, Leonardo<br />
Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233, www, Internet, 3(5), p. 18-33, 2004.<br />
(Naşcu & Jäntschi, 2004-MCE2): Horea Iustin NAŞCU, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Multiple Choice<br />
Examination System 2. Online Quizzes for General Chemistry, Leonardo Electronic Journal of<br />
Practices and Technologies, Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 3(5), p. 26-36,<br />
2004.<br />
(Naşcu & others, 1999): Horea NASCU, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Teodor HODIŞAN, Claudia<br />
CIMPOIU, Gabriela CÂMPAN, Some Applications of Statistics in Analytical Chemistry,<br />
Reviews in Analytical Chemistry, Freud Publishing House, ISSN 0793-0135, Tel Aviv &<br />
London, Israel & England, XVIII(6), p. 409-456, CAN 132:287941, 1999.<br />
(Pică & Jäntschi, 2003-CSC1): Elena Maria PICĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Case Study of Coals<br />
Farcasesti Area. 1. Depen<strong>de</strong>ncies Excluding Fixed Carbon Determinations, Annals of West<br />
University of Timişoara, Series Chemistry, West University of Timişoara, ISSN 1224-9513,<br />
Timisoara, Romania, 12(3), p. 1127-1136, CAN 142:41100, 2003.<br />
(Pică & Jäntschi, 2003-CSC2): Elena Maria PICĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Case Study of Coals<br />
Farcasesti Area. 2. Depen<strong>de</strong>ncies Including Fixed Carbon Determinations, Annals of West<br />
University of Timişoara, Series Chemistry, West University of Timişoara, ISSN 1224-9513,<br />
Timisoara, Romania, 12(3), p. 1137-1144, CAN 142:41119, 2003.<br />
(Pică & others, 2004-ASOC): Elena Maria PICĂ, Mihaela Ligia UNGUREŞAN, <strong>Lorentz</strong><br />
<strong>JÄNTSCHI</strong>, Amperometric Sensors for the Analysis of the Oxygen Content, Acta Tehnica<br />
Napocensis, series Machines Building. Materials, UTPres, ISSN 1224-9106, Cluj-Napoca,<br />
Romania, 47, p. 91-98, 2004.<br />
(Pică & others, 2004-OCAS): Elena Maria PICĂ, Mihaela Ligia UNGUREŞAN, <strong>Lorentz</strong><br />
<strong>JÄNTSCHI</strong>, Oxygen Content Analysis with Current Sensors, A&QT-R 2004 (THETA 14) 2004<br />
IEEE-TTTC - International Conference on Automation, Quality and Testing, Robotics,<br />
Mediamira, ISBN 973-713-046-4, Cluj-Napoca, Romania, 1, p. 471-472, May 13-15, 2004.<br />
(Sârbu & Jäntschi, 1998): Costel SÂRBU, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Statistic Validation and Evaluation<br />
of Analytical Methods by Comparative Studies. I. Validation of Analytical Methods using<br />
317
Regression Analysis (in Romanian), Revista <strong>de</strong> Chimie, SC Biblioteca Chimiei SA, ISSN 0034-<br />
7752, Bucuresti, Romania, 49(1), p. 19-24, CAN 128:225190, 1998.<br />
(Ştefu & others, 2002-FSD2): Monica ŞTEFU, Mihaela Ligia UNGUREŞAN, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>,<br />
Free Software Development. 2. Chemical Database Management, Leonardo Electronic Journal of<br />
Practices and Technologies, Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 1(1), p. 69-76,<br />
2002.<br />
(Ştefu & others, 2008-MHHS): Monica ŞTEFU, Sorana D. BOLBOACĂ, Mugur C. BĂLAN,<br />
<strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Molecular Hyperstructures with High Symmetry, Bulletin of University of<br />
Agricultural Sciences and Veterinary Medicine Cluj-Napoca. Horticulture, Aca<strong>de</strong>micPres, p-<br />
ISSN 1843-5254; e-ISSN 1843-5394, Cluj-Napoca, Romania, 65(2), p. 681-686, 2008.<br />
(Stoenoiu & others, 2007-CMST): Carmen Elena STOENOIU, Sorana Daniela BOLBOACĂ,<br />
<strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Characterization of Marine Sediments Toxicity based on Structural<br />
Information, Institute of General and Inorganic Chemistry, Bulgarian Aca<strong>de</strong>my of Sciences<br />
[http://sizemat.igic.bas.bg], FP6: EC-INCO-CT-2005-016414 Specific Support Action, Plovdiv,<br />
Bulgaria, p. 54, April 19-21, 2007.<br />
(Stoenoiu & others, 2007-MFI): Carmen Elena STOENOIU, Sorana-Daniela BOLBOACĂ, <strong>Lorentz</strong><br />
<strong>JÄNTSCHI</strong>, Mo<strong>de</strong>l Formulation and Interpretation for Chemical Reactions Mechanisms - From<br />
Experiment to Theory, Fourth International Conference of Applied Mathematics and Computing,<br />
August 12-18, 2007, University of Chemical Technology and Metallurgy Sofia & Technical<br />
University of Plovdiv, Invited lecture, presented on August 15, from 11.30 to 12.10, Plovdiv,<br />
Bulgaria, p. 511, 2007.<br />
(Stoenoiu & others, 2008-MFET): Carmen E. STOENOIU, Sorana D. BOLBOACĂ, <strong>Lorentz</strong><br />
<strong>JÄNTSCHI</strong>, Mo<strong>de</strong>l Formulation & Interpretation - From Experiment to Theory, International<br />
Journal of Pure and Applied Mathematics, Aca<strong>de</strong>mic Publications, ISSN 1311-8080, Sofia,<br />
Bulgaria, 47(1), p. 9-16, Zbl pre05492616, 2008.<br />
(Suciu & others, 2008-HMPP): Ioan SUCIU, Constantin COSMA, Mihai TODICĂ, Sorana D.<br />
BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Analysis of Soil Heavy Metal Pollution and Pattern in<br />
Central Transylvania, International Journal of Molecular Sciences, Molecular Diversity<br />
Preservation International, ISSN 1422-0067, Basel, Switzerland, 9(4), p. 434-453, 2008.<br />
(Tăut & others, 2007-MMCP): Ioan TĂUT, George ARGHIR, Viorel CÂNDEA, Sorana-Daniela<br />
BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mechanical Milling: Evolution of Crystal Parameter of Iron<br />
Pow<strong>de</strong>r, 9th Annual Conference of the Yugoslav Materials Research Society, Serbian Aca<strong>de</strong>my<br />
of Sciences and Arts, ISBN 978-86-80321-11-0, Herceg Novi, Montenegro, OSA11, p. 14,<br />
September 10-14, 2007.<br />
(Ţigan & others, 2006): Ştefan ŢIGAN, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana-Daniela BOLBOACĂ,<br />
Mo<strong>de</strong>ling Herbicidal Activity of a Substituted Triazines Class by Integration of Compounds<br />
Complex Structural Information, XXIII International Biometric Conference, International<br />
Biometric Society, TP1.219 (509.pdf on CD), Montreal, Quebec, Canada, July 16-21, 2006.<br />
Concluzii<br />
Derularea proiectului "De la Chimia Matematică la Chimia Cuantică şi la Chimia Medicală" a<br />
permis aprofundarea unor concepte cu ajutorul cărora se face trasnferul cunoştinţelor între domenii<br />
<strong>de</strong> vârf ale cercetării şi în acelaşi timp a <strong>de</strong>schis oportunitatea obţinerii unei serii <strong>de</strong> rezultate noi şi<br />
originale valorificate prin publicaţii ştiinţifice în reviste <strong>de</strong> prestigiu.<br />
318