20.07.2013 Views

Raport de cercetare - Lorentz JÄNTSCHI

Raport de cercetare - Lorentz JÄNTSCHI

Raport de cercetare - Lorentz JÄNTSCHI

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Raport</strong> <strong>de</strong> <strong>cercetare</strong><br />

- lucrare în extenso -<br />

cuprinzând activităţile <strong>de</strong>sfăşurate şi rezultatele obţinute în proiectul<br />

De la Chimia Matematică la Chimia Cuantică şi Chimia Medicală<br />

÷ Număr proiect: ID-1051/2007;<br />

÷ Competiţie: IDEI;<br />

÷ Cod competiţie: PNII-PCE-2007-1;<br />

÷ Cod program: 206/2007;<br />

÷ Durata <strong>de</strong> <strong>de</strong>sfăşurare: Octombrie 2007 - Septembrie 2010;<br />

÷ Director <strong>de</strong> proiect: <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, conf. dr.;<br />

÷ Contractor: Unitatea Executivă pentru Finanţarea Învăţământului Superior şi Cercetării<br />

Ştiinţifice Universitare (UEFISCSU);<br />

÷ Contractant: Universitatea Tehnică din Cluj-Napoca (UTCN), prin reprezentanţii săi legali<br />

(Rector, Contabil Şef şi Jurist) şi subsemnatul (conf. dr. <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>) în calitate <strong>de</strong><br />

director <strong>de</strong> proiect;<br />

CUPRINS<br />

1. Introducere .................................................................................................................................. 2<br />

2. Scop şi obiective........................................................................................................................... 3<br />

3. Activităţi şi rezultate................................................................................................................... 8<br />

4. Livrabile................................................................................................................................... 306<br />

5. Concluzii .................................................................................................................................. 318


1. Introducere<br />

Activităţile <strong>de</strong> <strong>cercetare</strong> prevăzute a se <strong>de</strong>sfăşura la începutul proiectului (la faza <strong>de</strong> contractare) au<br />

suferit modificări pe parcursul <strong>de</strong>rulării proiectului, şi au constituit obiectul unui şir <strong>de</strong> acte<br />

adiţionale consemnate între contractor (UEFISCSU) şi contractant (UTCN). Modificările suferite au<br />

avut ca obiect obiectivele, activităţile, livrabilele (cumulând rezultatele minimale aşteptate) cât şi<br />

sumele contractate pentru acestea.<br />

În forma sa finală (în urma modificărilor aduse) - şi finalizată a proiectului <strong>de</strong> <strong>cercetare</strong> - planul <strong>de</strong><br />

activităţi este prezentat în tabelul următor (Tabelul 1).<br />

Tabelul 1. Plan <strong>de</strong> realizare: Ani-Obiective-Activităţi-Livrabile<br />

Ani Obiective Activităţi Livrabile<br />

2007 Actualizare 1. Planificarea activităţilor experimentale; <strong>de</strong>rularea experimentelor <strong>de</strong>monstrative (<strong>de</strong> Site web<br />

documentare testare a meto<strong>de</strong>lor <strong>de</strong> analiză)<br />

proiect<br />

la nivelul 2. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi 1 BDI<br />

anului 2007 dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în 1 ISI<br />

Management străinătate)<br />

cunoştinţe 3. Selectare (abstracts), colectare (full text) informaţii private (pay per view), din publicaţii<br />

Elsevier & Springer<br />

4. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi<br />

dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în<br />

străinătate)<br />

5. Selectare (abstracts), colectare (full text) informaţii private (pay per view), din publicaţii<br />

Taylor&Francis & Wiley&Sons<br />

6. I<strong>de</strong>ntificarea surselor <strong>de</strong> date şi metodologiilor <strong>de</strong> colectare (eşantionare, criterii <strong>de</strong><br />

inclu<strong>de</strong>re şi exclu<strong>de</strong>re în studiu), şi <strong>de</strong> experimentare<br />

2008 Management 1. I<strong>de</strong>ntificarea meto<strong>de</strong>lor <strong>de</strong> analiză 2 BDI<br />

cunoştinţe 2. Analiza rezultatelor obţinute şi interpretarea rezultatelor 1 ISI<br />

Management 3. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi<br />

resurse<br />

dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în<br />

materiale străinătate)<br />

Management 4. Stabilirea necesarelor <strong>de</strong> materiale şi consumabile, i<strong>de</strong>ntificarea furnizorilor şi<br />

informaţie condiţiilor <strong>de</strong> procurare, întocmirea documentaţiilor <strong>de</strong> procurare, <strong>de</strong>rularea licitaţiilor<br />

pentru achiziţii<br />

5. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi<br />

dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în<br />

străinătate)<br />

6. Planificarea activităţilor experimentale; <strong>de</strong>rularea experimentelor <strong>de</strong>monstrative (<strong>de</strong><br />

testare a meto<strong>de</strong>lor <strong>de</strong> analiză)<br />

7. Proiectarea şi crearea bazelor <strong>de</strong> date pentru managementul cercetării şi a rezultatelor<br />

cercetării<br />

8. Completarea bazelor <strong>de</strong> date cu cunoştinţele provenite din documentare şi actualizare<br />

documentare (O1/2007) şi respectiv managementul cunoştinţelor (O2/2007)<br />

9. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi<br />

dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în<br />

străinătate)<br />

2009 Management 1. Crearea aplicaţiilor pentru interogarea bazei <strong>de</strong> date pentru managementul cercetării 2 BDI<br />

informaţie 2. Construirea mo<strong>de</strong>lelor moleculare (chimie cuantică) 1 ISI<br />

Partea 3. Colectarea informaţiei medicale <strong>de</strong> activitate terapeutică (chimie medicală)<br />

experimentală 4. Construirea mo<strong>de</strong>lelor Structură - Activitate folosind instrumentele specifice <strong>de</strong>zvoltate<br />

Integrarea 5. Obţinerea relaţiilor (semi)Cantitative Structură-Activitate, sQSARs<br />

cunoştinţelor 6. Validarea mo<strong>de</strong>lelor (TvT - Training versus Test, cv-loo - cross validation leave-oneout,<br />

CCA - Correlated Correlations Analysis)<br />

2010 "Drug 1. Aplicarea procedurilor QSAR şi colectarea informaţiei 2 BDI<br />

Design" 2. Construirea librăriilor <strong>de</strong> compuşi chimici virtuali (chimie combinatorială)<br />

2 ISI<br />

Realizarea 3. Interogarea bazelor <strong>de</strong> date internaţionale (Cambridge SDb, Protein Db, Visual Mol.<br />

spaţiului Dyn., MMDB - Mol. Mod. Db, PubChem Comp., PubChem Subst.), colectare<br />

virtual<br />

informaţii, elaborarea mo<strong>de</strong>lelor moleculare compuşi virtuali (chimie computaţională)<br />

Valorificarea 4. Obţinerea (Q)SRR, (Q)SPR, (Q)PAR, şi (Q)AAR (chimie farmaceutică)<br />

şi transferul 5. Construirea bazei <strong>de</strong> date cu cunoştinţe Compus chimic - Mo<strong>de</strong>l cuantic 3D -<br />

cercetării Descriptori moleculari - Proprietăţi fizico-bio-chimice - Activităţi terapeutice<br />

6. Proiectarea portalului web, Implementarea algoritmilor <strong>de</strong> interogare, Publicarea<br />

portalului web<br />

2


2. Scop şi obiective<br />

Scopul proiectului "De la chimia matematică la chimia cuantică şi chimia medicală" a fost<br />

integrarea <strong>de</strong> cunoştinţe specifice domeniului chimie matematică (şi anume elementele şi noţiunile<br />

<strong>de</strong> topologie moleculară) cu noţiunile <strong>de</strong> chimie cuantică (şi anume elementele şi noţiunile <strong>de</strong><br />

mo<strong>de</strong>lare moleculară) având ca <strong>de</strong>stinaţie realizarea <strong>de</strong> instrumente specifice chimiei medicale (şi<br />

anume relaţii cantitative între structura şi activitatea biologică <strong>de</strong> interes medical a seriilor <strong>de</strong><br />

compuşi chimici).<br />

Pentru atingerea acestui scop s-au stabilit, urmărit şi atins o serie <strong>de</strong> obiective <strong>de</strong>taliate în<br />

continuare:<br />

÷ Actualizare documentare la nivelul anului 2007<br />

o Pornind <strong>de</strong> la faptul că evoluţia conceptelor specifice domeniilor <strong>de</strong> frontieră (cum<br />

este cazul celor 3 domenii <strong>de</strong> frontieră în cadrul cărora proiectul se situează - chimie<br />

matematică, chimie cuantică şi chimie medicală) se realizează rapid, şi cu atât mai<br />

mult dacă este implicată şi puterea <strong>de</strong> calcul - fiind cazul pentru toate cele trei<br />

domenii - chimia matematică necesitând calcule complexe, chimia cuantică<br />

necesitând atât calcule complexe cât şi volum mare <strong>de</strong> date <strong>de</strong> intrare, iar chimia<br />

medicală operând cu volum mare <strong>de</strong> date <strong>de</strong> intrare - necesitatea actualizării<br />

documentării la începutul şi pe parcursul <strong>de</strong>sfăşurării proiectelor este şi a fost o<br />

necesitate;<br />

o Actualizarea documentării s-a realizat prin accesul la baze <strong>de</strong> date <strong>de</strong> specialitate<br />

cuprinzând lucrări reprezentative specifice domeniilor vizate, acces care a fost<br />

realizat parte în instituţia gazdă (a directorului <strong>de</strong> proiect) pentru acele baze <strong>de</strong> date<br />

şi pentru acele perioa<strong>de</strong> <strong>de</strong> timp la care accesul a fost posibil prin agrementurile<br />

instituţionale în care instituţia gazdă a fost parte, în parte în instituţia parteneră -<br />

UMF Cluj-Napoca prin coinvestigator Dr. Med. S. D. Bolboacă - membru al echipei<br />

<strong>de</strong> <strong>cercetare</strong>, şi ultima parte - prin accesul la bazele <strong>de</strong> date în instituţiile în care s-a<br />

participat la şcoli <strong>de</strong> vară, simpozioane, cursuri intensive, conferinţe, ş.a.m.d.<br />

prevăzute şi <strong>de</strong>sfăşurate ca activităţi în cadrul proiectului <strong>de</strong> fată; bazele <strong>de</strong> date<br />

folosite în documentare au fost (în principal): ScienceDirect (Elsevier), SpringerLink<br />

(Springer), InterScience (Wiley-Blackwell), BenthamDirect (Bentham), JSTOR<br />

(ITHAKA).<br />

÷ Management cunoştinţe<br />

o Analiza literaturii <strong>de</strong> specialitate a avut menirea <strong>de</strong> a oferi acele noţiunile specifice<br />

cu ajutorul cărora scopul proiectului să fie atins; obiectivul managementul<br />

cunoştinţelor a vizat obţinerea principiilor cu ajutorul cărora să se realizeze<br />

organizarea şi sistematizarea cunoştinţelor, pe baza instrumentelor şi mijloacelor<br />

care au stat la baza obţinerii acestora, cu referire directă la criteriile <strong>de</strong> inclu<strong>de</strong>re în<br />

studiu şi/sau exclu<strong>de</strong>re din studiu folosite în studiile colectate, modalităţile în care sa<br />

realizat eşantionarea, tipul <strong>de</strong> experiment ştiinţific folosit şi <strong>de</strong>signul experimental;<br />

o Activităţile aferente obiectivului Management cunoştinţe au permis:<br />

stabilirea următoarelor principii şi clasificatori pentru acestea: Propoziţii,<br />

ipoteze; Presupunerile ce trebuiesc făcute; I<strong>de</strong>ntificarea variabilei<br />

(variabilelor) <strong>de</strong>pen<strong>de</strong>nte (sunt datele <strong>de</strong> ieşire, rezultate); I<strong>de</strong>ntificarea<br />

variabilelor in<strong>de</strong>pen<strong>de</strong>nte (sunt datele <strong>de</strong> intrare care luate împreună<br />

formează spaţiul experimental); Care din variabilele in<strong>de</strong>pen<strong>de</strong>nte pot fi<br />

controlate; Caracterul populaţiei; Talia populaţiei; Costul şi resursele<br />

necesare (umane, materiale, etc.) pentru observare; Obiectivele propuse;<br />

Tipul studiului; Modalităţile <strong>de</strong> alegere a obiectului <strong>de</strong> studiu; Timpul<br />

necesar; Resursele financiare şi umane implicate; Procedura folosită; Accesul<br />

la date; Designul experimentului (Analiză factorială completă - Fisher,<br />

metodă ortogonală - Taguchi, etc);<br />

3


obţinerea surselor <strong>de</strong> date care pot şi au fost folosite ulterior drept sursă<br />

primară <strong>de</strong> informaţie în ceea ce priveşte structura şi proprietăţile compuşilor<br />

chimici în asociere cu <strong>de</strong>numirea şi activităţile biologice ale acestora:<br />

• Cambridge Structural Database<br />

o www.ccdc.cam.ac.uk/products/csd/;<br />

• Protein Data Bank<br />

o www.pdb.org/;<br />

• Visual Molecular Dynamics<br />

o www.ks.uiuc.edu/Research/vmd/;<br />

• Molecular Mo<strong>de</strong>ling DataBase<br />

o http://130.14.29.110/Structure/MMDB/mmdb.shtml;<br />

• PubChem Compounds<br />

o www.ncbi.nlm.nih.gov/pccompound;<br />

• PubChem Substance<br />

o www.ncbi.nlm.nih.gov/sites/entrez?db=pcsubstance<br />

i<strong>de</strong>ntificarea meto<strong>de</strong>lor <strong>de</strong> analiză în specificul Chimie matematică cu<br />

referire directă la fundamentele ştiinţifice ale acestui domeniu <strong>de</strong> preocupări -<br />

structura chimică ca un graf matematic, analiza structurii <strong>de</strong>pletizate <strong>de</strong><br />

atomii <strong>de</strong> hidrogen, graful molecular şi proprietăţi matematice stabilite pe<br />

baza acestuia, aplicaţiile topologiei moleculare în clasificarea şi<br />

caracterizarea compuşilor chimici;<br />

i<strong>de</strong>ntificarea meto<strong>de</strong>lor <strong>de</strong> analiză în specificul Chimie cuantică cu referire<br />

directă la mecanica funcţiilor orbitale, mo<strong>de</strong>lele <strong>de</strong> aproximare, diferitele<br />

nivele <strong>de</strong> teorie a aproximării stării staţionare pentru atomii cu mai mulţi<br />

electroni şi pentru moleculele cu mai mulţi atomi;<br />

i<strong>de</strong>ntificarea meto<strong>de</strong>lor <strong>de</strong> analiză în specificul Chimie medicală cu referire<br />

directă la relaţiile naturale care se stabilesc între structura şi proprietăţile<br />

substanţelor şi compuşilor chimici, modalităţile <strong>de</strong> observare şi experiment<br />

asupra acestor relaţii, şi informaţiile pe care relaţiile stabilite le aduc în<br />

caracterizarea compuşilor, proprietăţilor şi activităţilor cuprinse în relaţii;<br />

÷ Management resurse materiale<br />

o Pornind <strong>de</strong> la o serie <strong>de</strong> principii cum sunt costul achiziţiei, eficienţa în utilizare<br />

corelată cu costul <strong>de</strong> întreţinere şi importanţă a rezultatelor obţinute din exploatare,<br />

toate acestea în relaţie directă cu sfera <strong>de</strong> aplicabilitate în tematica proiectului s-au<br />

stabilit şi achiziţionat o serie <strong>de</strong> echipamente;<br />

o Echipamentele achiziţionate şi rolul acestora în <strong>de</strong>rularea proiectului a fost:<br />

Fluorometru - pentru analize în soluţie;<br />

Spectrofotometru - pentru analize <strong>de</strong> soli<strong>de</strong>;<br />

Staţii meteo - pentru monitorizarea condiţiilor <strong>de</strong> experimentare şi a<br />

parametrilor <strong>de</strong> mediu;<br />

Calculatoare tip Laptop - pentru a fi folosite împreună cu spectrofotometrul<br />

(care este portabil) la analize "in situ";<br />

Panouri fotovoltaice, acumulatori, regulator <strong>de</strong> încărcare, afişaj regulator,<br />

invertor - cu ajutorul cărora s-a realizat un sistem energetic portabil autonom<br />

- pentru a fi folosit să se efectueze acele analize chimice instrumentale la care<br />

accesul la alte surse <strong>de</strong> tensiune nu este posibil (analiza "in situ" <strong>de</strong> soluri<br />

contaminate cu poluanţi chimici);<br />

Sisteme <strong>de</strong> măsură şi transmisie a datelor (senzori <strong>de</strong> umiditate şi<br />

temperatură, repetitoare şi antene <strong>de</strong> transmisie);<br />

Calculatoare tip server (pentru gestiunea bazelor <strong>de</strong> date) şi tip staţie (pentru<br />

analiza datelor);<br />

Cărţi în problematica algoritmilor genetici - i<strong>de</strong>ntificată drept soluţie <strong>de</strong><br />

4


abordare integrată în căutarea relaţiilor structură-activitate;<br />

÷ Management informaţie<br />

o În <strong>de</strong>zvoltarea "top-down" (<strong>de</strong> sus în jos) Managementul informaţiei este următorul<br />

nivel <strong>de</strong> analiză şi a referit informaţiile acumulate prin parcurgerea activităţilor<br />

specifice atingerii obiectivelor <strong>de</strong> Actualizare documentare, Management cunoştinţe<br />

şi Management resurse materiale;<br />

o Dacă Managementul cunoştinţelor sub eticheta cunoştinţe a referit piese complexe <strong>de</strong><br />

informaţie <strong>de</strong> naturi diferite (<strong>de</strong> la modalitatea <strong>de</strong> experimentare şi colectare a datelor<br />

la tipul <strong>de</strong> date obţinute) managementul informaţiei referă informaţii cu structură<br />

bine <strong>de</strong>finită (activitate biologică <strong>de</strong> interes, clasă <strong>de</strong> compuşi chimici cu potenţă<br />

biologică, structură la nivel topologic, structură la nivel geometric, <strong>de</strong>scriptori<br />

moleculari, ecuaţii structură-activitate, analiză statistică; finalitatea managementului<br />

informaţiei a fost structura tabelelor ce stochează cunoştinţele şi rezultatele<br />

cercetării;<br />

÷ Partea experimentală<br />

o Faza imediat următoare <strong>de</strong>finirii structurii tabelelor ce stochează cunoştinţele şi<br />

rezultatele cercetării are ca obiect realizarea aplicaţiilor care să permită operarea cu<br />

acestea; în fapt această fază se constituie într-un întreg ciclu <strong>de</strong> viaţă - creare şi<br />

utilizare <strong>de</strong> aplicaţii care operează cu cunoştinţele şi rezultatele cercetării;<br />

o O serie <strong>de</strong> activităţi au fost <strong>de</strong>rulate pentru a atinge acest obiectiv; a fost ales un set<br />

<strong>de</strong> date "şcoală" - suficient <strong>de</strong> simple pentru a permite <strong>de</strong>zvoltarea primei generaţii a<br />

aplicaţiilor astfel încât crearea şi utilizarea acestor informaţii să se facă în timpi<br />

rezonabili <strong>de</strong> calcul şi în acelaşi timp suficient <strong>de</strong> complexe pentru ca elementele<br />

esenţiale aşteptate <strong>de</strong> la aceste aplicaţii să se regăsească în structura naturală a<br />

datelor analizate; în acest sens a fost ales drept set <strong>de</strong> date "şcoală" un set <strong>de</strong> 31 <strong>de</strong><br />

aminoacizi având ca proprietate observată punctul <strong>de</strong> topire; a fost parcurs un ciclu<br />

<strong>de</strong> viaţă în <strong>de</strong>zvoltarea aplicaţiilor care operează cu cunoştinţele şi rezultatele<br />

cercetării - proiectare, realizare, testare, modificare - ciclu <strong>de</strong> viaţă care a avut ca<br />

finalitate aplicaţii pentru obţinerea (procesarea) şi apoi stocarea cunoştinţelor<br />

cercetării, aplicaţii pentru obţinerea (procesarea) şi apoi stocarea rezultatelor<br />

cercetării, aplicaţii pentru analiza <strong>de</strong> validitate a rezultatelor cercetării; aplicaţii<br />

pentru interogarea şi vizualizarea cunoştinţelor şi rezultatelor cercetării; o altă<br />

componentă a părţii experimentale a constituit-o colectarea şi validarea pentru<br />

diferite seturi <strong>de</strong> compuşi chimici <strong>de</strong> interes a informaţiei medicale <strong>de</strong> natură<br />

terapeutică, folosind în acest sens sursele <strong>de</strong> date i<strong>de</strong>ntificate, literatura <strong>de</strong><br />

specialitate colectată şi aparatura experimentală achiziţionată;<br />

÷ Integrarea cunoştinţelor<br />

o Cunoştinţele <strong>de</strong> natură chimică cuprinzând aspectul structurii topologice (şi<br />

informaţiile aferente în specificul chimie matematică), aspectul structurii geometrice<br />

(şi informaţiile aferente în specificul chimie cuantică) cu cunoştinţele <strong>de</strong> natură<br />

medicală (cuprinzând aspectul potenţei biologice ale unui set <strong>de</strong> compuşi <strong>de</strong> interes)<br />

se integrează prin intermediul relaţiilor care se obţin între structura şi activitatea<br />

compuşilor;<br />

o Obţinerea <strong>de</strong> relaţii structură-activitate pe o serie <strong>de</strong> compuşi şi analiza <strong>de</strong> <strong>de</strong>taliu a<br />

efectului pe care îl au diferite opţiuni <strong>de</strong> căutare a relaţiei optimale asupra evoluţiei<br />

către obiectivul <strong>de</strong> optimizare a relaţiei structură-activitate au asigurat atingerea<br />

obiectivului <strong>de</strong> integrare a cunoştinţelor;<br />

÷ "Drug Design"<br />

o Seturile <strong>de</strong> compuşi chimici selectate, colectate şi validate în partea experimentală au<br />

constituit materialul cercetării pentru atingerea obiectivului "drug <strong>de</strong>sign";<br />

o Au fost raţionalizate prin aplicarea procedurilor QSAR şi colectarea informaţiei<br />

implicând elaborarea mo<strong>de</strong>lelor moleculare şi construirea librăriilor <strong>de</strong> compuşi<br />

5


chimici virtuali un număr <strong>de</strong> 12 seturi <strong>de</strong> compuşi chimici <strong>de</strong> interes ce posedă<br />

potenţă biologică - în total peste 1000 <strong>de</strong> compuşi chimici, rezultatul raţionalizării<br />

aflându-se stocat în baza <strong>de</strong> date MDFV construită în acest sens (are 21.5 Gb la data<br />

<strong>de</strong> 26 Sept 2010);<br />

÷ Realizarea spaţiului virtual<br />

o Spaţiul virtual <strong>de</strong> la chimia matematică la chimia cuantică şi la chimia medicală<br />

oferă soluţii pe întreg parcursul traseului <strong>de</strong> la structura compuşilor chimici la<br />

potenţa biologică a acestora şi la relaţia care se stabileşte între acestea;<br />

o Spaţiul virtual realizat cuprin<strong>de</strong>:<br />

Bazele <strong>de</strong> date MDF şi MDFV - stocate pe un server FreeBSD cu suport<br />

MySQL Server din intranet (IP: 172.27.211.4) fiind distinctă <strong>de</strong> restul<br />

aplicaţiilor, soluţie <strong>de</strong> stocare aleasă pentru o serie <strong>de</strong> motive, dintre care<br />

<strong>de</strong>scongestionarea reţelei, separarea spaţiului <strong>de</strong> stocare <strong>de</strong> unităţile <strong>de</strong><br />

procesare, securitatea şi protecţia <strong>de</strong> exterior (Internet), nefiind necesar<br />

accesul "<strong>de</strong> la distanţă" la acestea;<br />

Programele <strong>de</strong> calcul MDF şi MDFV - aplicaţii PHP stocate şi executate <strong>de</strong><br />

pe un server FreeBSD cu suport MySQL Client din intranet (IP:<br />

172.27.211.5) a căror misiune este calcularea familiei <strong>de</strong> <strong>de</strong>scriptori şi astfel<br />

realizarea bazei <strong>de</strong> cunoştinţe aferentă unui set <strong>de</strong> compuşi pentru care se<br />

posedă o proprietate sau activitate biologică <strong>de</strong> interes; aceeaşi sumă <strong>de</strong><br />

motive ca în cazul bazelor <strong>de</strong> date a făcut ca aceste aplicaţii să fie stocate şi<br />

executate în intranet;<br />

Programele <strong>de</strong> analiză (analiza <strong>de</strong> regresie simplă, multiplă, multiplă perechi,<br />

programul evolutiv) preiau datele din baza <strong>de</strong> date în raport cu specificaţiile<br />

<strong>de</strong> intrare - set, proprietate, tip <strong>de</strong> regresie căutată - şi sunt aplicaţii clientserver<br />

implementate în limbajul FreePascal şi compilate sub formă <strong>de</strong> binare<br />

executabile sub platformă Windows, efectuează căutarea relaţiilor structurăactivitate<br />

folosind algoritmi <strong>de</strong> căutare <strong>de</strong> la cei clasici <strong>de</strong> tipul "fiecare cu<br />

fiecare", la generaţii hibri<strong>de</strong> <strong>de</strong> tipul "fiecare cu fiecare în perechi <strong>de</strong> fiecare"<br />

şi până la generaţii euristice din care face parte algoritmul genetic<br />

implementat; oricare din aceste aplicaţii se execută pe orice calculator pe care<br />

este instalat MS Windows care este conectat la reţeaua intranet şi imediat<br />

obţinute relaţiile structură-activitate sunt salvate prin intermediul conexiunii<br />

pe server în baza <strong>de</strong> date MDF sau MDFV după caz; aceste aplicaţii sunt<br />

aplicaţii consumatoare <strong>de</strong> timp (o analiză poate dura două săptămâni) şi <strong>de</strong><br />

resurse (o analiză poate consuma până la 2G <strong>de</strong> memorie internă), motiv<br />

pentru care soluţia <strong>de</strong> implementare a fost aleasă FreePascal, codul generat<br />

fiind cod binar optimizat (pe 3 nivele <strong>de</strong> optimizare <strong>de</strong> cod) iar execuţia fiind<br />

aproape <strong>de</strong> maxim posibil în ceea ce priveşte viteza <strong>de</strong> execuţie;<br />

Programele <strong>de</strong> validare statistică (http://l.aca<strong>de</strong>micdirect.org/Statistics) şi <strong>de</strong><br />

interogare a rezultatelor (http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs) sunt<br />

stocate pe un calculator accesibil pe Internet (IP: 193.226.7.203) care se<br />

conectează prin intermediul porţii (IP: 193.226.7.211) la reţeaua intranet<br />

(172.27.211.1) şi apoi la bazele <strong>de</strong> date MDF şi MDFV, au ca scop analiza şi<br />

prezentarea rezultatelor;<br />

÷ Valorificarea şi transferul cercetării<br />

o Finalitatea proiectului "De la chimia matematică la chimia cuantică şi la chimia<br />

medicală" o reprezintă transferul cercetării către acele domenii din care şi către care<br />

se îndreaptă;<br />

o O serie <strong>de</strong> aplicaţii având ca scop valorificarea şi transferul cercetării către "Drug<br />

Design" au fost create; astfel:<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDFV/?set=sulfon18&pdb=s001<br />

6


• cu acces parţial restricţionat; necesită instalarea aplicaţiei<br />

"MDLChime" - versiunea 2.6 disponibilă gratuit (căutare după<br />

"MDLChime26SP7.exe"); permite vizualizarea tridimensională a<br />

structurii moleculare folosind doar Internet Explorer (v. figura <strong>de</strong> mai<br />

jos);<br />

http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs/MDF_SARs/k_browse_or_quer<br />

y.php?database=MDFSARs<br />

• cu acces liber; oferă mo<strong>de</strong>lul structură-activitate în abordarea MDF,<br />

ecuaţia <strong>de</strong> regresie (secvenţa "Browse") şi analiza acesteia (secvenţa<br />

"Query");<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDFV/?set=sulfon18&property=<br />

logKI&id=1&lori=<strong>de</strong>scriptive_statistics<br />

• cu acces parţial restricţionat; oferă mo<strong>de</strong>lul structură-activitate în<br />

abordarea MDFV, ecuaţia <strong>de</strong> regresie şi analiza <strong>de</strong>scriptivă a acesteia;<br />

7


3. Activităţi şi rezultate<br />

÷ 2007A1. Planificarea activităţilor experimentale; <strong>de</strong>rularea experimentelor <strong>de</strong>monstrative (<strong>de</strong><br />

testare a meto<strong>de</strong>lor <strong>de</strong> analiză)<br />

÷ 2007A2. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri)<br />

şi dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />

÷ 2007A3. Selectare (abstracts), colectare (full text) informaţii private (pay per view), din<br />

publicaţii Elsevier & Springer<br />

÷ 2007A4. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri)<br />

şi dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />

÷ 2007A5. Selectare (abstracts), colectare (full text) informaţii private (pay per view), din<br />

publicaţii Taylor&Francis & Wiley&Sons<br />

÷ 2007A6. I<strong>de</strong>ntificarea surselor <strong>de</strong> date şi metodologiilor <strong>de</strong> colectare (eşantionare, criterii <strong>de</strong><br />

inclu<strong>de</strong>re şi exclu<strong>de</strong>re în studiu), şi <strong>de</strong> experimentare<br />

÷ 2008A1. I<strong>de</strong>ntificarea meto<strong>de</strong>lor <strong>de</strong> analiză<br />

÷ 2008A2. Analiza rezultatelor obţinute şi interpretarea rezultatelor<br />

÷ 2008A3. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri)<br />

şi dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />

÷ 2008A4. Stabilirea necesarelor <strong>de</strong> materiale şi consumabile, i<strong>de</strong>ntificarea furnizorilor şi<br />

condiţiilor <strong>de</strong> procurare, întocmirea documentaţiilor <strong>de</strong> procurare, <strong>de</strong>rularea licitaţiilor pentru<br />

achiziţii<br />

÷ 2008A5. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri)<br />

şi dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />

÷ 2008A6. Planificarea activităţilor experimentale; <strong>de</strong>rularea experimentelor <strong>de</strong>monstrative (<strong>de</strong><br />

testare a meto<strong>de</strong>lor <strong>de</strong> analiză)<br />

÷ 2008A7. Proiectarea şi crearea bazelor <strong>de</strong> date pentru managementul cercetării şi a rezultatelor<br />

cercetării<br />

÷ 2008A8. Completarea bazelor <strong>de</strong> date cu cunoştinţele provenite din documentare şi actualizare<br />

documentare (O1/2007) şi respectiv managementul cunoştinţelor (O2/2007)<br />

÷ 2008A9. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri)<br />

şi dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />

÷ 2009A1. Crearea aplicaţiilor pentru interogarea bazei <strong>de</strong> date pentru managementul cercetării<br />

÷ 2009A2. Construirea mo<strong>de</strong>lelor moleculare (chimie cuantică)<br />

÷ 2009A3. Colectarea informaţiei medicale <strong>de</strong> activitate terapeutică (chimie medicală)<br />

÷ 2009A4. Construirea mo<strong>de</strong>lelor Structură - Activitate folosind instrumentele specifice<br />

<strong>de</strong>zvoltate<br />

÷ 2009A5. Obţinerea relaţiilor (semi)Cantitative Structură-Activitate, sQSARs<br />

÷ 2009A6. Validarea mo<strong>de</strong>lelor (TvT - Training versus Test, cv-loo - cross validation leave-oneout,<br />

CCA - Correlated Correlations Analysis)<br />

÷ 2010A1. Aplicarea procedurilor QSAR şi colectarea informaţiei<br />

÷ 2010A2. Construirea librăriilor <strong>de</strong> compuşi chimici virtuali (chimie combinatorială)<br />

÷ 2010A3. Interogarea bazelor <strong>de</strong> date internaţionale (Cambridge SDb, Protein Db, Visual Mol.<br />

Dyn., MMDB - Mol. Mod. Db, PubChem Comp., PubChem Subst.), colectare informaţii,<br />

elaborarea mo<strong>de</strong>lelor moleculare compuşi virtuali (chimie computaţională)<br />

÷ 2010A4. Obţinerea (Q)SRR, (Q)SPR, (Q)PAR, şi (Q)AAR (chimie farmaceutică)<br />

÷ 2010A5. Construirea bazei <strong>de</strong> date cu cunoştinţe Compus chimic - Mo<strong>de</strong>l cuantic 3D -<br />

Descriptori moleculari - Proprietăţi fizico-bio-chimice - Activităţi terapeutice<br />

÷ 2010A6. Proiectarea portalului web, Implementarea algoritmilor <strong>de</strong> interogare, Publicarea<br />

portalului web<br />

8


2007A1. Planificarea activităţilor experimentale; <strong>de</strong>rularea experimentelor <strong>de</strong>monstrative (<strong>de</strong><br />

testare a meto<strong>de</strong>lor <strong>de</strong> analiză)<br />

Activităţile experimentale planificate au fost:<br />

÷ Testarea meto<strong>de</strong>lor <strong>de</strong> regresie simplă<br />

÷ Testarea meto<strong>de</strong>i <strong>de</strong> regresie multiplă<br />

÷ Testarea meto<strong>de</strong>i <strong>de</strong> i<strong>de</strong>ntificare a <strong>de</strong>pen<strong>de</strong>nţei liniare<br />

÷ Testarea meto<strong>de</strong>i <strong>de</strong> predicţie bazată pe regresie<br />

Testarea meto<strong>de</strong>lor <strong>de</strong> regresie simplă<br />

Au fost implementate module online pentru analiza <strong>de</strong> regresie simplă capitalizând cunoştinţele<br />

dintr-o serie <strong>de</strong> studii anterior <strong>de</strong>rulate având ca subiect formularea <strong>de</strong> mo<strong>de</strong>le (Sârbu & Jäntschi,<br />

1998; Naşcu & others, 1999; Jäntschi, 2002-FSD1; Jäntschi, 2002-ASSP), şi verificarea mo<strong>de</strong>lelor<br />

într-o serie <strong>de</strong> studii <strong>de</strong> regresie (Jäntschi, 2002-TRPI; Jäntschi, 2002-ACRA; Jäntschi & Diu<strong>de</strong>a,<br />

2003-DM1; Stoenoiu & others, 2007-CMST; Tăut & others, 2007-MMCP; Jäntschi & Bolboacă,<br />

2007-JLRR) care au avut ca finalitate elaborarea mo<strong>de</strong>lelor <strong>de</strong> calcul în versiunea "release" a<br />

aplicaţiilor <strong>de</strong> regresie <strong>de</strong>zvoltate. Aceste module sunt înglobate în mai multe aplicaţii <strong>de</strong>zvoltate,<br />

una dintre acestea fiind disponibilă la adresa:<br />

http://l.aca<strong>de</strong>micdirect.org/Statistics/regression_mo<strong>de</strong>ls/.<br />

Datele următoare au fost folosite pentru testarea meto<strong>de</strong>lor <strong>de</strong> regresie simplă:<br />

Valorile numerice reprezentate în graficul <strong>de</strong> mai sus sunt:<br />

Nr X Y 7 1.16 0.71 14 1.44 0.8 21 1.61 0.82 28 1.97 0.95<br />

1 0.72 0.46 8 1.22 0.75 15 1.44 0.85 22 1.69 0.82 29 2.02 0.95<br />

2 0.92 0.61 9 1.27 0.73 16 1.46 0.81 23 1.8 0.85 30 2.11 1<br />

3 1 0.62 10 1.28 0.74 17 1.51 0.77 24 1.86 0.96 31 2.28 0.83<br />

4 1 0.65 11 1.33 0.8 18 1.57 0.9 25 1.91 0.96 32 2.91 0.93<br />

5 1.02 0.63 12 1.34 0.75 19 1.58 0.79 26 1.95 1<br />

6 1.14 0.68 13 1.42 0.79 20 1.58 0.87 27 1.97 0.82<br />

Următorul tabel centralizează rezultatele obţinute la testarea meto<strong>de</strong>lor <strong>de</strong> regresie simplă:<br />

Nr Metoda Varianta Ecuaţia Formula <strong>de</strong> calcul Analiza <strong>de</strong> regresie<br />

1 liniară 1 Y=aX a = M(Y)/M(X) a = 0.517<br />

MSE = 0.146<br />

MSE 2 = 0.0213<br />

r = 0.833<br />

r 2 = 0.694<br />

(Y-aX) 2 2 liniară 2 Y=aX = min a = 0.495<br />

MSE = 0.142<br />

MSE 2 = 0.0201<br />

r = 0.833<br />

r 2 (X-Y/a)<br />

= 0.694<br />

2 3 liniară 3 Y=aX = min a = 0.511<br />

9


MSE = 0.144<br />

MSE 2 = 0.0207<br />

r = 0.833<br />

r 2 a = √M(Y<br />

= 0.694<br />

2 )/M(X 2 4 liniară 4 Y=aX ) a = 0.503<br />

MSE = 0.142<br />

MSE 2 = 0.0202<br />

r = 0.833<br />

r 2 = 0.694<br />

(aX/b-Y/b+1) 2<br />

5 liniară 5 Y=aX+b = a = 0.580<br />

min<br />

b = 0.149<br />

MSE = 0.078<br />

MSE 2 = 0.0061<br />

r = 0.833<br />

r 2 = 0.694<br />

(Y-aX-b) 2 6 liniară 6 Y=aX+b = min a = 0.445<br />

b = 0.229<br />

MSE = 0.068<br />

MSE 2 = 0.0047<br />

r = 0.833<br />

r 2 = 0.694<br />

(X-Y/a+b/a) 2 7 liniară 7 Y=aX+b = min a = 0.289<br />

b = 14.198<br />

MSE = 22.34<br />

MSE 2 = 449<br />

r = 0.833<br />

r 2 = 0.694<br />

a = √M(Y 2 )/M(X 2 8 liniară 8 Y=aX+b ) a = 0.374<br />

b= M(Y)-aM(X) b = 0.275<br />

MSE = 0.071<br />

MSE 2 = 0.0051<br />

r = 0.833<br />

r 2 = 0.694<br />

9 hiperbolică 1 (X+a)(Y+b)-c=0 a, b şi c după a = -1336<br />

formulele <strong>de</strong> mai jos b = 1410<br />

c = -1112<br />

MSE = 0.378<br />

MSE 2 = 0.1425<br />

r = 0.833<br />

r 2 = 0.694<br />

C(X,Y) = M(XY) −M(X)M(Y) , c = ab + aM(Y) + bM(X) + M(XY)<br />

2 2<br />

2<br />

M(XY)C(X,XY) − M(X )C(Y,XY) + M(X)M(Y) ( M(XY ) −M(X<br />

Y) )<br />

a =<br />

2 2<br />

M(Y )C(X,X) − M(XY)C(X,Y) + M(X)M(Y) M(XY) −M(X<br />

)<br />

b =<br />

( )<br />

( 2 )<br />

( )<br />

2 2<br />

M(XY)C(Y,XY) − M(Y )C(X,XY) + M(X)M(Y) M(X Y) −M(XY<br />

)<br />

2 2<br />

M(Y )C(X,X) − M(XY)C(X,Y) + M(X)M(Y) M(XY) −M(X<br />

)<br />

Y=a+bX -1<br />

(X(Y-a)-b) 2 = min<br />

10 hiperbolică 2 a = 0.855<br />

b = -0.038<br />

MSE = 0.119<br />

MSE 2 = 0.0142<br />

r = 0.923<br />

10


2 Y<br />

= 0.852<br />

-1 =a+bX -1<br />

(Y -1 -a-bX -1 ) 2 11 hiperbolică 3 = min a = -24.37<br />

b = 40.237<br />

MSE = 0.766<br />

MSE 2 = 0.586<br />

r = -0.781<br />

r 2 = 0.610<br />

Testarea meto<strong>de</strong>i <strong>de</strong> regresie multiplă<br />

Au fost implementate module online pentru analiza <strong>de</strong> regresie multiplă capitalizând cunoştinţele<br />

dintr-o serie <strong>de</strong> studii anterior <strong>de</strong>rulate având ca subiect verificarea mo<strong>de</strong>lelor într-o serie <strong>de</strong> studii<br />

<strong>de</strong> regresie (Jäntschi & Pică, 2003-CASS; Pică & Jäntschi, 2003-CSC1; Pică & Jäntschi, 2003-<br />

CSC2) şi formularea <strong>de</strong> rutine automate <strong>de</strong> calcul (Jäntschi, 2004-DCS), şi care au avut ca finalitate<br />

elaborarea mo<strong>de</strong>lelor <strong>de</strong> calcul în versiunea "release" a aplicaţiilor <strong>de</strong> regresie <strong>de</strong>zvoltate. Aceste<br />

module sunt înglobate în mai multe aplicaţii <strong>de</strong>zvoltate, una dintre acestea fiind disponibilă la<br />

adresa: http://l.aca<strong>de</strong>micdirect.ro/Statistics/multi_regression/.<br />

Datele următoare au fost folosite pentru testarea meto<strong>de</strong>lor <strong>de</strong> regresie multiplă:<br />

1<br />

Valorile numerice reprezentate în graficul <strong>de</strong> mai sus sunt:<br />

Mol ISDmsHt lADrtHg Y<br />

PCB001 151.28 -2.4129 0.0997<br />

PCB002 150.54 -2.4752 0.1544<br />

PCB003 150.89 -2.4799 0.1937<br />

PCB004 147.93 -2.5878 0.2245<br />

PCB005 148.27 -2.6449 0.2785<br />

PCB006 146.92 -2.6610 0.2709<br />

PCB007 147.28 -2.6499 0.2566<br />

PCB008 147.40 -2.6659 0.2783<br />

PCB009 146.92 -2.6638 0.257<br />

PCB010 147.93 -2.5976 0.2243<br />

PCB011 146.28 -2.7289 0.3238<br />

PCB012 147.99 -2.7018 0.3298<br />

PCB013 146.55 -2.7348 0.3315<br />

0<br />

-3.40<br />

-2.40<br />

11<br />

150<br />

135<br />

120<br />

PCB014 146.17 -2.7028 0.2373<br />

PCB015 146.95 -2.7398 0.3387<br />

PCB016 144.84 -2.8090 0.3625<br />

PCB017 143.95 -2.8148 0.3398<br />

PCB018 143.92 -2.8046 0.3378<br />

PCB019 144.45 -2.7588 0.3045<br />

PCB020 143.94 -2.8881 0.417<br />

PCB021 145.59 -2.8521 0.4135<br />

PCB022 144.33 -2.8943 0.4267<br />

PCB023 144.26 -2.8423 0.377<br />

PCB024 144.98 -2.7928 0.3508<br />

PCB025 142.85 -2.8941 0.3937<br />

PCB026 143.03 -2.8787 0.3911<br />

PCB027 143.20 -2.8355 0.3521


PCB028 143.38 -2.8993 0.4031<br />

PCB029 144.72 -2.8430 0.382<br />

PCB030 143.55 -2.8075 0.3165<br />

PCB031 143.43 -2.8846 0.4094<br />

PCB032 143.81 -2.8378 0.3636<br />

PCB033 144.41 -2.8783 0.4163<br />

PCB034 142.48 -2.8821 0.3782<br />

PCB035 143.67 -2.9513 0.4738<br />

PCB036 141.95 -2.9517 0.4375<br />

PCB037 143.98 -2.9575 0.4858<br />

PCB038 144.95 -2.9018 0.5102<br />

PCB039 142.13 -2.9587 0.4488<br />

PCB040 141.79 -3.0255 0.5102<br />

PCB041 142.20 -3.0078 0.499<br />

PCB042 140.81 -3.0324 0.487<br />

PCB043 140.74 -3.0015 0.4587<br />

PCB044 140.86 -3.0208 0.4832<br />

PCB045 141.71 -2.9477 0.4334<br />

PCB046 141.30 -2.9745 0.445<br />

PCB047 139.96 -3.0381 0.4639<br />

PCB048 141.30 -3.0027 0.4651<br />

PCB049 139.89 -3.0274 0.461<br />

PCB050 140.38 -2.9636 0.4007<br />

PCB051 140.51 -2.9777 0.4242<br />

PCB052 139.93 -3.0156 0.4557<br />

PCB053 140.35 -2.9670 0.4187<br />

PCB054 141.12 -2.9114 0.38<br />

PCB055 141.20 -3.0914 0.5562<br />

PCB056 141.37 -3.1016 0.5676<br />

PCB057 139.95 -3.0800 0.5515<br />

PCB058 139.53 -3.1049 0.5267<br />

PCB059 140.56 -3.0287 0.486<br />

PCB060 141.20 -3.0914 0.5676<br />

PCB061 142.89 -3.0272 0.5331<br />

PCB062 142.20 -2.9831 0.4685<br />

PCB063 140.25 -3.0872 0.529<br />

PCB064 141.08 -3.0320 0.4999<br />

PCB065 142.20 -2.9716 0.4671<br />

PCB066 140.33 -3.1075 0.5447<br />

PCB067 140.32 -3.0814 0.5214<br />

PCB068 138.35 -3.1119 0.504<br />

PCB069 139.06 -3.0453 0.451<br />

PCB070 140.46 -3.0913 0.5407<br />

PCB071 140.74 -3.0447 0.4989<br />

PCB072 138.61 -3.0945 0.4984<br />

PCB073 138.69 -3.0486 0.4554<br />

PCB074 140.76 -3.0875 0.5341<br />

PCB075 139.70 -3.0475 0.4643<br />

PCB076 141.30 -3.0730 0.5408<br />

PCB077 141.04 -3.1696 0.6295<br />

12<br />

PCB078 140.67 -3.1465 0.6024<br />

PCB079 139.28 -3.1702 0.5894<br />

PCB080 137.65 -3.1697 0.5464<br />

PCB081 140.89 -3.1536 0.6149<br />

PCB082 139.09 -3.2205 0.6453<br />

PCB083 137.72 -3.2131 0.6029<br />

PCB084 138.58 -3.1580 0.5744<br />

PCB085 138.15 -3.2273 0.6224<br />

PCB086 139.42 -3.1790 0.6105<br />

PCB087 138.16 -3.2153 0.6175<br />

PCB088 138.96 -3.1307 0.5486<br />

PCB089 138.70 -3.1661 0.5779<br />

PCB090 136.66 -3.2207 0.5814<br />

PCB091 137.71 -3.1622 0.5549<br />

PCB092 136.78 -3.2077 0.5742<br />

PCB093 138.85 -3.1224 0.5437<br />

PCB094 137.12 -3.1594 0.5331<br />

PCB095 137.63 -3.1503 0.5464<br />

PCB096 138.30 -3.0959 0.5057<br />

PCB097 138.19 -3.2151 0.61<br />

PCB098 137.18 -3.1758 0.5415<br />

PCB099 137.26 -3.2215 0.588<br />

PCB100 136.43 -3.1787 0.5212<br />

PCB101 137.26 -3.2094 0.5816<br />

PCB102 137.78 -3.1579 0.5431<br />

PCB103 136.24 -3.1675 0.5142<br />

PCB104 137.08 -3.1084 0.4757<br />

PCB105 138.61 -3.3010 0.7049<br />

PCB106 138.53 -3.2612 0.668<br />

PCB107 137.32 -3.2890 0.6628<br />

PCB108 136.74 -3.3048 0.6626<br />

PCB109 137.73 -3.2154 0.6016<br />

PCB110 138.04 -3.2333 0.6314<br />

PCB111 135.57 -3.2916 0.6183<br />

PCB112 137.81 -3.2023 0.5986<br />

PCB113 136.08 -3.2367 0.5862<br />

PCB114 138.87 -3.2683 0.6828<br />

PCB115 138.28 -3.2186 0.6171<br />

PCB116 140.69 -3.1448 0.6132<br />

PCB117 138.24 -3.2065 0.615<br />

PCB118 137.73 -3.2900 0.6693<br />

PCB119 136.58 -3.2505 0.5968<br />

PCB120 135.85 -3.2936 0.6256<br />

PCB121 134.49 -3.2550 0.5518<br />

PCB122 138.29 -3.2921 0.6871<br />

PCB123 137.16 -3.2988 0.6658<br />

PCB124 137.38 -3.2808 0.6584<br />

PCB125 137.56 -3.2324 0.6142<br />

PCB126 137.98 -3.3609 0.7512<br />

PCB127 136.31 -3.3607 0.7078


PCB128 136.38 -3.4116 0.7761<br />

PCB129 136.34 -3.3870 0.7501<br />

PCB130 134.97 -3.4039 0.7184<br />

PCB131 135.78 -3.3375 0.6853<br />

PCB132 135.93 -3.3453 0.7035<br />

PCB133 133.67 -3.3952 0.6871<br />

PCB134 135.77 -3.3282 0.6796<br />

PCB135 134.43 -3.3376 0.6563<br />

PCB136 135.51 -3.2748 0.6257<br />

PCB137 135.48 -3.4055 0.7329<br />

PCB138 135.48 -3.4055 0.7403<br />

PCB139 134.95 -3.3413 0.6707<br />

PCB140 134.57 -3.3634 0.6707<br />

PCB141 135.40 -3.3811 0.72<br />

PCB142 137.38 -3.2892 0.6848<br />

PCB143 135.84 -3.3307 0.6789<br />

PCB144 134.83 -3.3291 0.6563<br />

PCB145 135.58 -3.2721 0.6149<br />

PCB146 134.06 -3.3977 0.6955<br />

PCB147 134.81 -3.3329 0.6608<br />

PCB148 132.95 -3.3566 0.6243<br />

PCB149 135.00 -3.3367 0.6672<br />

PCB150 134.21 -3.2887 0.5969<br />

PCB151 134.81 -3.3196 0.6499<br />

PCB152 135.38 -3.2630 0.6062<br />

PCB153 134.57 -3.3990 0.7036<br />

PCB154 133.65 -3.3544 0.6349<br />

PCB155 133.03 -3.3014 0.5666<br />

PCB156 135.88 -3.4662 0.8105<br />

PCB157 135.48 -3.4879 0.8184<br />

PCB158 135.19 -3.4161 0.7429<br />

PCB159 134.09 -3.4692 0.7655<br />

PCB160 136.25 -3.3722 0.7396<br />

PCB161 133.20 -3.4200 0.6968<br />

PCB162 134.27 -3.4743 0.7737<br />

PCB163 135.23 -3.4027 0.7396<br />

PCB164 134.89 -3.4161 0.7399<br />

PCB165 133.36 -3.4053 0.692<br />

PCB166 136.72 -3.3762 0.7572<br />

PCB167 134.60 -3.4758 0.7814<br />

PCB168 133.35 -3.4347 0.7068<br />

PCB169 134.95 -3.5475 0.8625<br />

PCB170 133.57 -3.5738 0.874<br />

PCB171 133.12 -3.5207 0.8089<br />

PCB172 132.24 -3.5650 0.8278<br />

PCB173 134.24 -3.4918 0.8152<br />

PCB174 133.10 -3.5046 0.7965<br />

PCB175 131.58 -3.5130 0.7611<br />

PCB176 132.74 -3.4468 0.7305<br />

PCB177 133.06 -3.5114 0.8031<br />

13<br />

PCB178 131.64 -3.5024 0.7537<br />

PCB179 132.62 -3.4369 0.7205<br />

PCB180 132.66 -3.5670 0.8362<br />

PCB181 133.32 -3.4960 0.7968<br />

PCB182 131.66 -3.5238 0.7653<br />

PCB183 132.19 -3.5115 0.772<br />

PCB184 131.49 -3.4607 0.7016<br />

PCB185 133.28 -3.4826 0.7848<br />

PCB186 133.94 -3.4240 0.7416<br />

PCB187 132.13 -3.5020 0.7654<br />

PCB188 131.25 -3.4517 0.692<br />

PCB189 132.78 -3.6479 0.9142<br />

PCB190 133.66 -3.5688 0.874<br />

PCB191 132.00 -3.5952 0.8447<br />

PCB192 131.75 -3.5718 0.8269<br />

PCB193 132.12 -3.5803 0.8397<br />

PCB194 130.80 -3.7308 0.962<br />

PCB195 131.52 -3.6711 0.9321<br />

PCB196 130.24 -3.6759 0.8938<br />

PCB197 129.97 -3.6147 0.8293<br />

PCB198 130.07 -3.6621 0.8845<br />

PCB199 131.14 -3.5940 0.8494<br />

PCB200 129.81 -3.6048 0.8197<br />

PCB201 130.07 -3.6621 0.8875<br />

PCB202 129.77 -3.5937 0.8089<br />

PCB203 130.59 -3.6610 0.8938<br />

PCB204 129.80 -3.6087 0.8217<br />

PCB205 130.50 -3.7430 0.9678<br />

PCB206 128.67 -3.8212 1.0103<br />

PCB207 128.32 -3.7579 0.9423<br />

PCB208 128.24 -3.7470 0.932<br />

PCB209 126.70 -3.8963 1.0496


Analiza <strong>de</strong> corelaţie pentru toate grupurile cu coeficient <strong>de</strong> corelaţie r > 0.95 a setului <strong>de</strong> date din<br />

tabelul <strong>de</strong> mai sus este redată în continuare:<br />

ISDmsHt lADrtHg Y Equation Residue Correlation<br />

1 1 0 +ISDmsHt*1.00lADrtHg*1.69*10<br />

0.12 0.97138<br />

1 =+1.92*10 2


ISDmsHt lADrtHg Y Equation Residue Correlation<br />

1 1 0 -ISDmsHt*5.90*10 -2 +lADrtHg*1.00=-<br />

1.13*10 1<br />

0.30 0.97138<br />

15


ISDmsHt lADrtHg Y Equation Residue Correlation<br />

0 1 1 +lADrtHg*1.00+Y*1.54=-2.28 0.21 0.98650<br />

16


ISDmsHt lADrtHg Y Equation Residue Correlation<br />

0 1 1 +lADrtHg*0.64+Y*1.00=-1.47 0.70 0.98650<br />

17


ISDmsHt lADrtHg Y Equation Residue Correlation<br />

1 1 1 +ISDmsHt*1.00-lADrtHg*4.05*10 1 3.94*10 -2 0.99704<br />

-Y*3.82*10 1 =+2.44*10 2<br />

18


ISDmsHt lADrtHg Y Equation Residue Correlation<br />

1 1 1 -ISDmsHt*2.46*10 -2 +lADrtHg*1.00 4.17*10 -2 0.99947<br />

+Y*0.94=-6.04<br />

19


ISDmsHt lADrtHg Y Equation Residue Correlation<br />

1 1 1 -ISDmsHt*2.61*10 -2 +lADrtHg*1.05 0.22 0.99851<br />

+Y*1.00=-6.40<br />

Testarea meto<strong>de</strong>i <strong>de</strong> i<strong>de</strong>ntificare a mo<strong>de</strong>lului <strong>de</strong> <strong>de</strong>pen<strong>de</strong>nţă<br />

Au fost implementate module online pentru analiza <strong>de</strong> mo<strong>de</strong>l capitalizând cunoştinţele dintr-o serie<br />

<strong>de</strong> studii anterior <strong>de</strong>rulate având ca subiect diferite modalităţi <strong>de</strong> implementare a analizei <strong>de</strong> mo<strong>de</strong>l<br />

(Jäntschi & Zaharieva-Stoyanova, 2003-MLPM), utilizarea în analiza <strong>de</strong> mo<strong>de</strong>l a diferitelor<br />

măsurabile ale asocierii (Jäntschi & Bolboacă, 2006-PSKC) şi care au avut ca finalitate elaborarea<br />

mo<strong>de</strong>lelor <strong>de</strong> calcul în versiunea "release" a aplicaţiilor <strong>de</strong> regresie <strong>de</strong>zvoltate. Aceste module sunt<br />

înglobate în mai multe aplicaţii <strong>de</strong>zvoltate, una dintre acestea fiind disponibilă la adresa:<br />

http://l.aca<strong>de</strong>micdirect.ro/Statistics/multi_regression/<br />

De asemenea, această analiză a adus cunoştinţe noi capitalizate într-o serie <strong>de</strong> publicaţii având ca<br />

subiect i<strong>de</strong>ntificarea mo<strong>de</strong>lului având la dispoziţie o serie <strong>de</strong> alternative (Jäntschi & others, 2007-<br />

NTCP; Jäntschi & Bolboacă, 2010-REBP), modalităţile <strong>de</strong> estimare a parametrilor <strong>de</strong> mo<strong>de</strong>l<br />

(Jäntschi, 2009-DF1), utilizarea unei serii <strong>de</strong> măsuri a asocierii între observaţii şi mo<strong>de</strong>l în analiza<br />

mo<strong>de</strong>lului (Jäntschi & Bolboacă, 2009-DF2), elaborarea algoritmilor <strong>de</strong> analiză <strong>de</strong> mo<strong>de</strong>l în ipoteza<br />

distribuţie normală a erorii <strong>de</strong> observare (Bolboacă & Jäntschi, 2009-DF3) şi aplicaţii ale acestora<br />

(Bălan & others, 2010-ATSC; Jäntschi & Bolboacă, 2010-REBP).<br />

20


Tabelul următor prezintă sintetic testarea meto<strong>de</strong>lor <strong>de</strong> analiză a mo<strong>de</strong>lului <strong>de</strong> <strong>de</strong>pen<strong>de</strong>nţă:<br />

Experimente <strong>de</strong>monstrative pentru testarea meto<strong>de</strong>i <strong>de</strong> i<strong>de</strong>ntificare a <strong>de</strong>pen<strong>de</strong>nţei liniare<br />

Coeficient<br />

<strong>de</strong> corelaţie<br />

Definiţie Formule <strong>de</strong> calcul<br />

Coeficient<br />

<strong>de</strong> corelaţie<br />

Masură a intensităţii şi<br />

direcţiei relatiei lineare a<br />

rPr<br />

s = ∑ (Ym−i−Y m)(Yest−i−Y est)<br />

2 2<br />

( ∑(Ym−i−Y m) )( ∑(Yest−i−Y<br />

est)<br />

)<br />

Pearson două variabile cantitative; un<strong>de</strong> Ym-i sunt valorile măsurate, iar Y m<br />

este valoarea medie masurată;<br />

Coeficient<br />

<strong>de</strong> corelaţie<br />

Spearman<br />

Coeficient<br />

<strong>de</strong> corelaţie<br />

Spearman-<br />

Masură (neparametrică) a<br />

corelaţiei între două<br />

variabile (care nu sunt<br />

neaparat cantitative) <strong>de</strong>spre<br />

a căror distribuţii <strong>de</strong><br />

frecvenţe nu se face nici o<br />

asumpţie;<br />

r<br />

r<br />

Spm<br />

=<br />

∑<br />

∑ ∑<br />

(R −R )(R −R<br />

)<br />

Y Ym Yest<br />

m−i Yest−i<br />

2 2<br />

( (RY −R Ym) )( (R Ye<br />

)<br />

m i Y −R )<br />

− est−i st<br />

un<strong>de</strong> RYm-i este rangul activităţii<br />

măsurate pe componenta i , iar R Yest−<br />

i<br />

este media activitaţiilor estimate;<br />

2<br />

6∑ D<br />

rSpm = 1− 2<br />

n(n −1)<br />

un<strong>de</strong> D = RYm-1 - RYest-1 (diferenţa<br />

oricăror două ranguri);<br />

n = volumul eşantionului<br />

Masură (neparametrică) a corelaţiei între două variabile semicantitative;<br />

∑ mi − m esti − est ∑(RY<br />

−R Ym)(R Yest<br />

mi Y −R<br />

)<br />

− esti −<br />

∑ ∑ ∑ ∑ st<br />

(Y −Y )(Y −Y<br />

)<br />

= ⋅<br />

sQ<br />

2 2 2<br />

2<br />

Pearson ( (Ymi − −Y m) )( (Yesti − −Y est) ) ( (RY −R Ym)<br />

)( (R e )<br />

mi Y −R<br />

Y )<br />

− esti −<br />

Coeficient<br />

<strong>de</strong> corelaţie<br />

Kendall-tau<br />

Coeficient<br />

<strong>de</strong> corelaţie<br />

Gamma<br />

Masură (neparametrică) a<br />

corelaţiei între două<br />

variabile ordinale;<br />

- exista 3 coeficienţi <strong>de</strong><br />

corelaţie Kendall: tau-a, taub<br />

şi tau-c<br />

Masură a asocierii între<br />

două variabile, care conţin<br />

valori lipsă;<br />

τKen,a = (C-D)/[n(n-1)/2]<br />

τKen,b=(C-D)/√[(n(n-1)/2-t)(n(n-1)/2-u)]<br />

τKen,c = 2(C-D)/n 2<br />

un<strong>de</strong><br />

C = numărul <strong>de</strong> perechi concordante;<br />

D = numărul <strong>de</strong> perechi disconcordante;<br />

E = numărul<strong>de</strong> perechi egale;<br />

Γ = (C-D)/(C+D),<br />

un<strong>de</strong><br />

C = numărul perechi concordante<br />

(perechile (Ym-j; Yest-j) si (Ym-i; Yest-i)<br />

sunt concordante dacă diferenţele Ym-j -<br />

Ym-i şi Yest-j - Yest-i au acelaşi semn);<br />

D = numărul perechi disconcordante<br />

(dacă diferenţele Ym-j - Ym-i şi Yest-j -<br />

Yest-i au semne diferite)<br />

1.a Interpretarea coeficientului <strong>de</strong> corelaţie Pearson:<br />

÷ -1 ≤ rPrs ≤ 1;<br />

÷ rPrs ≥ 0.80 indica o legatură puternică <strong>de</strong> directă proporţionalitate între cele două variabile după<br />

cum rPrs≤0.5 indică o corelaţie slabă între variabile;<br />

÷ coeficientul <strong>de</strong> <strong>de</strong>terminare rPrs 2 oferă informaţii <strong>de</strong>spre procentul în care variaţia variabilei<br />

21


<strong>de</strong>pen<strong>de</strong>nte se datorează relaţiei lineare;<br />

1.b. Semnificaţia testului:<br />

Testul Stu<strong>de</strong>nt poate fi utilizat pentru a <strong>de</strong>termina dacă valoarea coeficientului <strong>de</strong> corelaţie<br />

este semnificativă statistic, cu nivelul <strong>de</strong> semnificaţie <strong>de</strong> 0.01( sau 0.05);<br />

÷ Ipoteza nulă H0: rPrs = 0 (nu există corelaţie între variabile)<br />

÷ Ipoteza alternativă H1: rPrs 0 (nu există corelaţie între variabile)<br />

Dacă pentru pentru un nivel <strong>de</strong> semnificaţie <strong>de</strong> 0.01, p-value asociat lui tPrs,df este mai mic<br />

<strong>de</strong>cât 0.01 înseamnă că se respinge ipoteza nulă, adică acceptăm ipoteza alternativă. Există corelaţie<br />

între variabilele studiate.<br />

Formula folosită pentru calculul parametrului testului Stu<strong>de</strong>nt este:<br />

t = n − 2 ⋅<br />

2<br />

r<br />

2<br />

1−<br />

r<br />

Formula folosită pentru calculul parametrului testului Fisher este:<br />

2 ( n − 2)<br />

⋅ r<br />

F = 2<br />

1−<br />

r<br />

1.c. Rezultate:<br />

Datele studiate au fost:<br />

id d_IP d_IR d_Cr d_RSD d_Volum<br />

1 0 0 4.9 0 0<br />

2 0 0 5.81 0 0<br />

3 1.46 0.81 4.69 4.1 114<br />

4 1.69 0.82 4.31 4.58 126<br />

5 1.97 0.82 4.77 5.11 139<br />

27 0.72 0.46 6.6 1.85 150<br />

28 0.92 0.61 3.29 2.58 157<br />

29 1 0.65 1.75 2.8 164<br />

30 1.02 0.63 1.75 2.67 160<br />

31 1.14 0.68 1.4 2.74 201<br />

53 0 0 0 0 0<br />

54 0 0 1.5 0 0<br />

55 1 0.69 1.89 2.77 187<br />

56 1.2 0.69 1.61 3.24 133<br />

57 1.27 0.7 1.75 3.33 160<br />

79 0.97 0.61 5.49 2.57 160<br />

80 0.97 0.6 2.81 2.47 137<br />

81 0.88 0.58 2.61 2.39 146<br />

82 0.82 0.57 2.27 2.31 156<br />

83 0.79 0.55 1.98 2.23 167<br />

Matricea valorilor coeficientului <strong>de</strong> corelaţie:<br />

R(XX) d_IP d_IR D_Cr d_RSD d_Volum<br />

D_IP 1 0.9529 0.0929 0.9968 0.7273<br />

D_IR 1 0.0024 0.9578 0.8749<br />

D_Cr 1 0.0928 -0.1078<br />

D_RSD<br />

1 0.7234<br />

D_Volum<br />

Matricea valorilor parametrului testului Stu<strong>de</strong>nt:<br />

1<br />

t(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />

d_IP INF 9.1911 0.0366 37.3643 2.6448<br />

d_IR INF 0 9.7784 5.0474<br />

d_Cr INF 0.0365 0.0493<br />

22


d_RSD INF 2.6057<br />

d_Volum<br />

Matricea probabilitaţiilor (p-value):<br />

INF<br />

pt(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />

D_IP 0 3.22E-08 0.9712 1.64E-18 0.0165<br />

D_IR 0 1 1.26E-08 8.38E-05<br />

d_Cr 0 0.9713 0.9612<br />

d_RSD 0 0.0179<br />

d_Volum<br />

Valorile lui p-value colorate în albastru sunt semnificative (


81 0.88 0.58 2.61 2.39 146<br />

82 0.82 0.57 2.27 2.31 156<br />

83 0.79 0.55 1.98<br />

Matricea valorilor coeficientului <strong>de</strong> corelaţie:<br />

2.23 167<br />

ρ(XX) d_IP d_IR D_Cr d_RSD d_Volum<br />

d_IP 1 0.9965 0.742 0.9958 0.8395<br />

d_IR<br />

1 0.7462 0.9985 0.8461<br />

d_Cr 1 0.7455 0.7047<br />

d_RSD<br />

1 0.842<br />

d_Volum<br />

Matricea valorilor parametrului testului Stu<strong>de</strong>nt:<br />

1<br />

t(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />

d_IP INF 35.4911 2.7981 32.6577 4.2139<br />

d_IR INF 2.8444 53.8965 4.3495<br />

d_Cr INF 2.8362 2.4278<br />

d_RSD INF 4.2657<br />

d_Volum<br />

Matricea probabilitatiilor (p-value):<br />

INF<br />

pt(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />

d_IP 0 4.08E-18 0.0119 1.79E-17 5.22E-04<br />

d_IR 0 0.0108 2.37E-21 3.86E-04<br />

d_Cr 0 0.011 0.0259<br />

d_RSD<br />

0 4.65E-04<br />

d_Volum<br />

0<br />

Valorile lui p-value colorate în albastru sunt semnificative (


30 1.02 0.63 1.75 2.67 160<br />

31 1.14 0.68 1.4 2.74 201<br />

53 0 0 0 0 0<br />

54 0 0 1.5 0 0<br />

55 1 0.69 1.89 2.77 187<br />

56 1.2 0.69 1.61 3.24 133<br />

57 1.27 0.7 1.75 3.33 160<br />

79 0.97 0.61 5.49 2.57 160<br />

80 0.97 0.6 2.81 2.47 137<br />

81 0.88 0.58 2.61 2.39 146<br />

82 0.82 0.57 2.27 2.31 156<br />

83 0.79 0.55 1.98 2.23 167<br />

Matricea valorilor coeficientului <strong>de</strong> corelaţie Spearman semi-cantitativ:<br />

λ(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />

d_IP 1 0.9744 0.2626 0.9963 0.7814<br />

d_IR 1 0.0423 0.9779 0.8604<br />

d_Cr 1 0.263 0.2756<br />

d_RSD<br />

1 0.7805<br />

d_Volum<br />

Matricea valorilor parametrului testului Stu<strong>de</strong>nt:<br />

1<br />

t(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />

d_IP INF 12.8365 0.2932 34.7766 3.2709<br />

d_IR INF 0.0076 13.8793 4.6713<br />

d_Cr INF 0.2941 0.3232<br />

d_RSD INF 3.2588<br />

d_Volum INF<br />

Matricea probabilitaţiilor (p-value):<br />

pt(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />

d_IP 0 1.69E-10 0.772 5.86E-18 4.25E-03<br />

d_IR 0 0.994 4.69E-11 1.90E-04<br />

d_Cr 0 0.7721 0.7502<br />

d_RSD<br />

0 4.36E-03<br />

d_Volum<br />

0<br />

Valorile lui p-value colorate în albastru sunt semnificative (


un<strong>de</strong> variaţia este dată <strong>de</strong> formula:<br />

s 2<br />

τ<br />

Z<br />

τ<br />

Ken , a<br />

Ken,<br />

a<br />

n<br />

=<br />

C − D<br />

=<br />

s<br />

2<br />

τ<br />

Ken , a<br />

( n −1)(<br />

n + 5)<br />

Coeficientul <strong>de</strong> corelaţie Kendall tau-b:<br />

÷ Ipoteza nulă H0: τKen,b = 0 (nu există corelaţie)<br />

÷ Ipoteza alternativă H1: τKen,b 0 (există corelaţie)<br />

Formula folosită pentru calculul parametrului testului Z în cazul coeficientului <strong>de</strong> corelaţie Kendall<br />

tau-b este:<br />

C − D<br />

Z<br />

τ<br />

Ken,<br />

b<br />

=<br />

un<strong>de</strong> variaţia este dată <strong>de</strong> formula<br />

Tied(<br />

X)<br />

Tied(<br />

Y)<br />

⎛<br />

⎞<br />

⎜ ∑ ni<br />

( ni<br />

−1)(<br />

ni<br />

+ 5)<br />

+ ∑ mi<br />

( mi<br />

−1)(<br />

mi<br />

+ 5)<br />

⎟<br />

2 2<br />

s s<br />

⎜ i=<br />

1<br />

i=<br />

1<br />

⎟<br />

τ =<br />

Ken , b τ −<br />

+<br />

Ken , a ⎜<br />

18<br />

⎟<br />

⎜<br />

⎟<br />

⎝<br />

⎠<br />

Tied(<br />

X)<br />

Tied(<br />

Y)<br />

Tied(<br />

X)<br />

Tied(<br />

Y)<br />

ni<br />

( )( ) ( )( )<br />

( ni<br />

−1)(<br />

ni<br />

− 2)<br />

mi<br />

( mi<br />

−1)(<br />

mi<br />

− 2)<br />

∑ ni<br />

ni<br />

−1<br />

ni<br />

+ 5 ∑ mi<br />

mi<br />

−1<br />

mi<br />

+ 5 ∑<br />

∑<br />

i=<br />

1<br />

i=<br />

1<br />

i=<br />

1 9<br />

i=<br />

1 9<br />

+<br />

+<br />

2n(<br />

n −1)<br />

9n(<br />

n −1)(<br />

n − 2)<br />

Coeficientul <strong>de</strong> corelaţie Kendall tau-c:<br />

÷ Ipoteza nulă H0: τKen,c = 0 (nu există corelaţie)<br />

÷ Ipoteza alternativă H1: τKen,c 0 (există corelaţie)<br />

4.c. Rezultate:<br />

Matricea valorilor coeficientului <strong>de</strong> corelaţie Kendall tau-a:<br />

d_IP d_IR d_Cr d_RSD d_Volum<br />

d_IP 1 0.9 0.0474 0.8947 0.2368<br />

d_IR 1 0.0105 0.9316 0.2632<br />

d_Cr 1 0.0158 0.2053<br />

d_RSD 1 0.2368<br />

d_Volum<br />

Matricea valorilor parametrului testului Z:<br />

1<br />

Z(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />

d_IP INF 5.548 -0.292 5.5155 1.46<br />

d_IR INF -0.0649 5.7426 1.6222<br />

d_Cr INF -0.0973 -1.2653<br />

d_RSD INF 1.46<br />

d_Volum<br />

Matricea probabilităţiilor (p-value):<br />

INF<br />

pZ(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />

d_IP 0 2.89E-08 1.2297 3.48E-08 0.1443<br />

d_IR 0 1.0517 9.32E-09 0.1048<br />

d_Cr 0 1.0775 1.7942<br />

d_RSD 0 0.1443<br />

d_Volum<br />

0<br />

Valorile lui p-value colorate in albastru sunt semnificative (


Matricea valorilor coeficientului <strong>de</strong> corelaţie Kendall tau-b:<br />

τb(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />

d_IP 1 0.9293 0.0481 0.9239 0.2446<br />

d_IR 1 0.0107 0.962 0.2717<br />

d_Cr 1 0.016 0.2086<br />

d_RSD 1 0.2446<br />

d_Volum<br />

Matricea valorilor parametrului testului Z:<br />

1<br />

Z(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />

d_IP INF 5.5987 -0.2933 5.566 1.4733<br />

d_IR INF -0.0652 5.7951 1.637<br />

d_Cr INF -0.0978 -1.2711<br />

d_RSD INF 1.4733<br />

d_Volum<br />

Matricea probabilităţiilor (p-value):<br />

INF<br />

pZ(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />

d_IP 0 2.16E-08 1.2307 2.61E-08 0.1407<br />

d_IR 0 1.052 6.83E-09 0.1016<br />

d_Cr 0 1.0779 1.7963<br />

d_RSD 0 0.1407<br />

d_Volum<br />

Matricea valorilor coeficientului <strong>de</strong> corelaţie Kendall tau-b:<br />

0<br />

τc(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />

d_IP 1 0.855 0.045 0.85 0.225<br />

d_IR 1 0.01 0.885 0.25<br />

d_Cr 1 0.015 0.195<br />

d_RSD 1 0.225<br />

d_Volum<br />

Matricea valorilor parametrului testului Z:<br />

1<br />

Z(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />

d_IP INF 5.3188 -0.2787 5.2877 1.3997<br />

d_IR INF -0.0619 5.5054 1.5552<br />

d_Cr INF -0.0929 -1.2076<br />

d_RSD INF 1.3997<br />

d_Volum<br />

Matricea probabilităţiilor (p-value):<br />

INF<br />

pZ(XX) d_IP d_IR d_Cr d_RSD d_Volum<br />

d_IP 0 1.05E-07 1.2195 1.24E-07 0.1616<br />

d_IR 0 1.0494 3.68E-08 0.1199<br />

d_Cr 0 1.074 1.7728<br />

d_RSD 0 0.1616<br />

d_Volum<br />

0<br />

Valorile lui p-value colorate în albastru sunt semnificative (


d_RSD YES NO<br />

d_Volum YES<br />

2007A2. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi<br />

dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />

S-a participat pentru dobândire <strong>de</strong> competenţe complementare la Accelrys Science Forum<br />

2007 <strong>de</strong>sfăşurat la Cambridge în perioada 12-13 noiembrie 2007.<br />

Forumul a cuprins două secţiuni <strong>de</strong> prezentări ştiinţifice ale celor mai recente realizări ale<br />

companiei americane Accelrys şi colaboratorilor acesteia.<br />

Firma multinaţională Accelrys este profilată pe producerea <strong>de</strong> soft specializat şi <strong>de</strong>dicat<br />

pentru aplicaţii biomedicale şi farmaceutice (acesta fiind unul din publicurile ţintă ale sale) şi<br />

aplicaţii chimice şi <strong>de</strong> ştiinţa materialelor (acesta fiind cel <strong>de</strong>-al doilea public ţintă al său).<br />

Prima secţiune <strong>de</strong> prezentări ştiinţifice a cuprins cele mai recente realizări şi provocări în<br />

domeniul aplicaţiilor biomedicale şi farmaceutice.<br />

A doua secţiune <strong>de</strong> prezentări ştiinţifice a cuprins cele mai recente realizări şi provocări în<br />

domeniul aplicaţiilor chimice şi <strong>de</strong> ştiinţa materialelor.<br />

În cadrul forumului au fost cuprinse şi două secţiuni hands-on, aceasta însemnând instruire<br />

pe care reprezentanţii companiei au oferit-o participanţilor cu aplicaţiile soft <strong>de</strong>zvoltate <strong>de</strong> aceştia.<br />

În continuare sunt discutate prezentările susţinute.<br />

Secţiunea <strong>de</strong> aplicaţii biomedicale şi farmaceutice<br />

█ Gareth WILDEN (Department of medicinal chemistry, AstraZeneca R & D Charnwood,<br />

Loughborough, Leicestershire, UK) a susţinut prezentarea "GA: PP Using Pipeline Pilot as a<br />

Genetic Algorithm" în care după o scurtă prezentare a ceea ce a fost <strong>de</strong>zvoltat anterior, şi anume:<br />

÷ Procesul <strong>de</strong> <strong>de</strong>sign al librăriei;<br />

÷ Enumerarea completă a librăriei;<br />

÷ Obţinerea scorului compuşilor bazat pe violaţiile <strong>de</strong> tip Lipinski (numai compuşii cu cel mai<br />

mare scor - cea mai mare abatere - sunt eliminaţi în acest stadiu<br />

÷ Analiza vecinătăţii <strong>de</strong> vârfuri versus banca <strong>de</strong> compuşi<br />

÷ Filtrarea chimică<br />

÷ hERG, AMES, Solubilitate, Metabolit reactiv (filtrare şi sistem <strong>de</strong> atenţionare)<br />

÷ Gruparea pe categorii bazată pe amprente (alegerea iterativă din categorii până când numărul<br />

necesar <strong>de</strong> compuşi este selectat; compuşii cu cel mai mic scor sunt selectaţi primii)<br />

a prezentat problematica actuală şi soluţiile care în perspectiva autorului se profilează şi anume:<br />

÷ Problema ridicată <strong>de</strong> chimie: Cum se poate inclu<strong>de</strong> acoperirea farmacoforă în analiza<br />

diversităţii<br />

÷ Existenţa şi accesibilitatea locală a amprentelor structurale (metoda <strong>de</strong> clasificare prin<br />

excluziune sferică pentru a obţine avantajul amprentării structurale <strong>de</strong> acest tip, cu validare<br />

internă corectă<br />

÷ Dezvoltarea proce<strong>de</strong>elor <strong>de</strong> amprentare internă a farmacoforilor (în relaţie directă cu utilizarea<br />

aceleiaşi meto<strong>de</strong> <strong>de</strong> clasificare ca mai sus)<br />

÷ Cum adăugarea a încă unei amprente <strong>de</strong> farmacofor aduce o acoperire suplimentară<br />

█ Darren FAYNE, Tim JAMES, Andrew KNOX, Giorgio CARTA, David G. LLOYD (Molecular<br />

Design Group, School of Biochemistry and Immunology, Trinity College Dublin, Irlanda) au<br />

susţinut prezentarea High-throughput virtual screening drug discovery, în care după o scurtă<br />

prezentare a stadiului cunoaşterii, şi anume:<br />

÷ Diagrama <strong>de</strong> lucru în Drug Design - Faza I - Crearea mo<strong>de</strong>lului <strong>de</strong> receptor<br />

÷ Diagrama <strong>de</strong> lucru în Drug Design - Faza II - Evaluarea protocolului <strong>de</strong> examinare şi evaluare<br />

sistematică pentru i<strong>de</strong>ntificare substanţelor şi atributelor nedorite<br />

÷ Diagrama <strong>de</strong> lucru în Drug Design - Faza III - Aplicaţii ale protocolului <strong>de</strong> examinare şi<br />

28


evaluare sistematică pentru i<strong>de</strong>ntificare substanţelor şi atributelor nedorite<br />

÷ Paradigma complexităţii în Drug Design (spaţiul director - dimensiune <strong>de</strong> ordinul zecilor;<br />

spaţiul optimizat/virtual - dimensiune <strong>de</strong> ordinul zecilor <strong>de</strong> mii; spaţiul protocolului <strong>de</strong><br />

examinare şi evaluare sistematică - dimensiune <strong>de</strong> ordinul milioanelor; spaţiul <strong>de</strong>tectării chimice<br />

- dimensiune <strong>de</strong> ordinul zecilor <strong>de</strong> miliar<strong>de</strong>; spaţiul chimiei medicinale - dimensiune <strong>de</strong> ordinul<br />

10 60 )<br />

prezentarea şi-a concentrat atenţia asupra problematicii actuale şi a soluţiilor propuse:<br />

÷ Încre<strong>de</strong>rea în bazele <strong>de</strong> date pentru ER (adică setul <strong>de</strong> date Bissantz)<br />

÷ Rezultatele obţinute din andocare<br />

÷ Construcţia unui bun set <strong>de</strong> învăţare<br />

÷ Efectul SMILES: Conformeri<br />

÷ Funcţiile <strong>de</strong> scor şi ce sunt acestea<br />

÷ Studiu <strong>de</strong> caz la îmbogăţirea valorilor pentru funcţii <strong>de</strong> scor<br />

÷ Soluţii ale cercetării şi producerea unei noi funcţii <strong>de</strong> scor<br />

÷ Crearea unor noi instrumente pentru <strong>de</strong>sign molecular - fFLASH (al firmei IBM)<br />

÷ Protocoale <strong>de</strong> fixare rigidă<br />

÷ Protocoale în linie <strong>de</strong> aşteptare/procesare - librării şi pre-procesare<br />

÷ Conformeri, andocare şi atribuire <strong>de</strong> scor<br />

Discuţia a continuat cu prezentarea componentelor sistemului în <strong>de</strong>taliu şi anume:<br />

÷ Corina (modul ce poate fi executat pe o maşină in<strong>de</strong>pen<strong>de</strong>ntă)<br />

÷ Diagrama <strong>de</strong> reţea şi curgerea proceselor<br />

÷ Omega (manipulator configurabil şi noduri <strong>de</strong> execuţie)<br />

÷ Andocare şi atribuire <strong>de</strong> scor - modulul FRED (şi legătura acestuia cu date <strong>de</strong> analiză <strong>de</strong> raze X<br />

stocate în fişiere Brookhaven PDB; andocare ghidată)<br />

÷ Analiza şi interpretarea rezultatelor<br />

÷ Modulul HITS (modulul predictiv)<br />

÷ Distribuirea lucrului în sistem<br />

÷ Concluzii obţinute din <strong>de</strong>rularea exeprimentului prezentat<br />

█ Tim CLARK (Centre of Computational Chemistry, Friedrich-Alexan<strong>de</strong>r University, Erlangen,<br />

Nürnberg, Germania, Centre for Molecular Design, University of Portsmouth, Portsmouth, UK, şi<br />

Editor-in-Chief, Journal of Molecular Mo<strong>de</strong>ling, Springer, Germania) a susţinut prezentarea<br />

Surface-Based in silico Techniques, în care după o scurtă prezentare a participanţilor la proiectul<br />

prezentat:<br />

÷ Centre of Computational Chemistry, Friedrich-Alexan<strong>de</strong>r University, Erlangen, Nürnberg,<br />

Germania<br />

÷ Centre for Molecular Design, University of Portsmouth, Portsmouth, UK<br />

÷ Department of Computer Science, University of Aber<strong>de</strong>en, Aber<strong>de</strong>en, UK<br />

÷ Cepos InSilico Ltd, Erlangen, Germania<br />

a meto<strong>de</strong>lor folosite:<br />

÷ AM1 (Austin Mo<strong>de</strong>l 1)<br />

÷ Molecular Electrostatics (în legătură directă cu metoda MNDO)<br />

÷ B3LYP/6-31G(d)<br />

÷ MP2/6-31G(d)<br />

a trecut la prezentarea <strong>de</strong> ansamblu:<br />

÷ Proprietăţi locale (potenţial electrostatic molecular, interacţii cu probe, formă, proprietăţi<br />

<strong>de</strong>rivate din orbitali)<br />

÷ Descriptori pentru QSAR (eliminarea tuturor <strong>de</strong>scriptorilor specifici pentru atom/substructură;<br />

pot <strong>de</strong>scriptorii statistici bazaţi pe proprietăţi locale să performeze la fel <strong>de</strong> bine?)<br />

÷ QSAR convenţional (puncte <strong>de</strong> fierbere pentru N = 5453 molecule - !)<br />

÷ Mo<strong>de</strong>le integrale pe suprafeţe<br />

29


÷ Energii libere <strong>de</strong> hidratare (în mediu neutru)<br />

÷ CypScore<br />

÷ Mo<strong>de</strong>le bazate pe ParaSurf - proprietăţi atomice <strong>de</strong> suprafaţă<br />

÷ Setul <strong>de</strong> validare public<br />

÷ Setul <strong>de</strong> validare internă<br />

÷ Extensii armonice sferice<br />

÷ Descrierea suprafeţei<br />

÷ Potenţialul electrostatic molecular<br />

÷ Aliniamentul rapid ParaFit<br />

█ Peter HAYNES (Materials and Physics Department, Imperial College London) a susţinut<br />

prezentarea Linear-scaling Density-functional Theory for Life Sciences al cărui subiect principal a<br />

fost realizarea şi utilizarea aplicaţiei ONETEP. Codul ONETEP a fost construit pentru a efectua<br />

calcule <strong>de</strong> scară largă înalt eficiente cu aceeaşi acurateţe ca meto<strong>de</strong>le tradiţionale bazate pe primul<br />

principiu. Prezentarea a fost orientată către ilustrarea facilităţilor codului ONETEP care îl fac în<br />

special foarte potrivit pentru studiul sistemelor biologice, ilustrate <strong>de</strong> studiul inhibiţiei kinazelor<br />

<strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> ciclină.<br />

█ C. M. Venkatchalam (Cercetător, Accelrys) a susţinut prezentarea A Rational Approach to<br />

Receptor-flexible Docking: Method and Validation Results. În prezentare s-a susţinut că evi<strong>de</strong>nţa<br />

experimentală arată că structurile proteice adoptă o conformaţie variată când liganzi diferiţi sunt<br />

legaţi <strong>de</strong> acestea. În opinia prezentatorului, metoda <strong>de</strong> investigare <strong>de</strong> înaltă rezoluţie în general<br />

implică o singură structură <strong>de</strong> receptor cu o largă varietate <strong>de</strong> liganzi. De asemenea, oricum,<br />

flexibilitatea proteinelor poate juca un rol vital în mecanismul <strong>de</strong> andocare al ligandului. Echipa <strong>de</strong><br />

<strong>cercetare</strong> coordonată <strong>de</strong> prezentator a observat utilizând Discovery Studio (produs soft<br />

comercializat <strong>de</strong> Accelrys) o metodă automată pentru andocarea liganzilor când flexibilitatea<br />

ligandului şi a lanţului proteic sunt ambele luate în consi<strong>de</strong>rare. Rezultatele andocării liganzilor<br />

pentru câteva sisteme proteice au fost obţinute şi investigate. Metoda prezentată are avantajul că<br />

poate fi uşor extinsă pentru a consi<strong>de</strong>ra schimbările ciclice <strong>de</strong> conformaţie.<br />

Secţiunea <strong>de</strong> aplicaţii <strong>de</strong> chimie şi ştiinţa materialelor<br />

█ James ELLIOTT (Materials Mo<strong>de</strong>lling Group, Department of Engineering, University of<br />

Cambridge) a susţinut prezentarea A Semi-Empirical Molecular Orbital Study of Fullerene-<br />

Encapsulated Mo-S/Mo-O Nanoclusters în care problematica încapsulării <strong>de</strong> atomi şi ioni metalici<br />

în structura nanofulerenelor a fost investigată cu ajutorul mo<strong>de</strong>lării moleculare. Aglomerările <strong>de</strong><br />

metale tranziţionale nanoscopice sunt folosite pe scară largă în creşterea catalitică a nanotuburilor<br />

<strong>de</strong> carbon (CNTs) sintetizate utilizând procesul <strong>de</strong> <strong>de</strong>punere chimică din vapori (CVD). Este<br />

cunoscut că adiţia oxigenului la calcogenii grei cum este sulful <strong>de</strong>opotrivă produce creşterea ratei <strong>de</strong><br />

<strong>de</strong>punere a CNT şi promovează <strong>de</strong>punerea selectivă a straturilor simple şi duble <strong>de</strong> CNTs. Grupul<br />

coordonat <strong>de</strong> prezentator au raportat rezultate <strong>de</strong> calcul semi-empiric <strong>de</strong> orbitali moleculari<br />

(utilizând Materials Studio şi VAMP - produse <strong>de</strong> firma Accelrys) ale aglomerărilor <strong>de</strong> Mo-S şi<br />

Mo-O, care <strong>de</strong>monstrează schimbările care au loc în structura electronică şi sunt cauzate <strong>de</strong> aditivii<br />

folosiţi.<br />

█ Andrei GUSEV (Researcher, MatSim GmbH Zürich şi Professor, Department of Materials, Swiss<br />

Fe<strong>de</strong>ral Institute of Technology Zürich) a susţinut prezentarea Finite Element Approaches to<br />

Mesoscopic Materials Mo<strong>de</strong>lling al cărui subiect l-a constituit utilizarea meto<strong>de</strong>i elementului finit în<br />

mo<strong>de</strong>larea nanomaterialelor. Astfel, simulările <strong>de</strong> dinamică moleculară prezic că transportul gazelor<br />

în interiorul nanotuburilor <strong>de</strong> carbon (CNT) este cu câteva ordine <strong>de</strong> mărime mai rapidă <strong>de</strong>cât în<br />

orice alt maretial cunoscut. Grupul <strong>de</strong> <strong>cercetare</strong> coordonat <strong>de</strong> prezentator a utilizat tehnologia<br />

elementului finit oferită <strong>de</strong> platforma PLAMYRA/GRIDDER pentru a estima performanţa <strong>de</strong><br />

permeabilitate a membranelor matriciale mixte CNT/polimer. Colectivul <strong>de</strong> <strong>cercetare</strong> a <strong>de</strong>monstrat<br />

că astfel <strong>de</strong> membrane pot într-un mod favorabil să combine performanţa <strong>de</strong> flux ridicat a<br />

nanotuburilor cu selectivitatea intrinsecă a matricilor polimerice.<br />

█ Sam FRENCH (Senior Scientist, Johnson Matthey) a susţinut prezentarea Mo<strong>de</strong>lling Reactions at<br />

the Active Sites of Chiral Ruthenium Catalysts using Density Functional Theory. Scurta secţiune<br />

30


introductivă în subiectul prezentării a cuprins subiecte <strong>de</strong> actualitate <strong>de</strong>spre cataliză şi tehnologii<br />

chirale. Astfel, selectivitatea este un factor cheie <strong>de</strong> succes pe piaţa tehnologiilor <strong>de</strong> catalişti chirali.<br />

Înţelegerea proceselor fundamentale care apar când un reactiv interacţionează cu un sit simplu şi<br />

omogen <strong>de</strong> catalizator, în situl activ şi în absenţa acestuia, este <strong>de</strong>ci esenţial pentru <strong>de</strong>signul raţional<br />

al noilor catalişti. Catalizatorii <strong>de</strong> hidrogenare bazaţi pe ruteniu asimetrici au făcut parte dintr-un<br />

proiect <strong>de</strong> <strong>cercetare</strong> colaborativă al grupului reprezentat <strong>de</strong> prezentator [(S)-XyIBINAP-RuH2-<br />

(S,S)-DPEN], primul <strong>de</strong>scoperit <strong>de</strong> Noyori [Ryoji NOYORY, Asymmetric catalysis: Science and<br />

opportunities (nobel lecture), Angewandte Chemie - International Edition, 41(12), p. 2008-2022,<br />

2002], [Ryoji NOYORY, T. Ohkuma, Asymmetric catalysis by architectural and functional<br />

molecular engineering: Practical chemo- and stereoselective hydrogenation of ketones, Angewandte<br />

Chemie - International Edition, 40(1), p. 40-73, 2001] şi [Masato KITAMURA, Masaki<br />

TSUKAMOTO, Yuhki BESSHO, Masahiro YOSHIMURA, Uwe KOBS, Michael WIDHALM,<br />

Ryoji NOYORY, Mechanism of asymmetric hydrogenation of α-(acylamino)acrylic esters<br />

catalyzed by BINAP-ruthenium(II) diacetate, Journal of the American Chemical Society, 124(23),<br />

p. 6649-6667, 2002] este studiat ca patent sau mo<strong>de</strong>l prototip pentru o serie <strong>de</strong> catalizatori <strong>de</strong><br />

hidrogenare eficienţi, printre aceştia numărându-se catalizatori bazaţi pe familiile <strong>de</strong> liganzi P-Phos,<br />

PhanePhos, şi ParaPhos [Antonio ZANOTTI-GEROSA, William HEMS, Michelle GROARKE,<br />

Fred HANCOCK, Ruthenium-catalysed asymmetric reduction of ketones, Platinum Metals Review,<br />

49(4), p. 158-165, 2005].<br />

█ Asen ASENOV (Device Mo<strong>de</strong>lling Group, Department of Electronics and Electrical<br />

Engineering, Glasgow University) a susţinut prezentarea (care în opinia noastră a fost dintre cele<br />

mai valoroase prezentări) Simulation of Atomic Scale Effects in Nano-CMOS Devices. Fluctuaţiile<br />

parametrilor intrinseci asociate cu discretizarea sarcinii şi atomicitatea materiei sunt acum unii<br />

dintre factorii majori <strong>de</strong> limitare a scalei, a integrării şi a reducerii tensiunii aplicate şi puterii<br />

consumate. Profesorul Asenov a prezentat cele mai noi <strong>de</strong>scoperiri în simularea fluctuaţiilor <strong>de</strong><br />

variabilitate la scală atomică în componentele nano CMOS utilizând tehnicile <strong>de</strong> difuzie <strong>de</strong> drift<br />

(DD), Monte Carlo (MC) şi transport cuantic (QT). A discutat <strong>de</strong> asemenea necesitatea unei legături<br />

strânse între aceste componente şi mo<strong>de</strong>larea materialelor. Secţiunea introductivă a prezentării a<br />

cuprins:<br />

÷ Continuarea scenariului More Moore<br />

÷ Viitoarele MOSFET-uri sunt componentele la scară atomică<br />

÷ Discretizarea sarcinii şi materiei introduce variabilitate<br />

÷ Variabilitatea <strong>de</strong>vine o durere <strong>de</strong> cap majoră<br />

÷ Variabilitatea <strong>de</strong>ja şi-a arătat efectele adverse<br />

Prezentarea a continuat cu expunerea surselor <strong>de</strong> variabilitate:<br />

÷ Dopanţi întâmplători discreţi<br />

÷ Linii <strong>de</strong> separaţie iregulate<br />

÷ Iregularităţi ale interfeţelor<br />

÷ Margini formate din grăunţe <strong>de</strong> polisilicon<br />

÷ Morfologia pentru к înalt<br />

Secţiunea aplicativă a prezentării a cuprins tehnicile <strong>de</strong> simulare:<br />

÷ Corecţii ale soluţiilor cuantice pentru electroni şi goluri utilizând DG<br />

÷ IPF combinate în MOSFET-uri conglomerate<br />

÷ Sarcina suplimentară în conglomeratele MOSFET<br />

÷ Investigarea impurităţilor folosind Ab-initio în ansambluri Monte Carlo<br />

÷ Simularea IPF necesită simulări statistice tridimensionale<br />

÷ Rugozitatea interfeţei în simulările bidimensionale NEGF<br />

÷ Rugozitatea interfeţei în simulările tridimensionale NEGF<br />

÷ Dopanţi întâmplători în simulările bidimensionale NEGF<br />

÷ Dopanţi întâmplători în simulările tridimensionale NEGF<br />

Legătura între <strong>de</strong>signul componentelor nano şi mo<strong>de</strong>larea materialelor a cuprins următoarele<br />

31


subiecte <strong>de</strong> interes:<br />

÷ Impactul regiunii tranziţionale Si/SiO2 în calculele <strong>de</strong> străpungere a porţii<br />

÷ Incluziunea <strong>de</strong> stive-poartă cu к înalt<br />

÷ Variabilitatea conductibilităţii la tunelarea porţii<br />

÷ Structura <strong>de</strong> bandă în componentele UTB<br />

÷ Analiza rugozităţii în ansambluri Monte-Carlo folosind metoda Ab-initio<br />

Secţiunea <strong>de</strong> final a prezentării a cuprins cele mai importante concluzii <strong>de</strong>sprinse din provocările cu<br />

care se confruntă acum tehnologia nanocomponentelor semiconductoare:<br />

÷ Tranzistorii CMOS se apropie <strong>de</strong> ordinul <strong>de</strong> mărime atomic<br />

÷ Simularea necesită rezoluţie la scară atomică<br />

÷ Efectele <strong>de</strong> la scară atomică implică o variabilitate sporită<br />

÷ Legătura cu primele principii ale simulării materialelor <strong>de</strong>vin obligatorii<br />

█ Stephen TODD (Product Manager, Accelrys) a susţinut prezentarea Future Developments in<br />

Materials Studio 4.2 în conjuncţie cu prezentarea <strong>de</strong> ansamblu a produsului Materials Studio oferit<br />

<strong>de</strong> firma Accelrys, cu marcarea noilor funcţionalităţi introduse cu ajutorul limbajului <strong>de</strong> scriptare<br />

MaterialsScript, prin intermediul noii interfeţe Gaussian şi Adsorption Locator şi în contextul celor<br />

mai noi <strong>de</strong>scoperiri ale Nanotechnology Consortium. Prezentarea a început prin expunerea<br />

proiectelor <strong>de</strong> <strong>cercetare</strong> în care în prezent firma Accelrys este implicată:<br />

÷ Materials Visualizer (segregarea volumelor atomice, performanţă în utilizarea memoriei)<br />

÷ Simulări (editarea câmpurilor <strong>de</strong> forţe, dinamica moleculară fin divizată, proiectul GULP)<br />

÷ Mezoscala (<strong>de</strong>zvoltarea instrumentelor suport pentru îmbunătăţirea instrumentelor la mezoscală,<br />

analiză, utilitate)<br />

÷ Mecanica cuantică şi cataliza: CASTEP<br />

÷ Mecanica cuantică şi cataliza: DMol<br />

÷ Mecanica cuantică şi cataliza: VAMP<br />

÷ Mecanica cuantică şi cataliza: Guassian® UI<br />

÷ Mecanica cuantică şi cataliza: adsorbţia<br />

÷ Mecanica cuantică şi cataliza: ONETEP<br />

÷ Mecanica cuantică şi cataliza: QMERA<br />

÷ Nanotechnology Consortium<br />

÷ Discovery Studio<br />

█ Patricia GESTOSO-SOUTO (Senior Scientist, Accelrys) a susţinut prezentarea New Science in<br />

Contact Research Services: Case Studies, SIG’s and Recent Initiatives cu accent pe cercetări pentru<br />

surse <strong>de</strong> energie alternativă şi mo<strong>de</strong>larea ţesutului pielii umane. Prezentarea s-a concentrat pe<br />

următoarele subiecte cheie:<br />

÷ Activităţi specifice ale serviciilor <strong>de</strong> contractare a cercetării<br />

÷ Studiu <strong>de</strong> caz: Îmbunătăţirea formulărilor pentru industria cosmetică<br />

÷ Actualităţi pentru grupuri speciale <strong>de</strong> interes (polimeri pentru celule <strong>de</strong> energie, polimeri<br />

industriali, (noi) polimeri compoziţi avansaţi)<br />

÷ Alte iniţiative recente (cercetări <strong>de</strong> energie alternativă, mo<strong>de</strong>larea ţesutului pielii umane)<br />

█ Richard GILBERT (Principal Scientist, e2v Biosensors), autor a 15 patente şi 25 lucrări evaluate<br />

prin procedura peer-review (incluzând câteva articole în Nature şi în Analytical Chemistry and<br />

Biochemistry) a susţinut prezentarea Versatile Biosensor Labels (în opinia noastră fiind una dintre<br />

cele mai valoroase prezentări). În ultimele două <strong>de</strong>cenii biosenzorii şi-au mărit impactul în ştiinţele<br />

vieţii şi piaţa <strong>de</strong> echipamente medicale, şi încep a fi utilizaţi ca instrumente <strong>de</strong> <strong>cercetare</strong> primare în<br />

multe laboratoare. Biosenzorii sunt componente care utilizează reacţiile chimice şi biologice pentru<br />

a <strong>de</strong>tecta analiţi în probă, în mod tipic monitorizând nivelul unor proteine sau acizi nucleici specifici<br />

în lichi<strong>de</strong> biologice cum sunt sângele sau extractele celulare. Sunt o multitudine <strong>de</strong> tehnologii <strong>de</strong><br />

<strong>de</strong>tecţie biosenzorială, fiecare dintre ele aducând după sine proprile sale beneficii şi restricţii, şi care<br />

sunt uzual cerute <strong>de</strong> <strong>de</strong>zvoltarea unor sisteme specifice <strong>de</strong> i<strong>de</strong>ntificare chimică pentru a face cea mai<br />

bună utilizare a tehnologiilor senzoriale. Autorul prezentării a susţinut că utilizarea lui Materials<br />

32


Studio (al companiei Accelrys) a permis companiei pe care o reprezintă e2v să <strong>de</strong>zvolte o chimie<br />

i<strong>de</strong>ntificativă generică care poate fi aplicată la o varietate <strong>de</strong> tehnici <strong>de</strong> <strong>de</strong>tecţie. De usa singură,<br />

interfaţa <strong>de</strong> lucru pentru i<strong>de</strong>ntificare chimică a fost <strong>de</strong>zvoltată şi este compatibilă cu tehnologiile<br />

senzoriale dintre cele mai diverse, cum sunt electrochimia, fluorescenţa, chemiluminescenţa,<br />

electroluminescenţa şi spectroscopia Raman, dar oricum se adresează tuturor principalelor tipuri <strong>de</strong><br />

<strong>de</strong>tecţie din uzul curent.<br />

2007A3. Selectare (abstracts), colectare (full text) informaţii private (pay per view), din publicaţii<br />

Elsevier & Springer<br />

S-au selectat un număr <strong>de</strong> 11 lucrări <strong>de</strong> interes al căror conţinut reprezentativ pentru proiect<br />

este redat în continuare.<br />

÷ Lucrare: Quantitative structure-property relationship study of n-octanol-water partition<br />

coefficients of some of diverse drugs using multiple linear regression<br />

÷ Autori: Jahanbakhsh Ghasemi, Saadi Saaidpour<br />

÷ Sursa: Analytica Chimica Acta, 2007, Volum 604(2), p. 99-106<br />

÷ Rezumat:<br />

A quantitative structure-property relationship (QSPR) study was performed to <strong>de</strong>velop mo<strong>de</strong>ls<br />

those relate the structures of 150 drug organic compounds to their n-octanol-water partition<br />

coefficients (log Po/w). Molecular <strong>de</strong>scriptors <strong>de</strong>rived solely from 3D structures of the molecular<br />

drugs. A genetic algorithm was also applied as a variable selection tool in QSPR analysis. The<br />

mo<strong>de</strong>ls were constructed using 110 molecules as training set, and predictive ability tested using<br />

40 compounds. Mo<strong>de</strong>ling of log Po/w of these compounds as a function of the theoretically<br />

<strong>de</strong>rived <strong>de</strong>scriptors was established by multiple linear regression(MLR). Four <strong>de</strong>scriptors for<br />

these compounds molecular volume (MV) (geometrical), hydrophilic–lipophilic balance (HLB)<br />

(constitutional), hydrogen bond forming ability (HB) (electronic) and polar surface area (PSA)<br />

(electrostatic) are taken as inputs for the mo<strong>de</strong>l.<br />

The use of <strong>de</strong>scriptors calculated only from molecular structure eliminates the need for<br />

experimental <strong>de</strong>termination of properties for use in the correlation and allows for the estimationof<br />

log Po/w for molecules not yet synthesized. Application of the <strong>de</strong>veloped mo<strong>de</strong>l to a testing set<br />

of 40 drug organic compounds <strong>de</strong>monstrates that the mo<strong>de</strong>l is reliable with good predictive<br />

accuracy and simple formulation. The prediction results are in good agreement with the<br />

experimental value. The root mean square error of prediction (RMSEP) and square correlation<br />

coefficient (R 2 ) for MLR mo<strong>de</strong>l were 0.22 and 0.99 for the prediction set log Po/w.<br />

÷ Detalii <strong>de</strong> interes:<br />

The aim of this work is the <strong>de</strong>velopment, using theoretical molecular <strong>de</strong>scriptors, and the proposal<br />

of externally validated general QSPR mo<strong>de</strong>ls for the prediction of log Po/w for a wi<strong>de</strong> and<br />

heterogeneous set of drug organic compounds. The great advantage of theoretical <strong>de</strong>scriptors is<br />

that they can be calculated homogeneously by <strong>de</strong>.ned software for all chemicals, even those not<br />

yet synthesized, the only need being a hypothesized chemical structure. The results indicate that<br />

the GA is a very effective variable selection approach for QSPR analysis. Multiple linear<br />

regressions (MLR) have been used for structure–property relationship analysis for a set of 150<br />

drug compounds. The results obtained from this study indicate that four <strong>de</strong>scriptors, molecular<br />

volume (MV), hydrophilic–lipophilic balance (HLB), hydrogen bond forming ability (HB) and<br />

polar surface area (PSA), play an important role on the n-octanol/water partition coef.cients of<br />

drug structures. Predictive QSPR mo<strong>de</strong>l which is based on molecular <strong>de</strong>scriptors is proposed in<br />

this study to correlate the log Po/w of drug compounds. Application of the <strong>de</strong>veloped mo<strong>de</strong>l to a<br />

testing set of 40 compounds <strong>de</strong>monstrates that the new mo<strong>de</strong>l is reliable with good predictive<br />

accuracy and simple formulation.Since the QSPR was <strong>de</strong>veloped on the basis of theoretical<br />

molecular <strong>de</strong>scriptors calculated exclusively from molecular structure, the proposed mo<strong>de</strong>l could<br />

potentially provi<strong>de</strong> useful information about the log Po/w of drug compounds. Thisprocedure<br />

33


allowed us to achieve a precise and relatively fast method for <strong>de</strong>termination of log Po/w of<br />

different series of drug compounds and to predict with suf.cient accuracy the log Po/w of new drug<br />

<strong>de</strong>rivatives.<br />

÷ Lucrare: A multiple linear regression and partial least squares study of flavonoid compounds<br />

with anti-HIV activity<br />

÷ Autori: C. N. Alves, J. C. Pinheiro, A. J. Camargo, M. M. C. Ferreira, R. A. F. Romero, A. B. F.<br />

da Silva<br />

÷ Sursa: Journal of Molecular Structure: THEOCHEM, 2001,Volum 541(1-3), p. 81-88<br />

÷ Rezumat:<br />

The molecular orbital semi-empirical method PM3 was employed to calculate a set of molecular<br />

properties (variables or <strong>de</strong>scriptors) of 21 flavonoid compounds with anti-HIV activity. The<br />

correlation between biological activity and structural properties was obtained by using the<br />

multiple linear regression and partial least squares methods. The mo<strong>de</strong>l obtained showed not only<br />

statistical significance but also predictive ability. The significant molecular <strong>de</strong>scriptors related to<br />

the compounds with anti-HIV activity were: electronegativity (χ) and the charges on atoms C3<br />

and C7 (Q3 and Q7, respectively). These variables led to a physical explanation of electronic<br />

molecular property contributions to HIV inhibitory potency.<br />

÷ Detalii <strong>de</strong> interes:<br />

Significant regression equations were obtained by multiple linear regression and partial least<br />

squares methods for 20 flavonoid compounds according to their anti-HIV activity. The best<br />

regression equation obtained was based on the following <strong>de</strong>scriptors: electronegativity (χ) and<br />

atomic charges on atoms C3 and C7 (Q3 and Q7, respectively). The mo<strong>de</strong>l obtained showed not<br />

only statistical significance but also predictive ability and revealed that higher values for χ<br />

combined with high positive charges on C7 and high negative charges on C3 lead to an<br />

increasing of the anti-HIV activity. These variables allowed a physical explanation of electronic<br />

molecular properties contributing to HIV inhibitory potency as the electronic character relates<br />

directly to the electron distribution of interacting molecules at the active site.<br />

A comparison of the performance between the MLR and PLS mo<strong>de</strong>ls showed the PLS have<br />

substantially better predictive capability than the MLR mo<strong>de</strong>l, even thought their correlation<br />

coefficients are comparable. This indicates clearly that the correlation coefficient by itself is not a<br />

good parameter for testing the mo<strong>de</strong>l performance. Also, it has been shown that PLS is an<br />

excellent tool for those cases where the <strong>de</strong>scriptors are by any means correlated.<br />

÷ Lucrare: A faster algorithm for ridge regression of reduced rank data<br />

÷ Autori: Douglas M. Hawkins, Xiangrong Yin<br />

÷ Sursa: Computational Statistics & Data Analysis 40 (2002), p. 253 - 262<br />

÷ Rezumat:<br />

Regression data sets typically have many more cases than variables, but this is not always the<br />

case. Some current problems in chemometrics-for example fitting quantitative structure activity<br />

relationships-may involve fitting linear mo<strong>de</strong>ls to data sets in which the number of predictors far<br />

exceeds the number of cases. Ridge regression is an approach that has some theoretical foundation<br />

and has performed well in comparison with alternatives such as PLS and subset regression. Direct<br />

implementation of the regression formulation leads to a O(np 2 +p 3 ) calculation, which is<br />

substantial if p is large. We show that ridge regression may be performed in a O(np 2 )<br />

computation-a potentially large saving when p is larger than n. The algorithm lends itself to the<br />

use of case weights, to robust boun<strong>de</strong>d influence fitting, and cross-validation. The method is<br />

illustrated with a chemometric data set with 255 predictors, but only 18 cases, a ratio not unusual<br />

in QSAR problems.<br />

÷ Detalii <strong>de</strong> interes:<br />

The residuals from the ridge regression have variance (1−hi)σ2, and so internally stu<strong>de</strong>ntized<br />

residuals can be computed in the usual way from the ridge residuals, leverages, and setting up the<br />

ridge regression with weights leads to a number of possibilities.<br />

34


Setting the weights equal to 1 gives a conventional ridge regression. If the residuals from this<br />

regression show signs of heteroscedasticity, then the regression may be repeated with weights to<br />

correct it.<br />

This framework also allows for fitting M-estimates of the regression function, and/or for<br />

boun<strong>de</strong>d-influence regressions. For either of these purposes, the case weights wi are recomputed<br />

iteratively, with cases whose leverage, whose absolute residual, or whose influence is ‘large’<br />

being downweighted. In either of these applications, there may be some interplay between the<br />

ridge constant and the weights.<br />

÷ Lucrare: Smallest confi<strong>de</strong>nce intervals for one binomial proportion<br />

÷ Autor: Weizhen Wang<br />

÷ Sursa: Journal of Statistical Planning and Inference, 2006, Volum 136(12), p. 4293-4306<br />

÷ Rezumat:<br />

We specify three classes of one-si<strong>de</strong>d and two-si<strong>de</strong>d 1−α confi<strong>de</strong>nce intervals with certain<br />

monotonicity and symmetry on the confi<strong>de</strong>nce limits for the probability of success, the parameter<br />

in a binomial distribution. For each class of one-si<strong>de</strong>d confi<strong>de</strong>nce intervals the smallest interval, in<br />

the sense of the set inclusion, is obtained based on the direct analysis of coverage probability<br />

functions. A simple sufficient and necessary condition for the existence of the smallest two-si<strong>de</strong>d<br />

confi<strong>de</strong>nce interval is provi<strong>de</strong>d and the smallest interval is <strong>de</strong>rived if it exists. Thus the proposed<br />

intervals are uniformly most accurate, and have the uniformly minimum expected length as well.<br />

÷ Detalii <strong>de</strong> interes:<br />

In this paper, we use the set inclusion to <strong>de</strong>ci<strong>de</strong> whether one interval is superior than another.For<br />

the one-si<strong>de</strong>d interval, the solution is final since the smallest interval always exists and cannot be<br />

improved any further. Therefore, the Clopper–Pearson method in<strong>de</strong>ed yields the best one-si<strong>de</strong>d<br />

interval. For the two-si<strong>de</strong>d interval we provi<strong>de</strong> a precise condition un<strong>de</strong>r which the smallest<br />

interval exists for one proportion. This condition is of more theoretical interest because the<br />

smallest interval exists only when n or α is quite small. The nonexistence, however, may explain<br />

why statisticians after several <strong>de</strong>ca<strong>de</strong>s still cannot reach an agreement about which is the “best”<br />

interval. The Crow (1956) interval is equal to the Blyth and Still (1983) interval if the smallest<br />

interval exists and they are typically different otherwise. Nevertheless, it seems reasonable using<br />

the set inclusion to <strong>de</strong>fine a “better” interval, especially for one-si<strong>de</strong>d intervals. A much more<br />

interesting problem for the future research is how to construct the smallest interval when there<br />

exist nuisance parameters.<br />

÷ Lucrare: Fast computation of cross-validated properties in full linear leave-many-out procedures<br />

÷ Autor: Emili Besalú<br />

÷ Sursa: Journal of Mathematical Chemistry, Vol. 29, No. 3, 2001<br />

÷ Rezumat:<br />

A general theorem which allows the fast and direct computation of predicted properties in a full<br />

multiple linear leave-many-out procedure is <strong>de</strong>monstrated by induction. The result allows the<br />

<strong>de</strong>scription of a general algorithm which only requires a single multiple linear regression<br />

calculation. From the data generated by this fitting, in a full leave-n-out procedure involving a set<br />

of m objects, the resolution of linear systems of equations of dimension n×n suffices to obtain all<br />

the sets of cross-validated properties.<br />

÷ Detalii <strong>de</strong> interes:<br />

General algorithm and explicit expressions for particular cases. From the previous results, a<br />

practical and fast way to obtain predictions coming from a full linear LnO procedure is envisaged.<br />

The general algorithm to be followed is systematic and very simple:<br />

1. Given the matrix X, compute the predictions matrix H in equation<br />

H = {hij} = X[X T X] -1 X T<br />

2. Given the vector y, compute the coefficient vector c in equation<br />

C = [X T X] -1 X T y<br />

3. Obtain the vector of fitted data y_ using equation<br />

35


y' = (y1', y2', …, ym') = Xc = Hy<br />

4. Fix n, the number of leaving molecules.<br />

5. Loop over all the molecular subsets M(n). For every subset:<br />

5.1. Solve the linear system<br />

5.2. Keep the predicted values.<br />

In QSAR studies it is very common to search for an optimal set of representative <strong>de</strong>scriptors. The<br />

algorithm <strong>de</strong>scribed in previous section can be conceived as to be a tool which gives a statistic, rcv<br />

attached to a set of them, those <strong>de</strong>fining the matrix X. It is obvious that the algorithm can be<br />

repeated as many times as sets of <strong>de</strong>scriptors are tested in a QSAR project. Hence, the whole<br />

procedure furnishes a new method for selecting the best set of <strong>de</strong>scriptors according to the criteria<br />

of maximization of the value rcv. This will be presumably the most immediate utility of the<br />

LnOT. In this case, in or<strong>de</strong>r to speed up the process, it is not only recommen<strong>de</strong>d to implement the<br />

practical expressions outlined in previous section but also not to perform the gaussian fitting<br />

<strong>de</strong>scribed above. It is faster to obtain the correlation coefficients directly from the set of arithmetic<br />

mean values attached to every series of molecular cross-validated values.<br />

The leave-n-out theorem has been <strong>de</strong>monstrated.and as a consequence, general and explicit<br />

expressions attached to full linear leave-many-out cross-validation processes have been given. The<br />

formulation will allow to easily construct computer co<strong>de</strong>s oriented to be applied to QSAR<br />

problems and other fields.<br />

÷ Lucrare: A partial least squares regression study with antioxidant flavonoid compounds<br />

÷ Autori: Karen C. Weber, Kathia M. Honorio, Aline T. Bruni, Adriano D. Andricopulo, Alberico<br />

B. F. da Silva<br />

÷ Sursa: Structural Chemistry, 2006, Volum 17(3), p. 307-313<br />

÷ Rezumat:<br />

The quantitative structure-activity relationship of a set of 19 flavonoid compounds presenting<br />

antioxidant activity was studied by means of PLS (Partial Least Squares) regression. The<br />

optimization of the structures and calculation of electronic properties were done by using<br />

thesemiempirical method AM1. A reliable mo<strong>de</strong>l (r 2 =0.806 and q 2 =0.730) was obtained and<br />

from this mo<strong>de</strong>l it was possible to consi<strong>de</strong>r some aspects of the structure of the flavonoid<br />

compounds studied that are related with their free radical scavenging ability. The quality of the<br />

PLS mo<strong>de</strong>l obtained in this work indicates that it can be used in or<strong>de</strong>r to <strong>de</strong>sign new flavonoid<br />

compounds that present ability to scavenge free radicals.<br />

÷ Detalii <strong>de</strong> interes:<br />

From Table 5 we can see that the samples are very well fitted, as the residuals of prediction are<br />

very small (0.02–0.04). This constitutes a strong indication that the mo<strong>de</strong>l is reliable since it<br />

consistently predicted the TEAC values of the test set.Through the validation tests applied in the<br />

mo<strong>de</strong>l we can suggest that it can be used for un<strong>de</strong>rstanding and predicting the antioxidant activity<br />

of new flavonoid compounds before their synthesis and tests against free radicals. Furthermore,<br />

the use of a multivariate methodology to build a regression mo<strong>de</strong>l allows us to <strong>de</strong>al with various<br />

features of flavonoid compounds that can be related to their reactivity with free radicals,<br />

especially the influence of substitutents that are not hydroxyls, what constitutes a more complete<br />

<strong>de</strong>scription of the problem than taking into account only the number or the presence of hydroxyl<br />

groups at certain positions.<br />

36


÷ Lucrare: Quantitative structure-activity relationship (QSAR) studies of quinolone antibacterials<br />

against M. fortuitum and M.smegmatis using theoretical molecular <strong>de</strong>scriptors<br />

÷ Autori: Manish C. Bagchi, Denise Mills, Subhash C. Basak<br />

÷ Sursa: Journal of Molecular Mo<strong>de</strong>ling, 2007, Volume 13 (1), 2007<br />

÷ Rezumat:<br />

The inci<strong>de</strong>nce of tuberculosis infections that are resistant to conventional drug therapy has risen<br />

steadily in the last <strong>de</strong>ca<strong>de</strong>. Several of the quinolone antibacterials have been examined as<br />

inhibitors of M. tuberculosis infection as well as other mycobacterial infections. However, not<br />

much has been done to examine specific structure–activity relationships of the quinolone<br />

antibacterials against mycobacteria. The present paper <strong>de</strong>scribes quantitative structure–activity<br />

relationship mo<strong>de</strong>ling for a series of antimycobacterial compounds. Most of the antimycobacterial<br />

compounds do not have sufficient physicochemical data, and thus predictive methods based on<br />

experimental data are of limited use in this situation. Hence, there is a need for the <strong>de</strong>velopment of<br />

quantitative structure–activity relationship (QSAR) mo<strong>de</strong>ls utilizing theoretical molecular<br />

<strong>de</strong>scriptors that can be calculated directly from molecular structures. Descriptors associated with<br />

chemical structures of N-1 and C-7 substituted quinolone <strong>de</strong>rivatives as well as 8-substituted<br />

quinolone <strong>de</strong>rivatives with good antimycobacterial activities against M. fortuitum and M.<br />

smegmatis have been evaluated. Ridge regression (RR), Principal component regression (PCR),<br />

and partial least squares (PLS) regression were used, comparatively, to <strong>de</strong>velop predictive mo<strong>de</strong>ls<br />

for antibacterial activity, based on the activities of the above compounds. The in<strong>de</strong>pen<strong>de</strong>nt<br />

variables inclu<strong>de</strong> topostructural, topochemical and 3-D geometrical indices, which were used in a<br />

hierarchical fashion in the mo<strong>de</strong>l-<strong>de</strong>velopment process. The predictive ability of the mo<strong>de</strong>ls was<br />

assessed by the cross-validated R 2 . Comparison of the relative effectiveness of the various classes<br />

of molecular <strong>de</strong>scriptors in the regression mo<strong>de</strong>ls shows that the easily calculable topological<br />

indices explain most of the variance in the data.<br />

÷ Detalii <strong>de</strong> interes:<br />

Prior to mo<strong>de</strong>l <strong>de</strong>velopment, the activity values were scaled by natural logarithm as their values<br />

differed by many or<strong>de</strong>rs of magnitu<strong>de</strong>. Conventional ordinary least squares (OLS) regression<br />

cannot be used when the number of molecular <strong>de</strong>scriptors exceeds the number of observations<br />

37


[25]. In this<br />

situation, three alternative linear regression methods may be consi<strong>de</strong>red, these are a) Ridge<br />

Regression(RR), b) Principal Component Regression(PCR) and c) Partial Least Squares(PLS).<br />

These three methods are also very useful even when the in<strong>de</strong>pen<strong>de</strong>nt variables are highly<br />

correlated. In the ridge regression method, <strong>de</strong>scriptors are transformed into principal components<br />

(PCs). All of the principal components are used in the regression, but they are first shrunk<br />

differentially according to their eigenvalues and a ridging constant. In the principal components<br />

regression, the <strong>de</strong>scriptors are transformed into principal components after which a subset of the<br />

PCs is used in an ordinary least square regression. Partial least squares also uses a set of linear<br />

combinations of the <strong>de</strong>scriptors but, in this approach, the <strong>de</strong>pen<strong>de</strong>nt variable is also consi<strong>de</strong>red in<br />

this step. Each of these methods makes use of the entire available pool of in<strong>de</strong>pen<strong>de</strong>nt variables as<br />

opposed to selecting a subset, which introduces bias and may result in the elimination of important<br />

parameters from the study. Formal comparisons have consistently shown subsetting to be less<br />

effective than alternative methods, such as these, that retain all of the in<strong>de</strong>pen<strong>de</strong>nt variables and<br />

use other approaches to <strong>de</strong>al with the rank <strong>de</strong>ficiency [26]. Statistical theory suggests that RR is<br />

the best of the three methods and this has been generally borne out in multiple comparative studies<br />

[26–28]. As such, the RR mo<strong>de</strong>ls <strong>de</strong>veloped in the current study are analyzed in more <strong>de</strong>tail than<br />

the PCR and PLS mo<strong>de</strong>ls. The RR vector of regression coefficients, b, is given by b = (X T X+kI) -<br />

1 X T Y, where X is the matrix of <strong>de</strong>scriptors, Y is the vector of observed activities, I is an i<strong>de</strong>ntity<br />

matrix, and k is a nonnegative constant known as the “ridge” constant.<br />

÷ Lucrare: Multivariate analysis of experimental and computational <strong>de</strong>scriptors of molecular<br />

lipophilicity<br />

÷ Autori: Raimund Mannholda, Gabriele Crucianib, Karl Drossc, Roelof Rekkerd<br />

÷ Sursa: Journal of Computer-Ai<strong>de</strong>d Molecular Design, Volume 12, Number 6, 1998, p. 573-<br />

581(9).<br />

÷ Rezumat:<br />

Two experimental (log P, RMw) and 17 calculation <strong>de</strong>scriptors for molecular lipophilicity<br />

(fragmental, atom-based for based on molecular properties) were investigated by multivariate<br />

analysis for a database of 159 compounds including both simple structures as well as more<br />

complex drug molecules. Principal component analysis (PCA) of the entire database exhibits a<br />

clustering of chemical groups; preciseness of clustering corresponds to chemical similarity. Thus,<br />

diversity searching in databases might effectively be performed by PCA on the basis of<br />

calculatedlog P. The comparative validity check of experimental and computational procedures by<br />

regression analysis and PCA was performed with a chemically balanced, reduced data set (n D 55)<br />

representing 11 chemical groups with 5 members each. Regression of experimental <strong>de</strong>scriptors<br />

(log Poct versus RMw) proves that chromatographic data, obtained un<strong>de</strong>r well-<strong>de</strong>fined<br />

experimental conditions, can be used as valid substitutes for log P. Regression of calculated versus<br />

experimental lipophilicity data shows a superiority of fragmental over atom-based methods and<br />

approaches based on molecular properties, as indicated by correlation coefficients, slopes and<br />

intercepts. Inaddition, PCA revealed that fragmental methods (Rekker-type, KOWWIN, KLOGP)<br />

sense the compound ranking in log P data to almost the same extent as experimental approaches.<br />

For atom-based procedures and CLOGP, both the comparability of absolute values and the<br />

sensing of the compound ranking in the database are slightly less. This trend is more pronounced<br />

for the methods based on molecular properties, with the exception of BLOGP.<br />

÷ Detalii <strong>de</strong> interes:<br />

Validity check of calculation methods by regression analysis and PCA. Regression analysis of<br />

calculated versus experimental data shows that in general fragmental methods are superior to<br />

atom-based and 3D-related approaches. These results are in accord with our earlier analysis with a<br />

smaller dataset [35]. A limited applicability is often attributed to fragmental methods due to<br />

missing fragment values. This is true for CLOGP and Rekker-type methods, but not for<br />

KOWWIN. Information obtained by PCA on the same dataset, in general parallels the regression<br />

data, but unravels more precisely the comparability in absolute values and the reflection of<br />

38


compound ranking in the database. Accordingly, the ranking of calculation methods observed in<br />

regression analysis is confirmed, exceptional behaviour of CLOGP and BLOGP, however, is only<br />

<strong>de</strong>tected by PCA.<br />

2007A4. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi<br />

dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />

În a doua fază a dobândirii <strong>de</strong> competenţe complementare prin participări la manifestări ştiinţifice /<br />

stagii <strong>de</strong> documentare-<strong>cercetare</strong> s-a planificat pentru perioada 6-14 <strong>de</strong>cembrie participarea la<br />

următoarele:<br />

÷ University of Oxford, Computational Biology Reseach Group, cursul <strong>de</strong> instruire intitulat<br />

"Introduction to Bioinformatics at CBRG", 7 <strong>de</strong>cembrie 2007<br />

÷ Dublin Molecular Medicine Centre, cursul <strong>de</strong> instruire intitulat "DMMC Course: Techniques<br />

and Strategies in Molecular Medicine", 10-13 <strong>de</strong>cembrie 2007<br />

÷ Trinity College Dublin, Centre for Synthesis & Chemical Biology, simpozionul intitulat "Recent<br />

Advances in Synthesis and Chemical Biology VI", 14 <strong>de</strong>cembrie 2007<br />

Programul evenimentelor planificate este redat în tabelul <strong>de</strong> mai jos:<br />

"Introduction to Bioinformatics at CBRG", 7 <strong>de</strong>cembrie 2007<br />

This course is inten<strong>de</strong>d for new users and/or anyone not familiar with using their molbiol account<br />

for bioinformatics analysis. It will be held in the Medical Sciences Teaching Centre (behind the<br />

Dunn School of Pathology on South Parks Road).<br />

The day-long course is <strong>de</strong>signed to be run in two sessions:<br />

The first session will introduce you to the many bioinformatics analysis tools that are now<br />

available on this web site. The course will also introduce you to EMBOSS Explorer - a suite of<br />

bioinformatics software inten<strong>de</strong>d largely as a replacement for GCG. You will be shown how to<br />

carry out some basic bioinformatics analyses - for example:<br />

access the databases on our servers to retrieve sequence files<br />

examine sequence file formats<br />

run restriction analysis software<br />

carry out sequence alignments and produce publishable images of the aligned sequences<br />

search databases using BLAST<br />

It will also introduce you to other more specialised tools - BASE and MASCOT - that will allow<br />

you to analyse your microarray and proteomics data respectively.<br />

Second session: Some of the bioinformatics tools are only available on our Unix servers and the<br />

second session will introduce the Unix computing facilities available via your molbiol account.<br />

We will show you how to connect to the CBRG Unix machines and introduce you to the Unix<br />

environment in general.<br />

You will be introduced to some of the features of the programs from the morning session that are<br />

not available via the web. There will be a brief introduction to the Sta<strong>de</strong>n package of software<br />

used for the analysis of dna sequencing chromatograms.<br />

The course is not inten<strong>de</strong>d to be a comprehensive gui<strong>de</strong> to all the bioinformatics packages<br />

available at the CBRG. Instead it is <strong>de</strong>signed to show you the kind of analysis software that is<br />

available to you via your account. It should ensure that you also know where to look to find<br />

similar software on the CBRG web site and on orac and to find help with any of the software on<br />

the system.<br />

"DMMC Course: Techniques and Strategies in Molecular Medicine", 10-13 <strong>de</strong>cembrie 2007<br />

This course, running over four mornings, is <strong>de</strong>signed to give bioscientists and clinicians a broad<br />

overview of research techniques and their application. Basic molecular biology laboratory<br />

experience is assumed, but you should not need prior knowledge of the techniques covered in the<br />

course.<br />

This course, running over four mornings, is <strong>de</strong>signed to give bioscientists and clinicians a broad<br />

39


overview of research techniques and their application. Basic molecular biology laboratory<br />

experience is assumed, but you should not need prior knowledge of the techniques covered in the<br />

course.<br />

The objective for postgraduate teaching is to give stu<strong>de</strong>nts a broad basic knowledge of bioscience<br />

research techniques and technologies, including those not currently used in their own<br />

project/laboratory that may be of future use. We recommend that postgraduate stu<strong>de</strong>nts attend the<br />

whole course (DMMC Course Attendance Certificates are only provi<strong>de</strong>d for complete<br />

attendance).<br />

Follow the links below to read an abstract of each lecture, together with supplementary reading in<br />

some cases.<br />

ANALYSING GENES (Mon 10 Dec; 0930-1300)<br />

Session Chair: Dr Ross McManus, TCD<br />

0930 RNA Detection and quantitation Dr Shane Duggan, TCD<br />

The protein components of the cell are <strong>de</strong>rived by numerous processes indirectly interpreted from a genetic element<br />

known as the “gene” which is co<strong>de</strong>d in the cellular DNA. This element is interpreted by the cell in a process called<br />

“transcription” where the genetic co<strong>de</strong> for a particular gene is converted into a molecular co<strong>de</strong> known as messenger<br />

RNA (mRNA). This mRNA molecule can now be utilised in the creation of a new protein via the translation process.<br />

In this lecture the nature and analysis of Ribonucleic acid (RNA) in biological systems will be explored. The<br />

un<strong>de</strong>rstanding of this has allowed the laboratory scientist to interrogate and explore gene expression as it may relate to<br />

diseases or cell signalling. Extraction and quantitation of good quality RNA will be discussed as they are the first step<br />

in any investigation of gene expression. Standard techniques in common use such as Northern blotting and cycle<br />

limited RT-PCR shall also be <strong>de</strong>scribed as well as more mo<strong>de</strong>rn techniques such as real time RT-PCR analysis. This<br />

lecture will allow the interpretation of published literature utilising these techniques and introduce the steps involved<br />

in performing RNA related techniques in your laboratory.<br />

1015 Differential gene expression: overview of relevant methods Prof William Gallagher, UCD<br />

This lecture will summarise the main approaches used to <strong>de</strong>termine alterations in gene expression at the RNA level.<br />

Emphasis will be placed in this context on global approaches that attempt to map differences in the transcriptome, i.e.<br />

entire complement of transcripts in a cell. Methodologies that will be addressed inclu<strong>de</strong> differential display,<br />

subtractive hybridization, high-throughput sequencing (ESTs and SAGE), and DNA microarray technologies. Key<br />

examples from the literature will be utilised to illustrate examples of investigators applying these technologies to<br />

un<strong>de</strong>rstand biological phenomena, with a focus on disease-related processes. An indication of the relevant<br />

infrastructure and expertise to carry out this work within the DMMC will be presented.<br />

Review articles<br />

Lennon, G. G. (2000). High-throughput gene expression analysis for drug discovery. Drug Discovery Today, 5, 59-<br />

66.<br />

Schulze, A. and Downward, J. (2001). Navigating gene expression using microarrays – a technology review. Nature<br />

Cell Biology, 3, E190-E195.<br />

1100 Coffee/Tea<br />

1130 Mutation <strong>de</strong>tection, SNP analysis and genetic linkage Prof Denis Shields, UCD<br />

Different strategies are required to i<strong>de</strong>ntify rare and common genetic variants un<strong>de</strong>rlying both rare and common<br />

diseases. For common genetic variants, there is now a very rich dataset of i<strong>de</strong>ntified common single nucleoti<strong>de</strong><br />

polymorphisms (SNPs). These can be investigated in disease groups (compared to controls) in candidate genes, or by<br />

whole genome association analysis. Analysis of these genes requires careful attention to the patterns of association of<br />

SNPs that are chromosomally adjacent (in linkage disequilibrium). Linkage analysis (tracking in families the disease<br />

co-inheritance with wi<strong>de</strong>ly spaced gene markers) is the traditional approach of choice for rare mutations that have<br />

strong phenotypic effects. High throughput sequencing of candidate regions (and in future whole genomes) are<br />

accelerating the rate of data accumulation.<br />

1215 Mo<strong>de</strong>l organisms Dr Breandán Kennedy, UCD<br />

The goal of this lecture is to discuss animal mo<strong>de</strong>ls that are routinely applied to biomedical research. The advantages<br />

of using Drosophila (fly), Xenopus (frog), Danio (zebrafish), Gallus (chicken) and Mus Musculus (mouse) as mo<strong>de</strong>l<br />

organisms will be <strong>de</strong>scribed. The life-cycle, generation time, embryo <strong>de</strong>velopment and amenability of these<br />

organisms to genetic manipulation will be discussed. An emphasis will be placed on <strong>de</strong>scribing mutagenesis screens.<br />

This technique, in which the genes in the genome are randomly inactivated, has been extensively applied to the<br />

fly/fish mo<strong>de</strong>ls and has accelerated our un<strong>de</strong>rstanding of gene function (functional genomics).<br />

MANIPULATING GENES (Tue 11 Dec; 0930-1300)<br />

Session Chair: Dr Ross McManus, TCD<br />

0930 DNA cloning strategies Dr Ross McManus, TCD<br />

Even in the post genome era, DNA cloning is essential to the manipulation and stable propagation of genetic material.<br />

This talk will cover the basic aspects of DNA cloning, ranging from the anatomy of cloning vectors to the choice of<br />

40


vectors based on the cloning strategy employed. The strategy employed will <strong>de</strong>pend on the overall objectives of the<br />

project and the nature of the starting information or material available. Thus different choices and approaches would<br />

be employed for a sequencing project compared with a genome mapping project or production of RNA or protein. I<br />

will discuss a number of basic and specialised cloning strategies to illustrate some of the options and possibilities<br />

available.<br />

1015 RNA interference Dr Jane Farrar, TCD<br />

1100 Coffee/Tea<br />

1130 Transgenics and knockouts Dr Derek Brazil, UCD<br />

This lecture will provi<strong>de</strong> a broad overview of the strategies used to generate both transgenic and knockout mice,<br />

starting from the generation of the DNA constructs using cDNAs or genomic DNA, and proceeding through<br />

embryonic stem cell biology, to aggregation and chimeric mouse generation. Details on genotyping of transgenic<br />

animals, as well as phenotype characterization will be discussed. Specific examples such as the IRS-2 knockout will<br />

be cited.<br />

1215 Molecular therapies - false hope or the future of medicine? Dr Ruth Foley, TCD<br />

Molecular medicine has allowed the i<strong>de</strong>ntification of new targets and new approaches to treat human disease. The<br />

lecture will focus on some of these strategies, including targeting signal transduction pathways, use of monoclonal<br />

antibody based approaches and the numerous gene therapy strategies that are currently being evaluated. An overview<br />

of the different methodologies will be presented and the current situation on the clinical application of these<br />

approaches will be consi<strong>de</strong>red. Focusing particularly on cancer therapies as a mo<strong>de</strong>l system, the advances and<br />

challenges of the different approaches will be presented and discussed.<br />

PROTEINS (Wed 12 Dec; 0930-1300)<br />

Session Chair: Dr Niamh Moran, RCSI<br />

0930 Protein expression and purification<br />

Dr Henry Windle, TCD<br />

This lecture will cover the basics of protein expression and purification. Emphasis will be placed on alternative<br />

strategies and issues that should be consi<strong>de</strong>red prior to selection of specific expression systems and purification<br />

strategies. As protein purification methodologies are generally well <strong>de</strong>scribed and accessible, only a brief overview of<br />

these will be given but with emphasis on common problems that can arise, particularly for those about to attempt<br />

purification for the first time. The following books from The Practical Approach series by IRL Press are an invaluable<br />

aid with <strong>de</strong>tailed and reliable protocols: Protein Purification Applications; Protein Purification Methods (2001, Editor<br />

Simon Roe).<br />

Gallus (chicken) and Mus Musculus (mouse) as mo<strong>de</strong>l organisms will be <strong>de</strong>scribed. The life-cycle, generation time,<br />

embryo <strong>de</strong>velopment and amenability of these organisms to genetic manipulation will be discussed. An emphasis will<br />

be placed on <strong>de</strong>scribing mutagenesis screens. This technique, in which the genes in the genome are randomly<br />

inactivated, has been extensively applied to the fly/fish mo<strong>de</strong>ls and has accelerated our un<strong>de</strong>rstanding of gene<br />

function (functional genomics).<br />

1015 Determining protein: protein interactions in biology Dr Niamh Moran, RCSI<br />

During the past two <strong>de</strong>ca<strong>de</strong>s, mass spectrometry has become a major technique for the i<strong>de</strong>ntification, characterisation<br />

and quantification of biological molecules and bioactive drugs. In particular, the impact of mass spectrometry on<br />

proteomics and metabolomics has been phenomenal.<br />

This lecture will outline some of the applications of mass spectrometry in mo<strong>de</strong>rn life sciences and introduce course<br />

participants to basic vocabulary and concepts in biological mass spectrometry.<br />

1100 Coffee/Tea<br />

1130 Introduction to Mass Spectrometry<br />

Dr Achim Treumann, RCSI<br />

During the past two <strong>de</strong>ca<strong>de</strong>s, mass spectrometry has become a major technique for the i<strong>de</strong>ntification, characterisation<br />

and quantification of biological molecules and bioactive drugs. In particular, the impact of mass spectrometry on<br />

proteomics and metabolomics has been phenomenal.<br />

This lecture will outline some of the applications of mass spectrometry in mo<strong>de</strong>rn life sciences and introduce course<br />

participants to basic vocabulary and concepts in biological mass spectrometry.<br />

1215 Proteomic technologies Prof Steve Pennington, UCD<br />

CELLS & TISSUES (Thu 13 Dec; 0930-1300)<br />

Session Chair: Dr William Watson, UCD<br />

0930 Immuno<strong>de</strong>tection methods on cell and tissue extracts Dr Leonie Young, RCSI<br />

The use of antibodies to <strong>de</strong>tect and characterise proteins has been well established. With the <strong>de</strong>velopment of high<br />

through-put techniques such as tissue microarrays (TMA), a real challenge now exists to <strong>de</strong>termine the cellular<br />

location, level of expression and the function of these i<strong>de</strong>ntified proteins. In this lecture, principles fundamental to<br />

immuno<strong>de</strong>tection will be outlined. Common pitfalls and measures to avoid these will be discussed. Applications of<br />

immuno<strong>de</strong>tection in a mo<strong>de</strong>rn molecular context will be illustrated, including: western blotting, ELISA,<br />

immunohistochemistry/ immunofluorescence, tissue microarrays, co-immunprecipitation, Electromobility shift<br />

41


assays, chromatin immunoprecipitation (ChIP) and antibody arrays.<br />

1015 Cell imaging and sorting - flow cytometry<br />

Dr William Watson, UCD<br />

Flow cytometry is a method for quantitating components or structural features of cells, primarily by optical means.<br />

Although it makes measurements on one cell at a time, it can process thousands of cells in a few seconds. Since cell<br />

types can be distinguished by quantitating structural features, flow cytometry can be used to count prokaryotic or<br />

eukaryotic cells of different types in complex mixtures.<br />

1100 Coffee/Tea<br />

1130 High Content Analysis of nanoparticle/cell interactions Dr Yuri Volkov, TCD<br />

Fluorescent organic tags have represented one of the major tools in the arsenal of researchers working in the<br />

biomedical sciences for more that two <strong>de</strong>ca<strong>de</strong>s. The progress in <strong>de</strong>velopment of new fast and efficient research and<br />

diagnostic methods is largely <strong>de</strong>pen<strong>de</strong>nt on the availability of fluorescent probes with <strong>de</strong>sired cell receptor- and<br />

organelle specificity and optimised experimental protocols for their utilization.<br />

A unique opportunity to generate a wi<strong>de</strong> spectrum of such probes suitable for applications in living cells is offered by<br />

semiconductor quantum dots (QDs). As fluorescent probes QDs have several advantages over organic dyes, including<br />

wi<strong>de</strong> absorption profiles, tunable emission spectra, and superior photostability. QDs have been shown to readily<br />

distribute across animal cells, tissues and organs. Today, QDs with different physico-chemical properties and<br />

functionalities are readily available worldwi<strong>de</strong>. However, further exploitation of QDs in biomedical studies has been<br />

hin<strong>de</strong>red by the absence of a<strong>de</strong>quate technological platforms capable of performing multi-parametric quantitative<br />

analysis of individual responses in specific cell types.<br />

Recent years have witnessed a rapid progress in the <strong>de</strong>velopment of novel methods permitting high-resolution<br />

visualisation of cell receptor dynamics and intracellular biochemical processes utilizing fluorescent probes. Among<br />

these, high content screening (HCS) technology allows to perform analysis of molecular interactions in individual<br />

cells and their populations at the sub-cellular level un<strong>de</strong>r physiological conditions. This technology not only facilitates<br />

<strong>de</strong>velopment of a better un<strong>de</strong>rstanding of the true functionality of target molecules in the living cells, but it can also<br />

promote <strong>de</strong>signing of highly informative screens for novel therapeutic drugs, including inhibitors at small molecule<br />

and gene therapy level applicable in inflammation and cancer.<br />

Here we will discuss the data <strong>de</strong>monstrating the influence of such factors as QDs size, charge and selective<br />

functionalisation on their membrane and subcellular localisation specificity and present an overview of advantages<br />

and hurdles on the way of merging nanotechnology and high content cell analysis.<br />

1215 Laser Capture Microdissection and in situ hybridisation Dr Orla Sheils, TCD<br />

Laser Capture Microdissection is a method for procuring pure cells from specific microscopic regions of tissue<br />

sections. Un<strong>de</strong>r the microscope, tissues are heterogeneous complicated structures with hundreds of different cell types<br />

locked in morphologic units. In disease pathologies, the diseased cells of interest are surroun<strong>de</strong>d by these<br />

heterogeneous tissue elements. Laser Capture Microdissection constitutes an essential upstream technology to<br />

molecular analysis methods studying evolving disease lesions in actual tissue.<br />

In Situ Hybridization techniques allow the <strong>de</strong>monstration of specific nucleic acid sequences within their cellular<br />

environment. A logical extension of early in situ hybridization (ISH) techniques, which exploited the ability to label<br />

DNA with high-energy fluorophores, is FISH. This technique is now applied in an increasing number of molecular<br />

diagnostic areas, including karyotype analysis, gene mapping, disease diagnosis, and therapeutic targeting.<br />

Course Instructors<br />

Dr Derek Brazil (UCD Conway Institute of Biomolecular & Biomedical Research)<br />

Dr Shane Duggan (Institute of Molecular Medicine & TCD)<br />

Dr Jane Farrar (TCIN & TCD)<br />

Dr Ruth Foley (Institute of Molecular Medicine, TCD)<br />

Prof William Gallagher (UCD Conway Institute of Biomolecular & Biomedical Research)<br />

Prof Dr Breandán Kennedy (UCD Conway Institute of Biomolecular & Biomedical Research)<br />

Prof Mark Lawler (Institute of Molecular Medicine, St James's Hospital & TCD)<br />

Dr Ross McManus (Institute of Molecular Medicine, St James's Hospital & TCD)<br />

Dr Niamh Moran (Institute of Biopharmaceutical Sciences, RCSI)<br />

Prof Steve Pennington (UCD Conway Institute of Biomolecular & Biomedical Research)<br />

Dr Orla Sheils (Institute of Molecular Medicine, TCD)<br />

Denis Shields (UCD Conway Institute of Biomolecular & Biomedical Research)<br />

Dr Achim Treumann (Institute of Biopharmaceutical Sciences, RCSI)<br />

Dr Yuri Volkov (Institute of Molecular Medicine, St James's Hospital & TCD)<br />

Dr William Watson (UCD Conway Institute of Biomolecular & Biomedical Research)<br />

Dr Henry Windle (Institute of Molecular Medicine, St James's Hospital & TCD)<br />

Dr Leonie Young (Royal College of Surgeons in Ireland & Beaumont Hospital)<br />

42


"Recent Advances in Synthesis and Chemical Biology VI", 14 <strong>de</strong>cembrie 2007<br />

8.45am Opening session<br />

Introductory remarks: Professor Thorri Gunnlaugsson<br />

Speaker: Professor John Hegarty, Provost, TCD<br />

9.00am-10.00am Chairperson: Professor Paul Murphy<br />

Professor Peter Seeberger<br />

‘From Microreactors to a Malaria Vaccine’<br />

10.00am-11.00am Chairperson: Professor Kevin Nolan<br />

Professor Thomas Carell<br />

‘Synthestic and Crystallographic studies of Tanskription and Replication through DNA<br />

lesions’<br />

11.00am-11.30am Coffee/Tea Break<br />

11.30am-12.30pm Chairperson: Dr Donal O’Shea<br />

GLAXOSMITHKLINE LECTURE<br />

Professor Michael J. Krische<br />

‘Formation of C-C Bonds via Catalytic Hydrogenation and Transfer Hydrogenation’<br />

12.30pm-1.15pm Lunch Break<br />

1.15pm-2.15pm Chairperson: Professor Mathias Senge<br />

ELI LILLY LECTURE<br />

Professor Chris Schofield<br />

‘The Chemistry of Oxygen Sensing’<br />

2.15pm-3.15pm Poster Session. Coffee/Tea Break<br />

3.15pm-4.15pm Chairperson: Professor John M. Kelly<br />

INSTITUT DE RECHERCHES SERVIER LECTURE<br />

Professor Andreé Kirsch - De Mesmaeker<br />

‘Ru(II) complexes un<strong>de</strong>r illumination. Can they be used in Chemical Biology?’<br />

4.15pm-5.15pm Chairperson: Dr Marc Devocelle<br />

Professor Mark Bradley<br />

‘Interfacing Combinatorial Chemistry with Microarrays’<br />

5.15pm Closing Remarks followed by half-hour Wine Reception<br />

Professor Pat Guiry<br />

2007A5. Selectare (abstracts), colectare (full text) informaţii private (pay per view), din publicaţii<br />

Taylor&Francis & Wiley&Sons<br />

S-au selectat o serie <strong>de</strong> articole reprezentative pentru domeniul <strong>de</strong> <strong>cercetare</strong> specific proiectului.<br />

Articolele selectate sunt redate în continuare:<br />

Nr Articol<br />

1 Inhibition of 7-ethoxycoumarin O-<strong>de</strong>ethylase activity in rat liver microsomes by naturally<br />

occurring flavonoids: structure-activity relationships<br />

Author: Ja-Young Moon Dong-Wook Lee Ki-Hyun Park<br />

DOI: 10.1080/004982598239623<br />

Publication Frequency: 12 issues per year<br />

Published in: Xenobiotica, Volume 28, Issue 2 February 1998 , pages 117 - 125<br />

Subjects: Pharmacology; Toxicology;<br />

Formats available: PDF (English)<br />

Abstract<br />

1. The inhibitory effects of several naturally occurring flavonoids and related compounds<br />

oncytochrome P450-<strong>de</strong>pen<strong>de</strong>nt 7-ethoxycoumarin O-<strong>de</strong>ethylase(ECOD) and the structure-activity<br />

relationships were studied in liver microsomes from rats treated with 3-methylcholanthrene (MC).<br />

2. All the flavonoids (flavone, apigenin, chrysin, flavonol, fisetin, kaempferol, morin, myrisetin,<br />

43


quercetin, flavanone, hesperetin and naringenin) studied inhibited microsomal ECOD activity in the<br />

following or<strong>de</strong>r: flavones > flavonols > flavanones, were mixed type inhibitors and had Ki in the<br />

range of 0·17-4·5 μM. (±)-Catechin had no effect. 3. The double bond between C2 and C3 of the C<br />

ring, the keto group and hydroxyl group of this ring in the flavonoids seem to play major roles in<br />

inhibiting the ECOD activity. 4. The hydroxyl groups in the C5 and C7 positions of A ring in the<br />

flavone and the hydroxyl group in the C3 position of C ring in the flavonol classes, respectively,<br />

were important factors for the inhibition of the enzyme. 5. In a series of 3, 5, 7-trihydroxyflavones,<br />

the hydroxyl group at the C4 in the B ring was also an important factor for the inhibition of ECOD<br />

activity, but hydroxyl groups in other positions of the B ring had little effect on the inhibition. 6.<br />

We conclu<strong>de</strong> that all the flavonoids studied inhibit ECOD activity by interfering with the binding of<br />

substrate to the active site and other site(s) of the enzyme and that their structural differences lead to<br />

different binding affinities at the active site and possibly to binding at other site(s) of the enzyme<br />

for the flavonoids.<br />

Nr Articol<br />

2 Structure-antioxidant Activity Relationships of Flavonoids: A Re-examination<br />

Authors: M. Manuela Silva a; Marta R. Santos a; Gonçalo Caroço a; Rui Rocha a; Gonçalo<br />

Justino a; Lur<strong>de</strong>s Mira<br />

Affiliation: a Departamento <strong>de</strong> Química e Bioquímica, Faculda<strong>de</strong> <strong>de</strong> Ciências da Universida<strong>de</strong> <strong>de</strong><br />

Lisboa, 1749-016 Lisboa, Portugal.<br />

DOI: 10.1080/1071576021000016472<br />

Publication Frequency: 12 issues per year<br />

Published in: Free Radical Research, Volume 36, Issue 11 2002 , pages 1219 - 1227<br />

Subjects: Cell Biology; Molecular Biology;<br />

Number of References: 45<br />

Formats available: PDF (English)<br />

Abstract<br />

The antioxidant and prooxidant activities of flavonoids belonging to several classes were studied to<br />

establish their structure-activity relationships against different oxidants. Special attention was paid<br />

to the flavonoids quercetin (flavone), taxifolin (flavanone) and catechin (flavanol), which possess<br />

different basic structures but the same hydroxylation pattern (3,5,7,3',4'-OH). It was found that<br />

these three flavonoids exhibited comparable antioxidant activities against different oxidants leading<br />

to the conclusion that the presence of ortho -catechol group (3',4'-OH) in the B-ring is <strong>de</strong>terminant<br />

for a high antioxidant capacity. The flavone kaempferol (3,5,7,4'-OH), however, in spite of bearing<br />

no catechol group, also presents a high antioxidant activity against some oxidants. This fact can be<br />

attributed to the presence of both 2,3-double bond and the 3-hydroxyl group, meaning that the basic<br />

structure of flavonoids becomes important when the antioxidant activity of B-ring is small.<br />

Keywords: Flavonoids; Antioxidant; Free Radicals; Structure-activity Relationships<br />

Nr Articol<br />

3 Fuzzy structure-activity relationships<br />

Author: B. T. Luke<br />

Affiliation: a SAIC-Fre<strong>de</strong>rick, Inc., Advanced Biomedical Computing Center, NCI Fre<strong>de</strong>rick,<br />

P.O. Box B, Fre<strong>de</strong>rick, MD 21702, USA.<br />

DOI: 10.1080/1062936021000058773<br />

Publication Frequency: 8 issues per year<br />

Published in: SAR and QSAR in Environmental Research, Volume 14, Issue 1 2003 , pages 41 - 57<br />

Subjects: Applied & Industrial Chemistry; Chemistry; Environmental & Ecological Toxicology;<br />

Environmental Sciences; History & Philosophy of Mathematics;<br />

Abstract<br />

While quantitative structure-activity relationships attempt to predict the numerical value of the<br />

activities, it is found that statistically good predictors do not always do a good job of qualitatively<br />

<strong>de</strong>termining the activity. This study shows how Fuzzy classifiers can be used to generate Fuzzy<br />

structure-activity relationships which can more accurately <strong>de</strong>termine whether or not a compound<br />

44


will be highly inactive, mo<strong>de</strong>rately inactive or active, or highly active. Four examples of these<br />

classifiers are presented and applied to a well-studied activity dataset.<br />

Keywords: Fuzzy Classifiers; Fuzzy Structure-activity Relationship; Selwood Data; K Nearest<br />

Neighbor (KNN)<br />

Nr Articol<br />

4 Medicinal Chemistry and Chemical Biology of New Generation Taxane Antitumor Agents<br />

Authors: Iwao Ojima a; Raphaël Geney a; Ioana Maria Ungureanu a; Dansu Li a<br />

Affiliation: a Chemistry Department, State University of New York at Stony Brook, Stony Brook,<br />

NY 11794-3400, USA.<br />

DOI: 10.1080/15216540212658<br />

Publication Frequency: 12 issues per year<br />

Published in: IUBMB Life, Volume 53, Issue 4 & 5 April 2002 , pages 269 - 274<br />

Subjects: Cell Biology; Molecular Biology;<br />

Abstract<br />

P-glycoprotein (P-GP)-based multidrug resistance (MDR) and un<strong>de</strong>sirable si<strong>de</strong> effects are<br />

significant drawbacks to the clinical use of paclitaxel and docetaxel. Extensive SAR studies of<br />

taxanes in these laboratories led to the discovery of new generation taxanes that are highly active<br />

against not only drug-sensitive but also drug-resistant human cancer cell lines as well as tumor<br />

xenografts in mice. One of these second generation taxanes, SB-T-110131 (IDN5109), exhibited<br />

excellent pharmacological profile in the preclinical studies and has been selected for clinical<br />

<strong>de</strong>velopment (re-co<strong>de</strong>d as Bay 59-8862), which is currently in the phase II clinical trials. Bay 59-<br />

8862 is orally active with high bioavailability, showing excellent activity against a variety of drugresistant<br />

tumors. "Advanced second generation taxanes" show essentially no difference in<br />

cytotoxicity against drug-resistant and drug-sensitive cell lines, virtually overcoming MDR.<br />

Photoaffinity labeling of P-GP using photoreactive radiolabeled paclitaxel analogs has disclosed the<br />

paclitaxel-binding domain of P-GP. Highly efficient taxane-based MDR reversal agents (TRAs)<br />

have also been <strong>de</strong>veloped, which can recover the cytotoxicity of paclitaxel to practically the original<br />

level against paclitaxel-resistant MDR expressing cancer cells. Highly promising results have<br />

emerged from the study of taxane-monoclonal antibody (MAb) immunoconjugates, which have<br />

been proved to specifically <strong>de</strong>liver extremely cytotoxic agents to tumor in an animal mo<strong>de</strong>l.<br />

Keywords: Anticancer Agent; Immunoconjugate; Multidrug Resistance; P-glycoprotein;<br />

Photoaffinity Label; Taxane; Tumor-activated Prodrug<br />

Nr Articol<br />

5 Quantum chemistry of macromolecular shape<br />

Author: Paul G. Mezey<br />

DOI: 10.1080/014423597230226<br />

Publication Frequency: 4 issues per year<br />

Published in: International Reviews in Physical Chemistry, Volume 16, Issue 3 July 1997 , pages<br />

361 - 388<br />

Subjects: Chemical Physics; Physical Chemistry;<br />

Abstract<br />

Some of the new <strong>de</strong>velopments in the quantum-chemical study of macromolecular shapes are<br />

reviewed, with special emphasis on the additive fuzzy electron <strong>de</strong>nsity fragmentation methods and<br />

on the algebraic-topological shape group analysis of global and local shape features of fuzzy threedimensional<br />

bodies of electron <strong>de</strong>nsities of macromolecules. Earlier applications of these methods<br />

to actual macromolecules are reviewed, including studies on the anticancer drug taxol, the proteins<br />

bovine insulin and HIV protease, and other macromolecules. The results of test calculations<br />

establishing the accuracy of these methods are also reviewed. The spherically weighted affine<br />

transformation technique is <strong>de</strong>scribed and proposed for the <strong>de</strong>formation of electron <strong>de</strong>nsities<br />

approximating the changes occurring in small conformational displacements of atomic nuclei in<br />

macromolecules.<br />

Nr Articol<br />

45


6 Hexagonoidal Partitioning and Quasi-Single Bonds in Benzenoid Hydrocarbons<br />

Authors: Tetsuo Morikawa a; Susumu Narita b; Ivan Gutman c<br />

Affiliations: a Department of Chemistry, Joetsu University of Education, Joetsu, Japan<br />

b Faculty of Textile Science and Technology, Shinshu University, Nagano, Japan<br />

c Faculty of Science, University of Kragujevac, Kragujevac, Serbia and Montenegro<br />

DOI: 10.1080/10406630490277489<br />

Publication Frequency: 5 issues per year<br />

Published in: Polycyclic Aromatic Compounds, Volume 24, Issue 1 January 2004 , pages 75 - 82<br />

Subjects: Analytical Chemistry; Astrophysics; Chemical Spectroscopy; Organic Chemistry;<br />

Thermodynamics & Kinetic Theory;<br />

Abstract<br />

The concept of fully benzenoid hydrocarbons (molecular graphs; FBHs) is generalized. Each fullhexagon<br />

unit (aromatic sextet) in a FBH is replaced with a larger "hexagon-shaped" unit (subgraph;<br />

e.g., naphthalene, pyrene, coronene, or ovalene units). Such a molecular species may be called a<br />

"fully hexagonoid" hydrocarbon (FHHs). The Pauling bond or<strong>de</strong>r calculation suggests that a bond<br />

(edge) which interlinks one hexagon-shaped unit with another in the bottom of bays of FHH is<br />

quasi-single, if the two units are connected by more than two bonds. As a consequence, the<br />

hexagon-shaped units are <strong>de</strong>localized locally in the hexagonoidal (graph-theoretical) partitioning.<br />

Keywords: arenoidal partitioning; fully benzenoid; fully hexagonoid; molecular <strong>de</strong>sign; Pauling<br />

bond or<strong>de</strong>r<br />

Nr Articol<br />

7 Novel matrix invariants for characterization of changes of proteomics maps<br />

Authors: M. Randi a; J. Zupan a; M. Novi a; B. D. Gute b; S. C. Basak b<br />

Affiliations: a National Institute of Chemistry, 1001 Ljubljana, Slovenia.<br />

b Natural Resources Research Institute, University of Minnesota at Duluth, 5013 Miller Trunk<br />

Hwy. Duluth, MN 55811, USA.<br />

DOI: 10.1080/1062936021000043436<br />

Publication Frequency: 8 issues per year<br />

Published in: SAR and QSAR in Environmental Research, Volume 13, Issue 7 & 8 2002 , pages<br />

689 - 703<br />

Subjects: Applied & Industrial Chemistry; Chemistry; Environmental & Ecological Toxicology;<br />

Environmental Sciences; History & Philosophy of Mathematics;<br />

Abstract<br />

Previous studies on mathematical characterization of proteomics maps by sets of map invariants<br />

were based on the construction of a set of distance-related matrices obtained by matrix<br />

multiplication of a single matrix by itself. Here we consi<strong>de</strong>r an alternative characterization of<br />

proteomics maps based on a set of matrices characterizing local features of an embed<strong>de</strong>d zigzag<br />

curve over the map. It is shown that novel invariants can well characterize proteomics maps.<br />

Advantages of the novel approach are discussed.<br />

Keywords: Eigenvalue Reduction; Graph Spectra; Local Matrices; Matrix Invariants; Proteomics<br />

Maps; Quantitative Proteomics<br />

Nr Articol<br />

8 Reactivity profiles of ligands of mammalian retinoic acid receptors: a preliminary COREPA<br />

analysis<br />

Authors: G. T. Ankley a; O. G. Mekenyan b; V. B. Kamenska b; P. K. Schmie<strong>de</strong>r a; S. P.<br />

Bradbury a<br />

Affiliations: a U.S. Environmental Protection Agency, National Health and Environmental Effects<br />

Research Laboratory, Mid-Continent Ecology Division, 6201 Congdon Boulevard, Duluth, MN<br />

55804 USA.<br />

b Laboratory of Mathematical Chemistry, Department of Physical Chemistry, Bourgas University<br />

"Prof. As. Zlatarov", 118010 Bourgas, Bulgaria.<br />

DOI: 10.1080/10629360290002839<br />

46


Publication Frequency: 8 issues per year<br />

Published in: SAR and QSAR in Environmental Research, Volume 13, Issue 2 2002 , pages 365 -<br />

377<br />

Subjects: Applied & Industrial Chemistry; Chemistry; Environmental & Ecological Toxicology;<br />

Environmental Sciences; History & Philosophy of Mathematics;<br />

Abstract<br />

Retinoic acid and associated <strong>de</strong>rivatives comprise a class of endogenous hormones that bind to and<br />

activate different families of retinoic acid receptors (RARs, RXRs), and control many aspects of<br />

vertebrate <strong>de</strong>velopment. I<strong>de</strong>ntification of potential RAR and RXR ligands is of interest both from a<br />

pharmaceutical and toxicological perspective. The recently <strong>de</strong>veloped COREPA (COmmon<br />

REactivity PAttern) algorithm was used to establish reactivity profiles for a limited data set of<br />

retinoid receptor ligands in terms of activation of three RARs ( , , ) and an RXR ( ).<br />

Conformational analysis of a training set of retinoids and related analogues in terms of<br />

thermodynamic stability of conformers and rotational barriers showed that these chemicals tend to<br />

be quite flexible. This flexibility, and the observation that relatively small energy differences<br />

between conformers can result in significant variations in electronic structure, highlighted the<br />

necessity of consi<strong>de</strong>ring all energetically reasonable conformers in <strong>de</strong>fining common reactivity<br />

profiles. The <strong>de</strong>rived reactivity patterns for three different subclasses of the RAR ( , , ) were<br />

similar in terms of their global electrophilicity (nucleophilicity) and steric parameters. However, the<br />

profile of active chemicals with respect to interaction with the RXR- differed qualitatively from<br />

that of the RARs. Variations in reactivity profiles for the RAR versus RXR families would be<br />

consistent with established differences in their affinity for endogenous retinoids, likely reflecting<br />

functional differences in the receptors.<br />

Keywords: Retinoid; Receptor; Transactivation; Mo<strong>de</strong>l<br />

Nr Articol<br />

9 Quantitative molecular similarity analysis (QMSA) methods for property estimation: a<br />

comparison of property-based, arbitrary, and tailored similarity spaces<br />

Authors: S. C. Basak a; B. D. Gute a; D. Mills a<br />

Affiliation: a Natural Resources Research Institute, University of Minnesota at Duluth, 5013<br />

Miller Trunk Hwy., Duluth, MN 55811, USA.<br />

DOI: 10.1080/1062936021000043463<br />

Publication Frequency: 8 issues per year<br />

Published in: SAR and QSAR in Environmental Research, Volume 13, Issue 7 & 8 2002 , pages<br />

727 - 742<br />

Subjects: Applied & Industrial Chemistry; Chemistry; Environmental & Ecological Toxicology;<br />

Environmental Sciences; History & Philosophy of Mathematics;<br />

Abstract<br />

Three classes of arbitrary quantitative molecular similarity analysis (QMSA) methods have been<br />

computed using atom pairs, topological indices, and physicochemical properties. Tailored QMSA<br />

mo<strong>de</strong>ls have been <strong>de</strong>veloped using a selected number of TIs chosen by ridge regression. The<br />

methods have been applied to the K -nearest neighbor based estimation of log P of two sets of<br />

chemicals. Results show that the property-based and tailored QMSA methods are superior to the<br />

arbitrary similarity methods in estimating log P of both sets of chemicals<br />

Keywords: Quantitative Molecular Similarity Analysis (QMSA); Arbitrary Qmsa Method; Tailored<br />

Qmsa Method; Atom Pairs; Topological Indices; Physicochemical Properties<br />

Nr Articol<br />

10 Quantitative structure-metabolism relationships (QSMR) using computational chemistry:<br />

pattern recognition analysis and statistical prediction of phase II conjugation reactions of<br />

substituted benzoic acids in the rat<br />

Author: B. C. Cupid<br />

DOI: 10.1080/004982599238795<br />

Publication Frequency: 12 issues per year<br />

47


Published in: Xenobiotica, Volume 29, Issue 1 January 1999 , pages 27 - 42<br />

Subjects: Pharmacology; Toxicology;<br />

Abstract<br />

1. Quantitative relationships between molecular physico-chemical properties of 22 substituted<br />

benzoic acids and the extent of excretion of their metabolites in rat urine have been investigated<br />

using computational chemistry and multivariate statistics. 2. A data set of 34 theoretically <strong>de</strong>rived<br />

physico-chemical <strong>de</strong>scriptors calculated was used to classify the benzoic acids according to their<br />

predominant urinary metabolic fate. 3. Quantitative structure-metabolism relationships were<br />

obtained by linear regression using combinations of physico-chemical <strong>de</strong>scriptors allowing the<br />

prediction of % urinary excretion of glycine (r=0.73) and glucuroni<strong>de</strong> conjugates (r=0.82) and %<br />

urinary excretion of the parent compound (r=0.91).<br />

Nr Articol<br />

11 Mo<strong>de</strong>lling mutagenicity using properties calculated by computational chemistry<br />

Authors: D. J. Livingstone; R. Greenwood a; R. Rees b; M. D. Smith b<br />

Affiliations: a School of Biological Sciences, University of Portsmouth, Portsmouth, Hants, PO1<br />

2DY, UK.<br />

b Department of Genetic Toxicology, SmithKline Beecham Pharmaceuticals, The Frythe, Welwyn,<br />

Hertfordshire, UK.<br />

DOI: 10.1080/10629360290002064<br />

Publication Frequency: 8 issues per year<br />

Published in: SAR and QSAR in Environmental Research, Volume 13, Issue 1 2002 , pages 21 - 33<br />

Subjects: Applied & Industrial Chemistry; Chemistry; Environmental & Ecological Toxicology;<br />

Environmental Sciences; History & Philosophy of Mathematics;<br />

Abstract<br />

The recent advances in combinatorial chemistry and high throughput screening technologies have<br />

led to an explosion in the numbers of possible therapeutic candidates being produced at the early<br />

stages of drug discovery. This rapid increase in the number of chemicals to be classified results in a<br />

greater need for alternative methods for the prediction of toxicity. Most QSAR mo<strong>de</strong>ls for<br />

mutagenicity have been constructed for congeneric series. The prediction requirements of the<br />

pharmaceutical industry, however, cover quite diverse chemical structures. This paper reports a<br />

study of mutagenicity data for a diverse set of 90 compounds. Good discriminant mo<strong>de</strong>ls have been<br />

built for this data set using properties calculated by the techniques of computational chemistry.<br />

Jack-knifed (leave one out) predictions for these mo<strong>de</strong>ls are of the or<strong>de</strong>r of 85%.<br />

Keywords: Discriminant Analysis; Eva Descriptor; Variable Selection; Ames Test; Jack-knife<br />

Predictions; Qsar<br />

Nr Articol<br />

12 Computational mo<strong>de</strong>lling of low-energy electron-induced DNA damage by early physical and<br />

chemical events<br />

Authors: H. NIKJOO; P. O'NEILL; D. T. GOODHEAD; M. TERRISSOL<br />

DOI: 10.1080/095530097143798<br />

Publication Frequency: 12 issues per year<br />

Published in: International Journal of Radiation Biology, Volume 71, Issue 5 May 1997 , pages 467<br />

- 483<br />

Subjects: Nuclear Medicine; Radiation Oncology;<br />

Abstract<br />

Mo<strong>de</strong>lling and calculations are presented as a first step towards mechanistic interpretation and<br />

prediction of radiation effects based on the spectrum of initial DNA damage produced by low<br />

energy electrons (100eV-4.5keV) that can be compared with experimental information. Relative<br />

yields of single and clustered strand breaks are presented in terms of complexity and source of<br />

damage, either by direct energy <strong>de</strong>position or by reaction of OH radicals, and <strong>de</strong>pen<strong>de</strong>nce on the<br />

activation probability of OH radicals and the amount of energy required to give a single strand<br />

break (ssb). Data show that the majority of interactions in DNA do not lead to damage in the form<br />

48


of strand breaks and when they do occur, they are most frequently simple ssb. However, for doublestrand<br />

breaks (dsb), a high proportion (30%) are of more complex forms, even without consi<strong>de</strong>ring<br />

additional complexity from base damage. The greater contribution is from direct interactions in the<br />

DNA but reactions of OH radicals add substantially to this, both in terms of the total number of<br />

breaks and in increasing the complexity within a cluster. It has been shown that the lengths of<br />

damaged segments of DNA from individual electron tracks tend to be short, indicating that<br />

consequent <strong>de</strong>letion length (simply by loss of a fragment between nearby dsb) would be short, very<br />

seldom exceeding a few tens of base pairs.<br />

Nr Articol<br />

13 p-Do<strong>de</strong>cylaminophenol <strong>de</strong>rived from the synthetic retinoid, fenretini<strong>de</strong>: Antitumor efficacy in<br />

vitro and in vivo against human prostate cancer and mechanism of action<br />

International Journal of Cancer<br />

Volume 122, Issue 3, Date: 1 February 2008, Pages: 689-698<br />

Noriko Takahashi, Yusuke Watanabe, Yoshie Maitani, Takayasu Yamauchi, Kimio Higashiyama,<br />

Toshihiro Ohba<br />

Fun<strong>de</strong>d by:<br />

The Ministry of Education, Culture, Sports, Science and Technology, Japan and the Open Research<br />

Center Project<br />

Keywords<br />

aminophenol • anticancer • retinoid • prostate cancer • apoptosis<br />

Abstract<br />

Fenretini<strong>de</strong>, N-(4-hydroxyphenyl)retinami<strong>de</strong> (4-HPR) is an aminophenol-containing synthetic<br />

retinoid <strong>de</strong>rivative of all-trans-retinoic acid, which is a potent chemopreventive and antiproliferative<br />

agent against various cancers. Clinical studies of 4-HPR have shown si<strong>de</strong> effects consisting of night<br />

blindness and ocular toxicity. To maintain potent anticancer activity without si<strong>de</strong> effects, pdo<strong>de</strong>cylaminophenol<br />

(p-DDAP) was <strong>de</strong>signed based on structure-activity relationships of 4-HPR. In<br />

our study, we investigate whether p-DDAP shows anticancer activity against human prostate cancer<br />

cell line PC-3 when compared with 4-HPR. p-DDAP inhibited PC-3 cell growth progressively from<br />

low to high concentration in a dose-<strong>de</strong>pen<strong>de</strong>nt manner. p-DDAP was the most potent<br />

antiproliferative agent in vitro among 6 p-alkylaminophenols and 3 4-hydroxyphenyl analogs<br />

examined including 4-HPR. Cells treated with p-DDAP were shown to un<strong>de</strong>rgo apoptosis, based on<br />

con<strong>de</strong>nsation nuclei, cytofluorimetric analysis, propidium iodi<strong>de</strong> staining and the expression of bcl-<br />

2 and caspase 3. p-DDAP arrested the S phase of the cell cycle, while 4-HPR arrested the G0/G1<br />

phase. In addition, both the i.v. and i.p. administration of p-DDAP suppressed tumor growth in PC-<br />

3-implanted mice in vivo. p-DDAP showed no effects on blood retinol concentrations, in contrast to<br />

reductions after 4-HPR administration. These results indicate that p-DDAP exhibits excellent<br />

anticancer efficacy against hormonal in<strong>de</strong>pen<strong>de</strong>nt prostate cancer in vitro and in vivo, and it may<br />

have great potential for clinical use in the treatment of prostate cancer with reduced si<strong>de</strong> effects.<br />

Nr Articol<br />

14 Lipoxygenase inhibitors: A comparative QSAR study review and evaluation of new QSARs<br />

Medicinal Research Reviews<br />

Volume 28, Issue 1, Date: January 2008, Pages: 39-117<br />

Eleni Pontiki, Dimitra Hadjipavlou-Litina<br />

Keywords<br />

QSAR • LOX inhibitors • lipophilicity • steric factors • electronic effects<br />

Abstract<br />

This paper contains a quantitative structure activity relationship (QSAR) study for lipoxygenase<br />

(LO) inhibitors. It reveals that in almost all cases, the clog P parameter plays an important part in<br />

the QSARs (linear or bilinear mo<strong>de</strong>l). In some cases the steric factors such as the overall molar<br />

refractivity (CMR) or the substituents molar refractivity (MR) (linear or parabola) are important.<br />

Electronic effects are comparatively unimportant. The study shows that log P as calculated from the<br />

Clog P program is suitable for this form of QSAR study.<br />

49


Nr Articol<br />

15 A neural network approach to prediction of glass transition temperature of polymers<br />

International Journal of Intelligent Systems<br />

Volume 23, Issue 1, Date: January 2008, Pages: 22-32<br />

Xi Chen, Les Sztan<strong>de</strong>ra, Hugh M. Cartwright<br />

Abstract<br />

Polymeric materials are finding increasing application in commercial optical communication<br />

systems. Taking advantage of techniques from the field of artificial intelligence, the goal of our<br />

research is to construct systems that can computationally <strong>de</strong>sign polymer formulations, including<br />

polymer optical fibers, with specified <strong>de</strong>sirable consumer characteristics. Through the use of an<br />

extensive structure - property correlation database, properties of polymers can be predicted by an<br />

artificial network and the structure of novel polymers with <strong>de</strong>sired properties can be optimized by a<br />

genetic algorithm. In this paper, we are focusing on one of the parameters, glass transition<br />

temperature (Tg) that influences a <strong>de</strong>sired outcome in polymer optical fibers. Performance of such<br />

fibers can be optimized by engineering a polymer to exhibit a lower refractive in<strong>de</strong>x and Tg. This<br />

paper compares and discusses a neural network mo<strong>de</strong>l and a linear mo<strong>de</strong>l that have been <strong>de</strong>veloped<br />

to correlate Tg and repeating units of polymers. A neural network and multiple linear regression<br />

analysis were used in the study. A set of <strong>de</strong>scriptors, chosen based on previous studies on the<br />

relations between Tg and polymer structure, were used to <strong>de</strong>scribe the structure of repeating units,<br />

individual bond energies, and intermolecular forces, especially hydrogen bonding, which is the<br />

strongest intermolecular force and exerts the greatest influence on Tg compared with other<br />

intermolecular interactions. A comprehensive neural network mo<strong>de</strong>l with 28 <strong>de</strong>scriptors was<br />

<strong>de</strong>veloped to predict Tg values of 6 randomly selected polymers from a database containing 71<br />

polymers. The network was trained with the remaining 65 polymers and had a typical training root<br />

mean square error of 17 K (R2 = 0.95) and prediction average error of 17 K (R2 = 0.85). A linear<br />

regression mo<strong>de</strong>l <strong>de</strong>veloped for comparison had an average error of 30 K (R2 = 0.88).<br />

Nr Articol<br />

16 Investigation of DNA-binding properties of organic molecules using quantitative structureactivity<br />

relationship (QSAR) mo<strong>de</strong>ls<br />

Journal of Pharmaceutical Sciences<br />

Volume 97, Issue 1, Date: January 2008, Pages: 88-110<br />

Rajeshwar P. Verma, Corwin Hansch<br />

Keywords<br />

DNA • QSAR • log P • cancer • computer ai<strong>de</strong>d drug <strong>de</strong>sign<br />

Abstract<br />

Due to the great potential of DNA as a receptor, many classes of synthetic and naturally occurring<br />

molecules exert their anticancer activities through DNA-binding. In the field of antitumor DNAbinding<br />

agents, a number of acridine and anthracycline <strong>de</strong>rivatives are in the market as<br />

chemotherapeutic agents. However, the clinical application of such classes of compounds has<br />

encountered problems such as multi-drug resistance and secondary and/or collateral effects. Thus,<br />

there has been increasing interest in discovering and <strong>de</strong>veloping small molecules that are capable of<br />

DNA-binding, which will be expected to be used either in place of or in conjunction with, the<br />

existing compounds. The interest in the application of the QSAR paradigm has steadily increased in<br />

recent <strong>de</strong>ca<strong>de</strong>s and we hope it may be useful in the <strong>de</strong>sign and <strong>de</strong>velopment of DNA-binding<br />

molecules as new anticancer agents. In the present review, an attempt has been ma<strong>de</strong> to un<strong>de</strong>rstand<br />

the DNA-binding properties of different compound series and discussed using 27 QSAR mo<strong>de</strong>ls,<br />

which reveal a number of interesting points. The most important <strong>de</strong>terminants for the activity in<br />

these mo<strong>de</strong>ls are Hammett electronic (and +), hydrophobic, molar refractivity, and Sterimol width<br />

parameters.<br />

Nr Articol<br />

17 Design, synthesis and evaluation of pepti<strong>de</strong> inhibitors of Mycobacterium tuberculosis<br />

50


ibonucleoti<strong>de</strong> reductase<br />

Journal of Pepti<strong>de</strong> Science<br />

Volume 13, Issue 12, Date: December 2007, Pages: 822-832<br />

Johanna Nurbo, Annette K. Roos, Daniel Muthas, Erik Wahlström, Daniel J. Ericsson, Torbjörn<br />

Lundstedt, Torsten Unge, An<strong>de</strong>rs Karlén<br />

Fun<strong>de</strong>d by:<br />

Swedish Foundation for Strategic Research<br />

Swedish Research Council<br />

EU Sixth Framework Program; Grant Number: NM4TB CT:018 923<br />

Keywords<br />

Mycobacterium tuberculosis • ribonucleoti<strong>de</strong> reductase • pepti<strong>de</strong> inhibitors • alanine scan •<br />

statistical molecular <strong>de</strong>sign • structure activity relationships • FHDoE<br />

Abstract<br />

Mycobacterium tuberculosis ribonucleoti<strong>de</strong> reductase (RNR) is a potential target for new<br />

antitubercular drugs. Herein we <strong>de</strong>scribe the synthesis and evaluation of pepti<strong>de</strong> inhibitors of RNR<br />

<strong>de</strong>rived from the C-terminus of the small subunit of M. tuberculosis RNR. An N-terminal<br />

truncation, an alanine scan and a novel statistical molecular <strong>de</strong>sign (SMD) approach based on the<br />

heptapepti<strong>de</strong> Ac-Glu-Asp-Asp-Asp-Trp-Asp-Phe-OH were applied in this study. The alanine scan<br />

showed that Trp5 and Phe7 were important for inhibitory potency. A quantitative structure<br />

relationship (QSAR) mo<strong>de</strong>l was <strong>de</strong>veloped based on the synthesized pepti<strong>de</strong>s which showed that a<br />

negative charge in positions 2, 3, and 6 is beneficial for inhibitory potency. Finally, in position 5 the<br />

mo<strong>de</strong>l coefficients indicate that there is room for a larger si<strong>de</strong> chain, as compared to Trp5.<br />

Nr Articol<br />

18 Docking without docking: ISEARCH - prediction of interactions using known interfaces<br />

Proteins: Structure, Function, and Bioinformatics<br />

Volume 69, Issue 4, Date: December 2007, Pages: 839-844<br />

Stefan Günther, Patrick May, Andreas Hoppe, Cornelius Frömmel, Robert Preissner<br />

Keywords<br />

prediction of interaction • interfaces • superposition • knowledge-based<br />

Abstract<br />

The increasing number of solved protein structures provi<strong>de</strong>s a solid number of interfaces, if proteinprotein<br />

interactions, domain-domain contacts, and contacts between biological units are taken into<br />

account. An interface library gives us the opportunity to i<strong>de</strong>ntify surface regions on a target<br />

molecule that are similar by local structure and residue composition. If both unbound components<br />

of a possible protein complex exhibit structural similarities to a known interface, the unbound<br />

structures can be superposed onto the known interfaces. The approach is accompanied by two<br />

mathematical problems. Protein surfaces have to be quickly screened by thousands of patches, and<br />

similarity has to be evaluated by a suitable scoring scheme. The used algorithm (NeedleHaystack)<br />

i<strong>de</strong>ntifies similar patches within minutes. Structurally related sites are recognized even if only parts<br />

of the template patches are structurally related to the interface region. A successful prediction of the<br />

protein complex <strong>de</strong>pends on a suitable template of the library. However, the performed tests<br />

indicate that interaction sites are i<strong>de</strong>ntified even if the similarity is very low. The approach<br />

complements existing ab initio methods and provi<strong>de</strong>s valuable results on standard benchmark sets.<br />

Nr Articol<br />

19 First-principles, structure-based trans<strong>de</strong>rmal transport mo<strong>de</strong>l to evaluate lipid partition and<br />

diffusion coefficients of hydrophobic permeants solely from stratum corneum permeation<br />

experiments<br />

Journal of Pharmaceutical Sciences<br />

Volume 96, Issue 12, Date: December 2007, Pages: 3236-3251<br />

Joseph Kushner IV, William Deen, Daniel Blankschtein, Robert Langer<br />

Keywords<br />

trans<strong>de</strong>rmal drug <strong>de</strong>livery • permeability • mathematical mo<strong>de</strong>l • drug transport • percutaneous •<br />

51


skin • membrane transport • passive diffusion/transport<br />

Abstract<br />

To account for the effect of branched, parallel transport pathways in the intercellular domain of the<br />

stratum corneum (SC) on the passive trans<strong>de</strong>rmal transport of hydrophobic permeants, we have<br />

<strong>de</strong>veloped, from first-principles, a new theoretical mo<strong>de</strong>l - the Two-Tortuosity Mo<strong>de</strong>l. This new<br />

mo<strong>de</strong>l requires two tortuosity factors to account for: (1) the effective diffusion path length, and (2)<br />

the total volume of the branched, parallel transport pathways present in the SC intercellular domain,<br />

both of which may be evaluated from known values of the SC structure. After validating the Two-<br />

Tortuosity mo<strong>de</strong>l with simulated SC diffusion experiments in FEMLAB (a finite element software<br />

package), the vehicle-bilayer partition coefficient, Kb, and the lipid bilayer diffusion coefficient,<br />

Db, in untreated human SC were evaluated using this new mo<strong>de</strong>l for two hydrophobic permeants,<br />

naphthol (Kb = 225 ± 42, Db = 1.7 × 10-7 ± 0.3 × 10-7 cm2/s) and testosterone (Kb = 92 ± 29, Db<br />

= 1.9 × 10-8 ± 0.5 × 10-8 cm2/s). The results presented in this paper <strong>de</strong>monstrate that this new<br />

method to evaluate Kb and Db is comparable to, and simpler than, previous methods, in which SC<br />

permeation experiments were combined with octanol-water partition experiments, or with SC solute<br />

release experiments, to evaluate Kb and Db.<br />

Nr Articol<br />

20 Relationship between basicity and nucleophilicity<br />

Journal of Physical Organic Chemistry<br />

Volume 20, Issue 12, Date: December 2007, Pages: 1050-1057<br />

Paula Jaramillo, Patricia Pérez, Patricio Fuentealba<br />

Fun<strong>de</strong>d by:<br />

Fon<strong>de</strong>cyt; Grant Number: 1060961, 1050294<br />

Universidad Andres Bello; Grant Number: DI-28-06/I<br />

Millennium Nucleus for Applied Quantum Mechanics and Computational Chemistry; Grant<br />

Number: P02-004-F<br />

Keywords<br />

nucleophilicity in<strong>de</strong>x • nucleophiles • basicity • proton affinity • reactivity • HSAB principle • acidbase<br />

reaction • endothermic reactions<br />

Abstract<br />

The empirical concepts of basicity and nucleophilicity are related but not strictly proportional.<br />

Hence, the aim of this study is to help in elucidating the range where both concepts are directly<br />

proportional. To do this, the relationship between a recently introduced nucleophilicity in<strong>de</strong>x and<br />

the proton affinity (PA) of several families of bases has been studied. A good correlation between<br />

the PA and the nucleophilicity in<strong>de</strong>x using HF and HCN as electrophilic partner has been found.<br />

Our studies show that the correlation exists only when the interaction is soft-soft in character and<br />

for strong bases with weak acids. However, the relationship is not only valid for exothermic<br />

reactions as it has been previously postulated but also for endothermic reactions.<br />

Nr Articol<br />

21 Information theoretical measures to analyze trajectories in rational molecular <strong>de</strong>sign<br />

Journal of Computational Chemistry<br />

Volume 28, Issue 16, Date: December 2007, Pages: 2576-2580<br />

K. Hamacher<br />

Keywords<br />

molecular dynamics • molecular biophysics • data analysis • computational chemistry • rational<br />

<strong>de</strong>sign • pharmacology<br />

Abstract<br />

We <strong>de</strong>velop a new methodology to analyze molecular dynamics trajectories and other time series<br />

data from simulation runs. This methodology is based on an information measure of the difference<br />

between distributions of various data extract from such simulations. The method is fast as it only<br />

involves the numerical integration/summation of the distributions in one dimension while avoiding<br />

sampling issues at the same time. The method is most suitable for applications in which different<br />

52


scenarios are to be compared, e.g. to gui<strong>de</strong> rational molecular <strong>de</strong>sign. We show the power of the<br />

proposed method in an application of rational drug <strong>de</strong>sign by reduced mo<strong>de</strong>l computations on the<br />

BH3 motif in the apoptosis inducing BCL2 protein family.<br />

Nr Articol<br />

22 A novel semi-empirical topological <strong>de</strong>scriptor Nt and the application to study on QSPR/QSAR<br />

Journal of Computational Chemistry<br />

Volume 28, Issue 15, Date: 30 November 2007, Pages: 2413-2423<br />

Congyi Zhou, Changming Nie, Shan Li, Zhonghai Li<br />

Fun<strong>de</strong>d by:<br />

The Natural Science Foundation of Hunan Province; Grant Number: 03JJY3024<br />

The Technology Innovation Plans of the Economy Commission of Hunan Province; Grant<br />

Number: [2005]283<br />

Keywords<br />

equilibrium electronegativity • organic compounds • QSPR/QSAR • topological <strong>de</strong>scriptor Nt<br />

Abstract<br />

A novel semi-empirical topological <strong>de</strong>scriptor Nt was proposed by revising the traditional distance<br />

matrix based on the equilibrium electronegativity and the relative bond length. Nt can not only<br />

efficiently distinguish structures of organic compounds containing multiple bonds and/or<br />

heteroatoms, but also possess good applications of QSPR/QSAR (quantitative structureproperty/activity<br />

relationships) to a large diverse set of compounds, which are alkanes, alkenes,<br />

alkynes, al<strong>de</strong>hy<strong>de</strong>s, ketones, thiols, and alkoxy silicon chlori<strong>de</strong>s with all the correlation coefficients<br />

of the mo<strong>de</strong>ls over 0.99. The LOO CV (leave-one-out cross-validation) method was used to testify<br />

the stability and predictive ability of the mo<strong>de</strong>ls. The validation results verify the good stability and<br />

predictive ability of the mo<strong>de</strong>ls employing the cross-validation parameters: RCV, SEPCV and SCV,<br />

which <strong>de</strong>monstrate the wi<strong>de</strong> potential of the Nt <strong>de</strong>scriptor for applications to QSPR/ QSAR.<br />

Nr Articol<br />

23 Analysis of System Structure-Function Relationships<br />

ChemMedChem<br />

Volume 2, Issue 12, Date: December 10, 2007, Pages: 1774-1782<br />

Anton F. Fliri, William T. Loging, Robert A. Volkmann<br />

Keywords<br />

biospectra • cellular response • drug <strong>de</strong>sign • proteins • structure-function relationships<br />

Abstract<br />

Preclinical pharmacology studies conducted with experimental medicines currently focus on<br />

assessments of drug effects attributed to a drug's putative mechanism of action. The high failure rate<br />

of medicines in clinical trials, however, un<strong>de</strong>rscores that the information gathered from these<br />

studies is insufficient for forecasting drug effect profiles actually observed in patients. Improving<br />

drug effect predictions and increasing success rates of new medicines in clinical trials are some of<br />

the key challenges currently faced by the pharmaceutical industry. Addressing these challenges<br />

requires <strong>de</strong>velopment of new methods for capturing and comparing system-wi<strong>de</strong> structure-effect<br />

information for medicines at the cellular and organism levels. The current investigation <strong>de</strong>scribes a<br />

strategy for moving in this direction by using six different <strong>de</strong>scriptor sets for examining the<br />

relationship between molecular structure and broad effect information of 1064 medicines at the<br />

cellular and the organism level. To compare broad drug effect information between different<br />

medicines, information spectra for each of the 1064 medicines were created, and the similarity<br />

between information spectra was <strong>de</strong>termined through hierarchical clustering. The structure-effect<br />

relationships ascertained through these comparisons indicate that information spectra similarity<br />

obtained through preclinical ligand binding experiments using a mo<strong>de</strong>l proteome provi<strong>de</strong> useful<br />

estimates for the broad drug effect profiles of these 1064 medicines in organisms. This premise is<br />

illustrated using the ligand binding profiles of selected medicines in the dataset as biomarkers for<br />

forecasting system-wi<strong>de</strong> effect observations of medicines that were not inclu<strong>de</strong>d in the incipient<br />

1064-medicine analysis.<br />

53


Nr Articol<br />

24 Synthesis, Antimicrobial and Antineoplastic Activities for Agelasine and Agelasimine Analogs<br />

with a -Cyclocitral Derived Substituent<br />

Archiv <strong>de</strong>r Pharmazie<br />

Volume 340, Issue 12, Date: December 2007, Pages: 625-634<br />

Ágnes Proszenyák, Colin Charnock, Erik Hedner, Rolf Larsson, Lars Bohlin, Lise-Lotte Gun<strong>de</strong>rsen<br />

Fun<strong>de</strong>d by:<br />

The Norwegian Research Council; KOSK program; Grant Number: 165765/V30<br />

The Swedish Research for Environment, Agricultural Science and Spatial Planning<br />

Keywords<br />

Agelasimine • Agelasine • Anti-cancer activity • Antimicrobial activity • -Cyclocitral<br />

Abstract<br />

Agelasines and agelasimines are antimicrobial and cytotoxic purine <strong>de</strong>rivatives isolated from<br />

marine sponges (Agelas sp.). We have synthesized structurally simplified analogs of these natural<br />

products starting from -cyclocitral. The novel compounds were found to be strong inhibitors of a<br />

wi<strong>de</strong> variety of pathogenic microorganisms (incl. Mycobacterium tuberculosis) as well as cancer<br />

cell lines. The biological activities were generally in the same range as those previously found for<br />

the structurally more complex agelasines and agelasimines isolated in small amounts from natural<br />

sources. We also report for the first time that agelasine and agelasimine analogs inhibit growth of<br />

protozoa (Acanthamoeba castellanii and Acanthamoeba polyphaga). Acanthamoeba keratitis is an<br />

increasingly common and severe corneal infection, closely associated with contact lens wear.<br />

Nr Articol<br />

25 Synthesis and Anticancer Activity of (R,S)-9-(2,3-Dihydro-1,4-Benzoxathiin-3-ylmethyl)-9H-<br />

Purines<br />

ChemMedChem<br />

Early View<br />

Mónica Díaz-Gavilán, Ana Conejo-García, Olga Cruz-López, María C. Núñez, Duane Choquesillo-<br />

Lazarte, Josefa M. González-Pérez, Fernando Rodríguez-Serrano, Juan A. Marchal, Antonia<br />

Aránega, Miguel A. Gallo, Antonio Espinosa, Joaquín M. Campos<br />

Fun<strong>de</strong>d by:<br />

European Commission; Grant Number: MERG-CT-2005-030616<br />

Instituto <strong>de</strong> Salud Carlos III; Grant Number: PI041206<br />

Consejería <strong>de</strong> Innovación, Ciencia y Empresa of the Junta <strong>de</strong> Andalucía; Grant Number: 00636<br />

Keywords<br />

antitumor compounds • benzoxathiines • microwave • mitsunobu reaction • nitrogen heterocycles<br />

Abstract<br />

A series of eleven 2- and 6-substituted (R,S)-9-(2,3-dihydro-1,4-benzoxathiin-3-ylmethyl)-9Hpurine<br />

<strong>de</strong>rivatives was obtained by applying a standard Mitsunobu protocol that led to a sixmembered<br />

ring contraction from (R,S)-3,4-dihydro-2H-1,5-benzoxathiepin-3-ol via an episulfonium<br />

intermediate. The signal ~=151 ppm, which corresponds to the C4 carbon atom, is unequivocal<br />

proof of the N9 regioisomer. The potential of the target molecules as anticancer agents is reflected<br />

in their activity against the MCF-7 cancer cell line. The most active compounds have IC50 values<br />

of (6.18±1.70) and (8.97±0.83) M. The results indicate that the anticancer activity for the most<br />

active compounds is correlated with their capacity to induce apoptosis.<br />

Nr Articol<br />

26 Design, Synthesis, and Pharmacological Evaluation of Mefloquine-Based Ligands as Novel<br />

Antituberculosis Agents<br />

ChemMedChem<br />

Volume 2, Issue 11, Date: November 12, 2007, Pages: 1624-1630<br />

Jialin Mao, Yuehong Wang, Baojie Wan, Alan P. Kozikowski, Scott G. Franzblau<br />

Keywords<br />

54


hydrazones • ligand-based drug <strong>de</strong>sign • mefloquine • structure-activity relationships • tuberculosis<br />

Abstract<br />

Tuberculosis (TB) is presently regar<strong>de</strong>d as one of the most dangerous infective diseases worldwi<strong>de</strong><br />

and one of the major AIDS-associated infections. To shorten the current treatment regimen, there is<br />

an urgent need to i<strong>de</strong>ntify new anti-TB agents which are active against both replicating TB (R-TB)<br />

and nonreplicating TB (NRP-TB). Mefloquine, a well-known antimalarial drug was found to<br />

possess reasonable activity against NRP-TB, and accordingly, 30 new analogues were synthesized<br />

and evaluated for their anti-TB activity against Mycobacterium tuberculosis H37Rv. As the target<br />

of mefloquine in Mycobacterium tuberculosis remains unknown, we resorted to modifying<br />

mefloquine in a variety of chemically convenient ways, which led us in turn to the active hydrazone<br />

10 a. Further modifications of 10 a led to compound 7 f, with an improved anti-TB<br />

activity/selectivity profile with both less cytotoxicity and less predicted CNS si<strong>de</strong> effects compared<br />

with mefloquine. The clear structure-activity relationships (SARs) <strong>de</strong>rived from this study should<br />

facilitate our ultimate goal of i<strong>de</strong>ntifying improved anti-TB agents.<br />

Nr Articol<br />

27 Complexity in Mo<strong>de</strong>ling and Un<strong>de</strong>rstanding Protonation States: Computational Titration of<br />

HIV-1-Protease-Inhibitor Complexes<br />

Chemistry & Biodiversity<br />

Volume 4, Issue 11, Date: November 2007, Pages: 2564-2577<br />

Ashutosh Tripathi, Micaela Fornabaio, Francesca Spyrakis, Andrea Mozzarelli, Pietro Cozzini,<br />

Glen E. Kellogg<br />

Keywords<br />

Hydropathic analysis • Free energy • Molecular mo<strong>de</strong>ling • Isocrystallographic mo<strong>de</strong>ls • HINT<br />

Force field • HIV • Computational titration • Proteinligand complex<br />

Abstract<br />

The computational-titration (CT) algorithm based on the natural Hydropathic INTeractions (HINT)<br />

force field is <strong>de</strong>scribed. The HINT software mo<strong>de</strong>l is an empirical, non-Newtonian force field<br />

<strong>de</strong>rived from experimentally measured partition coefficients for solvent transfer between octanol<br />

and H2O (log Po/w). The CT algorithm allows the i<strong>de</strong>ntification, mo<strong>de</strong>ling, and optimization of<br />

multiple protonation states of residues and ligand functional groups at the protein-ligand active site.<br />

The importance of taking into account pH and ionization states of residues, which strongly affect<br />

the process of ligand binding, for correctly predicting binding free energies is discussed. The<br />

application of the CT protocol to a set of six cyclic inhibitors in their complexes with HIV-1<br />

protease is presented, and the advance of HINT as a virtual-screening tool is outlined.<br />

Nr Articol<br />

28 Structure-Activity Relationships for a Family of Benzothiophene Selective Estrogen Receptor<br />

Modulators Including Raloxifene and Arzoxifene<br />

ChemMedChem<br />

Volume 2, Issue 10, Date: October 8, 2007, Pages: 1520-1526<br />

Cassia R. Overk, Kuan-Wei Peng, Rezene T. Asghodom, Irida Kastrati, Daniel D. Lantvit, Zhihui<br />

Qin, Jonna Frasor, Judy L. Bolton, Gregory R. J. Thatcher<br />

Keywords<br />

cancer • chemoprevention • estradiol • estrogen receptor • hormone replacement therapy • SERM<br />

Abstract<br />

The search for the i<strong>de</strong>al selective estrogen receptor modulator (SERM) as a substitute for hormone<br />

replacement therapy (HRT) or use in cancer chemoprevention has focused on optimization of<br />

estrogen receptor (ER) ligand binding. Based on the clinical and preclinical benzothiophene<br />

SERMs, raloxifene and arzoxifene, a family of SERMs has been <strong>de</strong>veloped to modulate activity and<br />

oxidative lability. Antiestrogenic potency measured in human endometrial and breast cancer cells,<br />

and ER ligand binding data were correlated and seen to provi<strong>de</strong> a gui<strong>de</strong> to SERM <strong>de</strong>sign only when<br />

viewed in toto. The in vitro studies were exten<strong>de</strong>d to the juvenile rat mo<strong>de</strong>l, in which the <strong>de</strong>sired<br />

antiestrogenic profile and putative cardiovascular benefits of SERMs were observed.<br />

55


2007A6. I<strong>de</strong>ntificarea surselor <strong>de</strong> date şi metodologiilor <strong>de</strong> colectare (eşantionare, criterii <strong>de</strong><br />

inclu<strong>de</strong>re şi exclu<strong>de</strong>re în studiu), şi <strong>de</strong> experimentare<br />

Derularea activităţii a fost asigurată <strong>de</strong> preocupările şi rezultatele anterioare ale colectivului <strong>de</strong><br />

<strong>cercetare</strong> în ceea ce priveşte formularea <strong>de</strong> măsuri şi măsurabile pentru eşantionare şi volumul<br />

necesar al eşantionului pentru a da o anumită semnificaţie statistică rezultatului studiului (Bolboacă<br />

& Jäntschi, 2007-CRRF), cum datele trebuie înregistrate în ve<strong>de</strong>rea analizei (Bolboacă & others,<br />

2008-RRAS).<br />

O serie <strong>de</strong> filtre s-au dovedit utile în i<strong>de</strong>ntificarea surselor <strong>de</strong> date şi au fost folosite pentru<br />

inclu<strong>de</strong>rea în studiu, acestea bazându-se pe analiza <strong>de</strong> similaritate (Bolboacă & Jäntschi, 2007-<br />

SAHZ; Bolboacă & Jäntschi, 2007-MCSC).<br />

Problematica <strong>de</strong>signului experimental a ocupat un segment important al studiului, referind <strong>de</strong> la<br />

metodologia <strong>de</strong> prelevare a observaţiilor (Jäntschi & Bolboacă, 2007-HADR), la alegerea potrivită a<br />

scalei <strong>de</strong> reprezentare a observaţiilor (Bolboacă & Jäntschi, 2007-AAHS) la proiectarea<br />

experimentului (Bolboacă & Jäntschi, 2007-DoE) şi analiza <strong>de</strong> varianţă asociată acestuia (Bolboacă<br />

& others, 2009-AoV) şi la ipotezele cu privire la distribuţia erorii experimentale (Jäntschi &<br />

Bolboacă, 2009-OvO), acestea din urmă reprezentând rezultate noi obţinute din <strong>cercetare</strong>a<br />

<strong>de</strong>sfăşurată în cadrul proiectului.<br />

Tehnica experimentului se bazează pe noţiunea <strong>de</strong> observaţie. Experimentele sunt întot<strong>de</strong>auna<br />

empirice şi cu toate acestea uneori doar măsurătorile nu formează un experiment.<br />

Experimentele implică mai mult stabilirea unui anumit nivel <strong>de</strong> control şi manipularea unuia sau a<br />

mai multor factori <strong>de</strong> interes <strong>de</strong>cât stabirirea cauzei şi efectului.<br />

Definiţia din dicţionar a experimentului este aceea <strong>de</strong> a <strong>de</strong>termina eficacitatea unui lucru neîncercat<br />

anterior sau aceea <strong>de</strong> e examina validitatea unei ipoteze sau <strong>de</strong> a <strong>de</strong>monstra un a<strong>de</strong>văr cunoscut.<br />

Prima etapă în formularea unui experiment este <strong>de</strong>finirea câtorva termeni, cum ar fi:<br />

÷ Propoziţii, ipoteze<br />

÷ Presupunerile ce trebuiesc făcute (ele <strong>de</strong>termină scopul şi i<strong>de</strong>ntifică domeniile care nu pot fi<br />

investigate);<br />

÷ I<strong>de</strong>ntificarea variabilei (variabilelor) <strong>de</strong>pen<strong>de</strong>nte (sunt datele <strong>de</strong> ieşire, rezultate);<br />

÷ I<strong>de</strong>ntificarea variabilelor in<strong>de</strong>pen<strong>de</strong>nte (sunt datele <strong>de</strong> intrare care luate împreună formează<br />

spaţiul experimental);<br />

÷ Care din variabilele in<strong>de</strong>pen<strong>de</strong>nte pot fi controlate;<br />

În general, statisticianul nu studiază un caracter al populaţiei pe întreaga mulţime <strong>de</strong> elemente, din<br />

mai multe motive, dintre care menţionăm următoarele:<br />

÷ Talia populaţiei poate fi foarte mare sau chiar infinită ceea ce face imposibilă o “observare”<br />

exhaustivă a întregii populaţii;<br />

÷ Eşantioanele pot fi studiate mai rapid <strong>de</strong>cât populaţiile;<br />

÷ Studiul caracterului pe întreaga populaţie este frecvent imposibil, <strong>de</strong>oarece poate distruge<br />

populaţia.<br />

÷ În anumite situaţii nu se mai pot obţine informaţii <strong>de</strong>cât <strong>de</strong>spre o parte a populaţiei.<br />

÷ Rezultatele observaţiilor pe eşantioane a<strong>de</strong>sea sunt mai precise <strong>de</strong>cât rezultatele bazate pe<br />

observarea populaţiei în totalitate, <strong>de</strong>oarece la nivelul unui eşantion se controlează mai uşor<br />

procesul şi tehnicile <strong>de</strong> observare, acestea menţinându-se cu un efort mai mic în standar<strong>de</strong>le <strong>de</strong><br />

eroare acceptate.<br />

÷ Costul şi resursele necesare (umane, materiale, etc.) pentru observarea exhaustivă a unei<br />

populaţii pot <strong>de</strong> asemenea să fie un motiv pentru utilizarea eşantioanelor.<br />

Acestea sunt câteva raţiuni pentru care o populaţie este studiată cu ajutorul unei submulţimi a ei <strong>de</strong><br />

talie mai mică care să permită un studiu exhaustiv al ei.<br />

Un bun eşantion trebuie să constituie o imagine a<strong>de</strong>cvată şi fi<strong>de</strong>lă a întregii populaţii pentru care se<br />

doreşte studierea unui caracter. În caz contrar, se spune că eşantionul este nereprezentativ, sau cu<br />

"bias". Alegerea eşantionului şi culegerea datelor constituie partea cea mai laborioasă. Modalitatea<br />

<strong>de</strong> alegere a eşantionului, principiile <strong>de</strong> eşantinare, criteriile <strong>de</strong> inclu<strong>de</strong>re şi exclu<strong>de</strong>re precum şi<br />

56


modalitatea <strong>de</strong> culegere, colectare şi stocare a datelor trebuie să se regăsescă în protocolul<br />

cercetării. În scopul extrapolării rezultatelor la întreaga populaţie din cadrul căreia eşantionul a fost<br />

creat (obiectiv al statisticii inductive), acesta (adică eşantionul) trebuie să în<strong>de</strong>plienască anumite<br />

criterii (trebuie să fie reprezentativ). Pentru a obţine reprezentativitatea un eşantion trebuie să<br />

în<strong>de</strong>plinească următoarele condiţii:<br />

÷ Reprezentativitatea prin taliei: condiţie <strong>de</strong> ordin cantitativ. Volumul eşantionului trebuie să fie<br />

suficient <strong>de</strong> mare raportat la populaţia din care s-a extras.<br />

÷ Reprezentativitatea prin caracteristici: condiţie <strong>de</strong> ordin calitativ. Eşantionul trebuie extras<br />

aleator din populaţie pentru a cuprin<strong>de</strong> în mod proporţional totate caractericile popualţiei din<br />

care face parte.<br />

Cel mai bun mijloc <strong>de</strong> a asigura că un eşantion va permite inferenţe corecte este utilizarea<br />

meto<strong>de</strong>lor <strong>de</strong> eşantioanare probabilistică în obţinerea eşantionului. Această metodă, pentru fiecare<br />

subiect al populaţiei este cunoscută probabilitatea (şansa) <strong>de</strong> a fi inclus în eşantion.<br />

Patru meto<strong>de</strong> <strong>de</strong> eşantionare sunt folosite pentru a obţine eşantioane probabiliste:<br />

÷ eşantionarea simplu randomizată<br />

÷ eşantionarea sistematică<br />

÷ eşantionarea stratificată<br />

÷ eşantionarea cluster.<br />

Eşantionarea simplă randomizată este o selecţie formată din subiecţi extraşi la întâmplare din<br />

populaţia statistică. Fiecare subiect are aceiaşi şansă <strong>de</strong> a fi inclus în eşantion.<br />

Astfel pentru obţinerea unui eşantion aleator se poate utiliza o metodă <strong>de</strong> randomizare bazată pe<br />

proce<strong>de</strong>e <strong>de</strong> generare <strong>de</strong> numere aleatoare (<strong>de</strong> exemplu, funcţiile RAND sau RANDBETWEEN din<br />

Microsoft EXCEL). Prin această metodă, fiecare element al populaţiei primeşte un număr <strong>de</strong><br />

i<strong>de</strong>ntificare. Pentur eşantionare este dipsonibilă o listă <strong>de</strong> numere <strong>de</strong> i<strong>de</strong>ntificare numită structură <strong>de</strong><br />

eşantionare.<br />

Eşantionarea sistematică inclu<strong>de</strong> tot al k-lea element din populaţie în eşantion. Numărul k se obţine<br />

împărţind talia populaţiei la talia dorită a eşantionului.<br />

Eşantionarea sistematică nu este indicat să fie folosită atunci când în structura <strong>de</strong> eşantionare ar<br />

putea apare o periodicitate.<br />

Există şi alte meto<strong>de</strong> <strong>de</strong> meto<strong>de</strong> <strong>de</strong> eşantionare mai complexe, cum ar fi, <strong>de</strong> exemplu, eşantionarea<br />

stratificată. Pentru aceasta, se împarte populaţia în mai multe subgrupe relevante numite straturi şi<br />

se constituie eşantionul prin extrageri aleatoare din straturi. Fiecare strat trebuie să fie reprezentat în<br />

eşantion în funcţie <strong>de</strong> importanţa sa în populaţie.<br />

Eşantionarea cluster. Un eşantion aleator <strong>de</strong> clusteri se obţine printr-un proce<strong>de</strong>u în două etape.<br />

Într-o primă etapă se împarte populaţia în clusteri şi ulterior se selectează aleator o submulţime <strong>de</strong><br />

clusteri. În mod obişnuit alegerea clusterilor se bazează pe criterii geografice, iar acest proce<strong>de</strong>u<br />

este utilizat frecvent în studiile epi<strong>de</strong>miologice.<br />

Eşantionarea nonprobabilistă este aceia în care nu este cunoscută probabilitatea ca o entitate din<br />

populaţie să fie selectată. Eşantioanele obţinute în acest mod au frecvent bias <strong>de</strong> selecţie.<br />

Asignarea aleatoare. În anumite studii experimentale, prima dată, pe baza unor criterii subiecţii<br />

sunt selectaţi pentru a fi incluşi în studiu. Apoi fiecăruia dintre aceşti subiecţi trebuie să li se<br />

atribuie un anumit tratament. Dacă această atribuire a tratamentului este aleatoare atunci proce<strong>de</strong>ul<br />

se numeşte atribuire aleatoare. Acest proce<strong>de</strong>u <strong>de</strong> asignare aleatoare are ca scop ca grupurile ce<br />

primesc diferite tratamente să fie cât mai asemănător posibil.<br />

Populaţia ţintă şi populaţia <strong>de</strong> disponibilă. În anumite studii, subiecţii incluşi în eşantionul <strong>de</strong><br />

studiu nu aparţin întot<strong>de</strong>auna populaţiei pentru care cercetătorul doreşte să generalizeze concluziile<br />

studiului. În locul acestei populaţii, numită populaţie ţintă, cercetătorul utilizează frecvent o<br />

populaţie <strong>de</strong> subiecţi disponibili care verifică anumite condiţii impuse. Această populaţie din care<br />

<strong>de</strong> fapt este prelevat eşantionul (sau eşantioanele) se numeşte populaţia disponibilă. Pentru a face<br />

inferenţe relativ la populaţia ţintă pe baza populaţiei disponibile, aceasta din urmă trebuie să fie<br />

reprezentativă pentru populaţia ţintă (cele mai importante caracteristici au aceiaşi distribuţie în<br />

populaţia ţinţă şi în populaţia disponibilă).<br />

57


In anumite tipuri <strong>de</strong> studii sunt necesare cel puţin două eşantioane. Aceste eşantioane pot fi extrase<br />

sau prelevate din populaţia ţintă în două feluri: <strong>de</strong>pen<strong>de</strong>nt sau in<strong>de</strong>pen<strong>de</strong>nt.<br />

In cazul eşantioanelor in<strong>de</strong>pen<strong>de</strong>nte:<br />

÷ prelevarea unuia nu influenţează prelevarea celuilalt,<br />

÷ nu au, în general, acelaşi număr <strong>de</strong> unităţi.<br />

Un caz al eşantioanelor <strong>de</strong>pen<strong>de</strong>nte este cel implicând două eşantioane, care se spune că sunt<br />

eşantioane <strong>de</strong> observaţii perechi dacă au aceiaşi talie şi unităţile unui eşantion sunt în corespon<strong>de</strong>nţă<br />

bijectivă cu unităţile celuilalt eşantion.<br />

În domeniul medical, <strong>de</strong> exemplu, datele statistice au diverse provenienţe. Un prim tip este cel al<br />

datelor obţinute din măsurători, care rezultă pe baza unor <strong>de</strong>terminări cantitative ale unor<br />

proprietăţi susceptibile să varieze, în principiu <strong>de</strong> o manieră continuă, cum ar fi, spre exemplu,<br />

înălţimea, greutatea, presiunea sangvină, glicemia.<br />

Alte date statistice rezultă din enumerare, operaţie care furnizează în mod necesar date întregi.<br />

Aceste date <strong>de</strong> enumerare se obţin <strong>de</strong> regulă ca fiind numărul <strong>de</strong> indivizi care în<strong>de</strong>plinesc o anumită<br />

caracteristică, regula fiind stabilită în urma unor operaţii <strong>de</strong> clasificare după criterii bine stabilite.<br />

Rezultatele datelor <strong>de</strong> enumerare se exprimă frecvent sub forma <strong>de</strong> procente: rata <strong>de</strong> piese care<br />

în<strong>de</strong>plinesc condiţiile calitative necesare vânzării a fost <strong>de</strong> 65,5%.<br />

O altă categorie <strong>de</strong> date sunt datele <strong>de</strong> înseriere (ordinale sau <strong>de</strong> ordonare), care reprezintă poziţia<br />

unor obiecte "clasament" stabilit după anumite criterii. Datele <strong>de</strong> ordonare sunt frecvent utilizate,<br />

cum este <strong>de</strong> exemplu pentru <strong>de</strong>scriera calităţii unui produs.<br />

Clasificarea statistică a datelor<br />

Clasificarea statistică a datelor poate fi realizată ţinând seama <strong>de</strong> scalele <strong>de</strong> măsură utilizate. Astfel<br />

se disting următoarele scale <strong>de</strong> măsură:<br />

÷ Scala nominală este o scală pentru măsurarea variabilelor calitative ce pot lua un număr finit <strong>de</strong><br />

valori. Scala nominală nu admite nici o proprietate aritmetică şi nici ordonarea valorilor.<br />

Datele evaluate după o scală nominală sunt numite observaţii calitative, <strong>de</strong>oarece ele <strong>de</strong>scriu o<br />

calitate a unui obiect studiat. Unele dintre aceste scale au doar două valori şi atunci observaţiile sunt<br />

binare.<br />

÷ Scala ordinală este o scală utilizată în cazul variabilelor care pot lua valori într-o mulţime<br />

discretă finită <strong>de</strong> valori. Nu au nici o proprietate aritmetică. Permite o ordonare a valorilor.<br />

÷ Scala interval este o scală utilizată în cazul variabilelor cantitative continue (ce pot lua valori<br />

într-un interval) şi pentru care diferenţa între două valori ale scalei are sens.<br />

÷ Scala <strong>de</strong> tip raţie sau raport este utilizată în cazul variabilelor cantitative continue pentru care<br />

atât diferenţa cât şi câtul a oricăror două valori <strong>de</strong> pe scală au sens. Această scală are un zero<br />

absolut. Nu acceptă valori negative.<br />

Culegerea datelor<br />

Culegerea datelor se realizează în funcţie <strong>de</strong>:<br />

÷ obiectivele propuse<br />

÷ tipul studiului<br />

÷ modalităţile <strong>de</strong> alegere a subiecţilor<br />

÷ timpul disponibil<br />

÷ resursele financiare şi umane disponibile<br />

÷ procedura folosită<br />

÷ accesul la date.<br />

În funcţie <strong>de</strong> populaţia cuprinsă în studiu culegerea datelor poate fi:<br />

÷ Exhaustivă - cuprinzând toţi subiecţii populaţiei ţintă. Din consi<strong>de</strong>rente financiare (costuri foarte<br />

ridicate, echipă numeroasă necesară pentru culegerea datelor) şi/sau economice (distrugerea<br />

populaţiei <strong>de</strong> interes) culegerea exhaustivă a datelor este practic imposibilă.<br />

÷ Prin eşantionare - alegând din populaţia ţintă sau din populaţia disponibilă un grup <strong>de</strong> subiecţi -<br />

eşantionul. Pentru caracteristicile eşantionului reprezentativ vezi textul anterior.<br />

În funcţie <strong>de</strong> durata culegerii datelor poate fi:<br />

58


÷ Transversală: studierea unui eşantion la un moment X <strong>de</strong>terminat în timp şi/sau spaţiu.<br />

÷ Longitudinală: studierea unui eşantion într-un interval <strong>de</strong> timp prestabilit. În culegerea <strong>de</strong> date<br />

<strong>de</strong> tip longitudinal în funcţie <strong>de</strong> accesul la date culegerea poate fi:<br />

o Retrospectiv: din înregistrările anterioare (acolo un<strong>de</strong> este posibil), <strong>de</strong> la un moment<br />

M la un moment N (un<strong>de</strong> M este posterior momentului N şi anterior momentului în<br />

care protocolul <strong>de</strong> <strong>cercetare</strong> a fost stabilit).<br />

o Prospectiv: <strong>cercetare</strong> sistematică a datelor care se vor întâmpla <strong>de</strong> la un moment Y la<br />

un moment Z (un<strong>de</strong> momentul Y este anterior momentului Z şi posterior momentului<br />

în care protocolul <strong>de</strong> <strong>cercetare</strong> a fost stabilit)<br />

Design-ul experimentului<br />

I<strong>de</strong>ea <strong>de</strong> <strong>de</strong>sign al experimentului a fost introdusă <strong>de</strong> Fisher în 1920 care a <strong>de</strong>monstrat utilitatea<br />

acestui concept în domeniul agriculturii, analizând problema <strong>de</strong> optimizare a recoltelor tinând cont<br />

<strong>de</strong> diverşi factori (apă, ploaie, soare, condiţii <strong>de</strong> sol). În 1986, Taguchi a continuat i<strong>de</strong>a <strong>de</strong> <strong>de</strong>sign<br />

experimental, prin împartirea problemelor <strong>de</strong> optimizare în două categorii:<br />

÷ Probleme statice (problemele în care există câţiva factori <strong>de</strong> control ce <strong>de</strong>cid valoarea dorită a<br />

funcţiei). Meto<strong>de</strong> folosite în astfel <strong>de</strong> probleme sunt:<br />

o Aproximarea Smaller-the-Better este folosită când:<br />

Valorea i<strong>de</strong>ală pentru toate caracteristicile nedorite este zero<br />

Valoarea i<strong>de</strong>ală este finită şi este <strong>de</strong>finit maximul sau minimul ei<br />

o Aproximarea Nominal-the-Best este folosită când este aăteptată o anumită valoare şi nu<br />

se doreşte nici maximul nici minimul;<br />

o Aproximarea Larger-the-Better are la bază un mo<strong>de</strong>l care cuprin<strong>de</strong> trei etape:<br />

proiectarea sistemului<br />

proiectarea parametrilor<br />

proiectarea toleranţelor.<br />

În metoda Taguchi etapa <strong>de</strong> proiectare a sistemului, parametrilor şi a toleranţelor se face în<br />

aşa fel încât să se obţină un proiect ROBUST, adică insensibil, pe cât posibil, la variaţii normale<br />

ale mediului produsului.<br />

În acest scop, Taguchi a introdus noţiunea <strong>de</strong> parametri critici <strong>de</strong> proiectare pentru acei<br />

parametri a căror variaţie influenţează foarte mult calitatea / funcţionalitatea produsului. În<br />

principiu, aceşti parametri trebuie controlaţi în proiect prin toleranţe foarte strânse, în timp ce restul<br />

parametrilor trebuie lăsaţi cu toleranţe relaxate pentru a scă<strong>de</strong>a costurile.<br />

Taguchi propune abordarea problematicii prin 2 instrumente:<br />

o Elaborarea funcţiei obiectiv pe baza unuia din mo<strong>de</strong>lele <strong>de</strong> mai sus<br />

o Tehnica experimentelor (metoda matricelor ortogonale)<br />

Metoda şirurilor ortogonale este o metodă <strong>de</strong> optimizare a proceselor industriale, care<br />

asemenea altor tehnici <strong>de</strong> optimizare are ca şi obiective:<br />

o Profit maxim<br />

o Configuraţie cât mai bună a maşinilor<br />

o Alocare optimă a materialelor<br />

o Alocare optimă a forţelor <strong>de</strong> muncă în timp minim<br />

Metoda Taguchi constă în următoarele etape:<br />

o i<strong>de</strong>ntificarea factorilor controlabili şi necontrolabili<br />

o conceperea tabelelor <strong>de</strong> testare, separat pentru factorii controlabili şi cei necontrolabili<br />

o construirea matricei ortogonale a experimentelor prin combinarea tabelelor <strong>de</strong> testare pe<br />

orizontală şi pe verticală<br />

o efectuarea experimentelor ce corespund fiecărei căsuţe din matricea ortogonală, pe<br />

orizontală în tabloul factorilor controlabili şi pe verticală în tabloul factorilor<br />

necontrolabili<br />

o calculul raportului semnal / zgomot pentru fiecare linie a matricei ortogonale.<br />

÷ Probleme dinamice (există un parametru <strong>de</strong> intrare care <strong>de</strong>ci<strong>de</strong> rezultatul):<br />

o Senzitivitatea pantei: panta trebuie să aiba o valoare dată (<strong>de</strong> obicei 1) când funcţia<br />

59


ezultat este:<br />

O caracteristică nedorită (poate fi tratată ca o problemă <strong>de</strong> tip Smaller-the-Better)<br />

O caracteristică dorită (poate fi tratată ca o problemă <strong>de</strong> tip Larger-the-Better)<br />

o Linearitatea (Larger-the-Better): este folosită când caracteristicile dinamice trebuie sa<br />

aibă proporţionalitate între intrare şi rezultat.<br />

De fapt obiectivul optimizării procesului <strong>de</strong> prelucrare ar fi: calitate maximă-pier<strong>de</strong>ri minimeproductivitate<br />

maximă. Pentru <strong>de</strong>terminarea celor mai bune valori ale parametrilor implicaţi in<br />

procesul <strong>de</strong> prelucrare, se poate utiliza analiza factorială.<br />

În opoziţie cu analiza factorială, aproximarea lui Taguchi reduce numărul <strong>de</strong> experimente la un<br />

mo<strong>de</strong>l rezonabil în termeni <strong>de</strong> cost şi timp, prin folosirea şirurilor ortogonale. Ea este utilizată în<br />

domenii diferite ca: fizică, chimie, ştiinţe agricole, statistică, management şi afaceri, medicină.<br />

Alegerea şirurilor ortogonale potrivite pentru problema studiată este principala dificultate a<br />

aproximării lui Taguchi. În literatura <strong>de</strong> specialitate sunt cunoscute multe şiruri ortogonale însă nu a<br />

fost găsită o schemă completă care să conţină toate şirurile ortogonale corespunzătoare chiar şi<br />

unui număr mic <strong>de</strong> experimente.<br />

Lista cu şirurile ortogonale frecvent utilizate este:<br />

Experimente Scheme<br />

2 3<br />

4<br />

2 7<br />

8<br />

9<br />

16<br />

18<br />

2 5<br />

2 3<br />

3 4<br />

3 3<br />

4 5<br />

2 15<br />

2 1 ×3 7<br />

2 2 ×3 6<br />

3 7<br />

2 1 ×3 6<br />

2 1 ×3 4<br />

2 1 ×3 3<br />

3 3<br />

27<br />

Şirurile ortogonale pot fi clasificate astfel:<br />

÷ şiruri ortogonale cu nivel fix (toţi factorii au acelaşi număr <strong>de</strong> nivele)<br />

÷ şiruri ortogonale cu nivel mixt (factorii au număr diferit <strong>de</strong> nivele)<br />

Problema <strong>de</strong> studiu<br />

Fiind dat un numar n <strong>de</strong> experimente, care este numărul maxim <strong>de</strong> variabile şi care este numărul <strong>de</strong><br />

nivele pentru fiecare variabilă astfel încât să obţinem un şir ortogonal?<br />

S-au <strong>de</strong>terminat şirurile ortogonale pentru un numar <strong>de</strong> 4, 6, 8, 9, 10, 12, 14, 15, şi 16 <strong>de</strong><br />

experimente. Numărul <strong>de</strong> factori şi numărul <strong>de</strong> nivele corespunzător pentru fiecare sunt prezentaţi<br />

în tabelul <strong>de</strong> mai jos:<br />

nexp nf L1 ∑MF1 L2 ∑MF2 L3 ∑MF3 nexp nf L1 ∑MF1 L2 ∑MF2 L3 ∑MF3<br />

4 3 4 2 2 1 12 5 12 1 2 4<br />

2 3 6 5<br />

6 3 6 1 3 2 4 2 3 2 2 1<br />

3 3 4 1 3 2 2 2<br />

2 1 3 2 3 1 2 4<br />

8 7 4 4 2 3 4 12 4<br />

4 2 2 5 3 12 1 6 2<br />

2 7 14 6 7 5 2 1<br />

6 8 3 4 2 2 1 5 14 1 7 4<br />

60


9<br />

10<br />

12<br />

8 1 4 3 2 2 15 8 5 4 3 4<br />

8 1 4 1 2 4 7 5 5 3 2<br />

4 6 15 1 3 6<br />

5 8 3 2 2 5 2 3 5<br />

8 2 2 3 5 1 3 6<br />

8 1 4 3 2 1<br />

3 7<br />

8 1 2 4 6 15 1 5 5<br />

4 8 4 5 6<br />

5 3 5<br />

5 3 3 3<br />

4 9 4 16 15 2 15<br />

9 2 3 2 14 4 1 2 13<br />

9 1 3 3 13 8 1 2 12<br />

6 10 1 5 5<br />

4 2 2 11<br />

3 5 2 2 1 12 16 1 2 11<br />

11 2 11 10 16 1 8 1 2 8<br />

10 4 1 2 9 9 4 9<br />

9 4 2 2 7<br />

4 3 2 6<br />

7 4 4 2 3 7 8 7<br />

4 3 2 4 5 16 5<br />

3 7<br />

16 2 2 3<br />

6 4 6<br />

4 3 3 1 2 2<br />

4 2 3 1 2 3<br />

3 4 2 2<br />

3 3 2 3<br />

61<br />

nexp = numărul <strong>de</strong> experimente<br />

nf = numarul maxim <strong>de</strong> factori<br />

Li = niveluri associate cu factorul <strong>de</strong> ordinul i<br />

∑MFi = numărul maxim <strong>de</strong> factori pentru un nivel<br />

specificat<br />

Programarea lineară poate fi utilizată la construcţia şirurilor cu nivel fix în timp ce pentru<br />

construcţia şirurilor cu nivel mixt s-a folosit metoda înlocuirii. Analiza şirurilor ortogonale arată că<br />

un nou factor poate fi construit pe baza combinaţiei lineare a doi factori existenţi. Aşadar, un factor<br />

ce este in<strong>de</strong>pen<strong>de</strong>nt <strong>de</strong> ceilalţi factori din şirurile ortogonale verifică relaţia:<br />

(10)x·A + B, (100)x·A + (10)x·B + C,<br />

un<strong>de</strong> x reprezintă numărul <strong>de</strong> nivele, A, B şi C sunt elementele unui vector ca valorile ca modulo x<br />

(<strong>de</strong> la zero la nE - 1, nE = număr experimente.<br />

Rezultate:<br />

Pentru L8 s-au obţinut şirurile ortogonal din tabelul următor:<br />

Factor(Nivele)<br />

L8(2 7 ) A(2) B(2) C(2) D(2) E(2) F(2) G(2)<br />

1 0 1 1 1 0 0 0<br />

2 1 1 1 0 1 1 0<br />

3 0 1 0 0 1 0 1<br />

4 1 1 0 1 0 1 1<br />

5 0 0 1 0 0 1 1<br />

6 1 0 1 1 1 0 1<br />

7 0 0 0 1 1 1 0<br />

8 1 0 0 0 0 0 0<br />

Şirul ortogonal L8 (4 1 ×2 5 ) s-a obţinut ca o combinaţie lineară a factorilor A şi B:<br />

Factor(Nivele)<br />

L8 (4 1 ×2 5 ) Y(2) C(2) D(2) E(2) F(2) G(2)<br />

1 1 1 1 0 0 0<br />

2 3 1 0 1 1 0<br />

3 1 0 0 1 0 1<br />

4 3 0 1 0 1 1


5 0 1 0 0 1 1<br />

6 2 1 1 1 0 1<br />

7 0 0 1 1 1 0<br />

8 2 0 0 0 0 0<br />

Şirul ortogonal L8 (4 2 ×2 3 ) s-a obţinut prin combinaţia lineară a factorilor C şi D:<br />

L8 (4 Factor(Nivele)<br />

2 ×2 3 )<br />

Y(4) Z(4) E(4) F(4) G(4)<br />

1 1 3 0 0 0<br />

2 3 2 1 1 0<br />

3 1 0 1 0 1<br />

4 3 1 0 1 1<br />

5 0 2 0 1 1<br />

6 2 3 1 0 1<br />

7 0 1 1 1 0<br />

8 2 0 0 0 0<br />

Şirul ortogonal L8 (8 1 ×2 4 ) s-a obţinut prin combinaţia lineară a factorilor A, B şi C.<br />

Factor(Level)<br />

L8 (8 1 ×2 4 )<br />

Q(8) D(2) E(2) F(2) G(2)<br />

1 3 1 0 0 0<br />

2 7 0 1 1 0<br />

3 2 0 1 0 1<br />

4 6 1 0 1 1<br />

5 1 0 0 1 1<br />

6 5 1 1 0 1<br />

7 0 1 1 1 0<br />

8 4 0 0 0 0<br />

Deşi noii factori pot fi obţinuţi ca o combinaţie lineară nu se poate găsi numărul maxim al tuturor<br />

combinaţiilor posibile.<br />

De exemplu metoda propusă i<strong>de</strong>ntifică un număr <strong>de</strong> 12 scheme ca fiind numărul maxim <strong>de</strong> şiruri<br />

ortogonal pentru L8:<br />

• Şapte factori: 4 4 ×2 3 , 4 2 ×2 5 , 2 7<br />

• Saşe factori: 8 3 ×4 2 ×2 1 , 8 1 ×4 3 ×2 2 , 8 1 ×4 1 ×2 4 , 4 6<br />

• Cinci factor: 8 3 ×2 2 , 8 2 ×2 3 , 8 1 ×4 3 ×2, 8 1 ×2 4<br />

• Patru factori: 8 4<br />

Analog s-au obţinut celelalte şiruri ortogonale. În continuare se redau şirurile ortogonale obţinute:<br />

L4 Factori (nivele)<br />

4 2 ×2 1 A(4) B(4) C(2)<br />

1 0 2 0<br />

2 1 0 1<br />

3 2 3 1<br />

4 3 1 0<br />

L4 Factori (nivele)<br />

2 3 A(2) B(2) C(2)<br />

1 0 1 0<br />

2 1 1 1<br />

3 0 0 1<br />

4 1 0 0<br />

L6 Factori (nivele)<br />

6 1 ×3 2 A(6) B(3) C(3)<br />

1 0 1 0<br />

62


2 1 1 2<br />

3 2 0 1<br />

4 3 2 2<br />

5 4 2 0<br />

6 5 0 1<br />

3<br />

Factori (nivele)<br />

3<br />

A(3) B(3) C(3)<br />

1 0 1 1<br />

2 1 0 2<br />

3 2 2 2<br />

4 0 1 1<br />

5 1 2 0<br />

6 2 0 0<br />

3<br />

Factori (nivele)<br />

2 ×2 1<br />

A(3) B(3) C(2)<br />

1 1 1 0<br />

2 1 1 1<br />

3 2 0 0<br />

4 2 2 1<br />

5 0 2 0<br />

6 0 0 1<br />

L9 Factori (nivele)<br />

3 5 A(3) B(3) C(3) D(3) E(3)<br />

1 0 0 0 0 0<br />

2 0 0 2 2 1<br />

3 0 2 0 2 2<br />

4 1 1 2 0 2<br />

5 1 2 1 0 1<br />

6 1 2 2 1 0<br />

7 2 0 1 1 2<br />

8 2 1 0 1 1<br />

9 2 1 1 2 0<br />

L9 Factor (levels)<br />

9 4 A(9) B(9) C(9) D(9)<br />

1 0 0 7 5<br />

2 1 8 0 4<br />

3 2 1 1 1<br />

4 3 7 8 6<br />

5 4 6 6 0<br />

6 5 5 3 7<br />

7 6 2 2 8<br />

8 7 4 5 3<br />

9 8 3 4 2<br />

L9 Factori (nivele)<br />

9 2 ×3 2 A(9) B(9) C(3) D(3)<br />

1 0 1 1 0<br />

2 1 2 0 2<br />

3 2 4 2 1<br />

4 3 7 2 2<br />

5 4 8 1 1<br />

63


6 5 6 0 0<br />

7 6 5 1 0<br />

8 7 3 0 2<br />

9 8 0 2 1<br />

L9 Factori (nivele)<br />

9 1 ×3 3 A(9) B(3) C(3) D(3)<br />

1 0 1 1 1<br />

2 1 1 0 0<br />

3 2 0 2 2<br />

4 3 1 0 2<br />

5 4 2 2 1<br />

6 5 2 1 0<br />

7 6 0 2 0<br />

8 7 2 1 2<br />

9 8 0 0 1<br />

L10 Factori (nivele)<br />

10 1 ×5 5 A(10) B(5) C(5) D(5) E(5) F(5)<br />

1 0 0 0 0 2 2<br />

2 1 0 4 4 2 2<br />

3 2 4 4 1 0 3<br />

4 3 4 0 3 1 0<br />

5 4 3 1 4 3 4<br />

6 5 3 3 0 4 1<br />

7 6 2 3 2 4 1<br />

8 7 2 1 2 3 4<br />

9 8 1 2 3 1 0<br />

10 9 1 2 1 0 3<br />

L10 Factori (nivele)<br />

5 2 ×2 1 A(5) B(5) C(2)<br />

1 0 0 1<br />

2 1 0 0<br />

3 2 1 1<br />

4 3 1 0<br />

5 4 2 1<br />

6 0 4 0<br />

7 1 4 1<br />

8 2 3 0<br />

9 3 3 1<br />

10 4 2 0<br />

L12<br />

Factori (nivele)<br />

2 11 A(2) B(2) C(2) D(2) E(2) F(2) G(2) H(2) I(2) J(2) K(2)<br />

1 0 1 1 1 1 1 0 0 0 0 0<br />

2 1 1 1 1 0 0 1 1 1 0 0<br />

3 0 1 1 0 0 0 1 0 0 1 1<br />

4 1 1 0 1 1 0 0 1 0 1 1<br />

5 0 1 0 0 0 1 0 1 1 1 0<br />

6 1 1 0 0 1 1 1 0 1 0 1<br />

7 0 0 1 0 1 0 0 1 1 0 1<br />

8 1 0 1 1 0 1 0 0 1 1 1<br />

9 0 0 0 1 1 0 1 0 1 1 0<br />

64


10 1 0 1 0 1 1 1 1 0 1 0<br />

11 0 0 0 1 0 1 1 1 0 0 1<br />

12 1 0 0 0 0 0 0 0 0 0 0<br />

L12<br />

Factori (nivele)<br />

4 1 ×2 9 A(4) B(2) C(2) D(2) E(2) F(2) G(2) H(2) I(2) J(2)<br />

1 0 0 1 1 1 1 1 0 0 0<br />

2 0 1 1 1 1 0 0 1 1 1<br />

3 3 0 1 1 0 0 0 1 0 0<br />

4 3 1 1 0 1 1 0 0 1 0<br />

5 1 0 1 0 0 0 1 0 1 1<br />

6 2 1 1 0 0 1 1 1 0 1<br />

7 2 0 0 1 0 1 0 0 1 1<br />

8 3 1 0 1 1 0 1 0 0 1<br />

9 1 0 0 0 1 1 0 1 0 1<br />

10 1 1 0 1 0 1 1 1 1 0<br />

11 2 0 0 0 1 0 1 1 1 0<br />

12 0 1 0 0 0 0 0 0 0 0<br />

L12<br />

Factori (nivele)<br />

4 2 ×2 7 A(4) B(4) C(2) D(2) E(2) F(2) G(2) H(2) I(2)<br />

1 0 0 0 1 1 1 1 1 0<br />

2 1 1 1 1 1 1 0 0 1<br />

3 2 2 0 1 1 0 0 0 1<br />

4 2 3 1 1 0 1 1 0 0<br />

5 1 3 0 1 0 0 0 1 0<br />

6 3 0 1 1 0 0 1 1 1<br />

7 3 1 0 0 1 0 1 0 0<br />

8 3 2 1 0 1 1 0 1 0<br />

9 1 2 0 0 0 1 1 0 1<br />

10 0 3 1 0 1 0 1 1 1<br />

11 2 1 0 0 0 1 0 1 1<br />

12 0 0 1 0 0 0 0 0 0<br />

L12<br />

Factori (nivele)<br />

4 4 ×2 3 A(4) B(4) C(4) D(4) E(2) F(2) G(2)<br />

1 1 1 1 2 0 1 1<br />

2 1 1 1 2 1 1 1<br />

3 0 2 2 0 0 1 1<br />

4 1 2 3 3 1 1 0<br />

5 3 0 2 1 0 1 0<br />

6 3 3 0 1 1 1 0<br />

7 3 2 0 2 0 0 1<br />

8 2 0 2 3 1 0 1<br />

9 0 3 1 3 0 0 0<br />

10 2 3 3 0 1 0 1<br />

11 2 1 3 1 0 0 0<br />

12 0 0 0 0 1 0 0<br />

L12<br />

Factori (nivele)<br />

4 3 ×2 4 A(4) B(4) C(4) D(2) E(2) F(2) G(2)<br />

1 1 1 0 0 1 1 1<br />

2 1 1 3 1 1 1 1<br />

3 0 2 1 0 1 1 0<br />

65


4 2 0 2 1 1 0 1<br />

5 3 2 1 0 1 0 0<br />

6 2 3 2 1 1 0 0<br />

7 3 0 3 0 0 1 0<br />

8 3 3 0 1 0 1 1<br />

9 0 3 3 0 0 0 1<br />

10 1 2 2 1 0 1 0<br />

11 2 1 1 0 0 0 1<br />

12 0 0 0 1 0 0 0<br />

L12<br />

Factori (nivele)<br />

3 7 A(3) B(3) C(3) D(3) E(3) F(3) G(3)<br />

1 0 1 1 1 1 1 0<br />

2 1 1 1 1 0 2 1<br />

3 2 1 1 1 1 1 2<br />

4 0 0 0 0 2 2 2<br />

5 1 1 1 1 2 0 1<br />

6 2 0 2 2 1 1 2<br />

7 0 0 2 2 1 1 0<br />

8 1 2 0 2 0 2 1<br />

9 2 2 2 0 2 2 0<br />

10 0 2 2 0 0 0 2<br />

11 1 2 0 2 2 0 1<br />

12 2 0 0 0 0 0 0<br />

L12<br />

Factori (nivele)<br />

3 4 ×2 2 A(3) B(3) C(3) D(3) E(2) F(2)<br />

1 1 1 1 1 0 1<br />

2 1 1 1 1 1 1<br />

3 1 1 1 0 0 1<br />

4 1 1 1 0 1 1<br />

5 0 0 2 2 0 1<br />

6 2 2 0 2 1 1<br />

7 0 2 0 1 0 0<br />

8 0 2 2 2 1 0<br />

9 2 0 0 2 0 0<br />

10 2 0 2 1 1 0<br />

11 2 2 2 0 0 0<br />

12 0 0 0 0 1 0<br />

L12<br />

Factori (nivele)<br />

3 3 ×2 3 A(3) B(3) C(3) D(2) E(2) F(2)<br />

1 1 1 1 0 1 1<br />

2 1 1 0 1 1 1<br />

3 0 0 2 0 1 1<br />

4 1 1 1 1 1 0<br />

5 1 1 0 0 1 0<br />

6 2 2 2 1 1 0<br />

7 2 2 0 0 0 1<br />

8 0 2 1 1 0 1<br />

9 0 2 2 0 0 0<br />

10 2 0 2 1 0 1<br />

11 2 0 1 0 0 0<br />

66


12 0 0 0 1 0 0<br />

L12 Factori (nivele)<br />

4 3 ×3 1 ×2 2 A(4) B(4) C(4) D(3) E(2) F(2)<br />

1 1 1 1 1 0 1<br />

2 1 1 1 1 1 1<br />

3 1 0 2 2 0 1<br />

4 0 3 2 2 1 1<br />

5 3 2 0 0 0 1<br />

6 3 2 3 0 1 1<br />

7 0 3 3 0 0 0<br />

8 2 2 1 1 1 0<br />

9 2 0 3 1 0 0<br />

10 3 1 2 2 1 0<br />

11 2 3 0 2 0 0<br />

12 0 0 0 0 1 0<br />

L12<br />

Factori (nivele)<br />

4 2 ×3 1 ×2 3 A(4) B(4) C(3) D(2) E(2) F(2)<br />

1 1 1 1 0 1 1<br />

2 1 1 2 1 1 1<br />

3 0 2 0 0 1 1<br />

4 1 2 1 1 1 0<br />

5 3 0 2 0 1 0<br />

6 3 3 0 1 1 0<br />

7 3 2 0 0 0 1<br />

8 2 0 1 1 0 1<br />

9 0 3 2 0 0 0<br />

10 2 3 2 1 0 1<br />

11 2 1 1 0 0 0<br />

12 0 0 0 1 0 0<br />

L12 Factori (nivele)<br />

4 6 A(4) B(4) C(4) D(4) E(4) F(4)<br />

1 0 0 0 0 0 2<br />

2 1 0 0 3 3 0<br />

3 2 0 3 0 3 1<br />

4 3 1 1 3 1 3<br />

5 0 1 3 3 0 2<br />

6 1 3 0 1 3 3<br />

7 2 1 3 1 2 2<br />

8 3 2 1 0 0 1<br />

9 0 3 2 1 2 1<br />

10 1 3 2 2 1 0<br />

11 2 2 2 2 2 3<br />

12 3 2 1 2 1 0<br />

L12 Factori (nivele)<br />

12 1 ×2 4 A(12) B(2) C(2) D(2) E(2)<br />

1 0 1 1 1 0<br />

2 1 1 0 0 1<br />

3 2 0 1 0 0<br />

4 3 0 0 1 0<br />

5 4 0 0 1 1<br />

67


6 5 1 0 0 1<br />

7 6 0 1 0 1<br />

8 7 0 1 1 1<br />

9 8 1 1 0 0<br />

10 9 1 0 1 0<br />

11 10 1 1 1 1<br />

12 11 0 0 0 0<br />

L12 Factori (nivele)<br />

6 5 A(6) B(6) C(6) D(6) E(6)<br />

1 0 0 0 0 3<br />

2 1 0 5 5 0<br />

3 2 1 0 5 4<br />

4 3 1 5 0 2<br />

5 4 2 4 1 5<br />

6 5 2 2 4 3<br />

7 0 5 4 2 4<br />

8 1 5 1 2 0<br />

9 2 4 3 4 5<br />

10 3 4 3 3 1<br />

11 4 3 2 3 2<br />

12 5 3 1 1 1<br />

L12 Factori (nivele)<br />

4 2 ×3 2 ×2 1 A(4) B(4) C(3) D(3) E(2)<br />

1 1 1 0 1 1<br />

2 1 1 1 1 1<br />

3 1 2 2 1 0<br />

4 0 2 0 0 1<br />

5 3 0 1 1 0<br />

6 3 2 2 0 1<br />

7 3 3 0 0 0<br />

8 0 3 1 2 0<br />

9 2 3 2 2 1<br />

10 2 1 0 2 0<br />

11 2 0 1 2 1<br />

12 0 0 2 0 0<br />

L12 Factori (nivele)<br />

4 1 ×3 2 ×2 2 A(4) B(3) C(3) D(2) E(2)<br />

1 1 1 1 0 1<br />

2 2 1 1 1 1<br />

3 1 1 1 0 1<br />

4 2 1 1 1 1<br />

5 3 0 0 0 1<br />

6 0 2 2 1 1<br />

7 1 0 2 0 0<br />

8 2 0 2 1 0<br />

9 0 2 0 0 0<br />

10 3 2 0 1 0<br />

11 3 2 2 0 0<br />

12 0 0 0 1 0<br />

L12<br />

Factori (nivele)<br />

68


3 1 ×2 4 A(3) B(2) C(2) D(2) E(2)<br />

1 1 0 1 1 1<br />

2 1 1 1 1 1<br />

3 0 0 1 1 0<br />

4 0 1 1 0 1<br />

5 2 0 1 0 0<br />

6 2 1 1 0 0<br />

7 1 0 0 1 0<br />

8 2 1 0 1 1<br />

9 0 0 0 0 1<br />

10 1 1 0 1 0<br />

11 2 0 0 0 1<br />

12 0 1 0 0 0<br />

L12 Factori (nivele)<br />

12 4 A(12) B(12) C(12) D(12)<br />

1 0 0 0 0<br />

2 1 1 10 11<br />

3 2 11 1 10<br />

4 3 10 11 1<br />

5 4 9 2 7<br />

6 5 2 9 6<br />

7 6 8 7 5<br />

8 7 7 8 2<br />

9 8 6 5 4<br />

10 9 5 6 8<br />

11 10 3 4 9<br />

12 11 4 3 3<br />

L12 Factori (nivele)<br />

12 1 ×6 2 A(12) B(6) C(6)<br />

1 0 1 1<br />

2 1 1 1<br />

3 2 0 5<br />

4 3 4 5<br />

5 4 5 2<br />

6 5 5 0<br />

7 6 4 2<br />

8 7 3 3<br />

9 8 3 4<br />

10 9 2 4<br />

11 10 2 3<br />

12 11 0 0<br />

L14 Factori (nivele)<br />

7 5 ×2 1 B(7) C(7) D(7) E(7) F(7) A(2)<br />

1 0 0 0 0 5 0<br />

2 0 0 6 4 1 1<br />

3 1 6 0 6 0 0<br />

4 1 6 1 2 5 1<br />

5 2 1 4 5 2 0<br />

6 2 5 5 0 2 1<br />

7 3 5 6 1 3 0<br />

69


8 3 4 4 6 4 1<br />

9 4 4 5 3 6 0<br />

10 4 1 2 5 6 1<br />

11 5 2 3 2 1 0<br />

12 5 3 2 3 3 1<br />

13 6 3 3 4 4 0<br />

14 6 2 1 1 0 1<br />

L14 Factori (nivele)<br />

14 1 ×7 4 A(14) B(7) C(7) D(7) E(7)<br />

1 0 0 0 0 0<br />

2 1 0 5 5 6<br />

3 2 6 0 6 4<br />

4 3 1 5 4 3<br />

5 4 6 1 0 6<br />

6 5 5 6 1 4<br />

7 6 5 6 3 1<br />

8 7 4 3 6 0<br />

9 8 3 4 1 1<br />

10 9 4 4 3 2<br />

11 10 3 1 5 2<br />

12 11 1 2 4 5<br />

13 12 2 3 2 5<br />

14 13 2 2 2 3<br />

L15<br />

Factori (nivele)<br />

5 4 ×3 3 A(5) B(5) C(5) D(5) E(3) F(3) G(3) H(3)<br />

1 0 0 0 0 0 0 0 1<br />

2 1 0 0 2 2 2 2 0<br />

3 2 0 4 3 0 1 2 2<br />

4 3 1 4 3 1 0 0 0<br />

5 4 1 0 4 2 0 1 2<br />

6 0 1 4 2 2 2 1 1<br />

7 1 4 1 4 1 2 0 2<br />

8 2 2 3 1 1 1 0 2<br />

9 3 2 1 3 0 2 1 1<br />

10 4 2 3 1 1 1 2 1<br />

11 0 4 2 4 0 0 2 0<br />

12 1 4 2 0 2 0 2 2<br />

13 2 3 3 2 2 1 0 0<br />

14 3 3 2 0 0 2 1 1<br />

15 4 3 1 1 1 1 1 0<br />

L15<br />

Factori (nivele)<br />

15 1 ×3 6 A(15) B(3) C(3) D(3) E(3) F(3) G(3)<br />

1 0 0 0 0 0 1 1<br />

2 1 0 0 2 1 0 1<br />

3 2 0 2 0 2 2 1<br />

4 3 2 2 2 0 2 0<br />

5 4 2 2 0 1 1 2<br />

6 5 2 0 2 2 1 0<br />

7 6 2 1 1 0 0 2<br />

8 7 2 0 1 2 2 2<br />

70


9 8 0 2 2 2 1 1<br />

10 9 1 2 1 1 0 0<br />

11 10 1 1 1 0 1 1<br />

12 11 1 1 1 2 0 2<br />

13 12 1 1 0 1 0 0<br />

14 13 1 0 0 1 2 0<br />

15 14 0 1 2 0 2 2<br />

L15<br />

Factori (nivele)<br />

5 5 ×3 2 A(5) B(5) C(5) D(5) E(5) F(3) G(3)<br />

1 0 0 0 0 0 0 0<br />

2 1 0 0 2 3 2 2<br />

3 2 0 4 3 4 0 1<br />

4 3 1 4 3 0 2 0<br />

5 4 1 0 4 4 1 0<br />

6 0 1 4 2 3 1 2<br />

7 1 4 1 4 2 1 1<br />

8 2 2 3 1 1 2 1<br />

9 3 2 1 3 0 2 2<br />

10 4 2 3 1 1 0 2<br />

11 0 4 2 4 1 0 1<br />

12 1 4 2 0 4 2 1<br />

13 2 3 3 2 2 1 0<br />

14 3 3 2 0 3 1 0<br />

15 4 3 1 1 2 0 2<br />

L15<br />

Factori (nivele)<br />

5 2 ×3 5 A(5) B(5) C(3) D(3) E(3) F(3) G(3)<br />

1 0 0 0 0 0 0 0<br />

2 1 0 0 0 2 2 2<br />

3 2 0 2 2 0 0 2<br />

4 3 1 0 2 1 1 2<br />

5 4 1 2 0 0 2 0<br />

6 0 1 2 2 2 2 0<br />

7 1 4 0 2 0 1 1<br />

8 2 2 2 1 2 0 1<br />

9 3 2 1 2 1 1 0<br />

10 4 2 1 1 1 2 2<br />

11 0 4 2 0 1 1 2<br />

12 1 4 1 1 0 2 1<br />

13 2 3 1 1 2 0 1<br />

14 3 3 0 1 2 1 0<br />

15 4 3 1 0 1 0 1<br />

L15<br />

Factori (nivele)<br />

5 1 ×3 6 A(5) B(3) C(3) D(3) E(3) F(3) G(3)<br />

1 0 0 0 0 0 0 0<br />

2 1 0 0 2 2 1 1<br />

3 2 0 0 0 2 2 2<br />

4 3 0 2 2 0 0 2<br />

5 4 0 2 0 0 2 0<br />

6 0 1 2 2 1 2 1<br />

7 1 1 2 1 2 0 0<br />

71


8 2 1 2 0 2 1 2<br />

9 3 1 0 2 0 1 2<br />

10 4 1 1 2 2 1 0<br />

11 0 2 1 1 0 2 1<br />

12 1 2 1 1 1 0 1<br />

13 2 2 1 1 1 2 1<br />

14 3 2 1 0 1 0 2<br />

15 4 2 0 1 1 1 0<br />

L15<br />

Factori (nivele)<br />

3 7 A(3) B(3) C(3) D(3) E(3) F(3) G(3)<br />

1 0 0 0 0 0 0 1<br />

2 1 0 0 0 2 2 0<br />

3 2 0 0 2 0 1 2<br />

4 0 0 2 2 0 2 1<br />

5 1 0 2 0 2 0 1<br />

6 2 1 0 2 2 0 1<br />

7 0 1 2 2 2 0 2<br />

8 1 1 1 2 1 2 0<br />

9 2 1 2 0 1 2 2<br />

10 0 2 0 1 2 2 2<br />

11 1 2 1 0 0 1 2<br />

12 2 1 2 1 1 1 0<br />

13 0 2 1 1 1 1 0<br />

14 1 2 1 1 0 0 0<br />

15 2 2 1 1 1 1 1<br />

L15 Factori (nivele)<br />

15 1 ×5 5 A(15) B(5) C(5) D(5) E(5) F(5)<br />

1 0 0 0 0 0 0<br />

2 1 0 4 3 3 3<br />

3 2 0 2 3 3 4<br />

4 3 4 0 4 2 1<br />

5 4 4 0 1 4 3<br />

6 5 4 4 0 0 4<br />

7 6 3 4 0 3 0<br />

8 7 3 3 3 2 2<br />

9 8 3 2 4 1 2<br />

10 9 2 3 4 2 0<br />

11 10 2 2 1 4 1<br />

12 11 2 1 2 0 4<br />

13 12 1 3 2 1 1<br />

14 13 1 1 2 1 2<br />

15 14 1 1 1 4 3<br />

L15 Factori (nivele)<br />

5 6 A(5) B(5) C(5) D(5) E(5) F(5)<br />

1 0 0 0 0 0 0<br />

2 1 0 0 4 3 2<br />

3 2 0 4 0 4 3<br />

4 3 1 4 0 0 3<br />

5 4 1 0 2 4 4<br />

6 0 1 4 4 3 2<br />

72


7 1 4 1 1 2 4<br />

8 2 2 3 4 1 1<br />

9 3 2 1 3 0 3<br />

10 4 2 3 3 1 1<br />

11 0 4 2 2 1 4<br />

12 1 4 2 1 4 0<br />

13 2 3 3 3 2 2<br />

14 3 3 2 1 3 0<br />

15 4 3 1 2 2 1<br />

L15 Factori (nivele)<br />

5 3 ×3 3 A(5) B(5) C(5) D(3) E(3) F(3)<br />

1 0 0 0 0 0 0<br />

2 1 0 0 2 2 2<br />

3 2 0 4 0 0 2<br />

4 3 1 4 0 2 0<br />

5 4 1 0 2 1 0<br />

6 0 1 4 2 2 1<br />

7 1 4 1 0 2 0<br />

8 2 2 3 2 0 1<br />

9 3 2 1 0 1 2<br />

10 4 2 3 1 2 1<br />

11 0 4 2 1 1 2<br />

12 1 4 2 1 1 1<br />

13 2 3 3 2 0 0<br />

14 3 3 2 1 0 1<br />

15 4 3 1 1 1 2<br />

L16<br />

Factori (nivele)<br />

2 15 A(2) B(2) C(2) D(2) E(2) F(2) G(2) H(2) I(2) J(2) K(2) L(2) M(2) N(2) O(2)<br />

1 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0<br />

2 1 1 1 1 1 0 0 0 1 1 1 1 0 0 0<br />

3 0 1 1 1 0 0 0 0 1 0 0 0 1 1 1<br />

4 1 1 1 0 0 1 1 0 0 1 1 0 1 1 0<br />

5 0 1 0 0 1 1 0 0 0 1 0 1 1 0 1<br />

6 1 1 0 1 0 1 0 1 0 0 1 1 0 1 1<br />

7 0 1 0 0 0 0 1 1 1 1 1 0 0 0 1<br />

8 1 1 0 0 1 0 1 1 1 0 0 1 1 1 0<br />

9 0 0 1 0 1 0 1 0 0 0 1 1 0 1 1<br />

10 1 0 1 1 0 0 1 1 0 1 0 1 1 0 1<br />

11 0 0 1 0 0 1 0 1 1 1 0 1 0 1 0<br />

12 1 0 1 0 1 1 0 1 1 0 1 0 1 0 1<br />

13 0 0 0 1 1 0 0 1 0 1 1 0 1 1 0<br />

14 1 0 0 1 1 1 1 0 1 1 0 0 0 1 1<br />

15 0 0 0 1 0 1 1 0 1 0 1 1 1 0 0<br />

16 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0<br />

L16<br />

Factori (nivele)<br />

4 1 ×2 13 A(4) B(2) C(2) D(2) E(2) F(2) G(2) H(2) I(2) J(2) K(2) L(2) M(2) N(2)<br />

1 0 0 0 0 0 0 0 0 0 0 0 0 0 0<br />

2 1 0 0 0 0 0 0 1 1 1 1 1 1 1<br />

3 2 0 0 0 1 1 1 0 0 0 1 1 1 1<br />

4 3 0 0 0 1 1 1 1 1 1 0 0 0 0<br />

73


5 0 0 1 1 0 1 1 0 1 1 0 0 1 1<br />

6 1 0 1 1 0 1 1 1 0 0 1 1 0 0<br />

7 2 0 1 1 1 0 0 0 1 1 1 1 0 0<br />

8 3 0 1 1 1 0 0 1 0 0 0 0 1 1<br />

9 0 1 0 1 1 0 1 1 0 1 0 1 0 1<br />

10 1 1 0 1 1 0 1 0 1 0 1 0 1 0<br />

11 2 1 0 1 0 1 0 1 0 1 1 0 1 0<br />

12 3 1 0 1 0 1 0 0 1 0 0 1 0 1<br />

13 0 1 1 0 1 1 0 1 1 0 0 1 1 0<br />

14 1 1 1 0 1 1 0 0 0 1 1 0 0 1<br />

15 2 1 1 0 0 0 1 1 1 0 1 0 0 1<br />

16 3 1 1 0 0 0 1 0 0 1 0 1 1 0<br />

L16<br />

Factori (nivele)<br />

8 1 ×2 12 A(8) B(2) C(2) D(2) E(2) F(2) G(2) H(2) I(2) J(2) K(2) L(2) M(2)<br />

1 0 0 0 0 0 0 0 0 0 0 0 0 0<br />

2 1 0 0 0 0 0 1 1 1 1 1 1 1<br />

3 2 0 0 1 1 1 0 0 0 1 1 1 1<br />

4 3 0 0 1 1 1 1 1 1 0 0 0 0<br />

5 4 0 1 0 1 1 0 1 1 0 0 1 1<br />

6 5 0 1 0 1 1 1 0 0 1 1 0 0<br />

7 6 0 1 1 0 0 0 1 1 1 1 0 0<br />

8 7 0 1 1 0 0 1 0 0 0 0 1 1<br />

9 0 1 1 1 0 1 1 0 1 0 1 0 1<br />

10 1 1 1 1 0 1 0 1 0 1 0 1 0<br />

11 2 1 1 0 1 0 1 0 1 1 0 1 0<br />

12 3 1 1 0 1 0 0 1 0 0 1 0 1<br />

13 4 1 0 1 1 0 1 1 0 0 1 1 0<br />

14 5 1 0 1 1 0 0 0 1 1 0 0 1<br />

15 6 1 0 0 0 1 1 1 0 1 0 0 1<br />

16 7 1 0 0 0 1 0 0 1 0 1 1 0<br />

L16<br />

Factori (nivele)<br />

4 2 ×2 11 A(4) B(4) C(2) D(2) E(2) F(2) G(2) H(2) I(2) J(2) K(2) L(2) M(2)<br />

1 0 0 0 0 0 0 0 0 0 0 0 0 0<br />

2 1 0 0 0 0 0 1 1 1 1 1 1 1<br />

3 2 0 0 1 1 1 0 0 0 1 1 1 1<br />

4 3 0 0 1 1 1 1 1 1 0 0 0 0<br />

5 0 1 1 0 1 1 0 1 1 0 0 1 1<br />

6 1 1 1 0 1 1 1 0 0 1 1 0 0<br />

7 2 1 1 1 0 0 0 1 1 1 1 0 0<br />

8 3 1 1 1 0 0 1 0 0 0 0 1 1<br />

9 0 2 1 1 0 1 1 0 1 0 1 0 1<br />

10 1 2 1 1 0 1 0 1 0 1 0 1 0<br />

11 2 2 1 0 1 0 1 0 1 1 0 1 0<br />

12 3 2 1 0 1 0 0 1 0 0 1 0 1<br />

13 0 3 0 1 1 0 1 1 0 0 1 1 0<br />

14 1 3 0 1 1 0 0 0 1 1 0 0 1<br />

15 2 3 0 0 0 1 1 1 0 1 0 0 1<br />

16 3 3 0 0 0 1 0 0 1 0 1 1 0<br />

L16<br />

Factori (nivele)<br />

16×2 11 A(16) B(2) C(2) D(2) E(2) F(2) G(2) H(2) I(2) J(2) K(2) L(2)<br />

74


1 0 0 0 0 0 0 0 0 0 0 0 0<br />

2 1 0 0 0 0 1 1 1 1 1 1 1<br />

3 2 0 1 1 1 0 0 0 1 1 1 1<br />

4 3 0 1 1 1 1 1 1 0 0 0 0<br />

5 4 1 0 1 1 0 1 1 0 0 1 1<br />

6 5 1 0 1 1 1 0 0 1 1 0 0<br />

7 6 1 1 0 0 0 1 1 1 1 0 0<br />

8 7 1 1 0 0 1 0 0 0 0 1 1<br />

9 8 1 1 0 1 1 0 1 0 1 0 1<br />

10 9 1 1 0 1 0 1 0 1 0 1 0<br />

11 10 1 0 1 0 1 0 1 1 0 1 0<br />

12 11 1 0 1 0 0 1 0 0 1 0 1<br />

13 12 0 1 1 0 1 1 0 0 1 1 0<br />

14 13 0 1 1 0 0 0 1 1 0 0 1<br />

15 14 0 0 0 1 1 1 0 1 0 0 1<br />

16 15 0 0 0 1 0 0 1 0 1 1 0<br />

L16<br />

Factori (nivele)<br />

16×8×2 8 A(16) B(8) C(2) D(2) E(2) F(2) G(2) H(2) I(2) J(2)<br />

1 0 0 0 0 0 0 0 0 0 0<br />

2 1 0 0 0 1 1 1 1 1 1<br />

3 2 1 0 1 0 0 0 1 1 1<br />

4 3 1 1 1 1 1 1 0 0 0<br />

5 4 2 1 1 0 1 1 0 1 1<br />

6 5 2 1 1 1 0 0 1 0 0<br />

7 6 3 1 0 1 0 1 1 0 1<br />

8 7 3 1 0 0 1 0 0 1 0<br />

9 8 7 0 0 0 1 1 1 0 0<br />

10 9 7 1 0 1 0 0 0 1 1<br />

11 10 6 0 1 1 0 1 0 1 0<br />

12 11 6 1 1 0 1 0 1 0 1<br />

13 12 5 0 1 1 1 0 1 1 0<br />

14 13 5 0 1 0 0 1 0 0 1<br />

15 14 4 0 0 1 1 0 0 0 1<br />

16 15 4 1 0 0 0 1 1 1 0<br />

L16<br />

Factori (nivele)<br />

4 9 A(4) B(4) C(4) D(4) E(4) F(4) G(4) H(4) I(4)<br />

1 0 0 0 0 0 0 0 2 2<br />

2 1 0 0 0 3 2 3 0 2<br />

3 2 0 0 3 2 3 1 3 0<br />

4 3 0 3 2 0 0 1 1 0<br />

5 0 1 3 2 0 3 3 2 3<br />

6 1 1 3 1 3 0 3 3 1<br />

7 2 1 3 1 1 3 1 0 2<br />

8 3 1 2 2 3 1 1 2 3<br />

9 0 2 2 3 2 1 0 0 2<br />

10 1 2 2 1 3 3 0 1 0<br />

11 2 2 0 3 0 2 3 1 1<br />

12 3 2 1 2 2 1 2 2 3<br />

13 0 3 1 3 2 0 2 1 1<br />

14 1 3 2 0 1 2 2 3 0<br />

75


15 2 3 1 1 1 2 0 3 3<br />

16 3 3 1 0 1 1 2 0 1<br />

L16<br />

Factori (nivele)<br />

4 3 ×2 6 A(4) B(4) C(4) D(2) E(2) F(2) G(2) H(2) I(2)<br />

1 0 0 0 0 0 0 0 0 0<br />

2 1 0 0 0 1 1 1 1 1<br />

3 2 0 3 0 0 0 0 1 1<br />

4 3 0 2 1 0 1 1 0 1<br />

5 0 1 2 1 1 0 1 1 0<br />

6 1 1 1 1 0 1 0 1 0<br />

7 2 1 1 1 1 0 1 0 1<br />

8 3 1 2 1 1 0 0 0 0<br />

9 0 2 3 1 1 1 0 1 1<br />

10 1 2 1 0 1 1 1 0 0<br />

11 2 2 3 0 1 1 0 0 0<br />

12 3 2 2 0 0 1 1 1 0<br />

13 0 3 3 0 0 0 1 0 1<br />

14 1 3 0 1 0 1 0 0 1<br />

15 2 3 1 1 0 0 1 1 0<br />

16 3 3 0 0 1 0 0 1 1<br />

L16<br />

Factori (nivele)<br />

8 7 A(8) B(8) C(8) D(8) E(8) F(8) G(8)<br />

1 0 0 0 0 0 0 3<br />

2 1 0 0 7 7 7 4<br />

3 2 1 7 0 7 4 5<br />

4 3 1 7 7 0 5 3<br />

5 4 2 6 1 5 4 1<br />

6 5 2 6 6 1 2 4<br />

7 6 3 1 6 4 1 6<br />

8 7 3 3 5 5 2 0<br />

9 0 7 5 5 4 0 2<br />

10 1 7 3 4 3 5 7<br />

11 2 6 5 4 6 3 2<br />

12 3 6 1 3 3 6 1<br />

13 4 5 4 3 2 3 7<br />

14 5 5 2 2 1 6 0<br />

15 6 4 4 1 2 7 6<br />

16 7 4 2 2 6 1 5<br />

L16 Factori (nivele)<br />

16 5 A(16) B(16) C(16) D(16) E(16)<br />

1 0 0 0 0 0<br />

2 1 1 13 9 14<br />

3 2 2 12 13 8<br />

4 3 15 1 1 15<br />

5 4 14 2 15 3<br />

6 5 13 15 2 1<br />

7 6 12 14 8 7<br />

8 7 11 3 14 10<br />

9 8 10 11 11 2<br />

10 9 3 4 12 12<br />

76


11 10 9 9 4 11<br />

12 11 8 10 3 13<br />

13 12 7 7 7 9<br />

14 13 4 8 6 5<br />

15 14 6 5 10 4<br />

16 15 5 6 5 6<br />

L16 Factori (nivele)<br />

16 2 ×2 3 A(16) B(16) C(2) D(2) E(2)<br />

1 0 0 0 0 0<br />

2 1 13 0 1 1<br />

3 2 12 1 0 1<br />

4 3 1 0 1 1<br />

5 4 2 1 0 0<br />

6 5 15 0 1 0<br />

â7 6 14 1 0 0<br />

8 7 3 1 1 1<br />

9 8 11 1 0 1<br />

10 9 4 1 1 0<br />

11 10 9 1 1 0<br />

12 11 10 0 1 0<br />

13 12 7 0 0 1<br />

14 13 8 0 0 1<br />

15 14 5 1 1 1<br />

16 15 6 0 0 0<br />

În comparaţie cu şirurile orthogonale cunoscute, şirurile ortogonale rezultate au avantajul că<br />

permit investigarea unui mare număr <strong>de</strong> factori cu nivele diferite. Având o listă cu toate mulţimile<br />

posibile <strong>de</strong> şiruri ortogonale pentru un număr dat <strong>de</strong> experimente, <strong>de</strong>sign-ul experimental poate fi<br />

imbunătăţit sau simplificat. O optimizare bună a <strong>de</strong>signului unui experiment poate fi obţinută<br />

folosind unu număr mare <strong>de</strong> nivele si un număr mic <strong>de</strong> experimente. Trebuie menţionat că prin<br />

algoritmul testat odată ce numărul <strong>de</strong> experimente creşte, timpul pentru generarea numărului maxim<br />

<strong>de</strong> şiruri ortogonale creşte şi el.<br />

În <strong>de</strong>finirea populaţiilor statistice, care intervin în diferite studii trebuie stabilite cu claritate:<br />

÷ criteriile <strong>de</strong> inclu<strong>de</strong>re (condiţiile în care o entitate este un element al populaţiei)<br />

÷ criteriile <strong>de</strong> exclu<strong>de</strong>re (condiţiile în care o entitate nu aparţine populaţiei).<br />

2008A1. I<strong>de</strong>ntificarea meto<strong>de</strong>lor <strong>de</strong> analiză<br />

O serie <strong>de</strong> materiale tratând subiectul analizelor chimice şi instrumentale realizate în scopul<br />

i<strong>de</strong>ntificării proprietăţilor şi activităţilor substanţelor chimice cu activitate biologică şi potenţă<br />

farmaceutică (Jäntschi, 2002-CIA; Jäntschi, 2003-MTPS; Jäntschi, 2003-MME; Jäntschi, 2003-<br />

CIA; Jäntschi & Bolboacă, 2003-ACIA; Pică & others, 2004-ASOC; Pică & others, 2004-OCAS;<br />

Jäntschi, 2005-MTPS) şi în acelaşi timp <strong>de</strong>rularea activităţii a permis capitalizarea rezultatelor <strong>de</strong><br />

i<strong>de</strong>ntificare a meto<strong>de</strong>lor <strong>de</strong> analiză în două noi studii Cosma & others, 2008-IMCC; Suciu & others,<br />

2008-HMPP).<br />

Chimie Matematică<br />

Studiul sistematic prin instrumente specifice <strong>de</strong> chimie matematică a fost iniţiat <strong>de</strong> Crum-Brown şi<br />

Fraser în 1868 prin lucrarea [On the connection between chemical constitution and physiological action.<br />

Part 1. On the physiological action of the salts of the ammonium bases, <strong>de</strong>rived from Strychnia, Brucia,<br />

Thebia, Co<strong>de</strong>ia, Morphia, and Nicotia, Trans R Soc Edinb 25:151-203].<br />

Un pas important în domeniul chimie matematice s-a făcut prin introducerea noţiunii <strong>de</strong> graf <strong>de</strong><br />

77


către Sylvester în 1874 prin lucrarea [On an Application of the New Atomic Theory to the Graphical<br />

Representation of the Invariants and Covariants of Binary Quantics - With Three Appendices, Am J Math, 1,<br />

64-90] şi odată cu aceasta s-au <strong>de</strong>schis posibilităţile <strong>de</strong> explorare a topologiei moleculare. O serie <strong>de</strong><br />

monografii au revizuit şi complectat <strong>de</strong>-a lungul timpului conceptele <strong>de</strong> teoria grafurilor [(Harary,<br />

1969): Graph Theory, Addison - Wesley, Reading, MA], aplicaţiile grafurilor în chimie [(Kier şi Hall,<br />

1976): Molecular Connectivity in Chemistry and Drug Research, Acad Press, New York, NY], teoria<br />

grafurilor chimice [(Trinajstic, 1983): Chemical Graph Theory, CRC Press, Boca Raton, FL], şi ceea ce<br />

facem referire a fi topologia moleculară [(Diu<strong>de</strong>a şi alţii, 2001 & 2002): Molecular Topology, Nova,<br />

Hutington, NY]. Mo<strong>de</strong>lele matematice ale structurii chimice includ:<br />

÷ reprezentarea tridimensională (şi aici se face apel la Chimia Cuantică);<br />

÷ reprezentarea bidimensională (sub formă <strong>de</strong> formule structurale) numite grafuri moleculare;<br />

÷ reprezentarea sub formă <strong>de</strong> grafuri neorientate în care vârfurile sunt atomi şi legăturile sunt<br />

muchii;<br />

Teoria grafurilor aplicată în studiul structurilor moleculare reprezintă o ştiinţă interdisciplinară,<br />

numită teoria grafurilor chimice sau topologie moleculară. Prin utilizarea instrumentelor<br />

imprumutate din teoria grafurilor, teoria seturilor şi statistică se încearcă i<strong>de</strong>ntificarea facilităţilor<br />

structurale implicate în relaţiile structură-activitate. Partiţia proprietăţii moleculare şi recombinarea<br />

valorilor sale fragmentale prin mo<strong>de</strong>le aditive este unul dintre obiectivele principale. Caracterizarea<br />

topologică a structurilor chimice permite clasificarea moleculelor şi mo<strong>de</strong>larea structurilor<br />

necunoscute cu proprietăţi dorite.<br />

Noţiuni prealabile<br />

÷ Observaţie - o activitate ce consistă în recepţionarea cunoaşterii prin intermediul simţurilor sau<br />

al instrumentelor:<br />

o Observaţia presupune existenţa unui observator şi a unei observabile;<br />

o Recepţionarea cunoaşterii presupune abstractizarea rezultatului observaţiei;<br />

÷ Măsurare - o activitate ce presupune executarea a două operaţii: observarea şi înregistrarea<br />

rezultatelor observaţiei şi <strong>de</strong>pin<strong>de</strong> <strong>de</strong>:<br />

o natura obiectului (material) observat;<br />

o natura fenomenului (imaterial) observat;<br />

o <strong>de</strong> modalitatea <strong>de</strong> măsurare şi înregistrare a rezultatelor observaţiei.<br />

÷ Element (`e`): un obiect al unei observaţii sau al unei abstractizări;<br />

÷ Proprietate (`|(e)`): rezultatul unei operaţii <strong>de</strong> măsurare asupra unui element (`e`);<br />

÷ Mulţime (`S`): o colecţie <strong>de</strong> elemente (`e`) distincte (ordinea nu este relevantă);<br />

o Remarcă: <strong>de</strong> obicei o mulţime se constituie din elemente supuse observaţiei unei<br />

proprietăţi;<br />

÷ Mulţimea vidă (`∅`): o mulţime care nu conţine nici un element;<br />

÷ Valoare <strong>de</strong> a<strong>de</strong>văr - abstractizare binară (cu 2 valori posibile) a rezultatului unei observaţii:<br />

favorabile (`T` sau `0`) sau nefavorabile (`F` sau `1`);<br />

o Remarcă: valoarea <strong>de</strong> a<strong>de</strong>văr este o proprietate (|(e)=0 sau |(e)=1);<br />

÷ I<strong>de</strong>ntitatea logică (`≡`): exprimă faptul că rezultatul unei operaţii <strong>de</strong> măsurare asupra a două<br />

elemente este acelaşi;<br />

÷ Negaţia logică (¬): o operaţie care transformă o valoare <strong>de</strong> a<strong>de</strong>văr în contrariul său (¬0→1;<br />

¬1→0; ¬T→F; ¬F→T);<br />

÷ Apartenenţă (la o mulţime): proprietatea unui element <strong>de</strong> a face parte (∈) sau nu (∉) dintr-o<br />

mulţime;<br />

o Consecinţă:<br />

Apartenenţa unui element la o mulţime are o valoare <strong>de</strong> a<strong>de</strong>văr (`∈` ≡ `T` ≡ `0`;<br />

`∉` ≡ `F` ≡ `1`);<br />

÷ Submulţime (`⊆`): S1⊆S ⇔ [∀e∈S1 ⇒ e∈S]<br />

÷ Produs cartezian (`×`): S1×S2 = {(e1,e2) | e1∈S1 şi e2∈S2};<br />

÷ Relaţie binară (`2-r`): R ⊆ S1×S2;<br />

78


÷ Endorelaţie binară (`2-e-r`): R ⊆ S×S;<br />

÷ Proprietăţi ale endorelaţiilor binare:<br />

o Reflexivitate (`re`): R `re` ⇔ [∀e∈S ⇒ eRe];<br />

o Ireflexivitate (`ir`): R `ir` ⇔ [∀e∈S ⇒ ¬ eRe];<br />

o Coreflexivitate (`cr`): R `cr` ⇔ [∀e1,e2∈S | e1Re2 ⇒ e1≡e2];<br />

o Simetrie (`sy`): R `sy` ⇔ [∀e1,e2∈S | e1Re2 ⇒ e2Re1];<br />

o Antisimetrie (`ns`): R `ns` ⇔ [∀e1,e2∈S | e1Re2 şi e2Re1 ⇒ e1≡e2];<br />

o Asimetrie (`as`): R `as` ⇔ [∀e1,e2∈S | e1Re2 ⇒ ¬ e2Re1];<br />

o Tranzitivitate (`ts`): R `ts` ⇔ [∀e1,e2,e3∈S | e1Re2 şi e2Re3 ⇒ e1Re3];<br />

o Totală (`li`): R `li` ⇔ [∀e1,e2∈S ⇒ e1Re2 sau e2Re1];<br />

o Trihotomă (`tc`): R `tc` ⇔ [∀e1,e2∈S ⇒ !(e1Re2 sau e2Re1 sau e1≡e2)]; ! = exact una din<br />

o Euclidiană (`eu`): R `eu` ⇔ [∀e1,e2,e3∈S | e1Re2 şi e1Re3 ⇒ e2Re3];<br />

o Serială (`se`): R `se` ⇔ [∀e1∈S ∃s2∈S | e1Re2];<br />

o Echivalenţă (`eq`): R `eq` ⇔ R `re` şi R `sy` şi R `ts`;<br />

o Ordine parţială (`po`): R `po` ⇔ R `re` şi R `ns` şi R `ts`;<br />

o Ordine totală (`to`): R `to` ⇔ R `po` şi R `li`;<br />

o Bine ordonată (`wo`): R `wo` ⇔ R `to` şi ¬ R `se`;<br />

o R `sy` şi R `ts` şi R `se` ⇒ R `re`;<br />

÷ Exemple <strong>de</strong> relaţii binare:<br />

o Relaţia `=`:<br />

reflexivă: ∀e ⇒ e = e;<br />

coreflexivă: ∀e1,e2 | e1 = e2 ⇒ e1 ≡ e2;<br />

simetrică: ∀e1,e2 | e1 = e2 ⇒ e2 = e1;<br />

antisimetrică: ∀e1,e2 | e1 = e2 şi e2 = e1 ⇒ e1 ≡ e2;<br />

tranzitivă: ∀e1,e2,e3 | e1 = e2 şi e2 = e3 ⇒ e1 = e3;<br />

euclidiană: ∀e1,e2,e3 | e1 = e2 şi e1 = e3 ⇒ e2 = e3;<br />

echivalenţă: = `re`, `sy`, `ts`;<br />

o Relaţia `≤`:<br />

reflexivă: ∀e ⇒ e ≤ e;<br />

antisimetrică: ∀e1,e2 | e1 ≤ e2 şi e2 ≤ e1 ⇒ e1 ≡ e2;<br />

tranzitivă: ∀e1,e2,e3 | e1 ≤ e2 şi e2 ≤ e3 ⇒ e1 ≤ e3;<br />

totală: ∀e1,e2 ⇒ e1 ≤ e2 sau e2 ≤ e1;<br />

serială: ∀e1 ∃s2 | e1 ≤ e2;<br />

ordine parţială: ≤ `re`, `ns`, `ts`;<br />

ordine totală: ≤ `re`, `ns`, `ts`, `li`;<br />

o Relaţia `


simetrică: ∀e1,e2 | e1 ≠ e2 ⇒ e2 ≠ e1;<br />

o Relaţia `străbun al` şi `<strong>de</strong>scen<strong>de</strong>nt al`:<br />

tranzitivă: A `<strong>de</strong>scen<strong>de</strong>nt al` B şi B `<strong>de</strong>scen<strong>de</strong>nt al` C ⇒ A `<strong>de</strong>scen<strong>de</strong>nt al` C;<br />

o Relaţia distanţă euclidiană finită:<br />

reflexivă: ∀x ⇒ d(x,x)=0 < ∞;<br />

simetrică: ∀x,y ⇒ d(x,y) < ∞ ⇒ d(y,x) < ∞;<br />

tranzitivă: ∀x,y,z | d(x,y) < ∞ şi d(y,z) < ∞ ⇒ d(x,z) < ∞;<br />

euclidiană: ∀x,y,z | d(x,y) < ∞ şi d(x,z) < ∞ ⇒ d(y,z) < ∞;<br />

serială: ∀x ∃y=x | d(x,y)=d(x,x)=0 < ∞;<br />

echivalenţă: d(·,·) < ∞ `re`, `sy`, `ts`;<br />

o Relaţia funcţie <strong>de</strong>finită f:X→Y, y=f(x):<br />

serială: ∀x ∃y | y=f(x);<br />

valoare unică: ∀x,y1,y2 | f(x)=y1 şi f(x)=y2 ⇒ y1≡y2;<br />

injectivă ⇔ ∀x,y | x ≠ y ⇒ f(x) ≠ f(y);<br />

surjectivă ⇔ ∀y ∃x | y=f(x);<br />

bijectivă ⇔ injectivă şi surjectivă;<br />

÷ Funcţie <strong>de</strong> numărare: o funcţie bijectivă <strong>de</strong>finită pe o mulţime cu valori într-o submulţime a<br />

numerelor naturale;<br />

o Consecinţă: funcţia <strong>de</strong> numărare induce în codomeniu o relaţie <strong>de</strong> ordine totală;<br />

÷ Mulţime infinită: o mulţime pe care se poate <strong>de</strong>fini o funcţie <strong>de</strong> numărare şi orice funcţie <strong>de</strong><br />

numărare induce o relaţie <strong>de</strong> ordine totală;<br />

÷ Mulţime finită: o mulţime pe se poate <strong>de</strong>fini o funcţie <strong>de</strong> numărare, dar nu există nici o funcţie<br />

<strong>de</strong> numărare care induce relaţie <strong>de</strong> ordine totală;<br />

÷ Mulţime <strong>de</strong> puterea continuului: o mulţime pe care nu se poate <strong>de</strong>fini o funcţie <strong>de</strong> numărare;<br />

o Consecinţă: orice mulţime <strong>de</strong> puterea continuului (pe care nu se poate <strong>de</strong>fini o funcţie <strong>de</strong><br />

numărare) are acelaşi număr <strong>de</strong> elemente cu mulţimea funcţiilor {f: ℕ → {0,1}}, adică<br />

2 |ℕ| ; <strong>de</strong>monstraţia constă în construcţia unei funcţii bijective între mulţimea funcţiilor<br />

{f:ℕ→{0,1}} şi intervalul <strong>de</strong> numere reale [0,1) folosind exprimarea numerelor din<br />

intervalul [0,1) în baza <strong>de</strong> numeraţie 2 (r01=0.f1f2...);<br />

÷ Şir: o mulţime pe care s-a <strong>de</strong>finit o funcţie <strong>de</strong> numărare;<br />

÷ Şir parţial ordonat: şir în care elementele se află în relaţie <strong>de</strong> ordine parţială;<br />

÷ Şir total ordonat: şir în care elementele se află în relaţie <strong>de</strong> ordine totală;<br />

Noţiuni <strong>de</strong> bază<br />

Un graf G = G(V,E) este o pereche <strong>de</strong> două mulţimi, V - mulţime finită nevidă ale cărei elemente se<br />

numesc vârfuri (v∈V) şi E - mulţime <strong>de</strong> perechi <strong>de</strong> vârfuri (e∈E), care implementează o (endo-<br />

)relaţie binară pe mulţimea V. Două vârfuri vi,vj∈V se numesc adiacente dacă (vi,vj)∈E. Două<br />

perechi <strong>de</strong> vârfuri (vi1,vj1) şi (vi2,vj2) se numesc adiacente dacă au un vârf comun (i1 = i2 sau i1 = j2<br />

sau j1 = i1 sau j1 = j2).<br />

Următoarele remarci caracterizează grafurile chimice:<br />

÷ În general relaţia <strong>de</strong>finită <strong>de</strong> E este ireflexivă (pentru orice v∈V, (v,v)∉E);<br />

÷ Dacă relaţia <strong>de</strong>finită <strong>de</strong> E este simetrică (dacă (v1,v2)∈E atunci (v2,v1)∈E) atunci elementele lui<br />

E se numesc muchii, altfel se numesc arce;<br />

÷ Atunci când se face referinţă la un anume graf G, se notează V = V(G), E = E(G), |V| = N(G), şi<br />

|E| = Q(G); mărimile N(G) şi Q(G) permit transformarea grafului G prin izomorfisme <strong>de</strong><br />

numerotare în grafuri (relaţii bijective sau corespon<strong>de</strong>nţe 1 la 1) ale căror vârfuri sunt din<br />

mulţimea {1..N}; într-un astfel <strong>de</strong> izomorfism, vârfului vi∈V îi poate fi asociat numărul<br />

i∈{1..N} iar muchiei (vi,vj)∈E perechea <strong>de</strong> numere (i,j)∈{1..N}×{1..N};<br />

÷ Grafului G=(V,E) îi poate fi asociată o pereche <strong>de</strong> mulţimi <strong>de</strong> pon<strong>de</strong>ri WG=(WV,WE), în care<br />

fiecărui element v∈V îi corespun<strong>de</strong> un element wv∈WV (wv numit caracteristica vârfului v) şi<br />

în care fiecărui element e∈E îi corespun<strong>de</strong> un element we∈WE (we numit caracteristica<br />

80


muchiei e); pon<strong>de</strong>rile pentru vârfuri sunt asociate proprietăţilor atomice (cum sunt tipul<br />

atomului şi valenţa) în timp ce pon<strong>de</strong>rile pentru muchii sunt asociate proprietăţilor <strong>de</strong> legătură<br />

(cum sunt tipul legăturii şi lungimea).<br />

În tabelul următor sunt ilustrate câteva utilizări ale diferitelor tipuri <strong>de</strong> grafuri în teoria<br />

grafurilor chimice.<br />

Tabelul 1. Tipuri <strong>de</strong> grafuri chimice<br />

Graf, G Semnificaţie Tip Reprezentare (V,E) Utilizare<br />

Dacă vârfurile reprezintă orientat V={1, 2, 3} Grafuri <strong>de</strong><br />

sisteme chimice atunci nepon<strong>de</strong>rat E={(1,2), (2,1), reacţie<br />

graful reprezintă o reacţie<br />

cu preechilibru<br />

(2,3)}<br />

k2 k1 k3 Dacă vârfurile reprezintă<br />

sisteme chimice atunci<br />

orientat<br />

pon<strong>de</strong>rat<br />

V={1, 2, 3}<br />

E={(1,2), (2,1),<br />

Grafuri <strong>de</strong><br />

reacţie<br />

graful reprezintă o reacţie<br />

(1,3)}<br />

cu preechilibru<br />

VW={k2, k1, k3}<br />

N Cu N Graful reprezintă azanul <strong>de</strong> orientat V={1, 2, 3} Chimia<br />

cupru<br />

pon<strong>de</strong>rat E={(1,2), (3,2)} complecşilor<br />

WV={N, Cu, N} coordinativi<br />

Dacă vârfurile reprezintă neorientat V={1, 2, 3} Structuri<br />

atomi <strong>de</strong> carbon şi atomii <strong>de</strong> pon<strong>de</strong>rat E={(1,2), (2,1), alcătuite din<br />

hidrogen sunt neglijaţi,<br />

(2,3), (3,2)} atomi <strong>de</strong> acelaşi<br />

atunci graful reprezintă<br />

WE={1, 1, 2, 2} tip (uzual atomi<br />

propanona<br />

<strong>de</strong> carbon)<br />

Dacă vârfurile reprezintă neorientat V={1, 2, 3, 4} Structuri<br />

atomi <strong>de</strong> carbon şi atomii <strong>de</strong> nepon<strong>de</strong>rat E={(1,4), (4,1), alcătuite din<br />

hidrogen sunt neglijaţi,<br />

(2,4), (4,2), (3,4), atomi şi legături<br />

atunci graful reprezintă<br />

izobutanul<br />

(4,3)}<br />

<strong>de</strong> acelaşi tip<br />

N<br />

Dacă vârfurile nemarcate neorientat V={1, 2, 3} Structuri fără<br />

reprezintă atomi <strong>de</strong> carbon pon<strong>de</strong>rat E={(1,2), (2,1), legături<br />

şi atomii <strong>de</strong> hidrogen sunt<br />

(2,3), (3,2)} coordinative<br />

neglijaţi, atunci graful<br />

WV={N, C, C}<br />

reprezintă vinilamina<br />

WE={1, 1, 2, 2}<br />

Aşa cum se observă şi din tabelul <strong>de</strong> mai sus, două categorii <strong>de</strong> grafuri sunt <strong>de</strong> interes pentru<br />

topologia moleculară:<br />

÷ Grafurile neorientate şi nepon<strong>de</strong>rate, ce conferă maximă generalitate pentru studiul<br />

proprietăţilor graf-teoretice;<br />

÷ Grafurile neorientate şi pon<strong>de</strong>rate, ce conferă maximă specificitate pentru studiul grafurilor<br />

moleculare.<br />

Se uzează <strong>de</strong> o serie <strong>de</strong> noţiuni fundamentale <strong>de</strong> teoria grafurilor, redate în continuare:<br />

÷ Drum: v1...vk∈W(G) dacă (vi,vi+1)∈E pentru 1≤i


÷ Cale Hamiltoniană: v1...vN(G)∈H(G) dacă v1...vN(G)∈P(G);<br />

÷ Circuit Hamiltonian: v1...vN(G)v1∈HC(G) dacă v1...vN(G)∈H(G) şi (vN(G),v1)∈E(G);<br />

÷ Subgraf (≤): SG=SG(SV,SE)≤G(V,E)=G ⇔ SG graf, SV⊆V şi SE⊆E;<br />

÷ Graf complet: KN=({1..N},{(i,j),(j,i) | 1≤i


ale grafului; între numărul <strong>de</strong> feţe |F|, <strong>de</strong> vârfuri |V| şi muchii |E| se stabileşte relaţia Euler [Euler<br />

L. Solutio Problematis ad Geometriam Situs Pertinentis. Comment Acad Sci I Petropolitanae<br />

1736;8:128-140]: |V|-|E|+|F|=2; un graf este planar ⇔ nu există subgrafuri ale lui G homeomorfe<br />

cu K5 sau K3,3 (redate în figura <strong>de</strong> mai jos), rezultat stabilit <strong>de</strong> Kuratowski [Kuratowski K. Sur le<br />

Problème <strong>de</strong>s Courbes Gauches en Topologie. Fund Math 1930;15:271-283], dar care oricum nu ajută<br />

prea mult în practică, <strong>de</strong>oarece problema <strong>de</strong>terminării dacă H homeomorf al lui G este o<br />

problemă dificilă NP-completă (timpul necesar pentru a o rezolva creşte foarte repe<strong>de</strong> cu<br />

dimensiunea grafurilor); tabelul <strong>de</strong> mai jos redă transformarea unui graf astfel încât muchiile să<br />

nu se intersecteze:<br />

Tabelul 5. Exemplu <strong>de</strong> trasformare a unui graf la graf planar<br />

4 4 3<br />

5<br />

1 2<br />

Două transformări aplicate unui graf prezintă importanţă:<br />

÷ Graful linie: L(G)=(LV,LE) graf linie al lui G=(V,E) se obţine astfel:<br />

o i∈LV ⇔ ei∈E;<br />

o (i,j)∈LE ⇔ ei şi ej sunt adiacente.<br />

÷ Graful complementar: G=G(V,E) complementar lui G=G(V,E) ⇔ E=V×V\E.<br />

Tabelul următor prezintă cele două transformări aplicate unui graf:<br />

Tabelul 6. Exemplu <strong>de</strong> obţinere a grafului linie şi grafului complementar<br />

G L(G) G L(G)<br />

3<br />

Dacă dragul nu este complet, atunci numerotarea induce izomorfie (<strong>de</strong> numerotare). Două grafuri<br />

G1=G1(V,E) şi G2=G2(V,E) sunt izomorfe dacă există fiz astfel încât:<br />

÷ fiz:V(G1)→V(G2);<br />

÷ ∀v1∈V(G1) ∃! v2∈V(G2) a.î. v1=fiz(v2);<br />

÷ ∀v2∈V(G2), ∃! v1∈V(G1) a.î. v1=fiz(v2);<br />

÷ ∀(vi,vj)∈V(G1) ⇒ (fiz(vi),fiz(vj))∈V(G2);<br />

÷ ∀(vi,vj)∈V(G2) ⇒ (fiz -1 (vi),fiz -1 (vj))∈V(G1).<br />

În tabelul următor sunt redate două exemple <strong>de</strong> grafuri, primul în care numerotarea induce<br />

izomorfia <strong>de</strong> numerotare şi al doilea în care numerotarea nu induce izomorfie (cazul grafurilor<br />

complete), un<strong>de</strong> pentru simplitate s-au enumerat muchiile o singură dată:<br />

Tabelul 7. Două exemple <strong>de</strong> grafuri şi izomorfia <strong>de</strong> numerotare<br />

Caz Numerotare Reprezentare<br />

4<br />

2 1<br />

3 4<br />

3 V={1, 2, 3, 4}<br />

2 1<br />

E={(1,2), (2,3), (3,4), (2,4)}<br />

4 2<br />

1 3 1<br />

2 4 3 1 f1(1)=1; f1(2)=3; f1(3)=2/4; f1(4)=4/2;<br />

2<br />

2 4 1<br />

3 2<br />

3<br />

4 1 f2(1)=1; f2(2)=4; f2(3)=3/2; f2(4)=2/3;<br />

3 4<br />

1 2 1 2<br />

4 3 3 f3(1)=2; f3(2)=1; f3(3)=3/4; f3(4)=4/3;<br />

83<br />

5<br />

f 3<br />

1<br />

f 2<br />

f1<br />

2


4<br />

5<br />

6<br />

7<br />

8<br />

9<br />

10<br />

4<br />

1<br />

3 2<br />

4<br />

1<br />

3 2 f4(1)=2; f4(2)=3; f4(3)=4/1; f4(4)=1/4;<br />

1<br />

3<br />

4 2<br />

3<br />

1 4 2 f5(1)=2; f5(2)=4; f5(3)=1/3; f5(4)=3/1;<br />

4<br />

2<br />

1 3<br />

4<br />

2<br />

1 3 f6(1)=3; f6(2)=1; f6(3)=2/4; f6(4)=4/2;<br />

1<br />

4<br />

2 3<br />

4<br />

1 2 3 f7(1)=3; f7(2)=2; f7(3)=1/4; f7(4)=4/1;<br />

1<br />

2<br />

4 3<br />

1<br />

2<br />

4 3 f8(1)=3; f8(2)=4; f8(3)=1/2; f8(4)=2/1;<br />

2<br />

3<br />

1 4<br />

3<br />

2 1 4 f9(1)=4; f9(2)=1; f9(3)=3/2; f9(4)=2/3;<br />

3<br />

1<br />

2 4<br />

3<br />

1<br />

2 4 f10(1)=4; f10(2)=2; f10(3)=3/1; f10(4)=1/3;<br />

1 2<br />

3 4 3 4<br />

2 1 11 f11(1)=1; f11(2)=3; f11(3)=2/4; f11(4)=4/2;<br />

3<br />

2 1 3 2<br />

1 2 V={1, 2, 3}<br />

3<br />

1 E={(1,2), (1,3), (2,3)}<br />

- - -<br />

Analiza căilor şi ciclurilor în grafuri este <strong>de</strong> o importanţă <strong>de</strong>osebită pentru topologia moleculară.<br />

Astfel se folosesc următoarele noţiuni:<br />

÷ Lungime a unui drum: k | v1...vk∈W(G)<br />

÷ Distanţă: di,j=min{k | v1...vk∈P(G), v1=vi, vk=vj}<br />

÷ Detur: δi,j=max{k | v1...vk∈P(G), v1=vi, vk=vj}<br />

÷ Excentricitate: ecci=max{di,j}<br />

÷ Rază: r(G)=min{ecci}<br />

÷ Diametru: d(G)=max{ecci}<br />

÷ Căi distanţă: v1...vk∈D(G) ⇔ v1...vk∈P(G) şi d1,k=k-1<br />

÷ Căi <strong>de</strong>tur: v1...vk∈Δ(G) ⇔ v1...vk∈P(G) şi δ1,k=k-1<br />

Tabelul următor exemplifică noţiunile <strong>de</strong> mai sus pe un graf:<br />

Tabelul 8. Drum, distanţă, <strong>de</strong>tur, excentricitate, rază, diametru şi căi în grafuri<br />

1<br />

2 3 4 5<br />

6<br />

Drumuri Există o infinitate<br />

în graf<br />

Drumuri <strong>de</strong> De lungime 2:<br />

lungime dată ÷ 121; 131; 212; 232; 313; 323; 343; 434; 454; 464; 545; 565; 656; 646;<br />

÷ 123; 132; 134; 213; 231; 234; 312; 321; 345; 346; 431; 432; 456; 465; 543; 546;<br />

564; 654; 645; 643;<br />

Distanţă d1,2=1; d1,3=1; d1,4=2; d1,5=3; d1,6=3;<br />

d2,1=1; d2,3=1; d2,4=2; d2,5=3; d2,6=3;<br />

d3,1=1; d3,2=1; d3,4=1; d3,5=2; d3,6=2;<br />

d4,1=2; d4,2=2; d4,3=1; d4,5=1; d4,6=1;<br />

84


Detur<br />

d5,1=3; d5,2=3; d5,3=2; d5,4=1; d5,6=1;<br />

d6,1=3; d6,2=3; d6,3=2; d6,4=1; d6,5=1;<br />

δ1,2=2; δ1,3=2; δ1,4=3; δ1,5=5; δ1,6=5;<br />

δ2,1=2; δ2,3=2; δ2,4=3; δ2,5=5; δ2,6=5;<br />

δ3,1=2; δ3,2=2; δ3,4=1; δ3,5=3; δ3,6=3;<br />

δ4,1=3; δ4,2=3; δ4,3=1; δ4,5=2; δ4,6=2;<br />

δ5,1=5; δ5,2=5; δ5,3=3; δ5,4=2; δ5,6=2;<br />

δ6,1=5; δ6,2=5; δ6,3=3; δ6,4=2; δ6,5=2;<br />

Excentricitate ecc1=3; ecc2=3; ecc3=2; ecc4=2; ecc5=3; ecc6=3;<br />

Rază r=2;<br />

Diametru d=3;<br />

Căi 12; 123; 1234; 12345; 12346; 123456; 123465;<br />

13; 132; 134; 1345; 1346; 13456; 13465;<br />

21; 213; 2134; 21345; 213456; 213465;<br />

23; 231; 234; 2345; 2346; 23456; 23465;<br />

31; 32; 312; 321; 34; 345; 346; 3456; 3465;<br />

45; 46; 456; 465; 43; 431; 4312; 432; 4321;<br />

56; 564; 5643; 56431; 56432; 564312; 564321;<br />

65; 654; 6543; 65431; 65432; 654312; 654321;<br />

Căi terminale 123456; 123465; 132; 13456; 13465;<br />

213456; 213465; 231; 23456; 23465;<br />

312; 321; 3456; 3465;<br />

456; 465; 4321; 4312;<br />

564312; 564321; 54312; 54321; 546;<br />

645; 64312; 64321; 654312; 654321;<br />

Căi distanţă D1,2={12}; D1,3={13}; D1,4={134}; D1,5={1345}; D1,6={1346}<br />

D2,1={21}; D2,3={23}; D2,4={234}; D2,5={2345}; D2,6={2346}<br />

D3,1={31}; D3,2={32}; D3,4={34}; D3,5={345}; D3,6={346}<br />

D4,1={431}; D4,2={432}; D4,3={43}; D4,5={45}; D4,6={46}<br />

D5,1={5431}; D5,2={5432}; D5,3={543}; D5,4={54}; D5,6={56}<br />

D6,1={6431}; D6,2={6432}; D6,3={643}; D6,4={64}; D6,5={65}<br />

Căi <strong>de</strong>tur Δ1,2={132}; Δ1,3={123}; Δ1,4={1234}; Δ1,5={123465}; Δ1,6={123456}<br />

Δ2,1={231}; Δ2,3={213}; Δ2,4={2134}; Δ2,5={213465}; Δ2,6={213456}<br />

Δ3,1={321}; Δ3,2={312}; Δ3,4={34}; Δ3,5={3465}; Δ3,6={3456}<br />

Δ4,1={4321}; Δ4,2={4312}; Δ4,3={43}; Δ4,5={465}; Δ4,6={456}<br />

Δ5,1={564321}; Δ5,2={564312}; Δ5,3={5643}; Δ5,4={564}; Δ5,6={546}<br />

Δ6,1={654321}; Δ6,2={654312}; Δ6,3={6543}; Δ6,4={654}; Δ6,5={645}<br />

Matrici şi indici<br />

Se folosesc în studii matricile <strong>de</strong> Adiacenţă, Laplacian, Distanţă, Detur, Combinatoriale C(D,2),<br />

C(Δ,2), Wiener, Szeged, Căi, Hosoya, Cluj, Distanţă-Extinse, Detur-Extinse, Reciproce, Drum,<br />

Strat, Secvenţă, şi altele mai puţin frecvent.<br />

Molecula reprezentată în următorul tabel (Tabelul 9) este folosită pentru ilustrarea matricilor ce<br />

urmează:<br />

Tabelul 9. Graful molecular supus analizei folosind matrici<br />

1<br />

5<br />

2<br />

3<br />

4<br />

7<br />

6<br />

11<br />

8<br />

9<br />

10<br />

÷ Secvenţa căilor terminale<br />

o Şirul invariant al numărului <strong>de</strong> căi terminale: 0.0.0.8.12.6.8.8.8.8<br />

o Şirul invariant al lungimii căilor terminale: 0.0.0.32.60.36.56.64.72.80<br />

o Matricea <strong>de</strong> numărare a căilor terminale:<br />

85


PTDS 1 2345678910Σ Π<br />

1 0 00200022 0 642<br />

2 0 00100200 2 538<br />

3 0 00202000 0 420<br />

4 0 00100200 2 538<br />

5 0 00200022 0 642<br />

6 0 00040000 0 420<br />

7 0 00020040 0 642<br />

8 0 00020202 0 642<br />

9 0 00012000 2 537<br />

10 0 00012000 2 537<br />

11 0 00020202 0 642<br />

÷ Secvenţa tuturor căilor<br />

o Şirul invariant al numărului <strong>de</strong> căi: 12.15.19.23.22.18.16.12.8.4<br />

o Şirul invariant al lungimii căilor: 12.30.57.92.110.108.112.96.72.40<br />

o Matricea <strong>de</strong> numărare a căilor:<br />

PADS 1 2345678910Σ Π<br />

1 2 23544442 030157<br />

2 2 34434422 230157<br />

3 3 44422000 019 61<br />

4 2 34434422 230157<br />

5 2 23544442 030157<br />

6 3 44440000 019 59<br />

7 2 22464440 028142<br />

8 2 23454422 028142<br />

9 2 34443222 228142<br />

10 2 34443222 228142<br />

11 2 23454422 028142<br />

÷ Secvenţa căilor distanţă<br />

o Şirul invariant al numărului <strong>de</strong> căi distanţă: 12.15.14.10.8.4.0.0.0.0<br />

o Şirul invariant al lungimii căilor distanţă: 12.30.42.40.40.24.0.0.0.0<br />

o Matricea <strong>de</strong> numărare a căilor distanţă:<br />

PDDS 1 2345678910Σ Π<br />

1 2 21222000 011 39<br />

2 2 32220000 011 32<br />

3 3 42200000 011 25<br />

4 2 32220000 011 32<br />

5 2 21222000 011 39<br />

6 3 44000000 011 23<br />

7 2 22244000 016 64<br />

8 2 23220000 011 33<br />

9 2 34200000 011 28<br />

10 2 34200000 011 28<br />

11 2 23220000 011 33<br />

÷ Secvenţa căilor <strong>de</strong>tur<br />

o Şirul invariant al numărului <strong>de</strong> căi <strong>de</strong>tur: 1.0.11.15.10.2.4.8.8.4<br />

o Şirul invariant al lungimii căilor <strong>de</strong>tur: 1.0.33.60.50.12.28.64.72.40<br />

o Matricea <strong>de</strong> numărare a căilor <strong>de</strong>tur:<br />

PΔDS 1 2345678910Σ Π<br />

1 0 023002220 1166<br />

2 0 022100222 1173<br />

86


3 1 024220000 1145<br />

4 0 022100222 1173<br />

5 0 023002220 1166<br />

6 1 024400000 1143<br />

7 0 024204400 1692<br />

8 0 022300220 1163<br />

9 0 022210022 1168<br />

10 0 022210022 1168<br />

11 0 022300220 1163<br />

÷ Secvenţa distanţelor<br />

o Şirul invariant al distanţelor: 12.15.11.9.6.2.0.0.0.0<br />

o Şirul invariant al lungimii distanţelor: 12.30.33.36.30.12.0.0.0.0<br />

o Matricea <strong>de</strong> numărare a distanţelor:<br />

MDDS 1 2345678910Σ Π<br />

1 2 212210000 1033<br />

2 2 322100000 1027<br />

3 3 421000000 1021<br />

4 2 322100000 1027<br />

5 2 212210000 1033<br />

6 3 430000000 1020<br />

7 2 211220000 1035<br />

8 2 222200000 1030<br />

9 2 332000000 1025<br />

10 2 332000000 1025<br />

11 2 222200000 1030<br />

÷ Secvenţa <strong>de</strong>tururilor<br />

o Şirul invariant al <strong>de</strong>tururilor: 1.0.8.14.10.2.2.6.8.4<br />

o Şirul invariant al lungimii <strong>de</strong>tururilor: 1.0.24.56.50.12.14.48.72.40<br />

o Matricea <strong>de</strong> numărare a <strong>de</strong>tururilor:<br />

MΔDS 1 2345678910Σ Π<br />

1 0 023001220 1059<br />

2 0 022100122 1065<br />

3 1 023220000 1041<br />

4 0 022100122 1065<br />

5 0 023001220 1059<br />

6 1 014400000 1040<br />

7 0 013202200 1055<br />

8 0 012300220 1060<br />

9 0 012210022 1065<br />

10 0 012210022 1065<br />

11 0 012300220 1060<br />

÷ Adiacenţe:<br />

o Σ(·): 12;<br />

o Σ(·) 2 : 12;<br />

o ΣA(·): 12;<br />

o ΣA(·) 2 : 12;<br />

o Matricea:<br />

Ad 1 234567891011Σ<br />

1 0 10010000 0 0 2<br />

2 1 01000000 0 0 2<br />

3 0 10101000 0 0 3<br />

87


÷ Distanţe:<br />

o Σ(·): 153;<br />

o Σ(·) 2 : 537;<br />

o ΣA(·): 12;<br />

o ΣA(·) 2 : 12;<br />

o Matricea:<br />

4 0 01010000 0 0 2<br />

5 1 00100000 0 0 2<br />

6 0 01000001 1 0 3<br />

7 0 00000010 0 1 2<br />

8 0 00000101 0 0 2<br />

9 0 00001010 0 0 2<br />

10 0 00001000 0 1 2<br />

11 0 00000100 1 0 2<br />

Σ 2 23223222 2 224<br />

Di 1 2 3 4 5 6 7 8 9 10 11 Σ<br />

1 0 1 2 2 1 3 6 5 4 4 5 33<br />

2 1 0 1 2 2 2 5 4 3 3 4 27<br />

3 2 1 0 1 2 1 4 3 2 2 3 21<br />

4 2 2 1 0 1 2 5 4 3 3 4 27<br />

5 1 2 2 1 0 3 6 5 4 4 5 33<br />

6 3 2 1 2 3 0 3 2 1 1 2 20<br />

7 6 5 4 5 6 3 0 1 2 2 1 35<br />

8 5 4 3 4 5 2 1 0 1 3 2 30<br />

9 4 3 2 3 4 1 2 1 0 2 3 25<br />

10 4 3 2 3 4 1 2 3 2 0 1 25<br />

11 5 4 3 4 5 2 1 2 3 1 0 30<br />

Σ 33 27 21 27 33 20 35 30 25 25 30 306<br />

÷ Reciproce <strong>de</strong> Distanţe:<br />

o Σ(·): 26.95;<br />

o Σ(·) 2 : 17.8302(7);<br />

o ΣA(·): 12;<br />

o ΣA(·) 2 : 12;<br />

o Matricea:<br />

RDi 1 2 3 4 5 6 7 8 9 10 11 Σ<br />

1 0.000 1.000 0.500 0.500 1.000 0.333 0.167 0.200 0.250 0.250 0.200 4.400<br />

2 1.000 0.000 1.000 0.500 0.500 0.500 0.200 0.250 0.333 0.333 0.250 4.867<br />

3 0.500 1.000 0.000 1.000 0.500 1.000 0.250 0.333 0.500 0.500 0.333 5.917<br />

4 0.500 0.500 1.000 0.000 1.000 0.500 0.200 0.250 0.333 0.333 0.250 4.867<br />

5 1.000 0.500 0.500 1.000 0.000 0.333 0.167 0.200 0.250 0.250 0.200 4.400<br />

6 0.333 0.500 1.000 0.500 0.333 0.000 0.333 0.500 1.000 1.000 0.500 6.000<br />

7 0.167 0.200 0.250 0.200 0.167 0.333 0.000 1.000 0.500 0.500 1.000 4.317<br />

8 0.200 0.250 0.333 0.250 0.200 0.500 1.000 0.000 1.000 0.333 0.500 4.567<br />

9 0.250 0.333 0.500 0.333 0.250 1.000 0.500 1.000 0.000 0.500 0.333 5.000<br />

10 0.250 0.333 0.500 0.333 0.250 1.000 0.500 0.333 0.500 0.000 1.000 5.000<br />

11 0.200 0.250 0.333 0.250 0.200 0.500 1.000 0.500 0.333 1.000 0.000 4.567<br />

Σ 4.400 4.867 5.917 4.867 4.400 6.000 4.317 4.567 5.000 5.000 4.567 53.900<br />

÷ Detururi:<br />

o Σ(·): 317;<br />

o Σ(·) 2 : 2149;<br />

o ΣA(·): 51;<br />

88


o ΣA(·) 2 : 231;<br />

o Matricea:<br />

De 1 2 3 4 5 6 7 8 9 10 11 Σ<br />

1 0 4 3 3 4 4 7 8 9 9 8 59<br />

2 4 0 4 3 3 5 8 9 10 10 9 65<br />

3 3 4 0 4 3 1 4 5 6 6 5 41<br />

4 3 3 4 0 4 5 8 9 10 10 9 65<br />

5 4 3 3 4 0 4 7 8 9 9 8 59<br />

6 4 5 1 5 4 0 3 4 5 5 4 40<br />

7 7 8 4 8 7 3 0 5 4 4 5 55<br />

8 8 9 5 9 8 4 5 0 5 3 4 60<br />

9 9 10 6 10 9 5 4 5 0 4 3 65<br />

10 9 10 6 10 9 5 4 3 4 0 5 65<br />

11 8 9 5 9 8 4 5 4 3 5 0 60<br />

Σ 59 65 41 65 59 40 55 60 65 65 60 634<br />

÷ Reciproce <strong>de</strong> Detururi:<br />

o Σ(·): 11.8246031746;<br />

o Σ(·) 2 : 3.4927762031;<br />

o ΣA(·): 3.45;<br />

o ΣA(·) 2 : 1.5525;<br />

o Matricea:<br />

RDe 1 2 3 4 5 6 7 8 9 10 11 Σ<br />

1 0.000 0.250 0.333 0.333 0.250 0.250 0.143 0.125 0.111 0.111 0.125 2.032<br />

2 0.250 0.000 0.250 0.333 0.333 0.200 0.125 0.111 0.100 0.100 0.111 1.914<br />

3 0.333 0.250 0.000 0.250 0.333 1.000 0.250 0.200 0.167 0.167 0.200 3.150<br />

4 0.333 0.333 0.250 0.000 0.250 0.200 0.125 0.111 0.100 0.100 0.111 1.914<br />

5 0.250 0.333 0.333 0.250 0.000 0.250 0.143 0.125 0.111 0.111 0.125 2.032<br />

6 0.250 0.200 1.000 0.200 0.250 0.000 0.333 0.250 0.200 0.200 0.250 3.133<br />

7 0.143 0.125 0.250 0.125 0.143 0.333 0.000 0.200 0.250 0.250 0.200 2.019<br />

8 0.125 0.111 0.200 0.111 0.125 0.250 0.200 0.000 0.200 0.333 0.250 1.906<br />

9 0.111 0.100 0.167 0.100 0.111 0.200 0.250 0.200 0.000 0.250 0.333 1.822<br />

10 0.111 0.100 0.167 0.100 0.111 0.200 0.250 0.333 0.250 0.000 0.200 1.822<br />

11 0.125 0.111 0.200 0.111 0.125 0.250 0.200 0.250 0.333 0.200 0.000 1.906<br />

Σ 2.032 1.914 3.150 1.914 2.032 3.133 2.019 1.906 1.822 1.822 1.906 23.649<br />

÷ Matricea Cluj pe Distanţe, CJD:<br />

o Definiţie: CJDi,j = max|CJDSi,j|; {k}∈CJDSi,j ⇔ d(G)k,i


(5, 1) [5, 1] {4, 5}<br />

(1, 6) [1, 2, 3, 6] {1, 5}<br />

(6, 1) [6, 3, 2, 1] {6, 7, 8, 9, 10, 11}<br />

(1, 7) [1, 2, 3, 6, 9, 8, 7] {1, 4, 5}<br />

(1, 7) [1, 2, 3, 6, 10, 11, 7] {1, 4, 5}<br />

(7, 1) [7, 8, 9, 6, 3, 2, 1] {7, 10, 11}<br />

(7, 1) [7, 11, 10, 6, 3, 2, 1] {7, 8, 9}<br />

(1, 8) [1, 2, 3, 6, 9, 8] {1, 4, 5}<br />

(8, 1) [8, 9, 6, 3, 2, 1] {7, 8, 10, 11}<br />

(1, 9) [1, 2, 3, 6, 9] {1, 4, 5}<br />

(9, 1) [9, 6, 3, 2, 1] {7, 8, 9, 10, 11}<br />

(1, 10) [1, 2, 3, 6, 10] {1, 4, 5}<br />

(10, 1) [10, 6, 3, 2, 1] {7, 8, 9, 10, 11}<br />

(1, 11) [1, 2, 3, 6, 10, 11] {1, 4, 5}<br />

(11, 1) [11, 10, 6, 3, 2, 1] {7, 8, 9, 11}<br />

(2, 3) [2, 3] {1, 2}<br />

(3, 2) [3, 2] {3, 4, 6, 7, 8, 9, 10, 11}<br />

(2, 4) [2, 3, 4] {1, 2}<br />

(4, 2) [4, 3, 2] {4, 5}<br />

(2, 5) [2, 1, 5] {2, 3, 6, 7, 8, 9, 10, 11}<br />

(5, 2) [5, 1, 2] {4, 5}<br />

(2, 6) [2, 3, 6] {1, 2, 5}<br />

(6, 2) [6, 3, 2] {6, 7, 8, 9, 10, 11}<br />

(2, 7) [2, 3, 6, 9, 8, 7] {1, 2, 4, 5}<br />

(2, 7) [2, 3, 6, 10, 11, 7] {1, 2, 4, 5}<br />

(7, 2) [7, 8, 9, 6, 3, 2] {7, 10, 11}<br />

(7, 2) [7, 11, 10, 6, 3, 2] {7, 8, 9}<br />

(2, 8) [2, 3, 6, 9, 8] {1, 2, 4, 5}<br />

(8, 2) [8, 9, 6, 3, 2] {7, 8, 11}<br />

(2, 9) [2, 3, 6, 9] {1, 2, 4, 5}<br />

(9, 2) [9, 6, 3, 2] {7, 8, 9, 10, 11}<br />

(2, 10) [2, 3, 6, 10] {1, 2, 4, 5}<br />

(10, 2) [10, 6, 3, 2] {7, 8, 9, 10, 11}<br />

(2, 11) [2, 3, 6, 10, 11] {1, 2, 4, 5}<br />

(11, 2) [11, 10, 6, 3, 2] {7, 8, 11}<br />

(3, 4) [3, 4] {2, 3, 6, 7, 8, 9, 10, 11}<br />

(4, 3) [4, 3] {4, 5}<br />

(3, 5) [3, 4, 5] {2, 3, 6, 7, 8, 9, 10, 11}<br />

(5, 3) [5, 4, 3] {1, 5}<br />

(3, 6) [3, 6] {1, 2, 3, 4, 5}<br />

(6, 3) [6, 3] {6, 7, 8, 9, 10, 11}<br />

(3, 7) [3, 6, 10, 11, 7] {1, 2, 3, 4, 5}<br />

(3, 7) [3, 6, 9, 8, 7] {1, 2, 3, 4, 5}<br />

(7, 3) [7, 8, 9, 6, 3] {7, 11}<br />

(7, 3) [7, 11, 10, 6, 3] {7, 8}<br />

(3, 8) [3, 6, 9, 8] {1, 2, 3, 4, 5}<br />

(8, 3) [8, 9, 6, 3] {7, 8, 11}<br />

(3, 9) [3, 6, 9] {1, 2, 3, 4, 5}<br />

(9, 3) [9, 6, 3] {7, 8, 9}<br />

(3, 10) [3, 6, 10] {1, 2, 3, 4, 5}<br />

90


(10, 3) [10, 6, 3] {7, 10, 11}<br />

(3, 11) [3, 6, 10, 11] {1, 2, 3, 4, 5}<br />

(11, 3) [11, 10, 6, 3] {7, 8, 11}<br />

(4, 5) [4, 5] {3, 4, 6, 7, 8, 9, 10, 11}<br />

(5, 4) [5, 4] {1, 5}<br />

(4, 6) [4, 3, 6] {1, 4, 5}<br />

(6, 4) [6, 3, 4] {6, 7, 8, 9, 10, 11}<br />

(4, 7) [4, 3, 6, 9, 8, 7] {1, 2, 4, 5}<br />

(4, 7) [4, 3, 6, 10, 11, 7] {1, 2, 4, 5}<br />

(7, 4) [7, 8, 9, 6, 3, 4] {7, 10, 11}<br />

(7, 4) [7, 11, 10, 6, 3, 4] {7, 8, 9}<br />

(4, 8) [4, 3, 6, 9, 8] {1, 2, 4, 5}<br />

(8, 4) [8, 9, 6, 3, 4] {7, 8, 11}<br />

(4, 9) [4, 3, 6, 9] {1, 2, 4, 5}<br />

(9, 4) [9, 6, 3, 4] {7, 8, 9, 10, 11}<br />

(4, 10) [4, 3, 6, 10] {1, 2, 4, 5}<br />

(10, 4) [10, 6, 3, 4] {7, 8, 9, 10, 11}<br />

(4, 11) [4, 3, 6, 10, 11] {1, 2, 4, 5}<br />

(11, 4) [11, 10, 6, 3, 4] {7, 8, 11}<br />

(5, 6) [5, 4, 3, 6] {1, 5}<br />

(6, 5) [6, 3, 4, 5] {6, 7, 8, 9, 10, 11}<br />

(5, 7) [5, 4, 3, 6, 9, 8, 7] {1, 2, 5}<br />

(5, 7) [5, 4, 3, 6, 10, 11, 7] {1, 2, 5}<br />

(7, 5) [7, 8, 9, 6, 3, 4, 5] {7, 10, 11}<br />

(7, 5) [7, 11, 10, 6, 3, 4, 5] {7, 8, 9}<br />

(5, 8) [5, 4, 3, 6, 9, 8] {1, 2, 5}<br />

(8, 5) [8, 9, 6, 3, 4, 5] {7, 8, 10, 11}<br />

(5, 9) [5, 4, 3, 6, 9] {1, 2, 5}<br />

(9, 5) [9, 6, 3, 4, 5] {7, 8, 9, 10, 11}<br />

(5, 10) [5, 4, 3, 6, 10] {1, 2, 5}<br />

(10, 5) [10, 6, 3, 4, 5] {7, 8, 9, 10, 11}<br />

(5, 11) [5, 4, 3, 6, 10, 11] {1, 2, 5}<br />

(11, 5) [11, 10, 6, 3, 4, 5] {7, 8, 9, 11}<br />

(6, 7) [6, 10, 11, 7] {1, 2, 3, 4, 5, 6, 9}<br />

(6, 7) [6, 9, 8, 7] {1, 2, 3, 4, 5, 6, 10}<br />

(7, 6) [7, 8, 9, 6] {7, 11}<br />

(7, 6) [7, 11, 10, 6] {7, 8}<br />

(6, 8) [6, 9, 8] {1, 2, 3, 4, 5, 6, 10}<br />

(8, 6) [8, 9, 6] {7, 8}<br />

(6, 9) [6, 9] {1, 2, 3, 4, 5, 6, 10, 11}<br />

(9, 6) [9, 6] {7, 8, 9}<br />

(6, 10) [6, 10] {1, 2, 3, 4, 5, 6, 8, 9}<br />

(10, 6) [10, 6] {7, 10, 11}<br />

(6, 11) [6, 10, 11] {1, 2, 3, 4, 5, 6, 9}<br />

(11, 6) [11, 10, 6] {7, 11}<br />

(7, 8) [7, 8] {7, 10, 11}<br />

(8, 7) [8, 7] {1, 2, 3, 4, 5, 6, 8, 9}<br />

(7, 9) [7, 8, 9] {7, 11}<br />

(9, 7) [9, 8, 7] {1, 2, 3, 4, 5, 6, 9}<br />

(7, 10) [7, 11, 10] {7, 8}<br />

91


(10, 7) [10, 11, 7] {1, 2, 3, 4, 5, 6, 10}<br />

(7, 11) [7, 11] {7, 8, 9}<br />

(11, 7) [11, 7] {1, 2, 3, 4, 5, 6, 10, 11}<br />

(8, 9) [8, 9] {7, 8, 11}<br />

(9, 8) [9, 8] {1, 2, 3, 4, 5, 6, 9, 10}<br />

(8, 10) [8, 9, 6, 10] {7, 8}<br />

(8, 10) [8, 7, 11, 10] {8, 9}<br />

(10, 8) [10, 11, 7, 8] {1, 2, 3, 4, 5, 6, 10}<br />

(8, 11) [8, 7, 11] {8, 9}<br />

(11, 8) [11, 7, 8] {10, 11}<br />

(9, 10) [9, 6, 10] {8, 9}<br />

(10, 9) [10, 6, 9] {10, 11}<br />

(9, 11) [9, 8, 7, 11] {1, 2, 3, 4, 5, 6, 9}<br />

(11, 9) [11, 10, 6, 9] {7, 11}<br />

(11, 9) [11, 7, 8, 9] {10, 11}<br />

(10, 11) [10, 11] {1, 2, 3, 4, 5, 6, 9, 10}<br />

(11, 10) [11, 10] {7, 8, 11}<br />

o Σ(CJD): 229.5;<br />

o Σ(CJD) 2 : 824;<br />

o ΣA(CJD): 60.5;<br />

o ΣA(CJD) 2 : 242;<br />

o Matricea CJD:<br />

CJD 1 2 3 4 5 6 7 8 9 10 11 Σ<br />

1 0 2 2 2 2 2 3 3 3 3 3 25<br />

2 8 0 2 2 8 3 4 4 4 4 4 43<br />

3 8 8 0 8 8 5 5 5 5 5 5 62<br />

4 8 2 2 0 8 3 4 4 4 4 4 43<br />

5 2 2 2 2 0 2 3 3 3 3 3 25<br />

6 6 6 6 6 6 0 7 7 8 8 7 67<br />

7 3 3 2 3 3 2 0 3 2 2 3 26<br />

8 4 3 3 3 4 2 8 0 3 2 2 34<br />

9 5 5 3 5 5 3 7 8 0 2 7 50<br />

10 5 5 3 5 5 3 7 7 2 0 8 50<br />

11 4 3 3 3 4 2 8 2 2 3 0 34<br />

Σ 53 39 28 39 53 27 56 46 36 36 46 459<br />

o Σ(RCJD): 16.441(6);<br />

o Σ(RCJD) 2 : 4.45;<br />

o ΣA(RCJD): 3.308(3);<br />

o ΣA(RCJD) 2 : 0.78(3);<br />

o Matricea RCJD:<br />

RCJD 1 2 3 4 5 6 7 8 9 10 11 Σ<br />

1 0.000 0.500 0.500 0.500 0.500 0.500 0.333 0.333 0.333 0.333 0.333 4.167<br />

2 0.125 0.000 0.500 0.500 0.125 0.333 0.250 0.250 0.250 0.250 0.250 2.833<br />

3 0.125 0.125 0.000 0.125 0.125 0.200 0.200 0.200 0.200 0.200 0.200 1.700<br />

4 0.125 0.500 0.500 0.000 0.125 0.333 0.250 0.250 0.250 0.250 0.250 2.833<br />

5 0.500 0.500 0.500 0.500 0.000 0.500 0.333 0.333 0.333 0.333 0.333 4.167<br />

6 0.167 0.167 0.167 0.167 0.167 0.000 0.143 0.143 0.125 0.125 0.143 1.512<br />

7 0.333 0.333 0.500 0.333 0.333 0.500 0.000 0.333 0.500 0.500 0.333 4.000<br />

8 0.250 0.333 0.333 0.333 0.250 0.500 0.125 0.000 0.333 0.500 0.500 3.458<br />

9 0.200 0.200 0.333 0.200 0.200 0.333 0.143 0.125 0.000 0.500 0.143 2.377<br />

10 0.200 0.200 0.333 0.200 0.200 0.333 0.143 0.143 0.500 0.000 0.125 2.377<br />

92


11 0.250 0.333 0.333 0.333 0.250 0.500 0.125 0.500 0.500 0.333 0.000 3.458<br />

Σ 2.275 3.192 4.000 3.192 2.275 4.033 2.045 2.611 3.325 3.325 2.611 32.883<br />

÷ Matricea Cluj pe Detururi, CJΔ:<br />

o Definiţie: CJΔi,j = max|CJΔSi,j|; {k}∈CJΔSi,j ⇔ d(G)k,i


(2, 10) [2, 1, 5, 4, 3, 6, 9, 8, 7, 11, 10] {2}<br />

(10, 2) [10, 11, 7, 8, 9, 6, 3, 4, 5, 1, 2] {10}<br />

(2, 11) [2, 1, 5, 4, 3, 6, 9, 8, 7, 11] {2}<br />

(11, 2) [11, 7, 8, 9, 6, 3, 4, 5, 1, 2] {10, 11}<br />

(3, 4) [3, 2, 1, 5, 4] {3, 6, 7, 8, 9, 10, 11}<br />

(4, 3) [4, 5, 1, 2, 3] {4}<br />

(3, 5) [3, 2, 1, 5] {3, 6, 7, 8, 9, 10, 11}<br />

(5, 3) [5, 1, 2, 3] {5}<br />

(3, 6) [3, 6] {1, 2, 3, 4, 5}<br />

(6, 3) [6, 3] {6, 7, 8, 9, 10, 11}<br />

(3, 7) [3, 6, 10, 11, 7] {1, 2, 3, 4, 5}<br />

(3, 7) [3, 6, 9, 8, 7] {1, 2, 3, 4, 5}<br />

(7, 3) [7, 8, 9, 6, 3] {7, 11}<br />

(7, 3) [7, 11, 10, 6, 3] {7, 8}<br />

(3, 8) [3, 6, 10, 11, 7, 8] {1, 2, 3, 4, 5}<br />

(8, 3) [8, 7, 11, 10, 6, 3] {8, 9}<br />

(3, 9) [3, 6, 10, 11, 7, 8, 9] {1, 2, 3, 4, 5}<br />

(9, 3) [9, 8, 7, 11, 10, 6, 3] {9}<br />

(3, 10) [3, 6, 9, 8, 7, 11, 10] {1, 2, 3, 4, 5}<br />

(10, 3) [10, 11, 7, 8, 9, 6, 3] {10}<br />

(3, 11) [3, 6, 9, 8, 7, 11] {1, 2, 3, 4, 5}<br />

(11, 3) [11, 7, 8, 9, 6, 3] {10, 11}<br />

(4, 5) [4, 3, 2, 1, 5] {4}<br />

(5, 4) [5, 1, 2, 3, 4] {5}<br />

(4, 6) [4, 5, 1, 2, 3, 6] {4}<br />

(6, 4) [6, 3, 2, 1, 5, 4] {6, 7, 8, 9, 10, 11}<br />

(4, 7) [4, 5, 1, 2, 3, 6, 10, 11, 7] {4}<br />

(4, 7) [4, 5, 1, 2, 3, 6, 9, 8, 7] {4}<br />

(7, 4) [7, 8, 9, 6, 3, 2, 1, 5, 4] {7, 10, 11}<br />

(7, 4) [7, 11, 10, 6, 3, 2, 1, 5, 4] {7, 8, 9}<br />

(4, 8) [4, 5, 1, 2, 3, 6, 10, 11, 7, 8] {4}<br />

(8, 4) [8, 7, 11, 10, 6, 3, 2, 1, 5, 4] {8, 9}<br />

(4, 9) [4, 5, 1, 2, 3, 6, 10, 11, 7, 8, 9] {4}<br />

(9, 4) [9, 8, 7, 11, 10, 6, 3, 2, 1, 5, 4] {9}<br />

(4, 10) [4, 5, 1, 2, 3, 6, 9, 8, 7, 11, 10] {4}<br />

(10, 4) [10, 11, 7, 8, 9, 6, 3, 2, 1, 5, 4] {10}<br />

(4, 11) [4, 5, 1, 2, 3, 6, 9, 8, 7, 11] {4}<br />

(11, 4) [11, 7, 8, 9, 6, 3, 2, 1, 5, 4] {10, 11}<br />

(5, 6) [5, 1, 2, 3, 6] {4, 5}<br />

(6, 5) [6, 3, 2, 1, 5] {6, 7, 8, 9, 10, 11}<br />

(5, 7) [5, 1, 2, 3, 6, 10, 11, 7] {4, 5}<br />

(5, 7) [5, 1, 2, 3, 6, 9, 8, 7] {4, 5}<br />

(7, 5) [7, 8, 9, 6, 3, 2, 1, 5] {7, 10, 11}<br />

(7, 5) [7, 11, 10, 6, 3, 2, 1, 5] {7, 8, 9}<br />

(5, 8) [5, 1, 2, 3, 6, 10, 11, 7, 8] {4, 5}<br />

(8, 5) [8, 7, 11, 10, 6, 3, 2, 1, 5] {8, 9}<br />

(5, 9) [5, 1, 2, 3, 6, 10, 11, 7, 8, 9] {4, 5}<br />

(9, 5) [9, 8, 7, 11, 10, 6, 3, 2, 1, 5] {9}<br />

(5, 10) [5, 1, 2, 3, 6, 9, 8, 7, 11, 10] {4, 5}<br />

(10, 5) [10, 11, 7, 8, 9, 6, 3, 2, 1, 5] {10}<br />

94


(5, 11) [5, 1, 2, 3, 6, 9, 8, 7, 11] {4, 5}<br />

(11, 5) [11, 7, 8, 9, 6, 3, 2, 1, 5] {10, 11}<br />

(6, 7) [6, 10, 11, 7] {1, 2, 3, 4, 5, 6, 9}<br />

(6, 7) [6, 9, 8, 7] {1, 2, 3, 4, 5, 6, 10}<br />

(7, 6) [7, 8, 9, 6] {7, 11}<br />

(7, 6) [7, 11, 10, 6] {7, 8}<br />

(6, 8) [6, 10, 11, 7, 8] {1, 2, 3, 4, 5, 6}<br />

(8, 6) [8, 7, 11, 10, 6] {8}<br />

(6, 9) [6, 10, 11, 7, 8, 9] {1, 2, 3, 4, 5, 6}<br />

(9, 6) [9, 8, 7, 11, 10, 6] {9}<br />

(6, 10) [6, 9, 8, 7, 11, 10] {1, 2, 3, 4, 5, 6}<br />

(10, 6) [10, 11, 7, 8, 9, 6] {10}<br />

(6, 11) [6, 9, 8, 7, 11] {1, 2, 3, 4, 5, 6}<br />

(11, 6) [11, 7, 8, 9, 6] {11}<br />

(7, 8) [7, 11, 10, 6, 9, 8] {7}<br />

(8, 7) [8, 9, 6, 10, 11, 7] {8}<br />

(7, 9) [7, 11, 10, 6, 9] {7}<br />

(9, 7) [9, 6, 10, 11, 7] {9}<br />

(7, 10) [7, 8, 9, 6, 10] {7}<br />

(10, 7) [10, 6, 9, 8, 7] {10}<br />

(7, 11) [7, 8, 9, 6, 10, 11] {7}<br />

(11, 7) [11, 10, 6, 9, 8, 7] {11}<br />

(8, 9) [8, 7, 11, 10, 6, 9] {8}<br />

(9, 8) [9, 6, 10, 11, 7, 8] {9}<br />

(8, 10) [8, 9, 6, 10] {7, 8}<br />

(8, 10) [8, 7, 11, 10] {8, 9}<br />

(10, 8) [10, 11, 7, 8] {1, 2, 3, 4, 5, 6, 10}<br />

(8, 11) [8, 9, 6, 10, 11] {8}<br />

(11, 8) [11, 10, 6, 9, 8] {11}<br />

(9, 10) [9, 8, 7, 11, 10] {9}<br />

(10, 9) [10, 11, 7, 8, 9] {10}<br />

(9, 11) [9, 8, 7, 11] {1, 2, 3, 4, 5, 6, 9}<br />

(11, 9) [11, 10, 6, 9] {7, 11}<br />

(11, 9) [11, 7, 8, 9] {10, 11}<br />

(10, 11) [10, 6, 9, 8, 7, 11] {10}<br />

(11, 10) [11, 7, 8, 9, 6, 10] {11}<br />

o Σ(CJΔ): 127.5;<br />

o Σ(CJΔ) 2 : 268;<br />

o ΣA(CJΔ): 27.5;<br />

o ΣA(CJΔ) 2 : 63;<br />

o Matricea CJΔ:<br />

CJΔ 1 2 3 4 5 6 7 8 9 10 11 Σ<br />

1 0 1 1 1 1 2 2 2 2 2 2 16<br />

2 1 0 1 1 1 1 1 1 1 1 1 10<br />

3 7 7 0 7 7 5 5 5 5 5 5 58<br />

4 1 1 1 0 1 1 1 1 1 1 1 10<br />

5 1 1 1 1 0 2 2 2 2 2 2 16<br />

6 6 6 6 6 6 0 7 6 6 6 6 61<br />

7 3 3 2 3 3 2 0 1 1 1 1 20<br />

8 2 2 2 2 2 1 1 0 1 2 1 16<br />

9 1 1 1 1 1 1 1 1 0 1 7 16<br />

95


10 1 1 1 1 1 1 1 7 1 0 1 16<br />

11 2 2 2 2 2 1 1 1 2 1 0 16<br />

Σ 25 25 18 25 25 17 22 27 22 22 27 255<br />

o Σ(RCJΔ): 38.01(6);<br />

o Σ(RCJΔ) 2 : 26.6857;<br />

o ΣA(RCJΔ): 9.492857;<br />

o ΣA(RCJΔ) 2 : 7.6523809;<br />

o Matricea RCJΔ:<br />

RCJΔ 1 2 3 4 5 6 7 8 9 10 11 Σ<br />

1 0.000 1.000 1.000 1.000 1.000 0.500 0.500 0.500 0.500 0.500 0.500 7.000<br />

2 1.000 0.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 10.000<br />

3 0.143 0.143 0.000 0.143 0.143 0.200 0.200 0.200 0.200 0.200 0.200 1.771<br />

4 1.000 1.000 1.000 0.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 10.000<br />

5 1.000 1.000 1.000 1.000 0.000 0.500 0.500 0.500 0.500 0.500 0.500 7.000<br />

6 0.167 0.167 0.167 0.167 0.167 0.000 0.143 0.167 0.167 0.167 0.167 1.643<br />

7 0.333 0.333 0.500 0.333 0.333 0.500 0.000 1.000 1.000 1.000 1.000 6.333<br />

8 0.500 0.500 0.500 0.500 0.500 1.000 1.000 0.000 1.000 0.500 1.000 7.000<br />

9 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.000 1.000 0.143 9.143<br />

10 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.143 1.000 0.000 1.000 9.143<br />

11 0.500 0.500 0.500 0.500 0.500 1.000 1.000 1.000 0.500 1.000 0.000 7.000<br />

Σ 6.643 6.643 7.667 6.643 6.643 7.700 7.343 6.510 6.867 6.867 6.510 76.033<br />

÷ Matricea Cluj Fragmental pe Distanţe, CFD:<br />

o Definiţie: CFDi,j = max|CFDSi,j|; {k}∈CFDSi,j ⇔ d(Gp)k,i


(1, 11) [1, 2, 3, 6, 10, 11] {1, 4, 5}<br />

(11, 1) [11, 10, 6, 3, 2, 1] {7, 8, 9, 11}<br />

(2, 3) [2, 3] {1, 2}<br />

(3, 2) [3, 2] {3, 4, 6, 7, 8, 9, 10, 11}<br />

(2, 4) [2, 3, 4] {1, 2}<br />

(4, 2) [4, 3, 2] {4, 5}<br />

(2, 5) [2, 1, 5] {2, 3, 6, 7, 8, 9, 10, 11}<br />

(5, 2) [5, 1, 2] {4, 5}<br />

(2, 6) [2, 3, 6] {1, 2, 4, 5}<br />

(6, 2) [6, 3, 2] {6, 7, 8, 9, 10, 11}<br />

(2, 7) [2, 3, 6, 9, 8, 7] {1, 2, 4, 5}<br />

(7, 2) [7, 8, 9, 6, 3, 2] {7, 10, 11}<br />

(2, 7) [2, 3, 6, 10, 11, 7] {1, 2, 4, 5}<br />

(7, 2) [7, 11, 10, 6, 3, 2] {7, 8, 9}<br />

(2, 8) [2, 3, 6, 9, 8] {1, 2, 4, 5}<br />

(8, 2) [8, 9, 6, 3, 2] {7, 8, 10, 11}<br />

(2, 9) [2, 3, 6, 9] {1, 2, 4, 5}<br />

(9, 2) [9, 6, 3, 2] {7, 8, 9, 10, 11}<br />

(2, 10) [2, 3, 6, 10] {1, 2, 4, 5}<br />

(10, 2) [10, 6, 3, 2] {7, 8, 9, 10, 11}<br />

(2, 11) [2, 3, 6, 10, 11] {1, 2, 4, 5}<br />

(11, 2) [11, 10, 6, 3, 2] {7, 8, 9, 11}<br />

(3, 4) [3, 4] {2, 3, 6, 7, 8, 9, 10, 11}<br />

(4, 3) [4, 3] {4, 5}<br />

(3, 5) [3, 4, 5] {2, 3, 6, 7, 8, 9, 10, 11}<br />

(5, 3) [5, 4, 3] {1, 5}<br />

(3, 6) [3, 6] {1, 2, 3, 4, 5}<br />

(6, 3) [6, 3] {6, 7, 8, 9, 10, 11}<br />

(3, 7) [3, 6, 10, 11, 7] {1, 2, 3, 4, 5}<br />

(7, 3) [7, 11, 10, 6, 3] {7, 8, 9}<br />

(3, 7) [3, 6, 9, 8, 7] {1, 2, 3, 4, 5}<br />

(7, 3) [7, 8, 9, 6, 3] {7, 10, 11}<br />

(3, 8) [3, 6, 9, 8] {1, 2, 3, 4, 5}<br />

(8, 3) [8, 9, 6, 3] {7, 8, 10, 11}<br />

(3, 9) [3, 6, 9] {1, 2, 3, 4, 5}<br />

(9, 3) [9, 6, 3] {7, 8, 9, 10, 11}<br />

(3, 10) [3, 6, 10] {1, 2, 3, 4, 5}<br />

(10, 3) [10, 6, 3] {7, 8, 9, 10, 11}<br />

(3, 11) [3, 6, 10, 11] {1, 2, 3, 4, 5}<br />

(11, 3) [11, 10, 6, 3] {7, 8, 9, 11}<br />

(4, 5) [4, 5] {3, 4, 6, 7, 8, 9, 10, 11}<br />

(5, 4) [5, 4] {1, 5}<br />

(4, 6) [4, 3, 6] {1, 2, 4, 5}<br />

(6, 4) [6, 3, 4] {6, 7, 8, 9, 10, 11}<br />

(4, 7) [4, 3, 6, 9, 8, 7] {1, 2, 4, 5}<br />

(7, 4) [7, 8, 9, 6, 3, 4] {7, 10, 11}<br />

(4, 7) [4, 3, 6, 10, 11, 7] {1, 2, 4, 5}<br />

(7, 4) [7, 11, 10, 6, 3, 4] {7, 8, 9}<br />

(4, 8) [4, 3, 6, 9, 8] {1, 2, 4, 5}<br />

(8, 4) [8, 9, 6, 3, 4] {7, 8, 10, 11}<br />

97


(4, 9) [4, 3, 6, 9] {1, 2, 4, 5}<br />

(9, 4) [9, 6, 3, 4] {7, 8, 9, 10, 11}<br />

(4, 10) [4, 3, 6, 10] {1, 2, 4, 5}<br />

(10, 4) [10, 6, 3, 4] {7, 8, 9, 10, 11}<br />

(4, 11) [4, 3, 6, 10, 11] {1, 2, 4, 5}<br />

(11, 4) [11, 10, 6, 3, 4] {7, 8, 9, 11}<br />

(5, 6) [5, 4, 3, 6] {1, 2, 5}<br />

(6, 5) [6, 3, 4, 5] {6, 7, 8, 9, 10, 11}<br />

(5, 7) [5, 4, 3, 6, 9, 8, 7] {1, 2, 5}<br />

(7, 5) [7, 8, 9, 6, 3, 4, 5] {7, 10, 11}<br />

(5, 7) [5, 4, 3, 6, 10, 11, 7] {1, 2, 5}<br />

(7, 5) [7, 11, 10, 6, 3, 4, 5] {7, 8, 9}<br />

(5, 8) [5, 4, 3, 6, 9, 8] {1, 2, 5}<br />

(8, 5) [8, 9, 6, 3, 4, 5] {7, 8, 10, 11}<br />

(5, 9) [5, 4, 3, 6, 9] {1, 2, 5}<br />

(9, 5) [9, 6, 3, 4, 5] {7, 8, 9, 10, 11}<br />

(5, 10) [5, 4, 3, 6, 10] {1, 2, 5}<br />

(10, 5) [10, 6, 3, 4, 5] {7, 8, 9, 10, 11}<br />

(5, 11) [5, 4, 3, 6, 10, 11] {1, 2, 5}<br />

(11, 5) [11, 10, 6, 3, 4, 5] {7, 8, 9, 11}<br />

(6, 7) [6, 10, 11, 7] {1, 2, 3, 4, 5, 6, 9}<br />

(7, 6) [7, 11, 10, 6] {7, 8}<br />

(6, 7) [6, 9, 8, 7] {1, 2, 3, 4, 5, 6, 10}<br />

(7, 6) [7, 8, 9, 6] {7, 11}<br />

(6, 8) [6, 9, 8] {1, 2, 3, 4, 5, 6, 10}<br />

(8, 6) [8, 9, 6] {7, 8}<br />

(6, 9) [6, 9] {1, 2, 3, 4, 5, 6, 10, 11}<br />

(9, 6) [9, 6] {7, 8, 9}<br />

(6, 10) [6, 10] {1, 2, 3, 4, 5, 6, 8, 9}<br />

(10, 6) [10, 6] {7, 10, 11}<br />

(6, 11) [6, 10, 11] {1, 2, 3, 4, 5, 6, 9}<br />

(11, 6) [11, 10, 6] {7, 11}<br />

(7, 8) [7, 8] {7, 10, 11}<br />

(8, 7) [8, 7] {1, 2, 3, 4, 5, 6, 8, 9}<br />

(7, 9) [7, 8, 9] {7, 11}<br />

(9, 7) [9, 8, 7] {1, 2, 3, 4, 5, 6, 9}<br />

(7, 10) [7, 11, 10] {7, 8}<br />

(10, 7) [10, 11, 7] {1, 2, 3, 4, 5, 6, 10}<br />

(7, 11) [7, 11] {7, 8, 9}<br />

(11, 7) [11, 7] {1, 2, 3, 4, 5, 6, 10, 11}<br />

(8, 9) [8, 9] {7, 8, 11}<br />

(9, 8) [9, 8] {1, 2, 3, 4, 5, 6, 9, 10}<br />

(8, 10) [8, 9, 6, 10] {7, 8}<br />

(8, 10) [8, 7, 11, 10] {8, 9}<br />

(10, 8) [10, 11, 7, 8] {1, 2, 3, 4, 5, 6, 10}<br />

(8, 11) [8, 7, 11] {8, 9}<br />

(11, 8) [11, 7, 8] {10, 11}<br />

(9, 10) [9, 6, 10] {8, 9}<br />

(10, 9) [10, 6, 9] {10, 11}<br />

(11, 9) [11, 10, 6, 9] {7, 11}<br />

98


(9, 11) [9, 8, 7, 11] {1, 2, 3, 4, 5, 6, 9}<br />

(11, 9) [11, 7, 8, 9] {10, 11}<br />

(10, 11) [10, 11] {1, 2, 3, 4, 5, 6, 9, 10}<br />

(11, 10) [11, 10] {7, 8, 11}<br />

o Σ(CFD): 237;<br />

o Σ(CFD) 2 : 889;<br />

o ΣA(CFD): 60.5;<br />

o ΣA(CFD) 2 : 242;<br />

o Matricea CFD:<br />

CFD 1 2 3 4 5 6 7 8 9 10 11 Σ<br />

1 0 2 2 2 2 3 3 3 3 3 3 26<br />

2 8 0 2 2 8 4 4 4 4 4 4 44<br />

3 8 8 0 8 8 5 5 5 5 5 5 62<br />

4 8 2 2 0 8 4 4 4 4 4 4 44<br />

5 2 2 2 2 0 3 3 3 3 3 3 26<br />

6 6 6 6 6 6 0 7 7 8 8 7 67<br />

7 3 3 3 3 3 2 0 3 2 2 3 27<br />

8 4 4 4 4 4 2 8 0 3 2 2 37<br />

9 5 5 5 5 5 3 7 8 0 2 7 52<br />

10 5 5 5 5 5 3 7 7 2 0 8 52<br />

11 4 4 4 4 4 2 8 2 2 3 0 37<br />

Σ 53 41 35 41 53 31 56 46 36 36 46 474<br />

o Σ(RCFD): 15.725;<br />

o Σ(RCFD) 2 : 4.16(3);<br />

o ΣA(RCFD): 3.308(3);<br />

o ΣA(RCFD) 2 : 0.78(3);<br />

o Matricea RCFD:<br />

RCFD 1 2 3 4 5 6 7 8 9 10 11 Σ<br />

1 0.000 0.500 0.500 0.500 0.500 0.333 0.333 0.333 0.333 0.333 0.333 4.000<br />

2 0.125 0.000 0.500 0.500 0.125 0.250 0.250 0.250 0.250 0.250 0.250 2.750<br />

3 0.125 0.125 0.000 0.125 0.125 0.200 0.200 0.200 0.200 0.200 0.200 1.700<br />

4 0.125 0.500 0.500 0.000 0.125 0.250 0.250 0.250 0.250 0.250 0.250 2.750<br />

5 0.500 0.500 0.500 0.500 0.000 0.333 0.333 0.333 0.333 0.333 0.333 4.000<br />

6 0.167 0.167 0.167 0.167 0.167 0.000 0.143 0.143 0.125 0.125 0.143 1.512<br />

7 0.333 0.333 0.333 0.333 0.333 0.500 0.000 0.333 0.500 0.500 0.333 3.833<br />

8 0.250 0.250 0.250 0.250 0.250 0.500 0.125 0.000 0.333 0.500 0.500 3.208<br />

9 0.200 0.200 0.200 0.200 0.200 0.333 0.143 0.125 0.000 0.500 0.143 2.244<br />

10 0.200 0.200 0.200 0.200 0.200 0.333 0.143 0.143 0.500 0.000 0.125 2.244<br />

11 0.250 0.250 0.250 0.250 0.250 0.500 0.125 0.500 0.500 0.333 0.000 3.208<br />

Σ 2.275 3.025 3.400 3.025 2.275 3.533 2.045 2.611 3.325 3.325 2.611 31.450<br />

÷ Matricea Cluj Fragmental pe Detururi, CFΔ:<br />

o Definiţie: CFΔi,j = max|CFΔSi,j|; {k}∈CFΔSi,j ⇔ d(Gp)k,i


(1, 3) [1, 5, 4, 3] {1}<br />

(3, 1) [3, 4, 5, 1] {3, 6, 7, 8, 9, 10, 11}<br />

(1, 4) [1, 2, 3, 4] {1}<br />

(4, 1) [4, 3, 2, 1] {4}<br />

(1, 5) [1, 2, 3, 4, 5] {1}<br />

(5, 1) [5, 4, 3, 2, 1] {5}<br />

(1, 6) [1, 5, 4, 3, 6] {1, 2}<br />

(6, 1) [6, 3, 4, 5, 1] {6, 7, 8, 9, 10, 11}<br />

(1, 7) [1, 5, 4, 3, 6, 10, 11, 7] {1, 2}<br />

(7, 1) [7, 11, 10, 6, 3, 4, 5, 1] {7, 8, 9}<br />

(1, 7) [1, 5, 4, 3, 6, 9, 8, 7] {1, 2}<br />

(7, 1) [7, 8, 9, 6, 3, 4, 5, 1] {7, 10, 11}<br />

(1, 8) [1, 5, 4, 3, 6, 10, 11, 7, 8] {1, 2}<br />

(8, 1) [8, 7, 11, 10, 6, 3, 4, 5, 1] {8, 9}<br />

(1, 9) [1, 5, 4, 3, 6, 10, 11, 7, 8, 9] {1, 2}<br />

(9, 1) [9, 8, 7, 11, 10, 6, 3, 4, 5, 1] {9}<br />

(1, 10) [1, 5, 4, 3, 6, 9, 8, 7, 11, 10] {1, 2}<br />

(10, 1) [10, 11, 7, 8, 9, 6, 3, 4, 5, 1] {10}<br />

(1, 11) [1, 5, 4, 3, 6, 9, 8, 7, 11] {1, 2}<br />

(11, 1) [11, 7, 8, 9, 6, 3, 4, 5, 1] {10, 11}<br />

(2, 3) [2, 1, 5, 4, 3] {2}<br />

(3, 2) [3, 4, 5, 1, 2] {3, 6, 7, 8, 9, 10, 11}<br />

(2, 4) [2, 1, 5, 4] {2}<br />

(4, 2) [4, 5, 1, 2] {4}<br />

(2, 5) [2, 3, 4, 5] {2}<br />

(5, 2) [5, 4, 3, 2] {5}<br />

(2, 6) [2, 1, 5, 4, 3, 6] {2}<br />

(6, 2) [6, 3, 4, 5, 1, 2] {6, 7, 8, 9, 10, 11}<br />

(2, 7) [2, 1, 5, 4, 3, 6, 10, 11, 7] {2}<br />

(7, 2) [7, 11, 10, 6, 3, 4, 5, 1, 2] {7, 8, 9}<br />

(2, 7) [2, 1, 5, 4, 3, 6, 9, 8, 7] {2}<br />

(7, 2) [7, 8, 9, 6, 3, 4, 5, 1, 2] {7, 10, 11}<br />

(2, 8) [2, 1, 5, 4, 3, 6, 10, 11, 7, 8] {2}<br />

(8, 2) [8, 7, 11, 10, 6, 3, 4, 5, 1, 2] {8, 9}<br />

(2, 9) [2, 1, 5, 4, 3, 6, 10, 11, 7, 8, 9] {2}<br />

(9, 2) [9, 8, 7, 11, 10, 6, 3, 4, 5, 1, 2] {9}<br />

(2, 10) [2, 1, 5, 4, 3, 6, 9, 8, 7, 11, 10] {2}<br />

(10, 2) [10, 11, 7, 8, 9, 6, 3, 4, 5, 1, 2] {10}<br />

(2, 11) [2, 1, 5, 4, 3, 6, 9, 8, 7, 11] {2}<br />

(11, 2) [11, 7, 8, 9, 6, 3, 4, 5, 1, 2] {10, 11}<br />

(3, 4) [3, 2, 1, 5, 4] {3, 6, 7, 8, 9, 10, 11}<br />

(4, 3) [4, 5, 1, 2, 3] {4}<br />

(3, 5) [3, 2, 1, 5] {3, 6, 7, 8, 9, 10, 11}<br />

(5, 3) [5, 1, 2, 3] {5}<br />

(3, 6) [3, 6] {1, 2, 3, 4, 5}<br />

(6, 3) [6, 3] {6, 7, 8, 9, 10, 11}<br />

(3, 7) [3, 6, 10, 11, 7] {1, 2, 3, 4, 5}<br />

(7, 3) [7, 11, 10, 6, 3] {7, 8, 9}<br />

(3, 7) [3, 6, 9, 8, 7] {1, 2, 3, 4, 5}<br />

(7, 3) [7, 8, 9, 6, 3] {7, 10, 11}<br />

100


(3, 8) [3, 6, 10, 11, 7, 8] {1, 2, 3, 4, 5}<br />

(8, 3) [8, 7, 11, 10, 6, 3] {8, 9}<br />

(3, 9) [3, 6, 10, 11, 7, 8, 9] {1, 2, 3, 4, 5}<br />

(9, 3) [9, 8, 7, 11, 10, 6, 3] {9}<br />

(3, 10) [3, 6, 9, 8, 7, 11, 10] {1, 2, 3, 4, 5}<br />

(10, 3) [10, 11, 7, 8, 9, 6, 3] {10}<br />

(3, 11) [3, 6, 9, 8, 7, 11] {1, 2, 3, 4, 5}<br />

(11, 3) [11, 7, 8, 9, 6, 3] {10, 11}<br />

(4, 5) [4, 3, 2, 1, 5] {4}<br />

(5, 4) [5, 1, 2, 3, 4] {5}<br />

(4, 6) [4, 5, 1, 2, 3, 6] {4}<br />

(6, 4) [6, 3, 2, 1, 5, 4] {6, 7, 8, 9, 10, 11}<br />

(4, 7) [4, 5, 1, 2, 3, 6, 10, 11, 7] {4}<br />

(7, 4) [7, 11, 10, 6, 3, 2, 1, 5, 4] {7, 8, 9}<br />

(4, 7) [4, 5, 1, 2, 3, 6, 9, 8, 7] {4}<br />

(7, 4) [7, 8, 9, 6, 3, 2, 1, 5, 4] {7, 10, 11}<br />

(4, 8) [4, 5, 1, 2, 3, 6, 10, 11, 7, 8] {4}<br />

(8, 4) [8, 7, 11, 10, 6, 3, 2, 1, 5, 4] {8, 9}<br />

(4, 9) [4, 5, 1, 2, 3, 6, 10, 11, 7, 8, 9] {4}<br />

(9, 4) [9, 8, 7, 11, 10, 6, 3, 2, 1, 5, 4] {9}<br />

(4, 10) [4, 5, 1, 2, 3, 6, 9, 8, 7, 11, 10] {4}<br />

(10, 4) [10, 11, 7, 8, 9, 6, 3, 2, 1, 5, 4] {10}<br />

(4, 11) [4, 5, 1, 2, 3, 6, 9, 8, 7, 11] {4}<br />

(11, 4) [11, 7, 8, 9, 6, 3, 2, 1, 5, 4] {10, 11}<br />

(5, 6) [5, 1, 2, 3, 6] {4, 5}<br />

(6, 5) [6, 3, 2, 1, 5] {6, 7, 8, 9, 10, 11}<br />

(5, 7) [5, 1, 2, 3, 6, 10, 11, 7] {4, 5}<br />

(7, 5) [7, 11, 10, 6, 3, 2, 1, 5] {7, 8, 9}<br />

(5, 7) [5, 1, 2, 3, 6, 9, 8, 7] {4, 5}<br />

(7, 5) [7, 8, 9, 6, 3, 2, 1, 5] {7, 10, 11}<br />

(5, 8) [5, 1, 2, 3, 6, 10, 11, 7, 8] {4, 5}<br />

(8, 5) [8, 7, 11, 10, 6, 3, 2, 1, 5] {8, 9}<br />

(5, 9) [5, 1, 2, 3, 6, 10, 11, 7, 8, 9] {4, 5}<br />

(9, 5) [9, 8, 7, 11, 10, 6, 3, 2, 1, 5] {9}<br />

(5, 10) [5, 1, 2, 3, 6, 9, 8, 7, 11, 10] {4, 5}<br />

(10, 5) [10, 11, 7, 8, 9, 6, 3, 2, 1, 5] {10}<br />

(5, 11) [5, 1, 2, 3, 6, 9, 8, 7, 11] {4, 5}<br />

(11, 5) [11, 7, 8, 9, 6, 3, 2, 1, 5] {10, 11}<br />

(6, 7) [6, 10, 11, 7] {1, 2, 3, 4, 5, 6, 9}<br />

(7, 6) [7, 11, 10, 6] {7, 8}<br />

(6, 7) [6, 9, 8, 7] {1, 2, 3, 4, 5, 6, 10}<br />

(7, 6) [7, 8, 9, 6] {7, 11}<br />

(6, 8) [6, 10, 11, 7, 8] {1, 2, 3, 4, 5, 6}<br />

(8, 6) [8, 7, 11, 10, 6] {8}<br />

(6, 9) [6, 10, 11, 7, 8, 9] {1, 2, 3, 4, 5, 6}<br />

(9, 6) [9, 8, 7, 11, 10, 6] {9}<br />

(6, 10) [6, 9, 8, 7, 11, 10] {1, 2, 3, 4, 5, 6}<br />

(10, 6) [10, 11, 7, 8, 9, 6] {10}<br />

(6, 11) [6, 9, 8, 7, 11] {1, 2, 3, 4, 5, 6}<br />

(11, 6) [11, 7, 8, 9, 6] {11}<br />

101


(7, 8) [7, 11, 10, 6, 9, 8] {7}<br />

(8, 7) [8, 9, 6, 10, 11, 7] {8}<br />

(7, 9) [7, 11, 10, 6, 9] {7}<br />

(9, 7) [9, 6, 10, 11, 7] {9}<br />

(7, 10) [7, 8, 9, 6, 10] {7}<br />

(10, 7) [10, 6, 9, 8, 7] {10}<br />

(7, 11) [7, 8, 9, 6, 10, 11] {7}<br />

(11, 7) [11, 10, 6, 9, 8, 7] {11}<br />

(8, 9) [8, 7, 11, 10, 6, 9] {8}<br />

(9, 8) [9, 6, 10, 11, 7, 8] {9}<br />

(8, 10) [8, 9, 6, 10] {7, 8}<br />

(8, 10) [8, 7, 11, 10] {8, 9}<br />

(10, 8) [10, 11, 7, 8] {1, 2, 3, 4, 5, 6, 10}<br />

(8, 11) [8, 9, 6, 10, 11] {8}<br />

(11, 8) [11, 10, 6, 9, 8] {11}<br />

(9, 10) [9, 8, 7, 11, 10] {9}<br />

(10, 9) [10, 11, 7, 8, 9] {10}<br />

(11, 9) [11, 10, 6, 9] {7, 11}<br />

(9, 11) [9, 8, 7, 11] {1, 2, 3, 4, 5, 6, 9}<br />

(11, 9) [11, 7, 8, 9] {10, 11}<br />

(10, 11) [10, 6, 9, 8, 7, 11] {10}<br />

(11, 10) [11, 7, 8, 9, 6, 10] {11}<br />

o Σ(CFΔ): 128;<br />

o Σ(CFΔ) 2 : 273;<br />

o ΣA(CFΔ): 27.5;<br />

o ΣA(CFΔ) 2 : 63;<br />

o Matricea CFΔ:<br />

CFΔ 1 2 3 4 5 6 7 8 9 10 11 Σ<br />

1 0 1 1 1 1 2 2 2 2 2 2 16<br />

2 1 0 1 1 1 1 1 1 1 1 1 10<br />

3 7 7 0 7 7 5 5 5 5 5 5 58<br />

4 1 1 1 0 1 1 1 1 1 1 1 10<br />

5 1 1 1 1 0 2 2 2 2 2 2 16<br />

6 6 6 6 6 6 0 7 6 6 6 6 61<br />

7 3 3 3 3 3 2 0 1 1 1 1 21<br />

8 2 2 2 2 2 1 1 0 1 2 1 16<br />

9 1 1 1 1 1 1 1 1 0 1 7 16<br />

10 1 1 1 1 1 1 1 7 1 0 1 16<br />

11 2 2 2 2 2 1 1 1 2 1 0 16<br />

Σ 25 25 19 25 25 17 22 27 22 22 27 256<br />

o Σ(RCFΔ): 37.9(3);<br />

o Σ(RCFΔ) 2 : 26.6523809;<br />

o ΣA(RCFΔ): 9.492857;<br />

o ΣA(RCFΔ) 2 : 7.6523809;<br />

o Matricea RCFΔ:<br />

RCFΔ 1 2 3 4 5 6 7 8 9 10 11 Σ<br />

1 0.000 1.000 1.000 1.000 1.000 0.500 0.500 0.500 0.500 0.500 0.500 7.000<br />

2 1.000 0.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 10.000<br />

3 0.143 0.143 0.000 0.143 0.143 0.200 0.200 0.200 0.200 0.200 0.200 1.771<br />

4 1.000 1.000 1.000 0.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 10.000<br />

5 1.000 1.000 1.000 1.000 0.000 0.500 0.500 0.500 0.500 0.500 0.500 7.000<br />

102


6 0.167 0.167 0.167 0.167 0.167 0.000 0.143 0.167 0.167 0.167 0.167 1.643<br />

7 0.333 0.333 0.333 0.333 0.333 0.500 0.000 1.000 1.000 1.000 1.000 6.167<br />

8 0.500 0.500 0.500 0.500 0.500 1.000 1.000 0.000 1.000 0.500 1.000 7.000<br />

9 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.000 1.000 0.143 9.143<br />

10 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.143 1.000 0.000 1.000 9.143<br />

11 0.500 0.500 0.500 0.500 0.500 1.000 1.000 1.000 0.500 1.000 0.000 7.000<br />

Σ 6.643 6.643 7.500 6.643 6.643 7.700 7.343 6.510 6.867 6.867 6.510 75.867<br />

÷ Matricea Szeged pe Distanţe (SzD) şi Detururi (SzΔ):<br />

o Definiţie:<br />

÷ SzDi,j = |SzDSi,j|; SzDSi,j={k | d(G)k,i


(5,9) {1,2,4,5} {6,7,8,9,10,11} {1,2,3,4,5,6} {7,8,9,10,11}<br />

(6,9) {1,2,3,4,5,6,10,11} {7,8,9} {1,2,3,4,5,6,7,8} {9,10,11}<br />

(7,9) {7,11} {1,2,3,4,5,6,9} {1,2,3,4,5,6,7} {9,11}<br />

(8,9) {7,8,11} {1,2,3,4,5,6,9,10} {1,2,3,4,5,6,8,10} {7,9,11}<br />

(1,10) {1,2,4,5} {6,7,8,9,10,11} {1,2,3,4,5,6} {7,8,9,10,11}<br />

(2,10) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11}<br />

(3,10) {1,2,3,4,5} {7,10,11} {1,2,3,4,5,6} {8,9,10}<br />

(4,10) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11}<br />

(5,10) {1,2,4,5} {6,7,8,9,10,11} {1,2,3,4,5,6} {7,8,9,10,11}<br />

(6,10) {1,2,3,4,5,6,8,9} {7,10,11} {1,2,3,4,5,6,7,11} {8,9,10}<br />

(7,10) {7,8} {1,2,3,4,5,6,10} {1,2,3,4,5,6,7} {8,10}<br />

(8,10) {7,8,9} {1,2,3,4,5,6,10,11} {1,2,3,4,5,6,8,11} {7,9,10}<br />

(9,10) {8,9} {10,11} {9,11} {8,10}<br />

(1,11) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11}<br />

(2,11) {1,2,3,4,5} {7,8,10,11} {1,2,3,4,5} {6,7,8,9,10,11}<br />

(3,11) {1,2,3,4,5,6,9} {7,8,10,11} {1,2,3,4,5,6,7} {8,9,10,11}<br />

(4,11) {1,2,3,4,5} {7,8,10,11} {1,2,3,4,5} {6,7,8,9,10,11}<br />

(5,11) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11}<br />

(6,11) {1,2,3,4,5,6,9} {7,11} {1,2,3,4,5,6,7} {9,11}<br />

(7,11) {7,8,9} {1,2,3,4,5,6,10,11} {1,2,3,4,5,6,7,10} {8,9,11}<br />

(8,11) {8,9} {10,11} {8,10} {9,11}<br />

(9,11) {1,2,3,4,5,6,8,9} {7,10,11} {7,9,10} {1,2,3,4,5,6,8,11}<br />

(10,11) {1,2,3,4,5,6,9,10} {7,8,11} {7,8,10} {1,2,3,4,5,6,9,11}<br />

o Σ(SzD): 266.5;<br />

o Σ(SzD) 2 : 1154;<br />

o ΣA(SzD): 60.5;<br />

o ΣA(SzD) 2 : 242;<br />

o Matricea SzD:<br />

SzD 1 2 3 4 5 6 7 8 9 10 11 Σ<br />

1 0 2 2 2 2 3 5 5 4 4 5 34<br />

2 8 0 2 2 8 3 6 5 5 5 5 49<br />

3 8 8 0 8 8 5 6 7 5 5 7 67<br />

4 8 2 2 0 8 3 6 5 5 5 5 49<br />

5 2 2 2 2 0 3 5 5 4 4 5 34<br />

6 7 6 6 6 7 0 8 7 8 8 7 70<br />

7 5 5 3 5 5 3 0 3 2 2 3 36<br />

8 6 4 4 4 6 2 8 0 3 3 2 42<br />

9 6 6 3 6 6 3 7 8 0 2 8 55<br />

10 6 6 3 6 6 3 7 8 2 0 8 55<br />

11 6 4 4 4 6 2 8 2 3 3 0 42<br />

Σ 62 45 31 45 62 30 66 55 41 41 55 533<br />

o Σ(RSzD): 14.15059;<br />

o Σ(RSzD) 2 : 3.440714;<br />

o ΣA(RSzD): 3.308(3);<br />

o ΣA(RSzD) 2 : 0.78(3);<br />

o Matricea RSzD:<br />

RSzD 1 2 3 4 5 6 7 8 9 10 11 Σ<br />

1 0.000 0.500 0.500 0.500 0.500 0.333 0.200 0.200 0.250 0.250 0.200 3.433<br />

2 0.125 0.000 0.500 0.500 0.125 0.333 0.167 0.200 0.200 0.200 0.200 2.550<br />

3 0.125 0.125 0.000 0.125 0.125 0.200 0.167 0.143 0.200 0.200 0.143 1.552<br />

4 0.125 0.500 0.500 0.000 0.125 0.333 0.167 0.200 0.200 0.200 0.200 2.550<br />

104


5 0.500 0.500 0.500 0.500 0.000 0.333 0.200 0.200 0.250 0.250 0.200 3.433<br />

6 0.143 0.167 0.167 0.167 0.143 0.000 0.125 0.143 0.125 0.125 0.143 1.446<br />

7 0.200 0.200 0.333 0.200 0.200 0.333 0.000 0.333 0.500 0.500 0.333 3.133<br />

8 0.167 0.250 0.250 0.250 0.167 0.500 0.125 0.000 0.333 0.333 0.500 2.875<br />

9 0.167 0.167 0.333 0.167 0.167 0.333 0.143 0.125 0.000 0.500 0.125 2.226<br />

10 0.167 0.167 0.333 0.167 0.167 0.333 0.143 0.125 0.500 0.000 0.125 2.226<br />

11 0.167 0.250 0.250 0.250 0.167 0.500 0.125 0.500 0.333 0.333 0.000 2.875<br />

Σ 1.885 2.825 3.667 2.825 1.885 3.533 1.561 2.169 2.892 2.892 2.169 28.301<br />

o Σ(SzΔ): 270.5;<br />

o Σ(SzΔ) 2 : 1188;<br />

o ΣA(SzΔ): 60.5;<br />

o ΣA(SzΔ) 2 : 242;<br />

o Matricea SzΔ:<br />

SzΔ 1 2 3 4 5 6 7 8 9 10 11 Σ<br />

1 0 8 2 8 2 3 5 5 6 6 5 50<br />

2 2 0 2 2 2 3 4 5 5 5 5 35<br />

3 8 8 0 8 8 5 6 7 6 6 7 69<br />

4 2 2 2 0 2 3 4 5 5 5 5 35<br />

5 2 8 2 8 0 3 5 5 6 6 5 50<br />

6 7 7 6 7 7 0 8 7 8 8 7 72<br />

7 6 6 3 6 6 3 0 8 7 7 8 60<br />

8 5 6 4 6 5 2 3 0 8 8 2 49<br />

9 5 5 3 5 5 3 2 3 0 2 3 36<br />

10 5 5 3 5 5 3 2 3 2 0 3 36<br />

11 5 6 4 6 5 2 3 2 8 8 0 49<br />

Σ 47 61 31 61 47 30 42 50 61 61 50 541<br />

o Σ(RSzΔ): 13.9767857;<br />

o Σ(RSzΔ) 2 : 3.3592857;<br />

o ΣA(RSzΔ): 3.308(3);<br />

o ΣA(RSzΔ) 2 : 0.78(3);<br />

o Matricea RSzΔ:<br />

RSzΔ 1 2 3 4 5 6 7 8 9 10 11 Σ<br />

1 0.000 0.125 0.500 0.125 0.500 0.333 0.200 0.200 0.167 0.167 0.200 2.517<br />

2 0.500 0.000 0.500 0.500 0.500 0.333 0.250 0.200 0.200 0.200 0.200 3.383<br />

3 0.125 0.125 0.000 0.125 0.125 0.200 0.167 0.143 0.167 0.167 0.143 1.486<br />

4 0.500 0.500 0.500 0.000 0.500 0.333 0.250 0.200 0.200 0.200 0.200 3.383<br />

5 0.500 0.125 0.500 0.125 0.000 0.333 0.200 0.200 0.167 0.167 0.200 2.517<br />

6 0.143 0.143 0.167 0.143 0.143 0.000 0.125 0.143 0.125 0.125 0.143 1.399<br />

7 0.167 0.167 0.333 0.167 0.167 0.333 0.000 0.125 0.143 0.143 0.125 1.869<br />

8 0.200 0.167 0.250 0.167 0.200 0.500 0.333 0.000 0.125 0.125 0.500 2.567<br />

9 0.200 0.200 0.333 0.200 0.200 0.333 0.500 0.333 0.000 0.500 0.333 3.133<br />

10 0.200 0.200 0.333 0.200 0.200 0.333 0.500 0.333 0.500 0.000 0.333 3.133<br />

11 0.200 0.167 0.250 0.167 0.200 0.500 0.333 0.500 0.125 0.125 0.000 2.567<br />

Σ 2.735 1.918 3.667 1.918 2.735 3.533 2.858 2.377 1.918 1.918 2.377 27.954<br />

÷ Produsul Hadamard a două matrici H(·,·):<br />

o Definiţie: H(A,B)i,j=Ai,j·Bi,j;<br />

o Aplicaţii:<br />

Hadamard CJD CJΔ CFD CFΔ SzD SzΔ<br />

D H(D,CJD) H(D,CJΔ) H(D,CFD)H(D,CFΔ) H(D,SzD) H(D,SzΔ)<br />

Δ H(Δ,CJD) H(Δ,CJΔ) H(Δ,CFD) H(Δ,CFΔ) H(Δ,SzD) H(Δ,SzΔ)<br />

o Indici pe matricile Hadamard:<br />

105


H(·,·) Σ(·) Σ(·) 2 ΣA(·) ΣA(·) 2 Σ(1/(·)) Σ(1/(·)) 2 ΣA(1/(·)) 2 ΣA(1/(·)) 2<br />

H(D,CJD) 600 6954 60.5 242 7.971 1.315 3.308 0.783<br />

H(D,CJΔ) 347 2491 27.5 63 19.834 10.582 9.493 7.652<br />

H(D,CFD) 622 7616 60.5 242 7.717 1.278 3.308 0.783<br />

H(D,CFΔ) 349 2571 27.5 63 19.813 10.580 9.493 7.652<br />

H(D,SzD) 756 13048 60.5 242 7.389 1.250 3.308 0.783<br />

H(D,SzΔ) 769 13500 60.5 242 7.333 1.238 3.308 0.783<br />

H(Δ,CJD) 1292 32244 258.5 4718 3.574 0.255 0.896 0.075<br />

H(Δ,CJΔ) 653 6885 104.5 702 7.676 1.243 2.252 0.412<br />

H(Δ,CFD) 1338 35082 258.5 4718 3.437 0.244 0.896 0.075<br />

H(Δ,CFΔ) 655 6965 104.5 702 7.655 1.241 2.252 0.412<br />

H(Δ,SzD) 1564 51568 258.5 4718 3.189 0.224 0.896 0.075<br />

H(Δ,SzΔ) 1592 53560 258.5 4718 3.166 0.222 0.896 0.075<br />

÷ Produsul Schultz a două matrici S(·,A,·):<br />

o Definiţie: S(X,A,Y)i,j=X(A+Y);<br />

o Aplicaţii:<br />

Schultz CJD CJΔ CFD CFΔ SzD SzΔ<br />

A S(A,A,CJD) S(A,A,CJΔ) S(A,A,CFD) S(A,A,CFΔ) S(A,A,SzD) S(A,A,SzΔ)<br />

D S(D,A,CJD) S(D,A,CJΔ) S(D,A,CFD) S(D,A,CFΔ) S(D,A,SzD) S(D,A,SzΔ)<br />

Δ S(Δ,A,CJD) S(Δ,A,CJΔ) S(Δ,A,CFD) S(Δ,A,CFΔ) S(Δ,A,SzD) S(Δ,A,SzΔ)<br />

o Indici pe matricile Schultz:<br />

S(·,A,·) Σ(·) Σ(·) 2 ΣA(·) ΣA(·) 2 Σ(1/(·)) Σ(1/(·)) 2 ΣA(1/(·)) 2 ΣA(1/(·)) 2<br />

S(A,A,CJD) 550.5 4833.5 61 248 8.76175 1.31487 3.47024 0.72197<br />

S(A,A,CJΔ) 341.5 1987.5 35 59 16.89960 6.16609 8.11905 4.48810<br />

S(A,A,CFD) 565.5 5205.5 64 292 8.46774 1.26196 3.41607 0.70670<br />

S(A,A,CFΔ) 342.5 2003.5 35 59 16.81627 6.14526 8.11905 4.48810<br />

S(A,A,SzD) 628.5 6339.5 61 248 7.90838 1.13978 3.47024 0.72197<br />

S(A,A,SzΔ) 638.5 7171.5 63 342 7.49169 1.45677 3.43849 1.08596<br />

S(D,A,CJD) 6358.5 728779 1215 137976 0.57811 0.00663 0.13649 0.00177<br />

S(D,A,CJΔ) 3573.5 217760 712 45023 1.01352 0.01929 0.22652 0.00467<br />

S(D,A,CFD) 6576 764461 1278.5 147548 0.55208 0.00590 0.12597 0.00145<br />

S(D,A,CFΔ) 3591 219152 718.5 45529 1.00766 0.01898 0.22338 0.00450<br />

S(D,A,SzD) 7440 1002756 1515.5 219149 0.49894 0.00496 0.11222 0.00123<br />

S(D,A,SzΔ) 7786 1016184 1548.5 208403 0.47479 0.00423 0.10478 0.00102<br />

S(Δ,A,CJD) 13560.5 3120452 2446 527736 0.27149 0.00139 0.06576 0.00039<br />

S(Δ,A,CJΔ) 7227.5 887001 1330 150684 0.50828 0.00483 0.12147 0.00126<br />

S(Δ,A,CFD) 14022 3290896 2598.5 573094 0.25910 0.00124 0.06093 0.00032<br />

S(Δ,A,CFΔ) 7255 890817 1339.5 151878 0.50613 0.00476 0.12055 0.00123<br />

S(Δ,A,SzD) 15724 4220049 2992.5 802176 0.23648 0.00106 0.05506 0.00028<br />

S(Δ,A,SzΔ) 15684 4367127 2991.5 792573 0.23389 0.00108 0.05216 0.00025<br />

Polinoame<br />

Polinoamele au aplicaţii importante în topologia moleculară. Următoarele polinoame sunt <strong>de</strong>finite:<br />

÷ Polinomul caracteristic (ChP) asociat unui graf G [Bolboacă SD, Jäntschi L. 2007. How Good<br />

the Characteristic Polynomial Can Be for Correlations? Int J Mol Sci 8(4):335-345] se obţine pe<br />

baza matricii <strong>de</strong> adiacenţă A=A(G) astfel: ChP(G,X)=<strong>de</strong>t[XI-A(G)]<br />

÷ Polinoamele <strong>de</strong> numărare (CDi, CMx, CcM, CSz, CCf) se <strong>de</strong>finesc astfel [Jäntschi L. 2007.<br />

Characteristic and Counting Polynomials of Nonane Isomers. Cluj: Aca<strong>de</strong>micDirect, p. 101]:<br />

C(G,M,X) = Σk≥0|{Mi,j , |Mi,j| = k}|X k , un<strong>de</strong> M=D, Mx, cM, Sz, Cf.<br />

În tabelul 10 este redată matricea caracteristică, iar în Tabelele 11-15 sunt redate matricile <strong>de</strong><br />

numărare CDi, CMx, CcM, CSz, CCf asociate grafului molecular din Tabelul 9.<br />

106


Tabelul 10. Matricea caracteristică a grafului molecular din Tabelul 9<br />

[Ch] 1 2 3 4 5 6 7 8 9 10 11<br />

1 X -1 0 0 -1 0 0 0 0 0 0<br />

2 -1 X -1 0 0 0 0 0 0 0 0<br />

3 0 -1 X -1 0 -1 0 0 0 0 0<br />

4 0 0 -1 X -1 0 0 0 0 0 0<br />

5 -1 0 0 -1 X 0 0 0 0 0 0<br />

6 0 0 -1 0 0 X 0 0 -1 -1 0<br />

7 0 0 0 0 0 0 X -1 0 0 -1<br />

8 0 0 0 0 0 0 -1 X -1 0 0<br />

9 0 0 0 0 0 -1 0 -1 X 0 0<br />

10 0 0 0 0 0 -1 0 0 0 X -1<br />

11 0 0 0 0 0 0 -1 0 0 -1 X<br />

ChP X 11 - 12X 9 + 51X 7 - 2X 6 - 95X 5 + 12X 4 + 78X 3 - 18X 2 - 23X 1 + 8<br />

Tabelul 11. Matricea <strong>de</strong> numărare pe distanţe a grafului molecular din Tabelul 9<br />

[Di] 1 2 3 4 5 6 7 8 9 10 11<br />

1 0 1 2 2 1 3 6 5 4 4 5<br />

2 1 0 1 2 2 2 5 4 3 3 4<br />

3 2 1 0 1 2 1 4 3 2 2 3<br />

4 2 2 1 0 1 2 5 4 3 3 4<br />

5 1 2 2 1 0 3 6 5 4 4 5<br />

6 3 2 1 2 3 0 3 2 1 1 2<br />

7 6 5 4 5 6 3 0 1 2 2 1<br />

8 5 4 3 4 5 2 1 0 1 3 2<br />

9 4 3 2 3 4 1 2 1 0 2 3<br />

10 4 3 2 3 4 1 2 3 2 0 1<br />

11 5 4 3 4 5 2 1 2 3 1 0<br />

CDi 4X 6 + 12X 5 + 18X 4 + 22X 3 + 30X 2 + 24X 1 + 11<br />

Tabelul 12. Matricea fragmentelor maximale pentru graful molecular din Tabelul 9<br />

[Mx] 1 2 3 4 5 6 7 8 9 10 11<br />

1 1 3 4 5<br />

6 7 8 9<br />

2 2 3 4 5<br />

6 7 8 9<br />

10 11<br />

3 2 3 4 5<br />

6 7 8 9<br />

10 11<br />

4 2 3 4 5<br />

6 7 8 9<br />

10 11<br />

5 2 3 4 5<br />

6 7 8 9<br />

10 11<br />

6 2 3 4 5<br />

6 7 8 9<br />

10 11<br />

7 2 3 4 5<br />

6 7 8 9<br />

10 11<br />

10 11<br />

1 3 4 5<br />

6 7 8 9<br />

10 11<br />

1 3 4 5<br />

6 7 8 9<br />

10 11<br />

1 3 4 5<br />

6 7 8 9<br />

10 11<br />

1 3 4 5<br />

6 7 8 9<br />

10 11<br />

1 3 4 5<br />

6 7 8 9<br />

10 11<br />

1 2 4<br />

5<br />

1 2 4<br />

5<br />

1 2 4<br />

5<br />

1 2 4<br />

5<br />

6 7 8<br />

9 10<br />

11<br />

6 7 8<br />

9 10<br />

11<br />

1 2 3 5<br />

6 7 8 9<br />

10 11<br />

1 2 3 5<br />

6 7 8 9<br />

10 11<br />

1 2 3 5<br />

6 7 8 9<br />

10 11<br />

1 2 3 5<br />

6 7 8 9<br />

10 11<br />

1 2 3 5<br />

6 7 8 9<br />

10 11<br />

1 2 3 5<br />

6 7 8 9<br />

10 11<br />

1 2 3 4<br />

6 7 8 9<br />

10 11<br />

1 2 3 4<br />

6 7 8 9<br />

10 11<br />

1 2 3 4<br />

6 7 8 9<br />

10 11<br />

1 2 3 4<br />

6 7 8 9<br />

10 11<br />

1 2 3 4<br />

6 7 8 9<br />

10 11<br />

1 2 3 4<br />

6 7 8 9<br />

10 11<br />

1 2 3<br />

4 5<br />

1 2 3<br />

4 5<br />

1 2 3<br />

4 5<br />

1 2 3<br />

4 5<br />

1 2 3<br />

4 5<br />

7 8 9<br />

10<br />

11<br />

107<br />

1 2 3 4<br />

5 6 8 9<br />

10 11<br />

1 2 3 4<br />

5 6 8 9<br />

10 11<br />

1 2 3 4<br />

5 6 8 9<br />

10 11<br />

1 2 3 4<br />

5 6 8 9<br />

10 11<br />

1 2 3 4<br />

5 6 8 9<br />

10 11<br />

1 2 3 4<br />

5 6 8 9<br />

10 11<br />

1 2 3 4<br />

5 6 7 9<br />

10 11<br />

1 2 3 4<br />

5 6 7 9<br />

10 11<br />

1 2 3 4<br />

5 6 7 9<br />

10 11<br />

1 2 3 4<br />

5 6 7 9<br />

10 11<br />

1 2 3 4<br />

5 6 7 9<br />

10 11<br />

1 2 3 4<br />

5 6 7 9<br />

10 11<br />

1 2 3 4<br />

5 6 7 9<br />

10 11<br />

1 2 3 4<br />

5 6 7 8<br />

10 11<br />

1 2 3 4<br />

5 6 7 8<br />

10 11<br />

1 2 3 4<br />

5 6 7 8<br />

10 11<br />

1 2 3 4<br />

5 6 7 8<br />

10 11<br />

1 2 3 4<br />

5 6 7 8<br />

10 11<br />

1 2 3 4<br />

5 6 7 8<br />

10 11<br />

1 2 3 4<br />

5 6 7 8<br />

10 11<br />

1 2 3 4<br />

5 6 7 8<br />

9 11<br />

1 2 3 4<br />

5 6 7 8<br />

9 11<br />

1 2 3 4<br />

5 6 7 8<br />

9 11<br />

1 2 3 4<br />

5 6 7 8<br />

9 11<br />

1 2 3 4<br />

5 6 7 8<br />

9 11<br />

1 2 3 4<br />

5 6 7 8<br />

9 11<br />

1 2 3 4<br />

5 6 7 8<br />

9 11<br />

1 2 3 4<br />

5 6 7 8<br />

9 10<br />

1 2 3 4<br />

5 6 7 8<br />

9 10<br />

1 2 3 4<br />

5 6 7 8<br />

9 10<br />

1 2 3 4<br />

5 6 7 8<br />

9 10<br />

1 2 3 4<br />

5 6 7 8<br />

9 10<br />

1 2 3 4<br />

5 6 7 8<br />

9 10<br />

1 2 3 4<br />

5 6 7 8<br />

9 10


8 2 3 4 5<br />

6 7 8 9<br />

10 11<br />

9 2 3 4 5<br />

6 7 8 9<br />

10 11<br />

10 2 3 4 5<br />

6 7 8 9<br />

10 11<br />

11 2 3 4 5<br />

6 7 8 9<br />

10 11<br />

1 3 4 5<br />

6 7 8 9<br />

10 11<br />

1 3 4 5<br />

6 7 8 9<br />

10 11<br />

1 3 4 5<br />

6 7 8 9<br />

10 11<br />

1 3 4 5<br />

6 7 8 9<br />

10 11<br />

6 7 8<br />

9 10<br />

11<br />

6 7 8<br />

9 10<br />

11<br />

6 7 8<br />

9 10<br />

11<br />

6 7 8<br />

9 10<br />

11<br />

1 2 3 5<br />

6 7 8 9<br />

10 11<br />

1 2 3 5<br />

6 7 8 9<br />

10 11<br />

1 2 3 5<br />

6 7 8 9<br />

10 11<br />

1 2 3 5<br />

6 7 8 9<br />

10 11<br />

1 2 3 4<br />

6 7 8 9<br />

10 11<br />

1 2 3 4<br />

6 7 8 9<br />

10 11<br />

1 2 3 4<br />

6 7 8 9<br />

10 11<br />

1 2 3 4<br />

6 7 8 9<br />

10 11<br />

7 8 9<br />

10<br />

11<br />

7 8 9<br />

10<br />

11<br />

7 8 9<br />

10<br />

11<br />

7 8 9<br />

10<br />

11<br />

108<br />

1 2 3 4<br />

5 6 8 9<br />

10 11<br />

1 2 3 4<br />

5 6 8 9<br />

10 11<br />

1 2 3 4<br />

5 6 8 9<br />

10 11<br />

1 2 3 4<br />

5 6 8 9<br />

10 11<br />

1 2 3 4<br />

5 6 7 9<br />

10 11<br />

1 2 3 4<br />

5 6 7 9<br />

10 11<br />

1 2 3 4<br />

5 6 7 9<br />

10 11<br />

1 2 3 4<br />

5 6 7 8<br />

10 11<br />

1 2 3 4<br />

5 6 7 8<br />

10 11<br />

1 2 3 4<br />

5 6 7 8<br />

10 11<br />

1 2 3 4<br />

5 6 7 8<br />

9 11<br />

1 2 3 4<br />

5 6 7 8<br />

9 11<br />

1 2 3 4<br />

5 6 7 8<br />

9 11<br />

1 2 3 4<br />

5 6 7 8<br />

9 10<br />

1 2 3 4<br />

5 6 7 8<br />

9 10<br />

1 2 3 4<br />

5 6 7 8<br />

9 10<br />

CMx 90X 10 + 6X 6 + 10X 5 + 4X 4 +11<br />

Tabelul 13. Matricea fragmentelor complement-maximale pentru graful molecular din Tabelul 9<br />

[cM] 1 2 3 4 5 6 7 8 9 10 11<br />

1 2 3 6 7 8 9 10 11456 7 8 9 10 1178910 11<br />

2 1 3 6 7 8 9 10 11456 7 8 9 10 1178910 11<br />

3 1 2 456 7 8 9 10 1178910 11<br />

4 1 2 3 6 7 8 9 10 11 56 7 8 9 10 1178910 11<br />

5 1 2 3 6 7 8 9 10 114 6 7 8 9 10 1178910 11<br />

6 1 2 1 2 3 4 5 4 5 7 8 9 10 11<br />

7 1 2 1 2 3 4 5 4 5 1 2 3 4 5 6 8 9 10 11<br />

8 1 2 1 2 3 4 5 4 5 1 2 3 4 5 6 7 9 10 11<br />

9 1 2 1 2 3 4 5 4 5 1 2 3 4 5 6 7 8 10 11<br />

10 1 2 1 2 3 4 5 451 2 3 4 5 6 789 11<br />

11 1 2 1 2 3 4 5 4 5 1 2 3 4 5 6 7 8 9 10<br />

CcM 4X 7 + 10X 6 + 6X 5 + 90X 1 + 11<br />

Tabelul 14. Matricea fragmentelor Szged pentru graful molecular din Tabelul 9<br />

[Sz] 1 2 3 4 5 6 7 8 9 10 11<br />

1 1 5 1 5 1 2 1 2 1 2 1 2 3 4 1 2 3 4 1 2 4 5 1 2 4 5 1 2 3 4<br />

5 5 5<br />

5<br />

2 2 3 6 7 1 2 1 2 2 3 6 7 1 2 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4<br />

8 9 10<br />

8 9 10 5 5 6 5 5 5 5<br />

11<br />

11<br />

3 3 4 6 7 3 4 6 7 2 3 6 7 2 3 6 7 1 2 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4<br />

8 9 10 8 9 10 8 9 10 8 9 10 3 4 5 6 5 6 10 5 5 5 6 9<br />

11 11<br />

11 11 5<br />

4 3 4 6 7 4 5 4 5 3 4 6 7 1 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4<br />

8 9 10<br />

8 9 10 5 5 6 5 5 5 5<br />

11<br />

11<br />

5 4 5 4 5 1 5 1 5 1 4 1 2 3 4 1 2 3 4 1 2 4 5 1 2 4 5 1 2 3 4<br />

5 5 5<br />

5<br />

6 3 6 7 8 6 7 8 9 6 7 8 6 7 8 9 3 6 7 8 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4<br />

9 10 11 10 11 9 10 10 11 9 10 11 5 6 9 5 6 10 5 6 10 5 6 8 9 5 6 9<br />

11<br />

10<br />

11<br />

7 7 8 9 10 7 8 9 7 8 11 7 8 9 7 8 9 7 8 7 10 11 7 11 7 8 7 8 9<br />

11 10 11 10 11 10 11 11<br />

8 6 7 8 9 7 8 9 7 8 9 7 8 9 6 7 8 9 7 8 1 2 3 4 7 8 11 7 8 9 8 9<br />

10 11 11 11 11 10 11 5 6 8 9<br />

9 6 7 8 9 6 7 8 9 7 8 9 6 7 8 9 6 7 8 9 7 8 1 2 3 4 1 2 3 4 8 9 1 2 3 4<br />

10 11 10 11 10 11 10 11 9 5 6 9 5 6 9<br />

5 6 8 9


10 6 7 8 9<br />

10 11<br />

11 6 7 8 9<br />

10 11<br />

6 7 8 9<br />

10 11<br />

7 8 10<br />

11<br />

7 10<br />

11<br />

7 8 10<br />

11<br />

6 7 8 9<br />

10 11<br />

7 8 10<br />

11<br />

6 7 8 9<br />

10 11<br />

6 7 8 9<br />

10 11<br />

7 10<br />

11<br />

1 2 3 4<br />

5 6 10<br />

7 11 1 2 3 4<br />

5 6 10<br />

11<br />

10<br />

1 2 3 4 10 11 1 2 3 4<br />

5 6 10<br />

5 6 9<br />

11<br />

10<br />

10 11 7 10 11 7 8 11<br />

CSz 17X 8 + 8X 7 + 18X 6 + 21X 5 + 10X 4 + 16X 3 + 20X 2 + 11<br />

Tabelul 15. Matricea fragmentelor Cluj pentru graful molecular din Tabelul 9<br />

[Cf] 1 2 3 4 5 6 7 8 9 10 11<br />

1 1 5 1 5 1 2 1 2 1 4 1 4 5 1 4 5 1 4 5 1 4 5 1 4 5<br />

2 2 3 6 7<br />

8 9 10<br />

11<br />

3 3 4 6 7<br />

8 9 10<br />

11<br />

4 3 4 6 7<br />

8 9 10<br />

11<br />

3 4 6 7<br />

8 9 10<br />

11<br />

1 2 1 2 2 3 6 7<br />

8 9 10<br />

2 3 6 7<br />

8 9 10<br />

11<br />

11<br />

2 3 6 7<br />

8 9 10<br />

11<br />

4 5 4 5 3 4 6 7<br />

8 9 10<br />

11<br />

5<br />

1 2<br />

4 5<br />

1 2<br />

3 4<br />

5<br />

1 2<br />

4 5<br />

1 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5<br />

1 2 3 4<br />

5<br />

1 2 3 4<br />

5<br />

1 2 3 4<br />

5<br />

1 2 3 4<br />

5<br />

1 2 3 4<br />

5<br />

1 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5<br />

5 4 5 4 5 1 5 1 5 1 2<br />

5<br />

1 2 5 1 2 5 1 2 5 1 2 5 1 2 5<br />

6 6 7 8 9 6 7 8 9 6 7 8 6 7 8 9 6 7 8 9 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4<br />

10 11 10 11 9 10 10 11 10 11 5 6 10 5 6 10 5 6 10 5 6 8 9 5 6 9<br />

11<br />

11<br />

7 7 10 11 7 10 11 7 10<br />

11<br />

7 10 11 7 10 11 7 11 7 10 11 7 11 7 8 7 8 9<br />

8 7 8 10 7 8 10 7 8 10 7 8 10 7 8 10 7 8 1 2 3 4 7 8 11 8 9 8 9<br />

11 11 11 11 11<br />

5 6 8 9<br />

9 7 8 9 10<br />

11<br />

10 7 8 9 10<br />

11<br />

7 8 9 10<br />

11<br />

7 8 9 10<br />

11<br />

7 8 9<br />

10 11<br />

7 8 9<br />

10 11<br />

11 7 8 9 11 7 8 9 11 7 8 9<br />

11<br />

7 8 9 10<br />

11<br />

7 8 9 10<br />

11<br />

7 8 9 10<br />

11<br />

7 8 9 10<br />

11<br />

7 8<br />

9<br />

7 10<br />

11<br />

1 2 3 4<br />

5 6 9<br />

1 2 3 4<br />

5 6 10<br />

7 8 9 11 7 8 9 11 7 11 1 2 3 4<br />

5 6 10<br />

11<br />

1 2 3 4<br />

5 6 9<br />

10<br />

1 2 3 4<br />

5 6 10<br />

8 9 1 2 3 4<br />

5 6 9<br />

10 11 1 2 3 4<br />

5 6 9<br />

10<br />

10 11 10 11 7 8 11<br />

CCf 14X 8 + 7X 7 + 5X 6 + 16X 5 + 22X 4 + 23X 3 + 23X 2 +11<br />

Chimie Cuantică<br />

Se bazează pe mo<strong>de</strong>lul ondulatoriu al mecanicii atomilor şi moleculelor propus <strong>de</strong> Schrödinger în<br />

1926 [An Undulatory Theory of the Mechanics of Atoms and Molecules, Phys Rev, 28(6), 1049-1070].<br />

Două forme ale ecuaţiei lui Schrödinger sunt folosite (una <strong>de</strong>pen<strong>de</strong>ntă <strong>de</strong> timp şi cealaltă<br />

in<strong>de</strong>pen<strong>de</strong>ntă <strong>de</strong> timp), dintre care ecuaţia in<strong>de</strong>pen<strong>de</strong>ntă <strong>de</strong> timp (EΨ = ĤΨ) răspun<strong>de</strong> problematicii<br />

structurii chimice la echilibru, şi anume:<br />

÷ Un<strong>de</strong> sunt electronii şi nucleele unei molecule localizaţi în spaţiu? - şi din răspunsul la această<br />

întrebare <strong>de</strong>rivă o serie <strong>de</strong> consecinţe cum sunt: configuraţia, conformaţia, mărimea, forma, etc.<br />

÷ Sub un set dat <strong>de</strong> condiţii (<strong>de</strong> mediu) care sunt energiile (atomilor şi moleculelor)? - şi din<br />

răspunsul la această întrebare rezultă o serie <strong>de</strong> proprietăţi moleculare: căldura <strong>de</strong> formare,<br />

stabilitatea conformaţională, reactivitatea chimică, proprietăţile spectrale, etc.<br />

109


Termodinamica stabileşte relaţii cantitative între variabile macroscopice (volum, presiune,<br />

temperatură, concentraţie) ce <strong>de</strong>finesc un sistem fizico-chimic <strong>de</strong> proporţii mari, comparativ cu<br />

dimensiunile corpusculilor constituenţi (atomi, molecule, etc.). Tipul <strong>de</strong> sistem este <strong>de</strong>terminat <strong>de</strong><br />

caracteristicile suprafeţei <strong>de</strong> separare:<br />

÷ sistem <strong>de</strong>schis / închis - materia poate fi / nu poate fi transferată prin suprafaţa <strong>de</strong> separare;<br />

o sistemele închise şi <strong>de</strong>schise pot schimba energie cu mediul înconjurător;<br />

÷ sistem izolat - sistem închis care nu este în contact mecanic şi termic cu mediul înconjurător;<br />

÷ proces - transformare <strong>de</strong> stare (dilatare, răcire) sau transformare în starea fizică (topire,<br />

solidificare) sau transformare chimică complexă (se formează noi substanţe).<br />

÷ lucru este efectuat <strong>de</strong> sistem dacă în urma unui proces rezultă o energie cu care poate fi ridicată<br />

o greutate în mediu.<br />

Energia unui sistem poate varia şi ca urmare a unui transfer <strong>de</strong> căldură:<br />

÷ proces exoterm - proces în care se <strong>de</strong>gajă energie sub formă <strong>de</strong> căldură;<br />

÷ proces endoterm - proces care absoarbe energie sub formă <strong>de</strong> căldură;<br />

÷ proces adiabatic - proces care se <strong>de</strong>sfăşoară într-un sistem izolat adiabatic;<br />

o suprafeţele <strong>de</strong> separare adiabatice - nu permit transferul <strong>de</strong> căldură;<br />

Mişcarea haotică a moleculelor se numeşte mişcare termică. Din punct <strong>de</strong> ve<strong>de</strong>re molecular,<br />

lucrul este transferul <strong>de</strong> energie datorită mişcării ordonate. Distincţia între căldură şi lucru se<br />

realizează în mediu. Din punct <strong>de</strong> ve<strong>de</strong>re molecular, cele două noţiuni pot fi <strong>de</strong>finite astfel:<br />

÷ Lucrul este transferul <strong>de</strong> energie ce foloseşte mişcarea ordonată a atomilor din mediu;<br />

÷ Căldura este transferul <strong>de</strong> energie ce foloseşte mişcarea termică a atomilor din mediu.<br />

Principiul I al termodinamicii introduce noţiunea <strong>de</strong> energie internă:<br />

÷ Energia internă U este energia totală a unui sistem. Ea este o funcţie <strong>de</strong> stare: ΔU = Uf - Ui<br />

÷ U este o funcţie <strong>de</strong> proprietăţile care <strong>de</strong>termină starea sistemului la un moment dat şi<br />

in<strong>de</strong>pen<strong>de</strong>ntă <strong>de</strong> calea prin care s-a ajuns la starea respectivă: U = U(n,p,...)<br />

÷ Căldura şi lucrul sunt căi echivalente pentru variaţia energiei interne a unui sistem. Dacă un<br />

sistem este izolat <strong>de</strong> mediul înconjurător atunci nu are loc nici o variaţie <strong>de</strong> energie internă, sau,<br />

nu există nici o maşină care efectuează lucru mecanic fără consum energetic (perpetuum mobile<br />

<strong>de</strong> speţa I): energia internă a unui sistem izolat este constantă (Principiul I);<br />

Formularea principiului I nu menţionează căldura, însă o implică şi permite o <strong>de</strong>finire a căldurii pe<br />

baza lucrului.<br />

Fie două stări ale unui sistem, U1 şi U2 şi fie două transformări, una adiabatică şi una oarecare.<br />

Pentru transformarea adiabatică avem (conservarea energiei pentru sistem): ΔU = U2 - U1 = wad iar<br />

pentru transformarea oarecare avem (conservarea energiei pentru sistem): ΔU = U2 - U1 = w + q,<br />

un<strong>de</strong> q este cantitatea <strong>de</strong> energie neexplicată prin lucru sau energie internă. Diferenţa wad-w este<br />

pusă pe seama căldurii absorbite <strong>de</strong> sistem (conservarea energiei pentru mediu): q = wad - w, <strong>de</strong><br />

un<strong>de</strong>: q = ΔU - w. Concluzionând, variaţia <strong>de</strong> energie internă ΔU <strong>de</strong>pin<strong>de</strong> <strong>de</strong> energia transferată<br />

unui sistem sub formă <strong>de</strong> căldură q şi lucrul efectuat asupra unui sistem w prin: ΔU = q + w. Dacă<br />

se consi<strong>de</strong>ră variaţii infinitezimale, avem: dU = dq + dw. Transformarea pe care o suferă sistemul<br />

este cvasistatică dacă mişcarea sa este atât <strong>de</strong> lentă comparativ cu procesele care disipează energie<br />

şi materie în mediu încât peste tot în sistem presiunea şi temperatura sunt in<strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> spaţiu<br />

(pot fi însă <strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> timp).<br />

Dacă <strong>de</strong>scompunem dw în dw = dwe + dwexp un<strong>de</strong> dwexp lucrul mecanic <strong>de</strong> expansiune şi dwe un<br />

lucru mecanic suplimentar necauzat <strong>de</strong> expansiune, atunci: dU = dq + dwe + dwexp. Astfel, pentru<br />

sistemele ce evoluează la volum constant dwexp = 0; pentru sistemele care nu efectuează nici un fel<br />

<strong>de</strong> lucru (electric, optic, etc) şi dwe = 0; în aceste condiţii: dU = dq (la volum constant, fără lucru<br />

suplimentar). Pentru o transformare finită: ΔU = q, <strong>de</strong>ci prin măsurarea energiei primite <strong>de</strong> la un<br />

sistem la volum constant sub formă <strong>de</strong> căldură (q>0) sau obţinută <strong>de</strong> el sub formă <strong>de</strong> căldură (q


Astfel, adaptând principiul I al termodinamicii la condiţiile menţionate mai sus, a luat naştere o<br />

nouă funcţie <strong>de</strong> stare numită entalpie, care se notează cu H şi care însumează energia internă cu<br />

lucrul mecanic necesar pentru ocuparea <strong>de</strong> către sistem a volumului său propriu V la presiunea <strong>de</strong><br />

lucru p: H = U + pV. O variaţie <strong>de</strong> entalpie este egală cu căldura absorbită la temperatură constantă<br />

<strong>de</strong> către sistem atâta timp cât sistemul nu efectuează şi lucru suplimentar: dH = dq = dU (la presiune<br />

constantă, fără lucru suplimentar). Pentru o transformare finită: ΔH = qv,p.<br />

Proprietăţile unei probe in<strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> modul în care se obţine proba se numesc funcţii <strong>de</strong> stare.<br />

Ele pot fi privite ca fiind funcţie <strong>de</strong> alţi parametri fundamentali, ca presiunea, temperatura şi<br />

volumul, care <strong>de</strong>scriu starea curentă a sistemului. Energia internă, entalpia şi capacitatea calorică<br />

sunt funcţii <strong>de</strong> stare. Proprietăţile legate <strong>de</strong> prepararea stării se numesc funcţii <strong>de</strong> drum. Lucrul<br />

efectuat pentru prepararea unei stări, energia transferată sub formă <strong>de</strong> căldură sunt funcţii <strong>de</strong> drum.<br />

Lucrul şi căldura sunt funcţii <strong>de</strong> proces. Exprimând acum matematic această afirmaţie, avem:<br />

2<br />

2<br />

∫ 2 1<br />

∫<br />

2 1<br />

1<br />

1<br />

ΔU = dU = U − U , dU diferenţială exactă; ΔH = dH = H − H , dH diferenţială exactă<br />

Prin diferenţială exactă înţelegem o mărime infinitezimală care prin integrare conduce la un rezultat<br />

in<strong>de</strong>pen<strong>de</strong>nt <strong>de</strong> drumul dintre starea iniţială şi finală. Astfel:<br />

q = ∫ dq , dq diferenţială inexactă; w = ∫ dw , dw diferenţială inexactă<br />

γ [ 1,<br />

2]<br />

Prin diferenţială inexactă înţelegem o mărime infinitezimală care prin integrare conduce la un<br />

rezultat care <strong>de</strong>pin<strong>de</strong> <strong>de</strong> drumul dintre starea iniţială şi finală.<br />

Fie o funcţie <strong>de</strong> stare f = f(x,y) şi z o altă funcţie <strong>de</strong> stare z = z(x,y). Avem:<br />

⎛ f f ⎞<br />

⎜<br />

⎛ ∂ ⎞ ⎛ ∂ ⎞<br />

⎜ ⎟ dx + ⎜ ⎟ dy ⎟<br />

2 2<br />

∂ f ∂ f ⎛ ∂f<br />

⎞ ⎜ ⎝ ∂x<br />

⎠y<br />

⎝ ∂y<br />

⎠x<br />

⎟ ⎛ ∂f<br />

⎞ ⎛ ∂f<br />

⎞ ⎛ ∂y<br />

⎞<br />

= ⇒ ⎜ ⎟ =<br />

= ⎜ ⎟ + ⎜ ⎟ ⋅⎜<br />

⎟<br />

∂x∂y<br />

∂y∂x<br />

x ⎜<br />

z<br />

∂x<br />

⎟<br />

⎝ ∂ ⎠<br />

⎝ ∂x<br />

⎠y<br />

⎝ ∂y<br />

⎠ x x ⎝ ∂ ⎠z<br />

⎜<br />

⎟<br />

⎜<br />

⎟<br />

⎝<br />

⎠<br />

⎛ ∂x<br />

⎞ ⎛ ∂y<br />

⎞ ⎛ ∂x<br />

⎞ ⎛ ∂x<br />

⎞ ⎛ ∂y<br />

⎞ ⎛ ∂x<br />

⎞ ⎛ ∂y<br />

⎞ ⎛ ∂z<br />

⎞<br />

⎜ ⎟ = 1 ⎜ ⎟ , ⎜ ⎟ = −⎜<br />

⎟ ⋅⎜<br />

⎟ , ⎜ ⎟ ⋅⎜<br />

⎟ ⋅⎜<br />

⎟ = −1<br />

⎝ ∂y<br />

⎠ x z ⎝ ∂y<br />

⎠ z<br />

z ⎝ ∂ ⎠y<br />

⎝ ∂z<br />

⎠x<br />

⎝ ∂y<br />

⎠ z x x<br />

z ⎝ ∂ ⎠ ⎝ ∂<br />

z ⎝ ∂ ⎠<br />

⎠y<br />

Următoarea relaţie ne spune dacă df = g(x,y)dx + h(x,y)dy este sau nu o diferenţială totală (adică<br />

provine dintr-o funcţie <strong>de</strong> stare):<br />

⎛ ∂g<br />

⎞ ⎛ ∂h<br />

⎞<br />

df = g(x,y)dx + h(x,y)dy diferenţială totală ⇔ ⎜ ⎟ = ⎜ ⎟<br />

⎝ ∂y<br />

⎠ x<br />

x ⎝ ∂ ⎠y<br />

Primele studii asupra unei maşini termice care ar funcţiona după un ciclu format din patru etape<br />

reversibile: (a) dilatare izotermă (T = TA); (b) dilatare adiabatică (q = 0); (c) comprimare izotermă<br />

(T = TC); (d) comprimare adiabatică (q = 0), au fost efectuate <strong>de</strong> inginerul francez Sadi Carnot. Se<br />

numeşte ciclu Carnot, un ciclu format din cele patru etape reversibile (a), (b), (c) şi (d). Se numeşte<br />

maşină Carnot o maşină care ar funcţiona după un ciclu Carnot.<br />

Exprimând lucrul şi energia în cele patru transformări, ţinând seama <strong>de</strong> evoluţia sistemului:<br />

÷ ΔUAB = 0; qAB = -wAB; wAB = - ∫ - ⋅<br />

VB<br />

VB<br />

p dV = nRTA ⋅ ln<br />

V<br />

VC<br />

÷ qBC = 0; wBC = - p dV = ΔUBC; ΔUBC = CV(TC-TB)<br />

∫ ⋅<br />

V<br />

B<br />

VD<br />

÷ ΔUCD = 0; qCD = -wCD; wCD = - p dV = -<br />

V<br />

A<br />

∫ ⋅<br />

V<br />

C<br />

γ [ 1,<br />

2]<br />

V<br />

nRTC ⋅ ln<br />

V<br />

VA<br />

÷ qDA = 0; wDA = - p dV = ΔUDA; ΔUDA = CV(TB-TC)<br />

∫ ⋅<br />

V<br />

D<br />

111<br />

A<br />

D<br />

C<br />

z


Ţinând cont că se <strong>de</strong>fineşte randamentul unei maşini termice prin η=Lefectuat/qabsorbită, exprimând<br />

randamentul pentru un ciclu Carnot, ciclu format din cele patru etape reversibile:<br />

VC<br />

TC<br />

⋅ ln<br />

w AB + w CD − w AB + w CD qAB − qCD<br />

qCD<br />

VD<br />

TC<br />

η = =<br />

= = 1 - = 1−<br />

= 1-<br />

q<br />

V<br />

AB<br />

qAB<br />

qAB<br />

qAB<br />

B TA<br />

⋅ ln<br />

TA<br />

VA<br />

În expresia randamentului ciclului Carnot se poate observa că dacă temperatura sursei reci ar fi 0K<br />

(TC = 0K) atunci randamentul este ηCarnot = 1 (perpetuum mobile <strong>de</strong> speţa a II-a). Condiţia ca<br />

maşina Carnot să funcţioneze este ca TA > TC (pentru TC = TA ⇒ ηCarnot = 0).<br />

Unele procese au loc natural, <strong>de</strong> la sine, altele nu. Un gaz se dilată pentru a umple volumul<br />

disponibil, un corp cald se răceşte la temperatura mediului său înconjurător, iar o reacţie chimică<br />

<strong>de</strong>curge <strong>de</strong> preferinţă într-o anumită direcţie.<br />

Sensul transformărilor spontane este sensul care nu necesită efectuarea unui lucru pentru realizarea<br />

procesului.<br />

Se poate aduce un gaz la volum mai mic, se poate răci şi se pot aduce unele reacţii să <strong>de</strong>curgă în<br />

sens invers (electroliza apei) dar nici unul dintre aceste procese nu are loc spontan; fiecare se poate<br />

produce numai prin efectuarea unui lucru.<br />

Distincţia între cele două tipuri <strong>de</strong> procese, spontane şi nespontane formează obiectul principiului<br />

al doilea al termodinamicii: nu este posibil un proces al cărui unic rezultat este absorbţia <strong>de</strong> căldură<br />

<strong>de</strong> la un rezervor şi transformarea sa completă în lucru. Într-un sistem izolat sensul unui proces nu<br />

poate fi <strong>de</strong>terminat <strong>de</strong> energia sa totală. Principiul I stabileşte că energia se conservă şi nu se poate<br />

afirma că în orice proces sistemul tin<strong>de</strong> către o stare cu minim <strong>de</strong> energie, <strong>de</strong>oarece într-un sistem<br />

izolat energia totală este constantă. Când are loc un proces, energia totală a unui sistem izolat<br />

rămâne constantă, însă se distribuie în moduri diferite. Astfel, se poate corela sensul <strong>de</strong> <strong>de</strong>sfăşurare<br />

a proceselor cu modul <strong>de</strong> distribuire a energiei.<br />

Astfel, procesele spontane sunt întot<strong>de</strong>auna însoţite <strong>de</strong> o disipare a energiei într-o formă mai<br />

<strong>de</strong>zordonată.<br />

Principiul I a condus la introducerea energiei interne U. Energia internă ca funcţie <strong>de</strong> stare ne<br />

permite să stabilim dacă un proces este posibil; într-un sistem izolat pot avea loc numai acele<br />

procese (reprezentate în diagrama energetică U = U(T,V), <strong>de</strong> exemplu) în care energia internă<br />

rămâne constantă (suprafaţa <strong>de</strong> energie internă U constantă). Principiul al II-lea care permite<br />

aprecierea sensului proceselor spontane, poate fi formulat printr-o altă funcţie <strong>de</strong> stare, entropia S.<br />

Entropia arată dacă o stare a unui sistem este accesibilă din alta în mod spontan. Într-un sistem<br />

izolat entropia creşte în procesele spontane ΔStot > 0, un<strong>de</strong> ΔStot este entropia totală a sistemului<br />

izolat care conţine sistemul <strong>de</strong> analizat. Definiţia riguroasă a entropiei se poate face pe baza<br />

termodinamicii statistice.<br />

Pornind <strong>de</strong> la diferite observaţii <strong>de</strong> natură experimentală, Ludwig Boltzmann a propus ca formulă<br />

<strong>de</strong> calcul a entropiei ca grad <strong>de</strong> <strong>de</strong>zordine: S = k·lnW, un<strong>de</strong> k constanta Boltzmann şi W numărul <strong>de</strong><br />

moduri în care se poate rearanja energia sistemului prin rearanjarea atomilor şi a moleculelor pe<br />

diferite stări accesibile. Din <strong>de</strong>finirea entropiei pe baza relaţiei (6.3) rezultă şi unitatea <strong>de</strong> măsură a<br />

ei: SI = JK -1 .<br />

Relaţia dintre variaţiile <strong>de</strong> entropie în mediu şi entalpia <strong>de</strong> reacţie joacă un rol esenţial în<br />

<strong>de</strong>terminarea sensului transformărilor chimice spontane.<br />

Un sistem în contact termic şi mecanic cu mediul său, dStot = dS + dS'. Evoluţia tuturor proceselor<br />

în sistemul izolat format din sistemul observat şi mediul înconjurător este înspre creşterea<br />

<strong>de</strong>zordinii: dStot ≥ 0; egalitatea dStot = 0 (păstrarea <strong>de</strong>zordinii totale constante) se petrece pentru<br />

procesele reversibile (S - funcţie <strong>de</strong> stare) aşa încât: dS ≥ -dS', aşa încât: dS≥dq/T - inegalitatea lui<br />

Clausius.<br />

Se introduc alte două funcţii termodinamice <strong>de</strong> energie, numite potenţiale termodinamice:<br />

÷ Energie liberă Helmholtz: A = U - TS;<br />

÷ Entalpie liberă Gibbs: G = H - TS.<br />

112


Din formula sa <strong>de</strong> <strong>de</strong>finiţie dS = dqrev/T nu rezultă că entropia S este o funcţie <strong>de</strong> stare. Pentru a<br />

<strong>de</strong>monstra acest fapt, trebuie să <strong>de</strong>monstrăm că:<br />

dq<br />

= 0<br />

∫ γ]<br />

[<br />

rev<br />

T<br />

Fie un ciclu Carnot. Căldura cedată (qc) şi absorbită (qa) se exprimă prin:<br />

VD<br />

VB<br />

qc = nRTC ⋅ln<br />

; qa = nRTA ⋅ln<br />

VC<br />

VA<br />

Variaţia <strong>de</strong> entropie pe traseul [ABCDA] este:<br />

dq rev dq rev dqrev<br />

dqrev<br />

dqrev<br />

| qa<br />

| | qc<br />

|<br />

∫ =∫ +<br />

T T ∫ +<br />

T ∫ +<br />

T ∫ = - = 0<br />

T TA<br />

T<br />

[ ABCDA]<br />

[ AB]<br />

[ BC]<br />

[ CD]<br />

[ DA]<br />

C<br />

În cazul general al unui proces reversibil, acesta poate fi <strong>de</strong>scompus într-o serie <strong>de</strong> cicluri Carnot,<br />

astfel:<br />

dqrev<br />

dqrev<br />

∫ = ∑ T ∫ = ∑ 0 = 0<br />

[ γ]<br />

γ T<br />

i [ γi<br />

]<br />

γi Variaţia entropiei cu temperatura este dată <strong>de</strong>:<br />

dq<br />

ΔSAB =<br />

∫<br />

[ AB]<br />

şi exprimă faptul că valoarea variaţiei entropiei într-un proces oarecare între stările A şi B se<br />

regăseşte efectuând o transformare reversibilă între A şi B şi măsurând căldura necesară.<br />

Se combină principiul I cu al II-lea, pentru a se obţine pentru o transformare reversibilă următoarea<br />

relaţie:<br />

dU = dqrev + dwrev; dwrev = -pdV; dqrev = TdS; dU = TdS - pdV<br />

O observaţie foarte importantă este că valoarea dU este in<strong>de</strong>pen<strong>de</strong>ntă <strong>de</strong> drum, <strong>de</strong>ci in<strong>de</strong>pen<strong>de</strong>ntă<br />

<strong>de</strong> faptul că transformarea este reversibilă sau nu, aşa încât este a<strong>de</strong>vărată pentru orice tip <strong>de</strong><br />

transformare. Această ecuaţie se numeşte ecuaţia fundamentală a termodinamicii.<br />

Alegem acum alte două variabile <strong>de</strong> stare in<strong>de</strong>pen<strong>de</strong>nte care să caracterizeze starea unui sistem, S şi<br />

V. Exprimăm funcţia <strong>de</strong> stare U în raport cu acestea: U = U(S,V). În mod analog se obţine:<br />

⎛ ∂U<br />

⎞ ⎛ ∂U<br />

⎞<br />

dU = ⎜ ⎟⎠ dS + ⎜ ⎟⎠ dV<br />

⎝ ∂S<br />

V ⎝ ∂V<br />

S<br />

Prin simpla i<strong>de</strong>ntificare <strong>de</strong> coeficienţi în ecuaţiile diferenţiale rezultă că la compoziţie constantă (n<br />

= const.) avem:<br />

⎛ ∂U<br />

⎞ ⎛ ∂U<br />

⎞<br />

⎜ ⎟⎠ = T, ⎜ ⎟⎠ = - p<br />

⎝ ∂S<br />

V ⎝ ∂V<br />

S<br />

Deoarece U este funcţie <strong>de</strong> stare, rezultă relaţiile lui Maxwell:<br />

⎛ ∂T<br />

⎞ ⎛ ∂p<br />

⎞ ⎛ ∂T<br />

⎞ ⎛ ∂V<br />

⎞ ⎛ ∂p<br />

⎞ ⎛ ∂S<br />

⎞ ⎛ ∂V<br />

⎞ ⎛ ∂S<br />

⎞<br />

⎜ ⎟⎠ = - ⎜ ⎟⎠ ; ⎜ ⎟⎠ = ⎜ ⎟⎠ ; ⎜ ⎟⎠ = ⎜ ⎟⎠ ; ⎜ ⎟⎠ = - ⎜ ⎟⎠<br />

⎝ ∂V<br />

S ⎝ ∂S<br />

V ⎝ ∂p<br />

S<br />

p<br />

S ⎝ ∂ p ⎝ ∂T<br />

V ⎝ ∂V<br />

T ⎝ ∂T<br />

p ⎝ ∂ T<br />

La T = 0 toată mişcarea termică este îngheţată şi într-un cristal perfect toate particulele sunt dispuse<br />

într-o aranjare uniformă, regulată. Absenţa <strong>de</strong>zordinii spaţiale şi mişcării termice face ca S = 0.<br />

Acest fapt este în acord cu formula Boltzmann, întrucât dacă W = 1 atunci<br />

S = 0. Chiar dacă S ≠ 0 la T = 0, pentru o fază F a unei substanţe entropia sa SF(T) tin<strong>de</strong> la valoarea<br />

sa minimă, SF(0). Acest fapt se poate exprima prin teorema calorică a lui Nernst:<br />

Nernst: ΔS → 0 când T → 0<br />

Formula Boltzmann şi teorema Nernst (7.26) pun bazele pentru formularea Principiului III:<br />

Dacă entropia S a fiecărui element în starea sa cea mai stabilă la T = 0 se ia 0, atunci orice<br />

substanţă are S ≥ 0 şi S = 0 pentru substanţele perfect cristaline (inclusiv compuşii).<br />

O serie <strong>de</strong> programe soft au fost <strong>de</strong>zvoltate pentru mo<strong>de</strong>larea structurii moleculare bazată pe calcule<br />

<strong>de</strong> mecanică cuantică şi semiempirice, unele fiind în platformă open-source, altele free-to-use, şi<br />

altele fiind comerciale:<br />

113<br />

rev<br />

T


÷ AMPAC (commercial);<br />

÷ Cerius2 (commercial);<br />

÷ Chem3D (commercial);<br />

÷ Corina (commercial);<br />

÷ <strong>de</strong>Mon2k (free-to-use);<br />

÷ GAMESS (open-source);<br />

÷ GAUSSIAN (commercial);<br />

÷ HyperChem (commercial);<br />

÷ Insight II (commercial);<br />

÷ Jaguar (commercial);<br />

÷ MOE (commercial);<br />

÷ MOLDEN (open-source);<br />

÷ Molecular Mo<strong>de</strong>ling Pro (commercial);<br />

÷ MOPAC (free-to-use);<br />

÷ MPQC (open-source);<br />

÷ NWChem (open-source);<br />

÷ Octopus (open-source);<br />

÷ PCMo<strong>de</strong>l (commercial);<br />

÷ SCHRÖDINGER (commercial);<br />

÷ Spartan (commercial);<br />

÷ StoBe (commercial);<br />

÷ Sybyl (commercial).<br />

Chimie Medicală<br />

Primele evi<strong>de</strong>nţe <strong>de</strong> chimie medicală se găsesc în lucrarea lui Richet din 1893 [C R Seances Soc Biol<br />

Fil 45:775-776]: care formulează prima relaţie lipofilicitate -activitate şi care observă cantitativ că<br />

"plus ils sont solubles, moins ils sont toxiques";<br />

Hansch printr-o serie <strong>de</strong> lucrări în perioada 1962-1964 pune bazele QSAR, aducând 3 contribuţii<br />

esenţiale pentru domeniu:<br />

÷ combinarea mai multor parametrii fizico-chimici într-o singură ecuaţie <strong>de</strong> regresie;<br />

÷ <strong>de</strong>finirea parametrului <strong>de</strong> lipofilicitate π;<br />

÷ Formularea mo<strong>de</strong>lului parabolic pentru relaţia neliniară între lipofilicitate şi activitatea<br />

biologică;<br />

Enzima<br />

Cavitatea<br />

alosterică<br />

Efector<br />

alosteric<br />

Datorită<br />

schimbării<br />

conformaţionale<br />

a cavităţii active<br />

reacţia enzimatică<br />

este inhibată<br />

Absenţa<br />

reacţiei<br />

enzimatice<br />

Nu se poate<br />

lega substratul<br />

Reacţia<br />

enzimatică<br />

Cavitatea<br />

activă<br />

Substrat<br />

Are loc reacţia<br />

enzimatică<br />

Legarea<br />

substratului<br />

Căile biosintetice pot fi controlate cu ajutorul inhibiţiei <strong>de</strong> reacţie inversă, ceea ce înseamnă că<br />

114


produsul final al întregului lanţ metabolic inhibă activitatea primei enzime din lanţ (nu din genă).<br />

Dacă prima reacţie nu mai are loc, enzimele următoare sunt "înfometate" <strong>de</strong> substrat, şi produsul<br />

final nu mai este sintetizat. Produsul final se aşează pe prima enzimă într-o cavitate diferită <strong>de</strong><br />

cavitatea activă. Această a doua regiune se numeşte cavitate alosterică. Aşezarea efectorului<br />

alosteric schimbă structura tridimensională a proteinei şi în special conformaţia cavităţii active.<br />

Astfel, substratul nu se mai poate aşeza în cavitatea activă şi reacţia enzimatică este inhibată până<br />

când inhibitorul <strong>de</strong> reacţie inversă nu părăseşte cavitatea alosterică.<br />

Metabolismul zaharurilor în organism este extrem <strong>de</strong> esenţial pentru viaţă. În figura următoare este<br />

redat metabolismul glucozei:<br />

Dizahari<strong>de</strong><br />

Lactat<br />

Glicogen (animale)<br />

Amidon (plante)<br />

anabolism<br />

catabolism<br />

calea fosfogluconatului<br />

glucogeneză<br />

aerobic<br />

Glucoză Piruvat Acetil-CoA<br />

glicoliză<br />

ATP + NADH + H +<br />

anaerobic, în muşchi<br />

anaerobic, în drojdie<br />

Riboză-5-fosfat + NADPH + H +<br />

Etanol<br />

Măsurarea proprietăţilor bilogice <strong>de</strong>termină modalitatea <strong>de</strong> prelucrare şi interpretare a datelor<br />

obţinute. Operaţia <strong>de</strong> măsurare se poate efectua doar cu ajutorul unei scări <strong>de</strong> măsură. Din acest<br />

ultim unghi <strong>de</strong> ve<strong>de</strong>re a problematicii măsurătorii rezultă că măsurătoarea este direct asociată cu<br />

tipul scării <strong>de</strong> măsură. Aşa cum rezultă din ce expuse mai sus, cât <strong>de</strong> exactă este o măsurătoare este<br />

la fel <strong>de</strong> important ca valoarea măsurătorii înseşi. Din acest motiv atunci când se exprimă valoarea<br />

unei măsurători aceasta este însoţită <strong>de</strong> precizie, în diferite forme <strong>de</strong> exprimare ale acesteia. Măsura<br />

referă o mărime supusă observaţiei. Din acest punct <strong>de</strong> ve<strong>de</strong>re, mărimile se clasifică în mărimi<br />

calitative şi mărimi cantitative.<br />

O mărime este calitativă dacă pentru aceasta nu poate fi (sau cel puţin nu există) <strong>de</strong>finită o scară <strong>de</strong><br />

valori cel puţin ordonată. Dacă scara <strong>de</strong> valori a unei mărimi admite o relaţie <strong>de</strong> ordine (strictă) între<br />

elementele acesteia atunci mărimea este cantitativă.<br />

Un exemplu. Să consi<strong>de</strong>răm o mulţime cu 2 elemente în care ordinea elementelor nu este relevantă:<br />

C = {a,b}. Mulţimea submulţimilor acestei mulţimi este SC = {{},{a},{b},{a,b}}. O relaţie <strong>de</strong><br />

ordine în mulţimea SC este <strong>de</strong>finită prin numărul <strong>de</strong> elemente (cardinalitatea) al submulţimii. Încă<br />

<strong>de</strong> la început să remarcăm că relaţia <strong>de</strong> ordine cardinalitate nu este o relaţie <strong>de</strong> ordine strictă,<br />

existând două submulţimi cu acelaşi număr <strong>de</strong> elemente: |{a}| = |{b}| = 1. Relaţie <strong>de</strong> ordine strictă<br />

există între 0 = |{}| < |{a}| = 1 = |{b}| < |{a,b}| = 2.<br />

O întrebare se ridică acum: "Ce fel <strong>de</strong> scală <strong>de</strong> măsură <strong>de</strong>fineşte cardinalitatea?" şi pentru a afla<br />

răspunsul trebuie să ne întoarcem la observaţie şi anume să ne punem întrebarea "Ce caracteristică<br />

se doreşte a fi evaluată?". Dacă răspunsul la această a doua întrebare este numărul <strong>de</strong> elemente al<br />

submulţimii observate, atunci într-a<strong>de</strong>văr mărimea măsurată este cantitativă, având submulţimea cu<br />

0 elemente care este evi<strong>de</strong>nt mai mică <strong>de</strong>cât submulţimile cu 1 element şi care sunt evi<strong>de</strong>nt mai<br />

mici <strong>de</strong>cât submulţimea cu 2 elemente. Dacă se doreşte diferenţierea submulţimilor mulţimii C,<br />

atunci cu siguranţă că măsura cardinalitate nu este corect aleasă. Putem să ne concentrăm atenţia<br />

(observăm) însă numai mulţimile cu exact 1 element, pentru care măsura cardinalitate nu<br />

diferenţiază: {a} şi {b}. În acest caz ne aflăm într-o situaţie tipică <strong>de</strong> măsură calitativă, exprimată<br />

prin "Submulţimea conţine elementul 'a'?", întrebare al cărui răspuns în exemplul <strong>de</strong> mai sus este<br />

complementar cu răspunsul la întrebarea "Submulţimea conţine elementul 'b'?".<br />

115


Exemplul <strong>de</strong> mai sus a arătat cel puţin că procedura <strong>de</strong> <strong>de</strong>finire a unei scale <strong>de</strong> măsură trebuie cel<br />

puţin verificată din punct <strong>de</strong> ve<strong>de</strong>re al consistenţei, sau, dacă scala este <strong>de</strong>ja <strong>de</strong>finită (cum a fost<br />

cazul cardinalităţii), se impune cel puţin verificarea consistenţei acesteia în raport cu mărimea<br />

observată şi scopul urmărit. Mai mult, tot din exemplul <strong>de</strong> mai sus rezultă că chiar în absenţa unei<br />

relaţii <strong>de</strong> ordine între valorile măsurate ({a} şi {b}) pot exista însă alte tipuri <strong>de</strong> relaţii între valorile<br />

măsurate (în cazul <strong>de</strong> mai sus, este complementul logic, {a} = {a,b}\{b}; {b} = {a,b}\{a}), ceea ce<br />

face ca valorile unei mărimi calitative să nu fie in<strong>de</strong>pen<strong>de</strong>nte.<br />

O scală <strong>de</strong> măsură este nominală dacă între valorile acesteia nu se poate <strong>de</strong>fini o relaţie <strong>de</strong> ordine.<br />

De aici rezultă că în mod uzual scala <strong>de</strong> măsură nominală este caracteristică mărimilor calitative.<br />

În cadrul scalelor <strong>de</strong> măsură nominale, un caz extrem <strong>de</strong> importantă este scala (<strong>de</strong> măsură)<br />

binomială formată din doar două valori (între care nu există relaţie <strong>de</strong> ordine) cum ar fi: {Da, Nu},<br />

{Viu, Mort}, {Vivo, Vitro}, {Prezent, Absent}, {Alcan saturat, Alt tip <strong>de</strong> compus}, {Număr întreg,<br />

Număr neîntreg}.<br />

O caracteristică extrem <strong>de</strong> importantă a scalelor nominale este că ele au un număr finit <strong>de</strong> elemente<br />

(valori) şi aşa cum am observat şi în cazul mărimilor calitative indiferent <strong>de</strong> numărul acestora, între<br />

ele există o legătură <strong>de</strong> complementaritate. Astfel, pentru o scală <strong>de</strong> măsură nominală formată din<br />

grupele sangvine {0, A, B, AB} o valoare care este diferită <strong>de</strong> oricare 3 din cele 4 valori este cu<br />

siguranţă a 4-a dintre acestea. Scala <strong>de</strong> măsură nominală care nu este binomială se mai numeşte şi<br />

scală <strong>de</strong> măsură multinomială.<br />

O serie finită <strong>de</strong> valori poate să constituie o scală ordinală dacă elementele acesteia se află într-o<br />

relaţie <strong>de</strong> ordine. Astfel, <strong>de</strong> exemplu valorile {Prezent, Absent} enumerate între exemplele <strong>de</strong> scală<br />

binomială pot <strong>de</strong>veni scală ordinală dacă între valorile "Prezent" şi "Absent" se <strong>de</strong>fineşte o relaţie<br />

<strong>de</strong> ordine ("Absent" < "Prezent"). Alte astfel <strong>de</strong> exemple sunt "Fals" < "A<strong>de</strong>vărat", 0 < 1, "Negativ"<br />

< "Nenegativ", "Nepozitiv" < "Pozitiv". Dintre exemplele <strong>de</strong> scale <strong>de</strong> măsură cu 3 valori unul este<br />

imediat: "Negativ" < "Zero" < "Pozitiv".<br />

Ceea ce <strong>de</strong>osebeşte suplimentar o scală ordinală <strong>de</strong> o scală nominală este faptul că nu este necesar<br />

ca scala ordinală să fie formată dintr-un număr finit (sau cunoscut) <strong>de</strong> elemente. Este necesar însă<br />

ca intre ele să existe o relaţie <strong>de</strong> ordine <strong>de</strong>finită cel puţin printr-o funcţie "Succesor" al unei valori şi<br />

complementul acesteia "Pre<strong>de</strong>cesor".<br />

În scala interval distanţa între atribute are o semnificaţie. De exemplu la măsurarea temperaturii,<br />

distanţa între 30° şi 40° este aceeaşi cu distanţa între 70° şi 80°. Intervalul între valori este<br />

interpretabil (are o semnificaţie fizică). Acesta este motivul pentru care are sens să calculăm media<br />

unei variabile <strong>de</strong> tip interval, ceea ce nu se aplică la scalele ordinale. Aşa cum 80° nu reprezintă <strong>de</strong><br />

două ori mai cald <strong>de</strong>cât 40°, pe scalele interval nu are sens raportul a două valori.<br />

În final, pe scala raport există tot<strong>de</strong>auna valoarea 0 care are semnificaţie. În mod evi<strong>de</strong>nt<br />

construcţia unei scale raport presupune că cea mai mică valoare care se poate observa este 0.<br />

Aceasta înseamnă că întot<strong>de</strong>auna se poate evalua raportul a două măsuri pe o scală raport, aceasta<br />

fiind <strong>de</strong> asemenea o scală raport.<br />

Este important <strong>de</strong> notat că calitatea unei scale <strong>de</strong> măsură nu dă şi acurateţea <strong>de</strong> măsură, sau<br />

<strong>de</strong>nsitatea valorilor posibile ale unei variabile în jurul valorii măsurate. Astfel, chiar dacă frecvent<br />

folosim ipoteza că o variabilă este continuă (între oricare două valori măsurate teoretic există cel<br />

puţin încă o valoare) în practică se întâmplă <strong>de</strong>seori ca valoarea intermediară a cărei existenţă este<br />

presupusă (sau <strong>de</strong>monstrată teoretic sau practic) să nu poată fi observată (măsurată) datorită<br />

preciziei <strong>de</strong> care dispunem în măsură. Este <strong>de</strong> notat <strong>de</strong>ci că tipul scalei <strong>de</strong> măsură nu dă şi caracterul<br />

variabilei măsurate. Se pot la fel <strong>de</strong> bine măsura variabile discrete pe scale <strong>de</strong> măsură raport cum se<br />

pot măsura şi variabilele continue.<br />

Astfel, din punct <strong>de</strong> ve<strong>de</strong>re al tipului scalei <strong>de</strong> măsură, o variabilă care numără moleculele dintr-un<br />

set <strong>de</strong> date este "la fel <strong>de</strong>" variabilă raport ca o variabilă care măsoară temperatura la care aceste<br />

molecule se află în mediul ambiant sau trec <strong>de</strong> la starea <strong>de</strong> agregare solidă la cea lichidă.<br />

În tabelul 16 este redată o scară <strong>de</strong> măsură relativă (cu o singură referinţă), în care se exprimă<br />

cantitatea <strong>de</strong> dulce a zaharurilor.<br />

116


Tabelul 16. Cât <strong>de</strong> dulci sunt zaharurile<br />

Zahar Dulceaţă relativă la sucroză<br />

lactoză 0.16<br />

galactoză 0.32<br />

maltoză 0.33<br />

sucroză 1.00<br />

fructoză 1.73<br />

aspartam 180<br />

zaharină 450<br />

În figura <strong>de</strong> mai jos este reprezentată entropia scalelor <strong>de</strong> măsură în termeni <strong>de</strong> organizare a<br />

informaţiei.<br />

Binare<br />

Nominale<br />

Ordinale<br />

Interval<br />

<strong>Raport</strong><br />

Figura exprimă o serie <strong>de</strong> proprietăţi ale scalelor <strong>de</strong> măsură. Astfel, mulţimea scalelor <strong>de</strong> măsură<br />

binomiale este cea mai largă, cuprinzând scalele nominale. Demonstraţia acestui fapt este uşor <strong>de</strong><br />

făcut. Admiţând că avem la dispoziţie o scală nominală cu 3 categorii, atunci se pot <strong>de</strong>fini pe baza<br />

acesteia 3 scale binomiale, fiecare verificând apartenenţa măsurabilei la una din cele 3 categorii.<br />

Mulţimea scalelor ordinale este inclusă în mulţimea scalelor nominale. Admiţând că avem la<br />

dispoziţie o scală ordinală, renunţând la relaţia <strong>de</strong> ordine <strong>de</strong>ja am construit scala <strong>de</strong> măsură<br />

nominală asociată. În mod i<strong>de</strong>ntic, având la dispoziţie o scală interval, o putem segmenta pe aceasta<br />

într-un număr arbitrar <strong>de</strong> subintervale şi cu ajutorul acestor subintervale construim una din scalele<br />

ordinale asociate scalei interval.<br />

O proprietate importantă rezultă din incluziunea scalelor <strong>de</strong> măsură, şi anume incluziunea<br />

instrumentelor statistice (testelor statistice) cu pe care le avem la dispoziţie să caracterizăm sau<br />

investigăm mărimile măsurate. Presupunând că am înregistrat valorile variabilei X cu o scală <strong>de</strong><br />

măsură atunci toate statisticile care se pot aplica variabilei X în ipoteza că a fost măsurată cu o scală<br />

<strong>de</strong> măsură care o conţine pe cea utilizată, se aplică în egală măsură şi observaţiei cu scala <strong>de</strong> măsură<br />

utilizată, care, <strong>de</strong>sigur, oferă în plus o serie <strong>de</strong> statistici care nu se aplică <strong>de</strong>cât acestei scale şi celor<br />

pe care le inclu<strong>de</strong>.<br />

La fiecare nivel <strong>de</strong> incluziune, nivelul curent inclu<strong>de</strong> <strong>de</strong>ci toate calităţile ale mulţimilor mai mari şi<br />

aduce ceva în plus, reducând entropia scalei <strong>de</strong> măsură. În mod evi<strong>de</strong>nt, tot<strong>de</strong>auna este <strong>de</strong> dorit ca în<br />

observarea unei variabile să se folosească acea scală <strong>de</strong> măsură care înglobează cele mai multe<br />

caracteristici pe care variabila observată le prezintă, cum tot atât <strong>de</strong> important (sau mai important)<br />

este ca anumite atribute pe care le produce scala să fie proprii variabile şi să nu fie create în mod<br />

artificial <strong>de</strong> măsură, în caz contrar scala <strong>de</strong> măsură <strong>de</strong>venind o sursă <strong>de</strong> eroare.<br />

O serie <strong>de</strong> baze <strong>de</strong> date cumulează evi<strong>de</strong>nţe <strong>de</strong> chimie medicală. Grupate pe categorii, acestea sunt:<br />

÷ Conţinând date <strong>de</strong> efect biologic:<br />

÷ AmicBase;<br />

÷ Biocatalysis/Bio<strong>de</strong>gradation DB;<br />

÷ Carcinogenic Potency Project;<br />

÷ ChemBank;<br />

÷ Drug Data Report DB;<br />

÷ EDKB;<br />

÷ FDA Toxicity DBs;<br />

÷ ISS Chemical Carcinogens;<br />

÷ Leadscope Toxicity DB;<br />

÷ NIH NIEHS National Toxicology Program;<br />

117


÷ NIH NCI DBs (CambridgeSoft, CCC, MDL, DayLight);<br />

÷ Prous Science DBs;<br />

÷ PubChem;<br />

÷ RTECS (MDL, NIOSH);<br />

÷ US EPA DSSTox;<br />

÷ Vitic;<br />

÷ Conţinând biopolimeri:<br />

÷ ASEdb;<br />

÷ 3DID;<br />

÷ BID;<br />

÷ BOND;<br />

÷ BRITE;<br />

÷ DIP;<br />

÷ EMPIRE;<br />

÷ GRID;<br />

÷ iHOP;<br />

÷ IntAct;<br />

÷ InterDom;<br />

÷ KDBI;<br />

÷ MiMI;<br />

÷ MINT;<br />

÷ MPPI;<br />

÷ NuRISITE;<br />

÷ Orientation of Proteins in Membranes;<br />

÷ POINT;<br />

÷ ProtCom;<br />

÷ SNAPPI-DB;<br />

÷ SPIN-PP;<br />

÷ STRING;<br />

÷ UniHI;<br />

÷ Domain Motions;<br />

÷ molmovdb;<br />

÷ ProMo<strong>de</strong>;<br />

÷ PCDDB;<br />

÷ PPD;<br />

÷ Conţinând compuşi chimici şi medicamente:<br />

÷ Available Chemicals Directory (DayLight);<br />

÷ Cambridge Structural DB;<br />

÷ CCCBDB;<br />

÷ CenterWatch;<br />

÷ Drug Directories;<br />

÷ ChemDB;<br />

÷ ChemExper;<br />

÷ ChemFin<strong>de</strong>r;<br />

÷ ChemIDPlus;<br />

÷ chEBI;<br />

÷ ChEMnetBASE;<br />

÷ ClogP of Selected Drugs;<br />

÷ Comprehensive Medicinal Chemistry DB;<br />

118


÷ CSLS;<br />

÷ Cyberlipid Center;<br />

÷ DrugBank;<br />

÷ Drug Data Report;<br />

÷ Data & Property Calculation Websites;<br />

÷ EPA Chemical Registry System;<br />

÷ ESIS;<br />

÷ FDA Databases;<br />

÷ FDA Toxicity Databases / Leadscope;<br />

÷ FooDBank;<br />

÷ Handbook of Chemistry and Physics;<br />

÷ Henry's Law Constants;<br />

÷ Investigational Drugs DB;<br />

÷ iResearch;<br />

÷ Landolt-Börnstein;<br />

÷ LDB;<br />

÷ Leadscope Known Drugs;<br />

÷ Ligand.Info;<br />

÷ LiqCryst;<br />

÷ LogKow;<br />

÷ MDPI;<br />

÷ MedChem;<br />

÷ Merck In<strong>de</strong>x;<br />

÷ Metabolite DB;<br />

÷ NIST Online DBs (Gateway);<br />

÷ NLM SIS;<br />

÷ NCI DIS 3D DB;<br />

÷ Organic Compounds DB;<br />

÷ PhRMA New Medicines DB;<br />

÷ PhysProp DB;<br />

÷ Screening Compounds Directory;<br />

÷ SickList;<br />

÷ Solubility DB (IUPAC-NIST);<br />

÷ SRC Pointer File;<br />

÷ Stability Constants DB (IUPAC);<br />

÷ Super Drug Database;<br />

÷ World Drug In<strong>de</strong>x (DayLight);<br />

÷ ZINC;<br />

÷ Conţinând date <strong>de</strong> mediu:<br />

÷ ATSDR HazDat Database;<br />

÷ Environmental Fate DB;<br />

÷ Environmental Fate of Chemicals;<br />

÷ US EPA's IRIS;<br />

÷ Pestici<strong>de</strong> DB;<br />

÷ U.S. EPA TSCA (Cornell, DayLight, SRC);<br />

÷ Conţinând afinităţi <strong>de</strong> legătură:<br />

÷ AffinDB;<br />

÷ BindingDB;<br />

÷ Binding MOAD;<br />

119


÷ ChemBank;<br />

÷ DLRP;<br />

÷ KiBank;<br />

÷ PDBbind;<br />

÷ PDSP Drug Ki DB;<br />

÷ PubChem;<br />

÷ SCORPIO (structure-calorimetry);<br />

÷ SMID;<br />

÷ WOMBAT;<br />

÷ eF-site;<br />

÷ LigBase;<br />

÷ MSDsite;<br />

÷ PDBSite;<br />

÷ PINTS;<br />

÷ PRECISE;<br />

÷ pvSOAR;<br />

÷ Relibase;<br />

÷ sc-PDB;<br />

÷ SitesBase;<br />

÷ SMIDSuite;<br />

÷ SuMo;<br />

÷ Super Ligands;<br />

÷ Conţinând structuri şi proprietăţi ligand-receptor:<br />

÷ BioMagResBank;<br />

÷ CAZy;<br />

÷ FireDB;<br />

÷ IceDB;<br />

÷ IMB;<br />

÷ LPC/CSU;<br />

÷ Luna;<br />

÷ Macromolecular Structures DB (till 1999);<br />

÷ mmdb;<br />

÷ MSD;<br />

÷ NDB;<br />

÷ NIH CMM Links;<br />

÷ nrpdb;<br />

÷ OCA;<br />

÷ PDB;<br />

÷ PDBj;<br />

÷ PDBSelect;<br />

÷ PDBsum;<br />

÷ Planet;<br />

÷ PRECISE;<br />

÷ PROCAT;<br />

÷ RCSB DBs;<br />

÷ RECOORD;<br />

÷ SCOP;<br />

÷ Si<strong>de</strong>-Chain Interactions;<br />

÷ SPIN-PP;<br />

120


÷ STING Millenium Suite;<br />

÷ wwPDB;<br />

÷ XPDB;<br />

÷ Conţinând date <strong>de</strong> QSAR şi toxicogenomică:<br />

÷ MedChem QSAR DB;<br />

÷ ArrayExpress;<br />

÷ ArrayTrack;<br />

÷ Chemical Effects in Biological Systems.<br />

2008A2. Analiza rezultatelor obţinute şi interpretarea rezultatelor<br />

Analiza complexităţii mo<strong>de</strong>lelor structură-activitate, complexitate datorată volumului mare <strong>de</strong><br />

mo<strong>de</strong>le fizice <strong>de</strong> interacţiune posibile pentru un anume mo<strong>de</strong>l <strong>de</strong> structură moleculară şi volumului<br />

mare <strong>de</strong> modalităţi <strong>de</strong> obţinere (semi)cantitativă a activităţii biologice observate a impus ca soluţie<br />

<strong>de</strong> analiză şi interpretare a rezultatelor folosirea unui algoritm genetic, metodă euristică inspirată din<br />

natură şi teoria evoluţiei. O serie <strong>de</strong> rezultate au fost capitalizate în publicaţii din analiza cu ajutorul<br />

algoritmilor genetici <strong>de</strong>rulată în cadrul proiectului (Jäntschi & others, 2008-PTGS, Jäntschi &<br />

others, 2009-HPGS, Jäntschi & others, 2010-CAGA; Bolboacă & others, 2010-GAAS).<br />

Analiza cu ajutorul algoritmilor genetici este <strong>de</strong>sfăşurată în continuare.<br />

Grassy şi alţii în 1998 în lucrarea [Computer Assisted Rational Design of Immunosuppressive<br />

Compounds, Nature Biotechnol 16:748-752] raportează căutarea <strong>de</strong> pepdi<strong>de</strong> posedând activitate<br />

imunosupresivă. Aceştia au utilizat 27 <strong>de</strong>scriptori <strong>de</strong> proprietate (12 <strong>de</strong>scriptori <strong>de</strong> chimie<br />

matematică şi 15 <strong>de</strong>scriptori <strong>de</strong> chimie cuantică). S-a generat o librărie combinatorială cu 280000<br />

<strong>de</strong> compuşi după care s-au selectat 26 <strong>de</strong> pepti<strong>de</strong> pentru care o înaltă activitate a fost prezisă cu<br />

ajutorul <strong>de</strong>scriptorilor. 5 dintre aceste pepti<strong>de</strong> au fost sintetizate şi testate experimental. Cea mai<br />

potentă dintre acestea a arătat o activitate imunosupresivă <strong>de</strong> aproximativ 100 <strong>de</strong> ori mai mare <strong>de</strong>cât<br />

compusul <strong>de</strong> referinţă.<br />

Problema integrării informaţiilor <strong>de</strong> natură cuantică (geometria moleculară) cu cele <strong>de</strong> natură<br />

matematică (topologia moleculară) în prezicerea activităţilor biologice (chimia medicală) este o<br />

problemă dificilă şi analiza şi interpretarea rezultatelor necesită implementarea <strong>de</strong> algoritmi metaeuristici.<br />

Lamarck (Lamarck, 1809) după eforturi extraordinare <strong>de</strong> clasificare a organismelor vii, remarcă că<br />

atât în ceea ce priveşte animalele (studiind mai cu seamă animalele nevertebrate) cât şi plantele<br />

clasificarea pe specii şi varietăţi este mai mult sau mai puţin arbitrară, aducând numeroase<br />

argumente în acest sens. Făcând apel la taxonomia mo<strong>de</strong>rnă, astăzi sunt recunoscute 5 domenii, care<br />

mai apoi se subîmpart pe divizii, clase, ordine, familii, genuri şi specii. Însă studiile lui Lamarck<br />

<strong>de</strong>spre specii rămân <strong>de</strong> o <strong>de</strong>osebită importanţă, în ciuda faptului că explicaţia pe care a găsit-o<br />

Lamarck asupra observaţiilor sale bazată pe superstiţiile vremii şi anume că golurile constatate în<br />

schema <strong>de</strong> clasificare a speciilor ar fi în fapt datorată dispariţiei acestora a fost contrazisă ulterior <strong>de</strong><br />

studiile lui Darwin (Darwin, 1859). Chiar şi Darwin a fost influenţat <strong>de</strong> concluziile la care a ajuns<br />

Lamarck, aşa cum nota Fisher în 1954 (Fisher, 1954). Realizările majore ale epocii <strong>de</strong> început a<br />

geneticii sunt completate <strong>de</strong> studiile <strong>de</strong> încrucişare <strong>de</strong> varietăţi ale lui Men<strong>de</strong>l (Men<strong>de</strong>l, 1866)<br />

stabileşte legile care astăzi îi poartă numele, formularea teoriei moştenirii dure care vine să<br />

completeze elementele lipsă lăsate <strong>de</strong> pre<strong>de</strong>cesori (Weismann, 1893), şi în final studiile pe<br />

musculiţa <strong>de</strong> oţet ale lui Morgan (Morgan, 1915) în urma cărora acesta elaborează teoria<br />

cromozomială a moştenirii, care este şi astăzi la baza geneticii mo<strong>de</strong>rne. Nu în ultimul rând se<br />

menţionează studiile <strong>de</strong> o <strong>de</strong>osebită valoare ştiinţifică ale lui Fisher (Fisher, 1918; Fisher, 1922),<br />

care a adus argumente ştiinţifice <strong>de</strong> necontestat (chiar dacă la vremea când acestea au fost scrise <strong>de</strong><br />

către Fisher au fost din plin contestate, aşa cum se poate <strong>de</strong>sprin<strong>de</strong> şi din fragmentele alese pentru<br />

exemplificare) cu privire la originea speciilor şi teoria evoluţionistă.<br />

Rezumând, moştenirea dură (Weismann, 1893) şi uşoară (Lamarck, 1809), selecţia şi supravieţuirea<br />

121


(Darwin, 1859), genele şi încrucişarea genelor (Morgan, 1915) şi caracterelor (Men<strong>de</strong>l, 1866)<br />

în<strong>de</strong>lung <strong>de</strong>zbătute şi disputate <strong>de</strong>-a lungul secolului 19 (Fisher, 1954) constituie toate piese dintrun<br />

puzzle care construieşte astăzi genetica mo<strong>de</strong>rnă (Ayala şi alţii, 1994), şi reprezintă sursele <strong>de</strong><br />

inspiraţie ale algoritmilor genetici.<br />

Primele simulări ale evoluţiei se regăsesc în studiile lui Nils Aall BARRICELLI (Barricelli, 1954).<br />

Puţin timp mai târziu, Alex FRASER (1923-2002) a publicat o serie <strong>de</strong> lucrări <strong>de</strong>spre simularea<br />

selecţiei artificiale a organismelor cu locuşi multipli ce controlează o trăsătură măsurabilă.<br />

Simulările lui Fraser (Fraser, 1957-1970) includ toate elementele esenţiale ale algoritmilor genetici<br />

mo<strong>de</strong>rni.<br />

Uzual, în viaţa noastă <strong>de</strong> zi cu zi la fel ca şi în <strong>cercetare</strong>a ştiinţifică noi operăm cu probleme. În<br />

informatică şi ramurile <strong>de</strong>rivate ale acesteia (cum e cazul bio-informaticii şi chemo-informaticii) o<br />

problemă are o semnificaţie precisă, foarte apropiată cu cea <strong>de</strong> algoritm. Un algoritm este în esenţă<br />

o reţetă specificând ce să facem în anumite condiţii pentru a obţine un anumit obiectiv. Un algoritm<br />

necesită două resurse pentru a rezolva o problemă, şi anume timp (cu sensul <strong>de</strong> timp <strong>de</strong> execuţie,<br />

mărime corelată cu numărul <strong>de</strong> instrucţiuni elementare) şi spaţiu (pentru stocarea datelor <strong>de</strong> intrare<br />

şi a variabilelor).<br />

Nu toate problemele sunt <strong>de</strong> aceeaşi complexitate şi acelaşi lucru este valabil şi pentru algoritmii <strong>de</strong><br />

rezolvare. Astfel, unele probleme au complexitate exponenţială, ceea ce înseamnă că cel mai bun<br />

algoritm rezolvă problema într-un timp <strong>de</strong> execuţie ce creşte exponenţial în funcţie <strong>de</strong> dimensiunea<br />

(volumul, mărimea) datelor <strong>de</strong> intrare. Acest tip <strong>de</strong> probleme sunt numite dificile, <strong>de</strong>oarece chiar şi<br />

cel mai bun algoritm (care există sau ar putea exista) va fi probabil nepractic cu date <strong>de</strong> intrare din<br />

practică (Falkenauer, 1998).<br />

Dacă o problemă este dificilă, atunci căutarea optimului frecvent iese în afara timpului disponibil<br />

pentru aplicaţiile reale. Chiar dacă există această problemă, există totuşi o serie <strong>de</strong> probleme<br />

întâlnite în practică când obţinerea optimului nu este necesară (obligatorie). De cele mai multe ori o<br />

soluţie bună este suficientă.<br />

În concluzie, căutarea pentru algoritmi <strong>de</strong> aproximare buni este perfect legitimată, chiar dacă aceşti<br />

algoritmi nu garantează atingerea optimului global pentru orice instanţă cu care sunt hrăniţi, dar<br />

care produc soluţii aproape <strong>de</strong> soluţia optimă.<br />

Deoarece cele mai multe probleme dificile au fost împrejurul nostru <strong>de</strong> foarte mulţi ani, pentru o<br />

varietate <strong>de</strong> probleme dificile unul sau mai mulţi euristici au fost <strong>de</strong>ja concepuţi. Aceştia sunt seturi<br />

<strong>de</strong> reguli gândite pentru a rezolva o problemă anume, uzual bazaţi pe bunul simţ (în ceea ce priveşte<br />

soluţia aşteptată) prin evitarea erorilor grosolane, dar care nu sunt gândiţi pentru a produce<br />

tot<strong>de</strong>auna soluţia cu exactitate şi respectiv să fie capabili să producă o soluţie pentru orice valori <strong>de</strong><br />

intrare.<br />

Chiar dacă cei mai mulţi euristici sunt foarte mult ad-hoc şi <strong>de</strong>pen<strong>de</strong>nţi <strong>de</strong> problema dată, odată cu<br />

<strong>de</strong>zvoltarea informaticii cercetătorii au reuşit să formuleze trei euristici care sunt foarte generali, şi<br />

anume aplicabili la o mare varietate <strong>de</strong> probleme dificile. Din cauza acestei generalităţi pe care o<br />

posedă, aceştia au căpătat numele <strong>de</strong> meta-euristici. Toţi trei sunt stocastici [a fi stocastic: Implicând<br />

sau conţinând una sau mai multe variabile aleatoare, implicând şansa sau probabilitatea] în natura lor, doi<br />

dintre aceştia (SA şi GA) fiind bazaţi pe procese naturale care au loc în jurul nostru din tot<strong>de</strong>auna.<br />

Împreună cu călirea simulată (în engleză SA - Simulated Annealing; van Laarhoven and Aarts,<br />

1987; Davis, 1987) şi căutarea tabu (în engleză TS - Tabu Search; Glower, 1977 şi 1986; Glover şi<br />

alţii, 1992) sunt şi algoritmii genetici (în engleză GA - Genetic Algorithm).<br />

Primele studii în care au apărut algoritmii genetici se găsesc în anul 1954, însă studii <strong>de</strong> amploare<br />

ale acestora au apărut după 1970 (Bosworth şi alţii, 1972; Holland, 1975) şi au fost re-inventaţi ceva<br />

mai târziu (Davis, 1991, Holland, 1992).<br />

Înainte <strong>de</strong> a <strong>de</strong>fini ceea ce este un algoritm genetic, să <strong>de</strong>finim mai întâi prin ce evaluează calitatea<br />

unul algoritm euristic. Sunt trei criterii care trebuie consi<strong>de</strong>rate:<br />

÷ viteza: cât <strong>de</strong> repe<strong>de</strong> obţine soluţia;<br />

÷ precizia: cât <strong>de</strong> <strong>de</strong>parte <strong>de</strong> află acea soluţie <strong>de</strong> optimul global;<br />

÷ scopul: cât <strong>de</strong> mare este subsetul datelor <strong>de</strong> intrare în raport cu setul tuturor valorilor posibile<br />

122


pentru care algoritmul performează în raport cu anterioarele două criterii;<br />

O problemă importantă legată <strong>de</strong> complexitatea algoritmică este reprezentată <strong>de</strong> teorema<br />

inexistenţei mesei pe gratis (în engleză NFLT - No Free Lunch Theorem; Wolpert and Macready,<br />

1995 şi 1997), teoremă care utilizând aceste trei criterii <strong>de</strong> mai sus arată că toţi algoritmii sunt strict<br />

echivalenţi, ceea ce înseamnă că pentru doi algoritmi A şi B, pentru fiecare set <strong>de</strong> date pentru care<br />

A performează mai bine <strong>de</strong>cât B există un set <strong>de</strong> date pentru care B performează mai bine <strong>de</strong>cât A.<br />

Interpretarea simplă care se dă acestei teoreme în termeni comuni şi anume că oricât ai încerca să-ţi<br />

faci algoritmii tăi mai isteţi, este un efort în van <strong>de</strong>oarece ei vor performa la fel ca orice alt algoritm,<br />

nu este una corectă. Ceea ce teorema într-a<strong>de</strong>văr spune este că dacă se mediază performanţele<br />

tuturor algoritmilor pe toate datele posibile, atunci ei vor performa la fel. Revenind la termeni<br />

comuni, şmecheria este <strong>de</strong>sigur să nu încerci să hrăneşti toţi algoritmii pe care îi realizezi pe toate<br />

datele cu putinţă, ci să încerci să îţi <strong>de</strong>dici algoritmul la un domeniu <strong>de</strong> aplicabilitate, şi aici să iei<br />

în consi<strong>de</strong>rare şi să valorifici prin implementare în algoritm orice structură specială este posibil să<br />

existe în datele cu care intenţionezi să hrăneşti algoritmul. De aici rezultă că scopul algoritmului<br />

care performează bine trebuie să fie restrâns la setul <strong>de</strong> date care prezintă structurile speciale<br />

i<strong>de</strong>ntificate.<br />

Următoarele categorii <strong>de</strong> probleme pot fi subiect <strong>de</strong> rezolvare pentru algoritmii genetici:<br />

Probleme <strong>de</strong> <strong>de</strong>cizie<br />

÷ O problemă <strong>de</strong> <strong>de</strong>cizie este <strong>de</strong>finită pentr-o întrebare cu răspuns <strong>de</strong> tipul da/nu pe un set (infinit)<br />

<strong>de</strong> date <strong>de</strong> intrare; din acest motiv problemele <strong>de</strong> <strong>de</strong>cizie sunt echivalente cu obţinerea setului <strong>de</strong><br />

date <strong>de</strong> intrare pentru care răspunsul problemei este da. Problemele <strong>de</strong> <strong>de</strong>cizie sunt legată <strong>de</strong><br />

problemele <strong>de</strong> optimizare atâta timp cât problema este obţinerea celui mai bun răspuns la<br />

problemă.<br />

Probleme <strong>de</strong> clasificare<br />

÷ O problemă <strong>de</strong> clasificare pentru obiecte dintr-un domeniu dat este în<br />

separarea acestor obiecte în clase mai mici, şi producerea <strong>de</strong> criterii <strong>de</strong><br />

<strong>de</strong>terminare dacă un obiect anume dintr-un domeniu este într-o anume clasă<br />

sau nu. Una dintre cele mai faimoase probleme <strong>de</strong> clasificare este problema<br />

formulată <strong>de</strong> Carl LINNAEUS (23 Mai 23 1707 - 10 Januarie 10 1778) a<br />

clasificării vieţuitoarelor după clase, ordine, genuri şi specii (Linnaei,<br />

1735).<br />

Probleme <strong>de</strong> optimizare<br />

÷ O problemă <strong>de</strong> optimizare este o problemă <strong>de</strong> găsire a celei mai bune soluţii<br />

dintre toate soluţiile posibile. În mod formal, o problemă <strong>de</strong> optimizare este<br />

un cvadruplu (I,f,m,g) un<strong>de</strong>:<br />

o I - set <strong>de</strong> instanţe;<br />

o f(·) - setul soluţiilor posibile <strong>de</strong>finite pe I;<br />

o m(·,·) - măsura <strong>de</strong>finită pe produsul soluţiilor posibile şi instanţelor<br />

o g - min. sau max. - funcţia obiectiv<br />

o scopul este găsirea optimului lui x: m(x,f(x))=g{m(y,f(y), y ∈I}<br />

÷ Pentru fiecare problemă <strong>de</strong> optimizare există o problemă <strong>de</strong> <strong>de</strong>cizie care este asociată şi a cărei<br />

întrebare este dacă există o soluţie posibilă pentru o anumită măsură m0.<br />

Probleme <strong>de</strong> simulare<br />

÷ Simularea este imitarea unui fapt real, unei stări <strong>de</strong> fapt, sau a unui proces. Actul simulării a<br />

ceva în general implică reprezentarea unor anumite caracteristici sau comportamente cheie ale<br />

unui sistemul fizic sau abstract. Simularea este folosită în multe contexte incluzând mo<strong>de</strong>larea<br />

sistemelor naturale, pentru a pătrun<strong>de</strong> funcţionalitatea acestora. Elementele cheie în simulare<br />

includ achiziţia unei surse vali<strong>de</strong> <strong>de</strong> informaţie <strong>de</strong>spre subiectul <strong>de</strong> studiu, selecţia<br />

caracteristicilor şi comportamentelor cheie, utilizarea <strong>de</strong> aproximaţii şi presupuneri<br />

simplificatoare în cadrul simulării, şi evaluarea fi<strong>de</strong>lităţii şi validităţii rezultatelor simulării.<br />

Algoritmii genetici sunt algoritmi <strong>de</strong> căutare euristici adaptivi bazaţi pe i<strong>de</strong>ile teoriei evoluţiei şi<br />

123


anume aduce conceptele <strong>de</strong> selecţie naturală şi genetică în arena simulării matematice cu ajutorul<br />

calculatorului. Mimica proceselor observate în evoluţia naturală a materiei organice în general<br />

serveşte drept instrument algoritmilor genetici în scopul <strong>de</strong> a rezolva probleme <strong>de</strong> <strong>de</strong>cizie,<br />

clasificare, optimizare şi simulare. Elementele cheie la care se face apel în algoritmii genetici sunt:<br />

÷ Mo<strong>de</strong>lul genetic (dualismul genotip - fenotip) aşa cum a fost el formulat şi argumentat încă <strong>de</strong> la<br />

primii paşi ai geneticii (Morgan, 1915; Fisher, 1918);<br />

÷ Încrucişarea (dualismul caractere - gene) aşa cum a fost ea observată încă <strong>de</strong> la precursorii<br />

geneticii mo<strong>de</strong>rne (Lamarck, 1830; Men<strong>de</strong>l, 1865; Weismann, 1893);<br />

÷ Mutaţia, aşa cum a fost ea observată încă <strong>de</strong> la precursorii geneticii mo<strong>de</strong>rne şi până în zilele<br />

noastre:<br />

o întâmplătoare (De Veies, 1902);<br />

o <strong>de</strong>liberată prin expunerea la anumite condiţii (Patterson, 1928; Auerbach şi alţii, 1947);<br />

o sub presiunea factorilor <strong>de</strong> mediu: (Cains şi alţii, 1988);<br />

÷ Selecţia naturală sau "supravieţuirea celui mai tare" (Darwin, 1859).<br />

Construcţia algoritmilor genetici<br />

Algoritmii genetici se materializează sub forma <strong>de</strong> programe evolutive şi sunt simulări în care:<br />

(spaţiul <strong>de</strong> căutare)<br />

÷ Se operează asupra unei populaţii <strong>de</strong> reprezentări abstracte numite (după elementele genetice pe<br />

baza cărora au fost imaginate) cromozomi sau genotipuri ale unui genom, la rândul său fiecare<br />

reprezentare abstractă a unui cromozom fiind compusă din gene.<br />

···<br />

···<br />

···<br />

genă cromozom genom<br />

Spaţiul <strong>de</strong> căutare al unui algoritm genetic<br />

÷ Fiecare generaţie este compusă dintr-o populaţie <strong>de</strong> şiruri <strong>de</strong> caractere (sau alte forme <strong>de</strong><br />

reprezentare abstractă) analog cu cromozomii ADN-ului. Fiecare element al populaţiei<br />

reprezintă un punct în spaţiul <strong>de</strong> căutare şi în acelaşi timp o soluţie posibilă.<br />

÷ Ceea ce Figura 1 reprezintă formal, şi anume spaţiul <strong>de</strong> căutare al unui algoritm genetic, poate<br />

avea multe variante <strong>de</strong> implementare, trei dintre ele fiind următoarele:<br />

o Dacă algoritmul genetic are ca subiect rezolvarea unei probleme dificile formulate în<br />

sistemul S (în engleză: S-system formalism, Savageau, 1976) care este un tip <strong>de</strong> formalism<br />

<strong>de</strong>rivat din mo<strong>de</strong>lul <strong>de</strong> proces al reacţiilor stoechiometrice cu pre-echilibru (ΣiRi ↔ ΣjIj →<br />

ΣkPk, un<strong>de</strong> Ri reactanţi, Ij intermediari, Pk produşi ai unei reacţii în care constantele <strong>de</strong><br />

proces - constantă <strong>de</strong> viteză şi ordine parţiale <strong>de</strong> reacţie - sunt necunoscute şi se doresc a fi<br />

<strong>de</strong>terminate), atunci următoarea este o posibilă implementare:<br />

O genă: o constantă (un ordin parţial sau o constantă <strong>de</strong> viteză <strong>de</strong> reacţie) subiect al<br />

găsirii (optimizării);<br />

Un cromozom: o posibilă cale <strong>de</strong> <strong>de</strong>sfăşurare a reacţiei, având specificate toate ordinele<br />

parţiale şi constantele <strong>de</strong> viteză specificate;<br />

Genomul: toate căile <strong>de</strong> <strong>de</strong>sfăşurarea a reacţiei prezente într-o iteraţie a algoritmului<br />

genetic;<br />

o Dacă algoritmul genetic are ca subiect rezolvarea unei probleme dificile <strong>de</strong> aliniament <strong>de</strong><br />

secvenţe genetice (Notredame şi Higgins, 1996) <strong>de</strong> ADN, ARN sau proteine în scopul<br />

i<strong>de</strong>ntificării regiunilor <strong>de</strong> similaritate care pot fi sursă <strong>de</strong> relaţii structurale, funcţionale sau<br />

evolutive între secvenţe, atunci următoarea este o implementare posibilă:<br />

O genă: două (sau mai multe) poziţii corespunzătoare la două (sau mai multe) subsecvenţe<br />

aliniate (sau mai exact pseudo-aliniate) şi lungimea aliniamentului acestora;<br />

Un cromozom: o posibilitate <strong>de</strong> aliniament pentru cele două (sau mai multe) secvenţe;<br />

Genomul: toate posibilităţile <strong>de</strong> aliniament <strong>de</strong> secvenţe stocate într-o iteraţie a<br />

algoritmului genetic;<br />

o Dacă algoritmul genetic are ca scop o problemă <strong>de</strong> setare în managementul efectuat în<br />

124<br />

···


scopul maximizării randamentului <strong>de</strong> producţie în câmp (Liu şi alţii, 2001), o problemă<br />

dificilă <strong>de</strong> setare a parametrilor controlabili (sau alteori predictibili) pentru obţinerea unei<br />

productivităţi maxime, atunci următoarea este o implementare posibilă:<br />

O genă: una dintre următoarele: pH-ul solului, fertilizatori în termeni <strong>de</strong> cantitate <strong>de</strong> N,<br />

P şi K, cantitatea <strong>de</strong> materie organică din sol, gradul <strong>de</strong> creştere termică zilnică (o<br />

mărime medie între temperatura minimă şi maximă a zilei), potenţialul genetic (ce poate<br />

fi exprimat în termeni <strong>de</strong> randament care s-ar obţine dacă vremea, solul şi fertilitatea<br />

sunt toate optime), cantităţile <strong>de</strong> precipitaţii pe perioada <strong>de</strong> maximă vegetaţie pe lunile<br />

Mai, Iunie, Iulie şi August, <strong>de</strong>nsitatea <strong>de</strong> plantare şi factorul <strong>de</strong> rotaţie;<br />

Un cromozom: o stare <strong>de</strong> fapt care poate apare în practică în câmp;<br />

Genomul: toate stările <strong>de</strong> fapt stocate într-o iteraţie a algoritmului genetic;<br />

(selecţia şi supravieţuirea)<br />

÷ Un scor sau şansă <strong>de</strong> supravieţuire a fiecărei soluţii este calculată pentru fiecare genotip cu<br />

ajutorul unei funcţii, numită şi funcţie obiectiv. Valoarea acestei funcţii este asociată cu<br />

abilitatea individului să supravieţuiască şi <strong>de</strong>fineşte astfel fenotipul asociat genotipului.<br />

ADN plantă cultivar<br />

<strong>de</strong>codare mediu<br />

codare<br />

genotip fenotip supravieţuire<br />

<strong>de</strong>codare funcţie<br />

codare<br />

obiectiv<br />

şir soluţie<br />

valoare<br />

Selecţia: genotip, fenotip şi supravieţuire<br />

÷ Dacă fiecare genotip reprezintă un punct în spaţiul <strong>de</strong> căutare şi în acelaşi timp o soluţie<br />

posibilă, prin intermediul selecţiei genotipul este concretizat în fenotip (operaţie care iterează<br />

reprezentarea soluţiilor posibile în spaţiul soluţiilor şi evaluează valoarea acestora). Principiul<br />

selecţiei naturale se exprimă astfel:<br />

o Indivizii (fenotipurile) din populaţie concurează pentru supravieţuire (selecţie).<br />

o Genele indivizilor selectaţi se propagă <strong>de</strong> la o generaţie la alta (datorită selecţiei);<br />

o Fiecare generaţie <strong>de</strong>vine mai potrivită mediului în care se află (prin penalizarea indivizilor<br />

care eşuează a supravieţui).<br />

÷ Scorul este asociat fiecărui fenotip (soluţie) reprezentând abilitatea acestuia să concureze pentru<br />

resurse în mediu, pentru supravieţuire (selecţie). Scopul algoritmului genetic este ca să aplice<br />

încrucişarea şi mutaţia selectivă a fenotipurilor (prin intermediul <strong>de</strong>codării lor în genotipurile<br />

din care provin) pentru a produce <strong>de</strong>scen<strong>de</strong>nţi mai buni <strong>de</strong>cât părinţii lor.<br />

÷ Algoritmul genetic menţine un cultivar (un eşantion <strong>de</strong> populaţie) <strong>de</strong> un număr dat (sau uneori<br />

variabil) <strong>de</strong> genotipuri a căror selecţie se poate face aplicând acelaşi operator. Astfel, selecţia şi<br />

supravieţuirea sunt două concepte asociate. Selecţie se face pentru operaţiile <strong>de</strong> încrucişare şi<br />

mutaţie, şi selecţie se face şi pentru supravieţuire în populaţia limitată <strong>de</strong> fenotipuri.<br />

÷ Prin selecţie o parte din indivizii populaţiei mor şi sunt înlocuiţi <strong>de</strong> alţii. În acest mod se speră<br />

că <strong>de</strong>-a lungul generaţiilor soluţii mai bune vor răsări în timp ce cele mai slabe soluţii sunt<br />

înlăturate. Odată cu trecerea <strong>de</strong> la o generaţie la alta populaţia va conţine din ce în ce mai bune<br />

soluţii <strong>de</strong>cât generaţia anterioară.<br />

÷ În tabelul următor este redată legătura care se stabileşte între scorul (exprimat prin funcţia<br />

125


Fitness(·) în tabel) şi regula <strong>de</strong> selecţie în funcţie <strong>de</strong> metoda (aşa cum este ea cunoscută în<br />

literatura <strong>de</strong> specialitate) folosită.<br />

Scor şi selecţie în algoritmii genetici<br />

Metodă Expresia funcţiei <strong>de</strong> scor Selecţie Comentarii<br />

Proporţional pi=fi/Σifi Şansa <strong>de</strong> selecţie este proporţională cu<br />

scorul (utilizând probabilitatea pi în<br />

selecţie)<br />

Deterministic<br />

fi=Fitness(Cromozom_i)<br />

i | fi = max. Selecţia indivizilor este făcută pe baza celui<br />

sau min. mai tare (sau celui mai slab) individ<br />

(elitism)<br />

Turnir (fi,fj) Perechi <strong>de</strong> indivizi concurează între ei<br />

max. sau pentru selecţie (din nou cel mai tare sau cel<br />

min. mai slab)<br />

Normalizare gi=(fi-N0)(fmax.-fmin.)/(N1- pi=gi/Σigi O scală fixă [N0,N1] normalizează scorul<br />

N0)<br />

fenotipurilor între generaţii diferite<br />

Ranguri hi=Rank(fi)(fmax.-fmin.)/Size pi=hi/Σihi Şansa este proporţională cu rangul scorului<br />

un<strong>de</strong>: Rank(·): rangul; Size: volum genom<br />

÷ Ceea ce se reprezintă formal, şi anume selecţia şi supravieţuirea fenotipurilor poate avea multe<br />

variante <strong>de</strong> implementare, trei dintre ele fiind următoarele:<br />

o Dacă algoritmul genetic are ca subiect rezolvarea unei probleme dificile formulate în<br />

sistemul S (Savageau, 1976), atunci următoarea este o posibilă implementare:<br />

Şirul, corespunzător unui genotip: o listă <strong>de</strong> valori constante subiect al optimizării şi<br />

asociat cu un experiment virtual;<br />

Soluţia, corespunzătoare genotipului (şi cromozomului): seria <strong>de</strong> timp a elementelor<br />

experimentului virtual (pentru o reacţie chimică prin soluţie se înţeleg seriile <strong>de</strong> timp ale<br />

concentraţiilor reactanţilor, intermediarilor şi produşilor <strong>de</strong> reacţie pe parcursul<br />

<strong>de</strong>sfăşurării reacţiei);<br />

Valoarea, corespunzătoare scorului: suma pătrată a diferenţelor dintre valorile observate<br />

(ca serie sau serii <strong>de</strong> timp) şi valorile estimate (<strong>de</strong> fenotip) ale uneia (sau mai multor)<br />

observabile (cum ar fi concentraţie sau concentraţii <strong>de</strong> intermediari);<br />

o Dacă algoritmul genetic are ca subiect rezolvarea unei probleme dificile <strong>de</strong> aliniament <strong>de</strong><br />

secvenţe <strong>de</strong> aminoacizi (Notredame şi Higgins, 1996), atunci următoarea este o posibilă<br />

implementare:<br />

Şirul, corespunzător unui genotip: o listă <strong>de</strong> perechi (sau <strong>de</strong> mai multe) poziţii <strong>de</strong> subsecvenţe<br />

aliniate urmată <strong>de</strong> lungimea fiecărei sub-secvenţe;<br />

Soluţia, corespunzătoare fenotipului (şi genotipului): o serie <strong>de</strong> valori conţinând poziţii<br />

<strong>de</strong> rupere şi lungimi <strong>de</strong> translatare necesare pentru a alinia secvenţele;<br />

Valoarea, corespunzătoare scorului: o funcţie <strong>de</strong> scor dând (uzual sub forma unei sume)<br />

costul total pentru toate ruperile şi <strong>de</strong>plasările necesare pentru a alinia secvenţele,<br />

utilizând un cost pre<strong>de</strong>finit pentru o rupere şi pentru <strong>de</strong>plasarea unei unităţi în secvenţă;<br />

o Dacă algoritmul genetic setarea parametrilor necesari pentru obţinerea unei bune producţii<br />

în câmp (Liu şi alţii, 2001), atunci următoarea este o posibilă implementare:<br />

Şirul, corespunzător unui genotip: o listă <strong>de</strong> valori ce corespund unui experiment virtual<br />

şi constituie obiect al optimizării; Valorile din şir pot fi: pH-ul solului, fertilizatori în<br />

termeni <strong>de</strong> cantitate <strong>de</strong> N, P şi K, cantitatea <strong>de</strong> materie organică din sol, gradul <strong>de</strong><br />

creştere termică zilnică (o mărime medie între temperatura minimă şi maximă a zilei),<br />

potenţialul genetic (ce poate fi exprimat în termeni <strong>de</strong> randament care s-ar obţine dacă<br />

vremea, solul şi fertilitatea sunt toate optime), cantităţile <strong>de</strong> precipitaţii pe perioada <strong>de</strong><br />

maximă vegetaţie pe lunile Mai, Iunie, Iulie şi August, <strong>de</strong>nsitatea <strong>de</strong> plantare şi factorul<br />

<strong>de</strong> rotaţie;<br />

Soluţia, corespunzătoare fenotipului (şi genotipului): un şir <strong>de</strong> valori caracterizând<br />

soluţia, cuprinzând valori obţinute prin aplicarea <strong>de</strong> funcţii care să exprime: calitatea<br />

126


solului, calitatea vremii, managementul <strong>de</strong> cultivare, potenţialul genetic şi efectul unor<br />

evenimente întâmplătoare;<br />

Valoarea, corespunzătoare scorului: suma pătratelor diferenţelor între randamente<br />

observate (în serii <strong>de</strong> experimente anterioare) şi estimate (<strong>de</strong> fenotip) ale randamentelor;<br />

(încrucişarea şi mutaţia)<br />

÷ Încrucişarea reprezintă împerecherea între fenotipuri; fenotipurile (uzual două) sunt selectate<br />

din populaţie folosind operatorul <strong>de</strong> selecţie; o porţiune <strong>de</strong> încrucişat <strong>de</strong>-a lungul şirului <strong>de</strong> gene<br />

ale genotipurilor asociate fenotipurilor este aleasă (întâmplător sau <strong>de</strong>terministic) şi valorile<br />

celor două porţiuni <strong>de</strong> şiruri sunt schimbate între ele, rezultând astfel din această împerechere<br />

doi <strong>de</strong>scen<strong>de</strong>nţi care sunt direct selectaţi pentru a face parte din noua generaţie <strong>de</strong> populaţie;<br />

încrucişarea este făcută în speranţa că dacă se recombină porţiuni <strong>de</strong> genotipuri <strong>de</strong> succes,<br />

atunci acest proces este probabil să producă <strong>de</strong>scen<strong>de</strong>nţi chiar mai buni <strong>de</strong>cât părinţii din care<br />

provin;<br />

··· ··· ···<br />

site încrucişare<br />

··· ··· ···<br />

recombinare<br />

··· ··· ···<br />

··· ··· ···<br />

părinţi<br />

copii<br />

O încrucişare dublă implicând ruperea şi reunirea cromozomilor părinţilor<br />

părinte<br />

··· ···<br />

<strong>de</strong>scen<strong>de</strong>nţi<br />

··· ···<br />

mutant<br />

Mutaţia<br />

÷ Mutaţia este operatorul care introduce modificări noi (inexistente în populaţia unei generaţii);<br />

ceea ce este caracteristic în general mutaţiei şi implicit şi operatorului acesteia corespon<strong>de</strong>nt în<br />

algoritmii genetici este că ea se petrece cu o probabilitate scăzută, fiind <strong>de</strong>ci aplicată cu o<br />

probabilitate scăzută (cu probabilitatea <strong>de</strong> 1/8 în figura <strong>de</strong> mai sus); operatorul <strong>de</strong> mutaţie poate<br />

implementa o mutaţie:<br />

o Întâmplătoare: când o porţiune a unui individ selectat va suferi schimbarea valorilor stocate<br />

în genele sale cu alte valori existente în materialul genetic al populaţiei şi are rolul<br />

menţinerii diversităţii în populaţie pentru a preveni populaţia să prezinte o convergenţă<br />

prematură;<br />

o Deliberată: când expunerea la anumite condiţii se transpune în folosirea unei reguli<br />

pre<strong>de</strong>terminate <strong>de</strong> modificare a valorilor genelor;<br />

o Sub presiunea factorilor <strong>de</strong> mediu, când valorile genelor se schimbă în raport cu scorul<br />

fenotipului supus modificării genetice;<br />

(evoluţia)<br />

÷ Utilizând doar selecţia singură un algoritm nu va reuşi <strong>de</strong>cât să copieze (cloneze) cel mai bun<br />

individ (fenotip) al său în întreaga populaţie;<br />

÷ Utilizând mutaţia singură un algoritm va reuşi doar să inducă parcurgerea întâmplătoare a<br />

spaţiului <strong>de</strong> căutare;<br />

÷ Utilizând încrucişarea şi selecţia un algoritm va reuşi să conveargă către o soluţie bună dar nu<br />

127


sub-optimală (în apropierea celei optime);<br />

÷ Mutaţia şi selecţia (fără încrucişare) într-un algoritm creează algoritmi paraleli, toleranţi la<br />

perturbaţii în căutarea <strong>de</strong> puncte <strong>de</strong> maxim local (în terminologia în engleză: hill-climbing);<br />

÷ Utilizarea tuturor operatorilor (mutaţie, încrucişare si selecţie) asigură unui algoritm toate<br />

caracteristicile <strong>de</strong> <strong>de</strong>finire ale unui algoritm genetic;<br />

t+1<br />

scor<br />

selecţie<br />

cel mai bun fenotip<br />

t+1<br />

scor<br />

Schema ilustrativă a modului <strong>de</strong> lucru al unui algoritm genetic clasic<br />

÷ Într-un algoritm genetic clasic (<strong>de</strong> genul celui ilustrat), pentru a rezolva o problemă, se<br />

generează întâmplător sau se iniţiază cu valori pre<strong>de</strong>finite o populaţie <strong>de</strong> un volum dat <strong>de</strong><br />

genotipuri; cerinţele preliminare algoritmului genetic este existenţa funcţiei obiectiv cu ajutorul<br />

căreia se evaluează scorul unui fenotip în populaţie; algoritmul genetic iterează astfel:<br />

o Repetă<br />

Pasul_1: Utilizând operatorul <strong>de</strong> selecţie selectează doi cromozomi;<br />

Pasul_2: Utilizând o funcţie discretă <strong>de</strong> probabilitate pentru alegerea porţiunii <strong>de</strong><br />

încrucişat încrucişează cei doi părinţi şi creează <strong>de</strong>scen<strong>de</strong>nţii acestora;<br />

Pasul_3: Cu o mică probabilitate şi utilizând o funcţie discretă <strong>de</strong> probabilitate pentru<br />

alegerea porţiunii <strong>de</strong> mutat efectuează mutaţia unui genotip, eventual un <strong>de</strong>scen<strong>de</strong>nt al<br />

încrucişării din pasul anterior;<br />

Pasul_4: Iniţializează o nouă populaţie cu noile fenotipuri (<strong>de</strong> la paşii 2 şi 3 anteriori);<br />

Pasul_5: Completează utilizând operatorul <strong>de</strong> selecţie aplicat populaţiei <strong>de</strong> părinţi noua<br />

populaţie cu fenotipuri (până cel puţin la refacerea numărului iniţial <strong>de</strong> membrii);<br />

Pasul_6: Refă valorile funcţiei <strong>de</strong> scor ale noii populaţii în conformitate cu noua<br />

compoziţie a acesteia;<br />

o Până când cel mai bun fenotip al populaţiei satisface o condiţie impusă (condiţie care<br />

reprezintă condiţia <strong>de</strong> sfârşit a algoritmului).<br />

O problemă dificilă <strong>de</strong> structură biochimică şi formalismul algoritmilor genetici<br />

Lucrarea (Jäntschi şi alţii, 2007) serveşte drept sursă a exemplificării unei probleme dificile <strong>de</strong><br />

structură biochimică şi relaţia acesteia cu o proprietate măsurată. Astfel, în lucrare autorii pornesc<br />

<strong>de</strong> la datele experimentale ale timpilor <strong>de</strong> retenţie observaţi pentru separarea cromatografică a<br />

bifenililor policloruraţi (PCBs) raportaţi în (Mullin şi alţii, 1984). Folosind informaţia structurală, o<br />

bază <strong>de</strong> date conţinând <strong>de</strong>scriptori <strong>de</strong> structură a fost construită.<br />

`MDF`<br />

`ready`<br />

`qspr_qsar`<br />

selecţie<br />

t<br />

încrucişare<br />

`PCB_data`<br />

`PCB_tmpx`<br />

`PCB_xval`<br />

`PCB_yval`<br />

Baza <strong>de</strong> date pentru studiul problemei dificile <strong>de</strong> relaţie structură-activitate<br />

128<br />

t+1<br />

mutaţie


Fragmentation criteria<br />

Fragment of `i`vs. `j`<br />

Probe atom `i`<br />

Atomic property<br />

Distance metric<br />

Probe atom `j`<br />

Interaction <strong>de</strong>scriptor Interaction mo<strong>de</strong>l<br />

Molecular overall<br />

superposing formula<br />

Linearization<br />

formula<br />

Metodologia relaţiilor structură-activitate (SAR) în abordarea Familiei <strong>de</strong> Descriptori Moleculari<br />

(MDF), imagine preluată din (Jäntschi şi Bolboacă, 2008-MQMC)<br />

Problema dificilă <strong>de</strong> relaţie structură chimică - activitate/proprietate măsurată se formulează astfel:<br />

având la dispoziţie o informaţie structurală (obţinută din realizarea topologiei moleculare a fiecărui<br />

compus pe baza legăturilor chimice care se stabilesc între atomi şi realizarea geometriei moleculare<br />

pe baza aplicării mo<strong>de</strong>lelor aproximative ale fizicii cuantice şi moleculare) şi o informaţie rezultată<br />

în urma observaţiei experimentale a unei proprietăţi/activităţi pentru fiecare din cei 209 compuşi în<br />

aceleaşi condiţii <strong>de</strong> mediu, care este cea mai bună relaţie structură-activitate care să <strong>de</strong>scrie<br />

proprietatea/activitatea compuşilor în funcţie <strong>de</strong> structură.<br />

În acord cu metodologia <strong>de</strong>scrisă în (Jäntschi şi alţii, 2007) informaţia structurală se poate valorifica<br />

construind o familie <strong>de</strong> <strong>de</strong>scriptori. Fără a mai <strong>de</strong>talia procedura clasică <strong>de</strong> rezolvare a problemei,<br />

abordarea din perspectiva unui algoritm genetic aplicat problemei este următoarea:<br />

÷ Populaţia este familia <strong>de</strong> <strong>de</strong>scriptori moleculari având fiecare genotip (cromozom) <strong>de</strong>scris <strong>de</strong><br />

următoarele gene:<br />

o gena d conţinând operatorul <strong>de</strong> distanţă folosit la construirea <strong>de</strong>scriptorului molecular<br />

(fenotipului), având 2 valori posibile: `g` - distanţă geometrică; `t` - distanţă topologică;<br />

o gena p conţinând proprietatea atomică folosită la construirea fenotipului, cu 6 valori<br />

posibile: `M` - masa atomică relativă; `Q` - sarcina electrică parţială a atomului (obţinută în<br />

aproximaţia Hückel extinsă); `C` - cardinalitatea (proprietate atomică trivială, tot<strong>de</strong>auna<br />

valoarea sa pentru orice atom este 1); `E` - electronegativitatea atomică (valoare relativă la<br />

scara <strong>de</strong> electronegativitate San<strong>de</strong>rson); `G` - electronegativitatea <strong>de</strong> grup (valoare obţinută<br />

prin calcularea unei medii geometrice a electronegativităţii grupului <strong>de</strong> atomi situat în<br />

imediata vecinătate a atomului cercetat); `H` - numărul <strong>de</strong> atomi <strong>de</strong> hidrogen ce înconjoară<br />

atomul cercetat;<br />

o gena I conţinând <strong>de</strong>scriptorul <strong>de</strong> interacţiune, implicând 2 atomi participanţi şi având una<br />

din următoarele 24 <strong>de</strong> valori (în care s-au folosit notaţiile: d - operatorul <strong>de</strong> distanţă; p -<br />

proprietatea atomică): `D(d)`, `d(1/d)`, `O(p1)`, ‘o(1/p1)`, `P(p1p2)`, `p(1/p1p2)`, `Q(√p1p2)`,<br />

`q(1/√p1p2)`, `J(p1d)`, `j(1/p1d)`, `K(p1p2d)`, `k(1/p1p2d)`, `L(d√p1p2)`, `l(1/d√p1p2)`,<br />

`V(p1/d)`, `E(p1/d2)`, `W(p1 2 /d)`, `w(p1p2/d)`, `F(p1 2 /d 2 )`, `f(p1p2/d 2 )`, `S(p1 2 /d 3 ), `s(p1p2/d 3 )`,<br />

`T(p1 2 /d 4 )`, `t(p1p2/d 4 )`, în care prima literă dă valoarea genei şi între paranteze este dată<br />

formula <strong>de</strong> calcul asociată valorii acesteia;<br />

o gena O codificând suprapunerea interacţiunilor, fiind implementate 6 valori ale acesteia,<br />

două pentru mo<strong>de</strong>le în care interacţiunile sunt rare şi la distanţă (`R` şi `r`), două pentru<br />

129


mo<strong>de</strong>lele în care interacţiunile sunt <strong>de</strong>nse dar la distanţă (`M` şi `m`), şi două pentru<br />

mo<strong>de</strong>lele în care interacţiunile sunt <strong>de</strong>nse şi apropiate (`D` şi `d`);<br />

o gena f care codifică algoritmul <strong>de</strong> fragmentare moleculară pe perechi <strong>de</strong> atomi, care poate<br />

avea una din următoarele 4 valori: `P` - pentru fragmentare bazată pe căi; `D` - pentru<br />

fragmentare bazată pe distanţe; `M` - pentru fragmentare în fragmente maximale; `m` -<br />

pentru fragmentare în fragmente minimale (fragmente triviale conţinând un singur atom);<br />

o gena M care codifică modalitatea <strong>de</strong> suprapunere globală a interacţiunilor fragmentelor, care<br />

poate lua una din următoarele 19 valori împărţite în 4 grupuri: grupul <strong>de</strong> mărimi ( `m` -<br />

selectează cea mai mică valoare; `M` - cea mai mare valoare; `n` - cea mai mică valoare<br />

absolută; `N` - cea mai mare valoare absolută); grupul <strong>de</strong> medii ( `S` - suma; `A` - media<br />

aritmetică după numărul <strong>de</strong> proprietăţi <strong>de</strong> fragmente; `a` - media aritmetică după numărul<br />

<strong>de</strong> fragmente; `B` - media aritmetică după numărul <strong>de</strong> atomi; `b` - media aritmetică după<br />

numărul <strong>de</strong> legături); grupul geometric (`P` - multiplicare; `G` - medie geometrică după<br />

numărul <strong>de</strong> proprietăţi <strong>de</strong> fragmente; `g` - medie geometrică după numărul <strong>de</strong> fragmente;<br />

`F` - medie geometrică după numărul <strong>de</strong> atomi; `f`` - media geometrică după numărul <strong>de</strong><br />

legături); grupul armonic (`s` - suma armonică; `H` - medie armonică după numărul <strong>de</strong><br />

proprietăţi <strong>de</strong> fragmente; `h` - medie armonică după numărul <strong>de</strong> fragmente; `I` - medie<br />

armonică după numărul <strong>de</strong> atomi; `i`` - media armonică după numărul <strong>de</strong> legături);<br />

o gena L care rezultă în algoritm în urma unei mutaţii <strong>de</strong>terministe asupra fenotipului şi<br />

reprezintă unul din cei 6 operatori <strong>de</strong> linearizare ce urmează: `I` - i<strong>de</strong>ntitate, `i` - inversa,<br />

`A` - valoarea absolută, `a` - inversa valorii absolute, `L` - logaritmul valorii absolute, `l` -<br />

logaritmul;<br />

÷ Scorul (funcţia obiectiv): având proprietatea măsurată pentru cei 209 compuşi exprimată în şirul<br />

Y (cu 209 valori), urmează:<br />

o Fenotipul, caracterizat <strong>de</strong> genele care compun cromozomul este transformat în fenotip când<br />

se calculează valorile corespunzătoare genotipului pentru fiecare din cele 209 molecule ale<br />

setului <strong>de</strong> PCBs.<br />

o Pentru o funcţie obiectiv <strong>de</strong> estimare a proprietăţii măsurate folosind 2 genotipuri (în cazul<br />

general putând fi un număr oarecare fixat <strong>de</strong> genotipuri, r), ecuaţia <strong>de</strong> regresie este <strong>de</strong><br />

forma: Ŷ = a0 + a1·Fenotip1 + a2·Fenotip2, (în general: Ŷ = a0 + Σ1≤i≤rai·Fenotipi), un<strong>de</strong>:<br />

Ŷ este estimatorul proprietăţii măsurate;<br />

a0..a2 sunt coeficienţii care rezultă din minimizarea pătratelor diferenţelor între valorile<br />

măsurate Y şi cele estimate prin intermediul lui Ŷ pentru setul <strong>de</strong> 209 compuşi;<br />

Fenotip1=Fenotip(Genotip1) şi Fenotip2=Fenotip(Genotip2) sunt fenotipurile (şirurile <strong>de</strong><br />

valori ale <strong>de</strong>scriptorilor moleculari obţinuţi prin operaţiile prescrise <strong>de</strong> genotipurile<br />

Genotip1=d1p1I1O1f1M1L1 şi Genotip2=d2p2I2O2f2M2L2 pentru cei 209 compuşi;<br />

o Tăria (scorul) unei perechi <strong>de</strong> genotipuri (sau mai multe, pentru regresia multivariată) poate<br />

fi exprimată <strong>de</strong> una din următoarele (Tabelul 18).<br />

Tabelul 18. Funcţii <strong>de</strong> scor pentru penalizarea regresiilor cu perechi <strong>de</strong> fenotipuri<br />

Nr. Scor (i=1..2) Semnificaţie Obiectiv Remarci<br />

1 Suma minim Uzual p=2; pentru p = 1 şi mai mult pentru p<br />

Σ(Y-a0-Σiai·Fenotipi) p<br />

reziduurilor<br />

<strong>de</strong> estimare<br />

=1/2 există avantajul că se favorizează<br />

tendinţa generală în regresie în <strong>de</strong>favoarea<br />

abaterilor grosolane <strong>de</strong> la ecuaţia <strong>de</strong> regresie<br />

2 r 2 (Y,a0+Σiai·Fenotipi) Coeficient <strong>de</strong> maxim Are avantajul legăturii cu scopul general al<br />

<strong>de</strong>terminare optimizării (maximizarea coeficientului <strong>de</strong><br />

<strong>de</strong>terminare)<br />

÷ Încrucişarea:<br />

o Se selectează (folosind una din meto<strong>de</strong>le <strong>de</strong> selecţie <strong>de</strong>scrise în Tabelul 17) două genotipuri,<br />

Genotip1=d1p1I1O1f1M1L1 şi Genotip2=d2p2I2O2f2M2L2;<br />

o Se generează două numere aleatoare (din distribuţia uniformă) între 0 şi 6 (fie ele 2 şi 4);<br />

130


o Se încrucişează Genotip1 cu Genotip2 când se obţin <strong>de</strong>scen<strong>de</strong>nţii Descen<strong>de</strong>nt1 =<br />

d1p1I2O2f2M1L1 şi Descen<strong>de</strong>nt2 = d2p2I1O1f1M2L2; se obţin fenotipurile acestor <strong>de</strong>scen<strong>de</strong>nţi<br />

şi se adaugă la cultivar;<br />

÷ Mutaţia:<br />

o Se foloseşte o probabilitate <strong>de</strong> mutaţie α=1/7 (numărul <strong>de</strong> gene) pentru a <strong>de</strong>ci<strong>de</strong> dacă se<br />

aplică sau nu mutaţia;<br />

o Se alege unul din <strong>de</strong>scen<strong>de</strong>nţi (cel mai tare sau cel mai slab în raport cu scorul, sau<br />

aleatoriu);<br />

o Se generează un număr aleatoriu între 0 şi 6 pentru a <strong>de</strong>ci<strong>de</strong> care genă va suferi mutaţia (fie<br />

acest număr 3);<br />

o Corespunzător lui 3 este gena I; se generează atunci un număr aleatoriu între 1 şi 24<br />

(numărul <strong>de</strong> valori posibile pe care le permite gena I); folosind valoarea generată aleatoriu<br />

între 1 şi 24 (fie acesta 12) se înlocuieşte valoarea genei I cu noua valoare (pentru 12<br />

valoarea genei I este `k(1/p1p2d)`);<br />

÷ Evoluţia (algoritmul genetic):<br />

o Aşa cum rezultă în acest punct, din întregul populaţiei (care numără, după un calcul simplu)<br />

787968 membrii, implementarea în abordarea algoritmilor genetici necesită generarea şi<br />

păstrarea unui eşantion (cultivar) restrâns din întreaga populaţie (maxim 100 <strong>de</strong> genotipuri);<br />

fie volumul cultivarului N;<br />

o Se generează aleatoriu N genotipuri;<br />

o Se obţin N fenotipuri asociate celor N genotipuri;<br />

o Se repetă:<br />

Pentru fiecare pereche (în cazul regresiei bivariate) <strong>de</strong> genotipuri<br />

• Se obţine scorul asociat perechii <strong>de</strong> fenotipuri: r 2 (Y,a0+a1·Fenotip1+a2·Fenotip2)<br />

Sfârşit pentru.<br />

Pentru fiecare genotip<br />

• Se obţine scorul genotipului ca valoarea minimă a scorului pe care el îl obţine prin<br />

împerechere cu celelalte genotipuri;<br />

Sfârşit pentru.<br />

Se aleg două genotipuri din cultivar folosind operatorul <strong>de</strong> selecţie (Tabelul 17) şi se<br />

încrucişează; li se generează fenotipurile şi se adaugă cultivarului (volumul cultivarului<br />

<strong>de</strong>vine N+2);<br />

Se <strong>de</strong>ci<strong>de</strong> dacă unul dintre genotipuri va fi mutat folosind probabilitatea α=1/7; dacă da,<br />

atunci se alege unul dintre genotipurile încrucişate şi se aplică operatorul <strong>de</strong> mutaţie;<br />

mutantului i se generează fenotipul şi se adaugă cultivarului (în caz favorabil mutaţiei<br />

volumul cultivarului <strong>de</strong>vine N+3);<br />

Folosind scorul genotipurilor se înlătură din cultivar exact atâtea genotipuri până când<br />

volumul cultivarului <strong>de</strong>vine din nou N (minim 0, maxim 3);<br />

o Până când scorul asociat celei mai bune perechi (în cazul regresiei bivariate) <strong>de</strong> genotipuri<br />

satisface condiţia impusă (<strong>de</strong> exemplu r 2 > 0.99).<br />

÷ Remarcă cu privire la cultivar, mutaţie şi încrucişare:<br />

o Nu orice combinaţie <strong>de</strong> valori ale genelor produce un fenotip sănătos; la fel mutaţia poate<br />

produce un fenotip mort; acesta este motivul pentru care există posibilitatea ca după rularea<br />

unui ciclu complet <strong>de</strong> evoluţie, cultivarul să rămână neschimbat (atunci când încrucişarea<br />

urmată <strong>de</strong> o eventuală mutaţie produc 3 fenotipuri care fie nu se nasc, fie nu se adaptează<br />

mediului);<br />

o Semnificaţia este următoarea: aplicarea secvenţelor <strong>de</strong> construcţie a fenotipului <strong>de</strong>scrise <strong>de</strong><br />

cromozom pentru o anumită moleculă (sau pentru mai multe dintre acestea) poate, în traseul<br />

<strong>de</strong> construcţie să întâlnească ne<strong>de</strong>terminări (împărţiri la 0, logaritm din număr negativ);<br />

o Chiar dacă este născut fenotipul, există posibilitatea să nu se adapteze mediului (având <strong>de</strong><br />

131


exemplu valori i<strong>de</strong>ntice pentru toate moleculele setului, ceea ce-l face nefolositor în<br />

exprimarea unei ecuaţii <strong>de</strong> regresie cu proprietatea măsurată).<br />

Abordări, variante, adaptări şi alternative ale formalismului algoritmilor genetici<br />

Există multe variante şi adaptări ale algoritmilor genetici menite să îmbunătăţească performanţele<br />

acestora pentru un anume tip <strong>de</strong> probleme.<br />

Menţionarea tehnicilor <strong>de</strong>rivate şi/sau bazate pe tehnica algoritmilor genetici este suficientă pentru<br />

problematica abordată:<br />

÷ Optimizarea bazată pe strategia coloniilor <strong>de</strong> furnici (în engleză: Ant colony optimization;<br />

Bouktir şi Slimani, 2005);<br />

÷ Algoritmi bacteriologici (în engleză: Bacteriologic algorithms; Benoit şi alţii, 2005);<br />

÷ Metoda încrucişării entropiei (în engleză: cross-entropy method; De Boer şi alţii, 2005);<br />

÷ Algoritmi culturali (în engleză: Cultural algorithms; Kobti şi alţii, 2004);<br />

÷ Strategii evolutive (în engleză: Evolution strategies; Schwefel, 1995);<br />

÷ Programare evolutivă (în engleză: Evolutionary programming; Fogel şi alţii, 1966);<br />

÷ Optimizare extremistă (în engleză: Extremal optimization; Bak şi Sneppen, 1993);<br />

÷ Adaptare Gausiană (în engleză: Gaussian adaptation; Kjellström, 1991);<br />

÷ Programare genetică (în engleză: genetic programming; Banzhaf şi alţii, 1997);<br />

÷ Algoritmi memetici (în engleză: memetic algorithm; Smith, 2007);<br />

÷ Alte variate, colectate în (Davis, 1991).<br />

Alte abordări conjugă algoritmii genetici cu alte concepte. Următoarele se pot menţiona:<br />

÷ Utilizarea maşinilor cu suport vectorial (în engleză: Support Vector Machines (Brown şi alţii,<br />

2000);<br />

÷ Analiza <strong>de</strong> localizare a asemănărilor structurale prin histograme secvenţiale (acronim în<br />

engleză: SPLASH; Califano, 2000);<br />

÷ Setul neregulat (în engleză: Rough set; Hvidsten şi alţii, 2001).<br />

2008A3. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi<br />

dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />

Introduction to Practical Statistics for Medical Research<br />

÷ Organizator: University College London (UCL), Londra, UK<br />

÷ Tip: curs<br />

÷ Perioadă: 6-11 Aprilie 2008;<br />

÷ Deplasare: aferentă Obiectiv 1, Activitate 3;<br />

÷ Participanţi: <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>;<br />

÷ Tematica cursului:<br />

Basics of Study Design Rumana OMAR UCL<br />

Introduction to Data Analysis Caroline DORE MRC<br />

Observational Studies in Health Research Rumana OMAR UCL<br />

Randomised Controlled Trials Doug ALTMAN UOx<br />

Estimation and Hypothesis Testing Gareth AMBLER UCL<br />

Comparing Groups of Continuous Data Caroline DORE MRC<br />

Analysis of Categotical Data Pauline ROGERS UCL<br />

Sample Size Calculations Caroline DORE MRC<br />

Correlation and Linear Regression Gareth AMBLER UCL<br />

Further Regression Topics Gareth AMBLER UCL<br />

132


Measures of Disease in Health Research Rumana OMAR UCL<br />

Logistic Regression Andrew COPAS UCL<br />

Analysis of Survival Data Andrew COPAS UCL<br />

Analysis of Clustered Data Rebeca TURNER MRC<br />

Statistics in Medical Journals Doug ALTMAN UOx<br />

Legendă:<br />

UCL - University College London, Londra, UK<br />

MRC - Medical Research Center, Londra, UK<br />

UOx - University of Oxford, Oxford, UK<br />

÷ Puncte cheie din tematica cursului:<br />

o Basics of Study Design<br />

Designul este cel mai important aspect al unui studiu;<br />

Trebuie să răspundă întrebării <strong>de</strong> <strong>cercetare</strong>;<br />

Designul studiului acoperă:<br />

• Studii observaţionale;<br />

• Trialuri controlate randomizate;<br />

Este esenţială pregătirea protocolului <strong>de</strong> <strong>cercetare</strong>;<br />

Aspecte metodologice:<br />

• Specificarea obiectivului cercetării trebuie să includă:<br />

o Estimarea frecvenţei <strong>de</strong> apariţie a fenomenului observat;<br />

o Generarea şi testarea ipotezelor;<br />

o Înţelegerea cauzelor fenomenului observat;<br />

o Evaluarea intervenţiei sugerate <strong>de</strong> <strong>cercetare</strong>;<br />

• Specificarea populaţiei incluse în studiu:<br />

o Asigurarea reprezentativităţii eşantionului;<br />

o Criteriile <strong>de</strong> inclu<strong>de</strong>re şi exclu<strong>de</strong>re din studiu;<br />

o Specificarea răspunsului primar urmărit;<br />

o Specificarea răspunsurilor secundare urmărite;<br />

o Asigurarea unui eşantion <strong>de</strong> control;<br />

o Influenţa dimensiunii eşantionului asupra semnificaţiei;<br />

• Estimarea influenţelor:<br />

o Evaluarea confuziilor între factorul urmărit şi alţi factori;<br />

o Eroarea produsă <strong>de</strong> selecţie;<br />

o Eroarea produsă <strong>de</strong> observabilă;<br />

o Eroarea produsă <strong>de</strong> observator;<br />

o Eroarea produsă <strong>de</strong> evenimente anterioare celui urmărit;<br />

• Manipularea datelor:<br />

o Responsabilitate;<br />

o Evi<strong>de</strong>nţe duble;<br />

o Construcţie unei baze <strong>de</strong> date;<br />

o Menţinerea confi<strong>de</strong>nţialităţii;<br />

o Planul <strong>de</strong> analiză statistică;<br />

o Introduction to Data Analysis<br />

Meto<strong>de</strong> statistice utilizate pentru înţelegerea şi explicarea variaţiilor;<br />

Alegerea meto<strong>de</strong>i <strong>de</strong> analiză în funcţie <strong>de</strong>:<br />

• Tipul datelor;<br />

• Structura studiului;<br />

• Presupunerile cu privire la distribuţia datelor;<br />

Tipuri <strong>de</strong> date grupate pe categorii:<br />

• Două categorii (date binare);<br />

133


• Categorii nominale (neordonate);<br />

• Categorii ordinale (ordonate);<br />

Variabile răspuns şi variabile expunere;<br />

Date lipsă;<br />

Descrierea datelor;<br />

Măsuri:<br />

• De sumar:<br />

o Valoare tipică;<br />

o Împrăştierea valorilor;<br />

• Valori tipice:<br />

o Media;<br />

o Mediana;<br />

o Centila şi cuartila;<br />

• Împrăştierea valorilor:<br />

o Deviaţia standard;<br />

o Domeniu şi domeniu interquartilic;<br />

Verificarea datelor;<br />

Distribuţii statistice:<br />

• Presupuneri;<br />

• In<strong>de</strong>pen<strong>de</strong>nţă;<br />

• Legi <strong>de</strong> distribuţie:<br />

o Distribuţia normală;<br />

o Distribuţia binomială;<br />

o Distribuţia uniformă;<br />

o Distribuţia log-normală;<br />

o Distribuţia Poisson;<br />

o Distribuţia χ 2 ;<br />

o Distribuţia Stu<strong>de</strong>nt;<br />

Meto<strong>de</strong> parametrice;<br />

Meto<strong>de</strong> neparametrice;<br />

o Observational Studies in Health Research<br />

Studii observaţionale:<br />

• Serii caz-raport;<br />

• Secţionare încrucişată;<br />

• Cohorte;<br />

• Caz-control;<br />

Puterea şi limitele fiecărui tip <strong>de</strong> studiu;<br />

Tipuri <strong>de</strong> studii:<br />

• Studii <strong>de</strong>scriptive;<br />

• Studii analitice;<br />

Aplicaţiile <strong>de</strong>signului <strong>de</strong> studiu;<br />

Stabilirea cauzalităţii în studii observaţionale analitice:<br />

• Criteriul Bradford Hill<br />

o Randomised Controlled Trials<br />

Ce este un trial controlat randomizat;<br />

Aspecte cheie ale <strong>de</strong>signului şi analizei unui trial controlat;<br />

Întâmplarea;<br />

Simularea întâmplării;<br />

Generarea <strong>de</strong> secvenţe întâmplătoare;<br />

Designul;<br />

Generarea întâmplătoare pe blocuri;<br />

134


Generarea întâmplătoare stratificată;<br />

Când generarea întâmplătoare apare;<br />

Când generarea întâmplătoare operează corespunzător;<br />

Când generarea întâmplătoare operează necorespunzător;<br />

Alocarea sistematică;<br />

Conducerea (execuţia) unui trial;<br />

Orbirea: asigurarea întâmplării prin privarea <strong>de</strong> informaţii;<br />

Designul trialurilor clinice;<br />

Trialuri <strong>de</strong> echivalenţă;<br />

Volumul eşantionului;<br />

Măsuri ale răspunsului;<br />

Protocolul <strong>de</strong> <strong>cercetare</strong>;<br />

Probleme <strong>de</strong> etică;<br />

Probleme cheie ale analizei unui trial controlat;<br />

o Estimation and Hypothesis Testing<br />

Populaţii şi eşantioane;<br />

Analiza statistică;<br />

Estimarea parametrilor populaţiei;<br />

Incertitudinea în estimare;<br />

Distribuţia <strong>de</strong> eşantionare;<br />

Măsuri ale incertitudinii;<br />

Intervale <strong>de</strong> încre<strong>de</strong>re;<br />

Testarea ipotezelor în populaţii şi eşantioane;<br />

Valori <strong>de</strong> probabilitate;<br />

Semnificativ vs. nesemnificativ (statistic);<br />

Interpretarea valorilor <strong>de</strong> probabilitate;<br />

Estimare vs. testarea ipotezelor;<br />

o Comparing Groups of Continuous Data<br />

Structura datelor;<br />

Presupuneri cu privire la distribuţia datelor;<br />

Eşantioane pereche;<br />

Distribuţia t (Stu<strong>de</strong>nt);<br />

Eşantioane in<strong>de</strong>pen<strong>de</strong>nte;<br />

Distribuţia reziduurilor;<br />

Transformarea logaritmică;<br />

Analiza <strong>de</strong> varianţă ANOVA;<br />

Distribuţia F (Fisher);<br />

Comparaţii multiple;<br />

Procedura Bonferoni;<br />

o Analysis of Cathegorical Data<br />

Analiza a două grupuri <strong>de</strong> date grupate pe categorii;<br />

Compararea riscului în două grupuri in<strong>de</strong>pen<strong>de</strong>nte;<br />

Tabele <strong>de</strong> frecvenţă 2X2;<br />

Testul χ 2 ;<br />

Mai mult <strong>de</strong> două categorii;<br />

Tabele <strong>de</strong> frecvenţă mari;<br />

Testul Fisher exact;<br />

Două grupuri pereche;<br />

Testul McNemar;<br />

o Sample size calculations<br />

Importanţa calculului volumului eşantionului;<br />

Calcule bazate pe putere vs. calcule bazate pe precizie;<br />

135


Meto<strong>de</strong> <strong>de</strong> bază pentru medii şi pentru proporţii;<br />

<strong>Raport</strong>area calculelor <strong>de</strong> volum <strong>de</strong> eşantion;<br />

Fezabilitatea studiilor;<br />

Erori <strong>de</strong> tipul I;<br />

Erori <strong>de</strong> tipul II;<br />

Nivel <strong>de</strong> semnificaţie;<br />

o Further Regression Topics<br />

Regresia multiplă;<br />

Predictori binari şi predictori pe categorii;<br />

Interacţiuni;<br />

Selecţia mo<strong>de</strong>lelor;<br />

o Measures of Disease in Health Research<br />

Determinarea factorilor ce contribuie la un răspuns medical;<br />

I<strong>de</strong>ntificarea şi explicarea amprentelor geografice;<br />

Determinarea, <strong>de</strong>scrierea şi raportarea unui răspuns medical în curs;<br />

Determinarea măsurilor preventive;<br />

Sănătatea în planificarea şi <strong>de</strong>zvoltarea serviciilor <strong>de</strong> sănătate;<br />

Furnizarea <strong>de</strong> date administrative şi <strong>de</strong> planificare;<br />

o Logistic regression<br />

Când şi un<strong>de</strong> se foloseşte regresia logistică;<br />

Ce este regresia logistică;<br />

Interpretare: rata parităţilor;<br />

Rata parităţilor vs. riscul relativ;<br />

o Analysis of Survival Data<br />

Ce sunt datele <strong>de</strong> supravieţuire;<br />

Tabele <strong>de</strong> viaţă şi curbe <strong>de</strong> supravieţuire;<br />

Testarea pentru diferite rate <strong>de</strong> supravieţuire între grupuri;<br />

Analiza <strong>de</strong> regresie;<br />

Greşeli comune;<br />

o Analysis of clustered data<br />

Când sunt datele grupate;<br />

Meto<strong>de</strong> statistice vs. date grupate;<br />

Meto<strong>de</strong> complexe <strong>de</strong> investigare;<br />

o Statistics in medical journals<br />

Utilizarea <strong>de</strong>signului şi analizei;<br />

Utilizarea tehnicilor <strong>de</strong> analiză;<br />

Interpretarea rezultatelor;<br />

<strong>Raport</strong>area selectivă a rezultatelor;<br />

Citarea selectivă a literaturii;<br />

Obţinerea concluziilor;<br />

Summer School on Neural Networks in Classification, Regression and Data Mining<br />

÷ Organizator: Institutos Superiores <strong>de</strong> Engenharia do Porto (ISEP), Porto, PT<br />

÷ Tip: şcoală <strong>de</strong> vară<br />

÷ Perioadă: 6-12 Iulie 2008;<br />

÷ Deplasare: aferentă Obiectiv 1, Activitate 3;<br />

÷ Participanţi: <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>;<br />

÷ Tematica cursului:<br />

Basic Notions. Why NN? Joaquim Marques <strong>de</strong> Sá<br />

MLP and RBF algorithms Petia Georgieva<br />

MLP’s with Entropic Criteria Jorge Santos<br />

Data Mining with MLPs Paulo Cortez<br />

136


Functional Networks Noelia Sánchez Maroño<br />

Multi-class SVMs, Theory Yann Guermeur<br />

Functional Networks application Noelia Sánchez Maroño<br />

SVMs application to protein secondary structure prediction Yann Guermeur<br />

Multiple kernel learning and HM-SVM for bioinformatic applications Alexan<strong>de</strong>r Zien<br />

Semi-Supervised Learning Alexan<strong>de</strong>r Zien<br />

Multi-Valued and UB Neurons - I Igor Aizenberg<br />

Kernel PLS Mark Embrechts<br />

Multi-Valued and UB Neurons - II Igor Aizenberg<br />

Selecting Algorithms and Parameters with Meta-Learning Carlos Soares<br />

Text Mining Mark Embrechts<br />

÷ Puncte cheie din tematica cursului:<br />

o Basic Notions. Why NN?<br />

Learning Approaches<br />

What are NNs?<br />

A Simple Neuron: The Linear Discriminant<br />

Neural Activation Functions<br />

Learning Dichotomies: The Perceptron<br />

Neural Net Types<br />

FFNN as Universal Approximators<br />

o MLP and RBF algorithms<br />

Historical perspective - biological analogy<br />

Learning algorithms: Backpropagation, conjugate gradient, Newton’s<br />

methods<br />

NN Architectures - MLP, RBF<br />

Examples and applications<br />

o MLP’s with Entropic Criteria<br />

Entropy<br />

Entropy Estimation<br />

Entropy in Learning Systems<br />

Entropic Cost Function<br />

Algorithm Optimizations<br />

Other Similar Algorithms<br />

Experiments<br />

o Data Mining with MLPs<br />

Intensive Care and Meat Quality applications<br />

Knowledge Discovery in Databases (KDD)<br />

Data Mining (DM)<br />

Business Intelligence and Data Mining<br />

DM Methodologies: CRISP-DM<br />

DM goals & DM methods<br />

• Classification<br />

• Regression<br />

• Clustering<br />

• Link analysis<br />

Multilayer Perceptrons (MLPs)<br />

Activation functions<br />

Architecture/Topology<br />

Why Data Mining with MLPs?<br />

137


• Popularity<br />

• Universal Approximators<br />

• Nonlinearity<br />

• Robustness<br />

• Explanatory Knowledge<br />

Software<br />

R statistical environment<br />

Supervised Learning<br />

Handling Missing Data<br />

Outliers<br />

Non numerical variable remapping<br />

Feature Selection<br />

Classification Metrics<br />

Receiver Operating Characteristic (ROC)<br />

Regression Metrics<br />

Validation method: how to estimate the performance?<br />

MLP Training Algorithm<br />

Local Minima with MLP<br />

Overfitting<br />

Case Study: Intensive Care Medicine (Classification)<br />

Knowledge extraction (Decision Tree example for the renal organ)<br />

Case Study: Lamb Meat Quality (Regression)<br />

o Functional Networks<br />

Introduction to functional networks<br />

Differences between functional and artificial neural networks<br />

Functional equations<br />

Working with functional networks<br />

Different mo<strong>de</strong>ls<br />

Applications<br />

o Multi-class SVMs, Theory<br />

Yann Guermeur<br />

Guaranteed risk for large margin multi-category classifiers<br />

• Theoretical framework<br />

• Basic uniform convergence result<br />

• γ-ψ-dimensions<br />

• Generalized Sauer-Shelah lemma<br />

• Nature and rate of convergence<br />

Multi-class SVM<br />

• Multi-cathegory classification with binary SVMs<br />

• Class of functions implemented by the M-SVMs<br />

• Generalized formulation of the training algorithm<br />

• Three main mo<strong>de</strong>ls of M-SVMs<br />

• Some variants of the main mo<strong>de</strong>ls<br />

• Margins and support vectors<br />

Guaranteed risk for multi-class SVMs<br />

• Bounds on the covering numbers<br />

• Use of the Ra<strong>de</strong>macher complexity<br />

Mo<strong>de</strong>l selection for multi-class SVMs<br />

• Algorithms fitting the entire regularization path<br />

• Bounds on the leave-one-aut cross-validation error<br />

Open problems<br />

138


o SVMs application to protein secondary structure prediction<br />

Protein secondary structure prediction<br />

• Different levels of structural organization in proteins<br />

• A problem of central importance in structural biology<br />

• Different measures of prediction accuracy<br />

State of the art<br />

• Choice of the predictors<br />

• Building blocks and architecture of the main prediction methods<br />

Implementation of multi-class SVMs<br />

• Mo<strong>de</strong>ls implemented<br />

• Training algorithm<br />

• Dedicated RBF kernel<br />

• Computation opf weighting vector θ<br />

• Experimental results<br />

Future work<br />

o Multiple kernel learning and HM-SVM for bioinformatic applications<br />

Support Vector Machines (SVMs)<br />

Handling Non-Linearity with Kernels<br />

SVMs as Perceptrons<br />

Application: Predicting Protein Subcellular Localization<br />

Multiple Kernel Learning (MKL)<br />

Large Margin MKL Mo<strong>de</strong>l<br />

Optimization for MKL<br />

Normalization of Kernels<br />

Multiclass Multiple Kernel Learning<br />

Application: Predicting Protein Subcellular Localization<br />

o Semi-Supervised Learning<br />

Why Semi-Supervised Learning?<br />

Why and How Does SSL Work?<br />

Generative Mo<strong>de</strong>ls<br />

The Semi-Supervised SVM (S 3 VM)<br />

Graph-Based Methods<br />

Further Approaches (Co-Training, Transduction)<br />

o Multi-Valued and UB Neurons - I<br />

Why we need the complex valued neurons?<br />

A classical Minsky-Papert’s limitation<br />

Is it possible to learn XOR and Parity n functions using a single neuron?<br />

Multi-Valued and Universal Binary Neurons (MVN and UBN)<br />

Multi-valued mappings<br />

Traditional approaches to learn the multiple-valued mappings on a neuron<br />

Sigmoidal neurons: limitations<br />

Multi-Valued Neuron (MVN)<br />

Multi-valued mappings and multiple-valued logic<br />

Discrete-Valued (k-valued) Activation Function<br />

Multiple-Valued (k-valued) Threshold Functions<br />

Learning Algorithm for the Discrete MVN with the Error-Correction<br />

Learning Rule<br />

Continuous-Valued Activation Function<br />

Learning Algorithm for the Continuous MVN with the Error Correction<br />

Learning Rule<br />

A role of the factor 1/(n+1) in the Learning Rule<br />

Self-Adaptation of the Learning Rate<br />

139


Modified Learning Rules with the Self-Adaptive Learning Rate<br />

Convergence of the learning algorithm<br />

MVN as a mo<strong>de</strong>l of a biological neuron<br />

P-realizable Boolean Functions over the field of Complex numbers and a<br />

Universal Binary Neuron<br />

Depen<strong>de</strong>nce of the number of sectors on the number of inputs<br />

Learning Algorithm for UBN<br />

Mail Applications<br />

o Kernel PLS<br />

Introduction<br />

• Latent Variables<br />

• The Machine Learning Paradox<br />

• Beyond Regression (PCR)<br />

Principal Component Analysis (PCA)<br />

• Definition<br />

• NIPALS algorithm<br />

• Principal Component Regression (PCR)<br />

• Loading factors and variable selection<br />

Partial Least Squares (PLS)<br />

Nonlinear PLS<br />

• Kernels<br />

• Direct kernel methods<br />

• K-PCA<br />

• K-PLS<br />

• Preprocessing and centering the kernel<br />

• Variable/feature selection with sensitivity analysis<br />

Applications<br />

• Portuguese Wine data<br />

• Pima Indians<br />

• Italian Olive Oils multi-class classification<br />

• Svante Wold’s QSAR data<br />

• Real QSAR data<br />

• Time series prediction<br />

o Multi-Valued and UB Neurons - II<br />

Associative memory<br />

A feedforward multilayer MVN-based neural network (MLMVN), its<br />

<strong>de</strong>rivative-free backpropagation learning algorithm and solving some<br />

classification and prediction problems<br />

Learning of the genetic co<strong>de</strong> using MLMVN<br />

Gene expression data classification using MLMVN<br />

Blur i<strong>de</strong>ntification using MLMVN<br />

Solving the problem of Gene Expression Patterns<br />

Classification using the MVN-based neural network<br />

Learning of non-threshold Boolean functions using a single<br />

UBN<br />

o Selecting Algorithms and Parameters with Meta-Learning<br />

Background: why is this a problem?<br />

• approximating functions with machine learning<br />

• algorithm selection and bias<br />

• a few solutions<br />

Meta-Learning: THE solution<br />

140


Meta-learning for Algorithm Recommendation<br />

o Text Mining<br />

What is text mining<br />

Text mining process<br />

Visualizations for text mining<br />

Kernel methods<br />

Case studies<br />

Fingerprinting text<br />

Text categorization<br />

Applying text mining to bioinformatics<br />

Customer service center analysis<br />

Detecting ontologies<br />

2008A4. Stabilirea necesarelor <strong>de</strong> materiale şi consumabile, i<strong>de</strong>ntificarea furnizorilor şi<br />

condiţiilor <strong>de</strong> procurare, întocmirea documentaţiilor <strong>de</strong> procurare, <strong>de</strong>rularea licitaţiilor pentru<br />

achiziţii<br />

÷ S-au achiziţionat serie <strong>de</strong> echipamente pentru <strong>cercetare</strong>:<br />

o Fluorometru (pentru analize în soluţie)<br />

o Staţie Meteo Wireless (pentru monitorizare parametrii <strong>de</strong> mediu)<br />

o Notebook (pentru preluare date <strong>de</strong> la fluorometru şi <strong>de</strong> monitorizare parametrii <strong>de</strong><br />

mediu)<br />

÷ S-au achiziţionat o serie <strong>de</strong> obiecte <strong>de</strong> inventar necesare cercetării:<br />

o Procesor CPU Intel Xeon Quad Core; Multifunctional Brother; Panou solar fotovoltaic;<br />

Acumulatori; Regulator <strong>de</strong> încărcare; Afişaj regulator; Invertor; Imprimanta Canon;<br />

Senzor umiditate frunze; Senzor umiditate sol; Senzor temperatura din otel inoxidabil;<br />

Repetitor; Antena Yagi; Repetitor standard wireless<br />

÷ S-au achiziţionat o serie <strong>de</strong> cărţi:<br />

o Evolutionary Dynamics; Evolutionary Computation: The Fossil Record; The Genetical<br />

Theory of Natural Selection<br />

2008A5. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi<br />

dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />

Strasbourg Summer School on Chemoinformatics: CheminfoS3<br />

÷ Organizator: Louis Pasteur University (ULP), Strasbourg, FR<br />

÷ Tip: şcoală <strong>de</strong> vară<br />

÷ Perioadă: 20-04 Iunie-Iulie 2008;<br />

÷ Deplasare: aferentă Obiectiv 2, Activitate 5;<br />

÷ Participanţi: <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Carmen E. STOENOIU;<br />

÷ Cursurile şcolii:<br />

QSAR: discovery and first steps T. Fujita<br />

History and challenges of chemoinformatics J. Gasteiger<br />

Current trends in chemoinformatics W. Warr<br />

Fingerprint Design and Molecular Complexity Effects J. Bajorath<br />

Diversity Analysis and Library Design V. Gillet<br />

De novo Design G. Schnei<strong>de</strong>r<br />

Lessons learned from mo<strong>de</strong>lling bioactivity - what works and what doesn't R. Glen<br />

141


Exploring novel estrogen receptors and more... T. Oprea<br />

Tutorial: Impact of dataset composition on mo<strong>de</strong>ls performance A. Varnek<br />

Molecular <strong>de</strong>scriptors: an overview R. To<strong>de</strong>schini<br />

The good, the bad and the ugly practices of QSAR mo<strong>de</strong>lling A. Tropsha<br />

Pharmacophore Approach in Drug Discovery T. Langer<br />

Classification of chemical reactions J. Aires-<strong>de</strong>-Sousa<br />

Machine learning methods in QSAR I. Tetko<br />

Tutorial on application of non-linear methods in chemistry (neural networks,<br />

I. Baskin<br />

support vector machines)<br />

In silico target profiling J. Mestres<br />

Docking and post-docking strategies D. Rognan<br />

What Crystal Structure Databases Tell us about Conformational Preferences of<br />

M. Stahl<br />

Drug-like Molecules<br />

The Role of Cheminformatics in the Mo<strong>de</strong>rn Drug Discovery Process P. Ertl<br />

÷ Puncte cheie din cursuri:<br />

o QSAR: discovery and first steps<br />

Origin of Classical QSAR is from the SAR Studies of Agrochemicals<br />

Plant Growth Regulators/Herbici<strong>de</strong>s<br />

Structure-Activity Patterns<br />

The "Birth" of the Multi-variable Approach<br />

Features of the QSAR<br />

Conditions for the QSAR<br />

Classical QSAR for Series of Substituted Analogs<br />

Process of the Emergence of Biological Activity<br />

Early Trials of the Quantitative Approach<br />

Commercialized Drugs <strong>de</strong>veloped with the Aid of Classical QSAR<br />

o History and challenges of chemoinformatics<br />

the scope of chemoinformatics<br />

the beginnings<br />

a field of ist own<br />

scientific challenges<br />

political challenges<br />

o Current trends in chemoinformatics<br />

Literature analysis<br />

Hardware and infrastructure<br />

Web 2.0<br />

The Semantic Web<br />

Text mining<br />

Combichem<br />

Evaluation of scientific methods<br />

o Fingerprint Design and Molecular Complexity Effects<br />

Chemical Similarity Searching<br />

Molecular Fingerprints<br />

Similarity Search<br />

Multiple Active Reference Molecules<br />

Molecular Complexity and Size Effects<br />

Fingerprint Design<br />

Activity-Specific Descriptor Value Ranges<br />

Assessment of Descriptor Selectivity<br />

PDR-FP Descriptor Selection<br />

142


Similarity Assessment with PDR-FP<br />

Relevance of Complexity Effects<br />

Tversky Similarity<br />

Relevance of Complexity Effects<br />

Activity Classes of Different Avg. Size<br />

Pairwise Tversky Similarity<br />

Complexity Effects<br />

Weighted Tversky Coefficient<br />

Random Reduction of Bit Density<br />

o Diversity Analysis and Library Design<br />

Diversity Analysis<br />

• Measuring diversity<br />

• Selecting diverse subsets<br />

• Computational filtering<br />

Combinatorial Library Design<br />

• Designing libraries optimised on multiple properties<br />

• Reduced Graphs as Molecular Descriptors<br />

o De novo Design<br />

De Novo Design Concepts<br />

Adaptive Walk in a “Fitness Landscape”<br />

What is a Molecule?<br />

Local Neighborhood Search<br />

Local Neighborhood Strategies<br />

Elements of Artificial Adaptive Systems<br />

Ant Colony Optimization. A Simple Combinatorial Case: Pepti<strong>de</strong> Design<br />

Ant System for Combinatorial Design<br />

Principle of Evolutionary Strategies<br />

Algorithm of the (1,λ) Evolution Strategy<br />

De novo Fragment Assembly<br />

Operators of Evolutionary Optimization<br />

Particle Swarm Optimization (PSO)<br />

Visualization of Particle Trajectories<br />

COLIBREE®: Combinatorial Library Breeding<br />

Self-Organizing Map (SOM)<br />

Pharmacophore Road Map of Chemical Space<br />

o Lessons learned from mo<strong>de</strong>lling bioactivity - what works and what doesn't<br />

Dynamic pharmacophores in the 5HT1b/d GPCR<br />

• An introduction to <strong>de</strong>signing 5-HT1B ligands<br />

• 5-HT1B pharmacophore <strong>de</strong>velopment<br />

• Homology mo<strong>de</strong>lling based on the beta-2 crystal structure<br />

• Dynamic pharmacophores<br />

• Efficacy mo<strong>de</strong>ls<br />

Moving on to Structure-Activity/Property mo<strong>de</strong>ls - some observations<br />

• How reliable are solubility data?<br />

• ‘Solubility’ in the literature<br />

• So, we have created a Solubility Challenge<br />

• Methods to discover mo<strong>de</strong>ls<br />

• Property behaviour<br />

• So - does (Q)SAR work?<br />

• Overfitting and cross validation: three papers to read by Hawkins<br />

• A simple mo<strong>de</strong>l example, again using solubility - putting in<br />

143


parameters that relate to the phenomenon<br />

o Exploring novel estrogen receptors and more...<br />

MLI in Numbers<br />

NM MLSC (3-year summary) U54MH074425<br />

Summary Assays NMMLSC<br />

Integrated Discovery Teams<br />

HyperCyt<br />

Integration of VS & HTS<br />

GPR30 - A Novel Estrogen Target for MLI<br />

2D Similarity<br />

Shape Similarity - ROCS<br />

Electrostatic Similarity - EON<br />

In Silico Screening: Bet on all horses…<br />

Summary of Estrogen Receptors Results<br />

Biomolecular Screening Results<br />

Virtual and Biomolecular Screening Workflow<br />

Probe Discovery At NMMLSC<br />

How Many Drug Targets?<br />

WOMBAT-PK<br />

Measured Data in WOMBAT-PK<br />

Drug Targets & Dis-ease<br />

The Fitness Landscape<br />

Multi-Target Binding Affinity Cliffs<br />

Mono-Target Drugs<br />

Current Drugs Classification<br />

Unique Drug Targets by Class<br />

Urban Legend…<br />

Drug Targets Revisited<br />

From DrugBank<br />

What are the relevant drug metabolizing enzymes?<br />

The Problem with unique lists…<br />

More realistic? Overview of drug metabolism<br />

o Tutorial: Impact of dataset composition on mo<strong>de</strong>ls performance<br />

Software<br />

• R<br />

• Weka<br />

Datasets<br />

Mo<strong>de</strong>l building<br />

• Descriptors<br />

• Data files<br />

• Obtaining and validation of the mo<strong>de</strong>ls<br />

• Extracting the training and the external related test set from the<br />

Cherkasov dataset<br />

• Build and analyze a Bayesian mo<strong>de</strong>l<br />

• External validations on unrelated test set<br />

Detection of the bias: profiling of data sets<br />

o Molecular <strong>de</strong>scriptors: an overview<br />

The chemical data<br />

Molecular structure<br />

Some historical notes<br />

Molecular <strong>de</strong>scriptors intro<br />

• The role of the molecular <strong>de</strong>scriptors<br />

144


• Representations of a molecular structure<br />

• Properties of a molecular <strong>de</strong>scriptor<br />

Molecular <strong>de</strong>scriptors <strong>de</strong>tail<br />

• Molecular graph<br />

• Topological matrices<br />

• Local vertex invariants<br />

• Distance matrix<br />

• Strategies for molecular <strong>de</strong>scriptors<br />

o Următoarele 3 figuri<br />

• QSAR strategy<br />

o mo<strong>de</strong>ls ...<br />

regression mo<strong>de</strong>ls (quantitative response)<br />

classification mo<strong>de</strong>ls (qualitative response)<br />

ranking mo<strong>de</strong>ls (or<strong>de</strong>red response)<br />

145


• FAQ -Frequently Asked Questions<br />

• FGA - our Frequently Given Answers<br />

o The good, the bad and the ugly practices of QSAR mo<strong>de</strong>lling<br />

Introduction: The need for <strong>de</strong>veloping externally validated predictive<br />

mo<strong>de</strong>ls of biological data<br />

Why do mo<strong>de</strong>ls fail (bad practices)<br />

Predictive QSAR Mo<strong>de</strong>ling Workflow (good practices)<br />

Examples of the Workflow applications<br />

• QSAR based virtual screening and hit i<strong>de</strong>ntification<br />

• Consensus QSAR mo<strong>de</strong>ling of chemical toxicity<br />

Conclusions: “best”QSAR mo<strong>de</strong>ling is a <strong>de</strong>cision support science<br />

• focus on accurate predictions<br />

o Pharmacophore Approach in Drug Discovery<br />

146


Introduction - Non HTS Hit Recognition<br />

The SOSA Approach<br />

• Concept<br />

• Application Examples<br />

Pharmacophore-based Ligand Profiling<br />

• HT Mo<strong>de</strong>l Generation<br />

• Software Solutions<br />

• Application Examples<br />

o Classification of chemical reactions<br />

Why do we need to classify reactions?<br />

Representation of reactions<br />

RC (Reaction Classification) numbers<br />

Con<strong>de</strong>nsed Reaction Graphs (CRG)<br />

Fingerprints of enzymatic reaction features<br />

Representation of the reaction center with physicochemical parameters<br />

• Representation of reactions by physicochemical properties of the<br />

reaction center<br />

Representation of differences between the structures of products and<br />

reactants<br />

• Daylight fingerprints of reactions<br />

Reaction MOLMAPs<br />

Reaction signatures<br />

Fingerprints of reactions based on atom types<br />

o Machine learning methods in QSAR<br />

Multiple Linear Regression (MLR)<br />

Partial Least Squares (PLS)<br />

Support Vector Regression (SVR)<br />

Back-Propagation Neural Network (BPNN)<br />

K Nearest Neighbours(kNN)<br />

Decision Trees (DT)<br />

o Tutorial on application of non-linear methods in chemistry (neural networks,<br />

support vector machines)<br />

Benchmarking of Different Machine Learning Regression Methods<br />

• Machine Learning Methods<br />

• Datasets and Descriptors<br />

• Files<br />

• Step-by-Step Instructions<br />

o Initialization of the Experimenter mo<strong>de</strong><br />

o Specification of the list of databases to be processed<br />

o Specification of the list of machine learning methods<br />

o Running machine learning methods<br />

o Analysis of obtained results<br />

Descriptor Selection Bias<br />

• Datasets and Descriptors<br />

• Files<br />

• Mo<strong>de</strong>ling<br />

o Internal Cross-Validation using Preliminary Selected<br />

Descriptors<br />

o Internal cross-validation using <strong>de</strong>scriptors selected in<br />

course of mo<strong>de</strong>l building<br />

o External cross-validation<br />

147


o In silico target profiling<br />

Traditional drug discovery<br />

High-throughput screening<br />

Chemical Screening<br />

The need to go beyond traditional drug discovery<br />

Pharmacological Profiling<br />

Chemogenomic Profiling<br />

Necessary drug discovery<br />

Annotated chemical libraries: WOMBAT<br />

Chemo and Target spaces covered by WOMBAT<br />

Biologically-relevant <strong>de</strong>scriptors: SHED (Shannon Entropy Descriptors)<br />

Biologically-relevant molecular <strong>de</strong>scriptors<br />

Ligand-based approach to in silico pharmacology<br />

Validation example: nuclear receptor family<br />

Target ID case #1: Drug profiling<br />

Target ID case #2: Targeted chemical biology<br />

o Docking and post-docking strategies<br />

A few starting points<br />

Strategic importance of docking<br />

Docking Flowchart<br />

Which Compound Library?<br />

Commercially-available screening collections<br />

Library set--up<br />

Chemical Filters<br />

Pharmacokinetical filters<br />

Lead-likeness<br />

Which Ligand Conformation?<br />

Which Protein coordinates?<br />

Which Docking Tool?<br />

Docking methods<br />

Conformational sampling methods<br />

Which Scoring function?<br />

Scoring functions<br />

Scoring ΔG bind is extraordinarily difficult<br />

Predicting binding free energies<br />

Empirical scoring functions<br />

Potentials of mean force<br />

Force-fields<br />

Predicting ΔG bind is very difficult<br />

Docking Accuracy<br />

Ranking Accuracy<br />

Source of Docking Errors<br />

Pros and Cons of docking co<strong>de</strong>s<br />

Post-processing<br />

Consensus scoring<br />

Efficient Post-processing<br />

Docking + QSAR<br />

Flexible Protein - Flexible ligand docking<br />

Refining docking poses par MM-PB/SA, MM-GB/SA<br />

Use of topological scoring functions<br />

Post-processing by molecular diversity<br />

Post-processing vHTS results<br />

148


Post-processing: Visual Inspection<br />

Protein-based virtual screening: Current status<br />

o What Crystal Structure Databases Tell us about Conformational Preferences of<br />

Drug-like Molecules<br />

Conformational Energies Matter<br />

• Strained Bioactive Conformations Affect Binding Energy<br />

Required Generalizations<br />

• Statistics over Recurring Fragments<br />

Coverage of Relevant Substructures<br />

• In Crystal Structure Databases<br />

Cis or Trans? From Ami<strong>de</strong>s to Electrostatic Repulsion<br />

• Generalized Allylic Strain<br />

• The Sulfonyl Group<br />

• Properties of Aniline Derivatives<br />

• Project Example: New F.VIIaInhibitors<br />

o The Role of Cheminformatics in the Mo<strong>de</strong>rn Drug Discovery Process<br />

Data Explosion in Chemistry<br />

Cheminformatics in the Pharma Industry<br />

Drug Discovery & Development Process<br />

Typical Cheminformatics Activities at Pharmaceutical Industry<br />

• Molecular databases<br />

• Large-scale data analysis, knowledge discovery<br />

• Calculation of molecular properties / <strong>de</strong>scriptors<br />

• Estimation of ADME characteristics, toxicity alerting<br />

• Navigation in chemistry space<br />

• Virtual screening<br />

• Support for HTS - hitlist triaging<br />

• Support for combinatorial chemistry and molecule optimization<br />

Novartis Web-based Cheminformatics System<br />

• Novartis Data Warehouse - Avalon<br />

• Classification of GPCR Ligands<br />

• Novartis In Silico Profiling<br />

• 3D Hydrophobicity<br />

149


• Molecular Property Space<br />

• Structural Diversity Space<br />

The Scaffold Tree - Basic Algorithm<br />

• Scaffold Tree Example for HTS results<br />

Virtual Screening<br />

• Virtual Screening Workflow<br />

• Learning from the Nature<br />

High-Throughput Screening - HTS<br />

Combinatorial Chemistry Molecule Design<br />

• Early CombiChem<br />

• Database of Organic Substituents<br />

Bioisosteric Design<br />

• Substituent Bioisosteric Design<br />

• Cheminformatics - Future Trends<br />

2008A6. Planificarea activităţilor experimentale; <strong>de</strong>rularea experimentelor <strong>de</strong>monstrative (<strong>de</strong><br />

testare a meto<strong>de</strong>lor <strong>de</strong> analiză)<br />

În această fază s-au testat meto<strong>de</strong>le <strong>de</strong> predicţie bazată pe regresie şi calcul al intervalului <strong>de</strong><br />

încre<strong>de</strong>re al estimatei pentru ca în final să se planifice activităţile experimentale. O serie <strong>de</strong> studii<br />

anterioare (Diu<strong>de</strong>a & others, 2001-MT; Jäntschi & Ungureşan, 2001-SCA; Jäntschi & Ungureşan,<br />

2001-MKD; Jäntschi & others, 2006-GPAP; Jäntschi, 2007-CCPN; Jäntschi & others, 2007-CCPN;<br />

Jäntschi & Bolboacă, 2008-EEVC) au reprezentat suportul cercetării, finalizate prin publicarea unui<br />

nou rezultat (Jäntschi & others, 2008-FVCT).<br />

Testarea meto<strong>de</strong>i <strong>de</strong> predicţie bazată pe regresie (metoda leave-one-out):<br />

Metoda constă în următoarele etape:<br />

÷ <strong>de</strong>terminarea valorilor estimate (YY) pe baza ecuaţiei mo<strong>de</strong>lului <strong>de</strong> regresie lineară: Y=aX+b<br />

÷ eliminarea pe rând a câte unei valori din mulţimea valorilor observate şi reconstructţia<br />

mo<strong>de</strong>lului <strong>de</strong> regresie;<br />

÷ calcularea valorii prezise pentru compusul elininat pentru valorilor prezise pe baza ecuaţiei<br />

noului mo<strong>de</strong>l <strong>de</strong> regresie lineară<br />

÷ coeficienţii (ai) şi (bi), 1 ≤ i ≤ n, n = numărul <strong>de</strong> valori observate (măsurate) sunt obţinuţi prin<br />

minimizarea sumei pătratelor distanţelor între valorile observate şi cele estimate:<br />

Rezultate obţinute:<br />

n<br />

∑<br />

j=<br />

1<br />

j≠i<br />

2<br />

( ) min<br />

YYi = aiXi+bi, (ai, bi) din Y − a X − b = , i = 1..n<br />

Mol ISDmsHt lADrtHg Y YY YYY<br />

PCB001 151.28 -2.4129 0.0997 0.108431 0.108812<br />

PCB002 150.54 -2.4752 0.1544 0.154384 0.154383<br />

PCB003 150.89 -2.4799 0.1937 0.167591 0.166551<br />

PCB004 147.93 -2.5878 0.2245 0.206896 0.206397<br />

PCB005 148.27 -2.6449 0.2785 0.273453 0.273315<br />

PCB006 146.92 -2.661 0.2709 0.257517 0.257212<br />

PCB007 147.28 -2.6499 0.2566 0.254805 0.254763<br />

PCB008 147.4 -2.6659 0.2783 0.274048 0.27395<br />

PCB009 146.92 -2.6638 0.257 0.26038 0.260456<br />

PCB010 147.93 -2.5976 0.2243 0.216919 0.216717<br />

PCB011 146.28 -2.7289 0.3238 0.311597 0.311365<br />

PCB012 147.99 -2.7018 0.3298 0.324924 0.324777<br />

j<br />

150<br />

i<br />

j<br />

i


PCB013 146.55 -2.7348 0.3315 0.324111 0.323962<br />

PCB014 146.17 -2.7028 0.2373 0.282264 0.28317<br />

PCB015 146.95 -2.7398 0.3387 0.338825 0.338828<br />

PCB016 144.84 -2.809 0.3625 0.358953 0.358902<br />

PCB017 143.95 -2.8148 0.3398 0.343524 0.343579<br />

PCB018 143.92 -2.8046 0.3378 0.332372 0.332284<br />

PCB019 144.45 -2.7588 0.3045 0.298253 0.298128<br />

PCB020 143.94 -2.8881 0.417 0.418247 0.418263<br />

PCB021 145.59 -2.8521 0.4135 0.421032 0.42121<br />

PCB022 144.33 -2.8943 0.4267 0.433949 0.434063<br />

PCB023 144.26 -2.8423 0.377 0.379088 0.379115<br />

PCB024 144.98 -2.7928 0.3508 0.345746 0.345669<br />

PCB025 142.85 -2.8941 0.3937 0.398222 0.398271<br />

PCB026 143.03 -2.8787 0.3911 0.386793 0.386743<br />

PCB027 143.2 -2.8355 0.3521 0.346692 0.346606<br />

PCB028 143.38 -2.8993 0.4031 0.416261 0.416403<br />

PCB029 144.72 -2.843 0.382 0.390845 0.390974<br />

PCB030 143.55 -2.8075 0.3165 0.326457 0.326639<br />

PCB031 143.43 -2.8846 0.4094 0.402427 0.40235<br />

PCB032 143.81 -2.8378 0.3636 0.363685 0.363687<br />

PCB033 144.41 -2.8783 0.4163 0.419506 0.419553<br />

PCB034 142.48 -2.8821 0.3782 0.377069 0.377054<br />

PCB035 143.67 -2.9513 0.4738 0.476401 0.476445<br />

PCB036 141.95 -2.9517 0.4375 0.435528 0.435511<br />

PCB037 143.98 -2.9575 0.4858 0.490183 0.490277<br />

PCB038 144.95 -2.9018 0.5102 0.4565 0.455205<br />

PCB039 142.13 -2.9587 0.4488 0.447007 0.446992<br />

PCB040 141.79 -3.0255 0.5102 0.507163 0.507135<br />

PCB041 142.2 -3.0078 0.499 0.498902 0.498901<br />

PCB042 140.81 -3.0324 0.487 0.490699 0.490723<br />

PCB043 140.74 -3.0015 0.4587 0.457417 0.457406<br />

PCB044 140.86 -3.0208 0.4832 0.480035 0.480013<br />

PCB045 141.71 -2.9477 0.4334 0.425677 0.425602<br />

PCB046 141.3 -2.9745 0.445 0.443245 0.443229<br />

PCB047 139.96 -3.0381 0.4639 0.476127 0.476233<br />

PCB048 141.3 -3.0027 0.4651 0.472085 0.472136<br />

PCB049 139.89 -3.0274 0.461 0.463504 0.46353<br />

PCB050 140.38 -2.9636 0.4007 0.410016 0.41018<br />

PCB051 140.51 -2.9777 0.4242 0.427557 0.427602<br />

PCB052 139.93 -3.0156 0.4557 0.452396 0.452356<br />

PCB053 140.35 -2.967 0.4187 0.412774 0.412672<br />

PCB054 141.12 -2.9114 0.38 0.374393 0.374275<br />

PCB055 141.2 -3.0914 0.5562 0.560398 0.560449<br />

PCB056 141.37 -3.1016 0.5676 0.57491 0.575025<br />

PCB057 139.95 -3.08 0.5515 0.518738 0.518549<br />

PCB058 139.53 -3.1049 0.5267 0.534122 0.534163<br />

PCB059 140.56 -3.0287 0.486 0.480914 0.480878<br />

PCB060 141.2 -3.0914 0.5676 0.560398 0.560311<br />

PCB061 142.89 -3.0272 0.5331 0.535303 0.535349<br />

PCB062 142.2 -2.9831 0.4685 0.473641 0.473687<br />

151


PCB063 140.25 -3.0872 0.529 0.533302 0.533328<br />

PCB064 141.08 -3.032 0.4999 0.49677 0.496749<br />

PCB065 142.2 -2.9716 0.4671 0.46188 0.461836<br />

PCB066 140.33 -3.1075 0.5447 0.555983 0.556066<br />

PCB067 140.32 -3.0814 0.5214 0.52905 0.529096<br />

PCB068 138.35 -3.1119 0.504 0.51296 0.513051<br />

PCB069 139.06 -3.0453 0.451 0.461889 0.462054<br />

PCB070 140.46 -3.0913 0.5407 0.542535 0.542548<br />

PCB071 140.74 -3.0447 0.4989 0.501598 0.501615<br />

PCB072 138.61 -3.0945 0.4984 0.501405 0.501437<br />

PCB073 138.69 -3.0486 0.4554 0.456383 0.456402<br />

PCB074 140.76 -3.0875 0.5341 0.545849 0.545945<br />

PCB075 139.7 -3.0475 0.4643 0.4795 0.479638<br />

PCB076 141.3 -3.073 0.5408 0.543981 0.544014<br />

PCB077 141.04 -3.1696 0.6295 0.636533 0.636727<br />

PCB078 140.67 -3.1465 0.6024 0.604028 0.604054<br />

PCB079 139.28 -3.1702 0.5894 0.594904 0.594942<br />

PCB080 137.65 -3.1697 0.5464 0.555271 0.55534<br />

PCB081 140.89 -3.1536 0.6149 0.61657 0.616604<br />

PCB082 139.09 -3.2205 0.6453 0.641786 0.641744<br />

PCB083 137.72 -3.2131 0.6029 0.601336 0.601328<br />

PCB084 138.58 -3.158 0.5744 0.565626 0.565582<br />

PCB085 138.15 -3.2273 0.6224 0.626179 0.626201<br />

PCB086 139.42 -3.179 0.6105 0.607264 0.607236<br />

PCB087 138.16 -3.2153 0.6175 0.614147 0.614129<br />

PCB088 138.96 -3.1307 0.5486 0.546827 0.546818<br />

PCB089 138.7 -3.1661 0.5779 0.57679 0.576785<br />

PCB090 136.66 -3.2207 0.5814 0.583667 0.583687<br />

PCB091 137.71 -3.1622 0.5549 0.549041 0.548992<br />

PCB092 136.78 -3.2077 0.5742 0.573252 0.573243<br />

PCB093 138.85 -3.1224 0.5437 0.535699 0.53565<br />

PCB094 137.12 -3.1594 0.5331 0.532016 0.532001<br />

PCB095 137.63 -3.1503 0.5464 0.53495 0.53483<br />

PCB096 138.3 -3.0959 0.5057 0.495397 0.495259<br />

PCB097 138.19 -3.2151 0.61 0.614662 0.614687<br />

PCB098 137.18 -3.1758 0.5415 0.550229 0.550321<br />

PCB099 137.26 -3.2215 0.588 0.598886 0.598946<br />

PCB100 136.43 -3.1787 0.5212 0.535194 0.535458<br />

PCB101 137.26 -3.2094 0.5816 0.586511 0.586542<br />

PCB102 137.78 -3.1579 0.5431 0.546323 0.54635<br />

PCB103 136.24 -3.1675 0.5142 0.519179 0.519303<br />

PCB104 137.08 -3.1084 0.4757 0.478899 0.478988<br />

PCB105 138.61 -3.301 0.7049 0.712592 0.712776<br />

PCB106 138.53 -3.2612 0.668 0.669969 0.669995<br />

PCB107 137.32 -3.289 0.6628 0.669358 0.669406<br />

PCB108 136.74 -3.3048 0.6626 0.671596 0.671651<br />

PCB109 137.73 -3.2154 0.6016 0.603928 0.603939<br />

PCB110 138.04 -3.2333 0.6314 0.629675 0.629665<br />

PCB111 135.57 -3.2916 0.6183 0.630015 0.630114<br />

PCB112 137.81 -3.2023 0.5986 0.592451 0.592421<br />

152


PCB113 136.08 -3.2367 0.5862 0.58611 0.586109<br />

PCB114 138.87 -3.2683 0.6828 0.68539 0.68544<br />

PCB115 138.28 -3.2186 0.6171 0.620402 0.620421<br />

PCB116 140.69 -3.1448 0.6132 0.60277 0.602604<br />

PCB117 138.24 -3.2065 0.615 0.607067 0.607026<br />

PCB118 137.73 -3.29 0.6693 0.680221 0.680334<br />

PCB119 136.58 -3.2505 0.5968 0.612223 0.612321<br />

PCB120 135.85 -3.2936 0.6256 0.638781 0.638869<br />

PCB121 134.49 -3.255 0.5518 0.566663 0.567115<br />

PCB122 138.29 -3.2921 0.6871 0.69581 0.695956<br />

PCB123 137.16 -3.2988 0.6658 0.67554 0.675613<br />

PCB124 137.38 -3.2808 0.6584 0.662412 0.66244<br />

PCB125 137.56 -3.2324 0.6142 0.617234 0.617249<br />

PCB126 137.98 -3.3609 0.7512 0.758731 0.758968<br />

PCB127 136.31 -3.3607 0.7078 0.718444 0.718545<br />

PCB128 136.38 -3.4116 0.7761 0.77218 0.772101<br />

PCB129 136.34 -3.387 0.7501 0.746061 0.746005<br />

PCB130 134.97 -3.4039 0.7184 0.730463 0.730554<br />

PCB131 135.78 -3.3375 0.6853 0.681997 0.681978<br />

PCB132 135.93 -3.3453 0.7035 0.693574 0.693512<br />

PCB133 133.67 -3.3952 0.6871 0.690364 0.690401<br />

PCB134 135.77 -3.3282 0.6796 0.672246 0.672204<br />

PCB135 134.43 -3.3376 0.6563 0.649698 0.649618<br />

PCB136 135.51 -3.2748 0.6257 0.611394 0.611236<br />

PCB137 135.48 -3.4055 0.7329 0.74434 0.744453<br />

PCB138 135.48 -3.4055 0.7403 0.74434 0.74438<br />

PCB139 134.95 -3.3413 0.6707 0.665962 0.665925<br />

PCB140 134.57 -3.3634 0.6707 0.679443 0.679516<br />

PCB141 135.4 -3.3811 0.72 0.717466 0.717448<br />

PCB142 137.38 -3.2892 0.6848 0.671003 0.670897<br />

PCB143 135.84 -3.3307 0.6789 0.676483 0.676469<br />

PCB144 134.83 -3.3291 0.6563 0.650605 0.65055<br />

PCB145 135.58 -3.2721 0.6149 0.610312 0.610263<br />

PCB146 134.06 -3.3977 0.6955 0.702281 0.70234<br />

PCB147 134.81 -3.3329 0.6608 0.654011 0.653947<br />

PCB148 132.95 -3.3566 0.6243 0.633607 0.633874<br />

PCB149 135 -3.3367 0.6672 0.662458 0.66242<br />

PCB150 134.21 -3.2887 0.5969 0.594407 0.594344<br />

PCB151 134.81 -3.3196 0.6499 0.64041 0.640304<br />

PCB152 135.38 -3.263 0.6062 0.596206 0.596062<br />

PCB153 134.57 -3.399 0.7036 0.715851 0.715939<br />

PCB154 133.65 -3.3544 0.6349 0.648158 0.648398<br />

PCB155 133.03 -3.3014 0.5666 0.579074 0.579654<br />

PCB156 135.88 -3.4662 0.8105 0.816018 0.816172<br />

PCB157 135.48 -3.4879 0.8184 0.82861 0.828896<br />

PCB158 135.19 -3.4161 0.7429 0.74822 0.748271<br />

PCB159 134.09 -3.4692 0.7655 0.776124 0.77623<br />

PCB160 136.25 -3.3722 0.7396 0.728765 0.72865<br />

PCB161 133.2 -3.42 0.6968 0.704446 0.704542<br />

PCB162 134.27 -3.4743 0.7737 0.78566 0.785797<br />

153


PCB163 135.23 -3.4027 0.7396 0.735476 0.735442<br />

PCB164 134.89 -3.4161 0.7399 0.74102 0.741029<br />

PCB165 133.36 -3.4053 0.692 0.693253 0.693269<br />

PCB166 136.72 -3.3762 0.7572 0.744137 0.743928<br />

PCB167 134.6 -3.4758 0.7814 0.795115 0.795307<br />

PCB168 133.35 -3.4347 0.7068 0.72308 0.723245<br />

PCB169 134.95 -3.5475 0.8625 0.876843 0.877402<br />

PCB170 133.57 -3.5738 0.874 0.870618 0.870535<br />

PCB171 133.12 -3.5207 0.8089 0.805512 0.805473<br />

PCB172 132.24 -3.565 0.8278 0.829696 0.829721<br />

PCB173 134.24 -3.4918 0.8152 0.802837 0.802667<br />

PCB174 133.1 -3.5046 0.7965 0.788566 0.788485<br />

PCB175 131.58 -3.513 0.7611 0.760675 0.760668<br />

PCB176 132.74 -3.4468 0.7305 0.720814 0.720684<br />

PCB177 133.06 -3.5114 0.8031 0.794561 0.79447<br />

PCB178 131.64 -3.5024 0.7537 0.751275 0.751234<br />

PCB179 132.62 -3.4369 0.7205 0.707809 0.707608<br />

PCB180 132.66 -3.567 0.8362 0.841822 0.841904<br />

PCB181 133.32 -3.496 0.7968 0.785051 0.784934<br />

PCB182 131.66 -3.5238 0.7653 0.77364 0.77376<br />

PCB183 132.19 -3.5115 0.772 0.773782 0.773803<br />

PCB184 131.49 -3.4607 0.7016 0.705028 0.705119<br />

PCB185 133.28 -3.4826 0.7848 0.770387 0.770252<br />

PCB186 133.94 -3.424 0.7416 0.726298 0.726173<br />

PCB187 132.13 -3.502 0.7654 0.762626 0.76259<br />

PCB188 131.25 -3.4517 0.692 0.690063 0.689999<br />

PCB189 132.78 -3.6479 0.9142 0.927439 0.927898<br />

PCB190 133.66 -3.5688 0.874 0.867664 0.867511<br />

PCB191 132 -3.5952 0.8447 0.854821 0.854973<br />

PCB192 131.75 -3.5718 0.8269 0.82489 0.824864<br />

PCB193 132.12 -3.5803 0.8397 0.842463 0.842502<br />

PCB194 130.8 -3.7308 0.962 0.964698 0.964782<br />

PCB195 131.52 -3.6711 0.9321 0.920924 0.920651<br />

PCB196 130.24 -3.6759 0.8938 0.895111 0.895135<br />

PCB197 129.97 -3.6147 0.8293 0.826041 0.825977<br />

PCB198 130.07 -3.6621 0.8845 0.876917 0.876784<br />

PCB199 131.14 -3.594 0.8494 0.832953 0.832718<br />

PCB200 129.81 -3.6048 0.8197 0.812076 0.811905<br />

PCB201 130.07 -3.6621 0.8875 0.876917 0.876731<br />

PCB202 129.77 -3.5937 0.8089 0.799764 0.79954<br />

PCB203 130.59 -3.661 0.8938 0.888273 0.888176<br />

PCB204 129.8 -3.6087 0.8217 0.815825 0.815695<br />

PCB205 130.5 -3.743 0.9678 0.969974 0.970041<br />

PCB206 128.67 -3.8212 1.0103 1.006027 1.005892<br />

PCB207 128.32 -3.7579 0.9423 0.93289 0.932664<br />

PCB208 128.24 -3.747 0.932 0.919822 0.919526<br />

PCB209 126.7 -3.8963 1.0496 1.035549 1.035067<br />

Din analiza regresiei se poate observa că valorile prezise aproximează foarte bine valorile observate<br />

aşa incât mo<strong>de</strong>lul studiat e stabil.<br />

ANOVA df SS MS F Significance F<br />

154


Regression 1 6.730776811 6.730777 71183.87637 1.2444E-264<br />

Residual 207 0.019572842 9.46E-05<br />

Total 208 6.750349654<br />

Coefficients Standard Error t Stat P-value Lower 95%<br />

Intercept 0.001676011 0.002337583 0.716985 0.474191692 -0.002932507<br />

Y 0.997196853 0.003737576 266.8031 1.2444E-264 0.989828262<br />

Testarea meto<strong>de</strong>i <strong>de</strong> calcul a intervalului <strong>de</strong> încre<strong>de</strong>re (confi<strong>de</strong>nţă) pentru variabile distribuite binomial<br />

Definiţie: un şir estimat <strong>de</strong> valori care cu o anumită probabilitate (e.g. 95%, 99%, 99.9%) includ un<br />

parametru necunoscut al populaţiei, intervalul estimat fiind calculat pe un anumit set <strong>de</strong> date. Dacă<br />

din populaţie se extrag în mod repetat, eşantioane in<strong>de</strong>pen<strong>de</strong>nte şi se calculează câte un interval <strong>de</strong><br />

confi<strong>de</strong>nţă pentru fiecare eşantion, atunci un anumit procent al intervalelor va conţine parametrul<br />

necunoscut al populaţiei. Cel mai frenvent intervalele <strong>de</strong> confi<strong>de</strong>nţă sunt calculate pentru un procent<br />

<strong>de</strong> 95%. Generic acest procent se notează cu α şi se mai numeşte şi prag <strong>de</strong> semnificaţie.<br />

Variabilele cantitative şi calitative care rezultă din observaţii urmează anumite distribuţii teoretice.<br />

Varibilele continue urmează <strong>de</strong> regulă, distribuţia normală (Laplace-Gauss) în timp ce varibilelele<br />

discrete urmează distribuţia binomială.<br />

Distribuţia normală a fost introdusă <strong>de</strong> De Moivre în contextul aproximării unei distribuţii<br />

binomiale cu un n (volum al eşantionului) mare. Mai târziu rezultatele au fost extinse <strong>de</strong> Laplace în<br />

teorema care acum este cunoscută sub numele <strong>de</strong> Teorema lui De Moivre-Laplace.<br />

Estimarea intervalelor <strong>de</strong> confi<strong>de</strong>nţă pentru proporţii utilizând o distribuţie normală a fost şi este şi<br />

astăzi frecvent utilizată în simulare, datorită faptului că, în practică era mai uşor <strong>de</strong> aplicat<br />

distribuţia normală <strong>de</strong>cât cea binomială <strong>de</strong> exemplu (calcul mai puţin laborios).<br />

Dacă pe un eşantion <strong>de</strong> talie n consi<strong>de</strong>răm variabila X ce urmează o distribuţie binomialǎ atunci<br />

probabilitatea <strong>de</strong> a obţine valoarea Y(0 ≤ Y ≤ n) este dată <strong>de</strong> formula:<br />

Y<br />

n−<br />

Y<br />

n!<br />

X<br />

( )<br />

( n − X)<br />

PB<br />

n,<br />

X,<br />

Y = ⋅<br />

n<br />

Y!<br />

( n − Y)<br />

! n<br />

Media, respectiv variaţia distributiei binomiale sunt:<br />

M n,X = X<br />

( )<br />

( )<br />

X⋅ n−X Var ( n, X)<br />

=<br />

n<br />

Probabilitatea <strong>de</strong> a obţine variabila normală Y care are media M(n, X) şi variaţia Var(n,X) este dată<br />

<strong>de</strong> formula:<br />

( Y−M<br />

( n,<br />

X)<br />

)<br />

2Var(<br />

n,<br />

X)<br />

1<br />

−<br />

PN<br />

( n,<br />

X,<br />

Y)<br />

=<br />

⋅e<br />

2πVar(<br />

n,<br />

X)<br />

Întrucât noua variabilă normala <strong>de</strong>pin<strong>de</strong> doar <strong>de</strong> medie şi dispersie, înlocuind media şi dispersia din<br />

formula distribuţiei binomiale se obţine următoarea formulă:<br />

( n,<br />

X,<br />

Y)<br />

2 ( Y − X)<br />

X(<br />

n − X)<br />

−<br />

2<br />

2 ( Y−X<br />

)<br />

X(<br />

n−X<br />

) n<br />

PN<br />

=<br />

⋅e<br />

2 n<br />

Eroarea <strong>de</strong> aproximare a distribuţiei binomiale a variabilei Y printr-o distribuţie normală este dată<br />

astfel <strong>de</strong> formula:<br />

Err( n,<br />

X,<br />

Y)<br />

= PB<br />

( n,<br />

X,<br />

Y)<br />

− PN<br />

( n,<br />

X,<br />

Y)<br />

Având în ve<strong>de</strong>re că probabilitatea lui Y <strong>de</strong>screşte odată cu creşterea dispersiei lui X, funcţia <strong>de</strong><br />

eroare poate fi discretizată prin:<br />

⎧ PB<br />

( n,<br />

X,<br />

Y)<br />

− PN<br />

( n,<br />

X,<br />

Y)<br />

, PB<br />

( n,<br />

X,<br />

Y)<br />

> 1 n<br />

Errc<br />

( n,<br />

X,<br />

Y)<br />

= ⎨<br />

⎩0<br />

, PB<br />

( n,<br />

X,<br />

Y)<br />

< 1 n<br />

O serie <strong>de</strong> meto<strong>de</strong> au fost propuse pentru evaluarea intervalelor <strong>de</strong> confi<strong>de</strong>nţă [Sorana Daniela<br />

BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>. Binomial Distribution Sample Confi<strong>de</strong>nce Intervals Estimation<br />

155<br />

2


for Positive and Negative Likelihood Ratio Medical Key Parameters. Annual Symposium on<br />

Biomedical and Health Informatics, American Informatics Medical Association, Bethseda, Special<br />

Issue: from Foundations to Applications to Policy (Proc. CD, October 22-26, Washington D.C.,<br />

USA), 2005:66-70, && Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>. Optimized Confi<strong>de</strong>nce<br />

Intervals for Binomial Distributed Samples. International Journal of Pure and Applied Mathematics<br />

2007;40(3)]:<br />

Metoda Formula<br />

AvgOEA<br />

∑ − n A M<br />

εX<br />

, n<br />

100 α −<br />

X=<br />

An<br />

+ 1−<br />

2A<br />

( )<br />

∑ −<br />

StDOEA n A M<br />

2<br />

εX<br />

, n − AvgOEA<br />

X=<br />

A n − 2A<br />

( )<br />

∑ −<br />

SiDOEA<br />

n A M<br />

2<br />

εX,<br />

n −100α<br />

X=<br />

A n + 1−<br />

2A<br />

AvADAA n<br />

M<br />

A ε − AvgOEA<br />

AvADSA<br />

S8DOEA<br />

∑ −<br />

X=<br />

A<br />

8<br />

∑ − n A<br />

X=<br />

A<br />

n A<br />

∑<br />

X A<br />

−<br />

=<br />

X,<br />

n<br />

ε<br />

n − 2A<br />

M<br />

X,<br />

n<br />

−100α<br />

n + 1−<br />

2A<br />

M ( ε −100α)<br />

n + 1−<br />

2A<br />

un<strong>de</strong>:<br />

n = talia eşantionului;<br />

M = metoda utilizatǎ pentru calculul intervalului <strong>de</strong> confi<strong>de</strong>nţă;<br />

ε M = eroarea experimentalǎ obţinutǎ în urma aplicǎrii meto<strong>de</strong>i investigate;<br />

α = pragul <strong>de</strong> semnificaţie impus (α = 5%);<br />

A = variabila binarǎ (cu valorile 0 sau 1);<br />

Eroarea experimentalǎ pentru distribuţia binomialǎ corespunzǎtoare unui eşantion <strong>de</strong> volum<br />

n este datǎ <strong>de</strong> formula:<br />

∑dBin(<br />

n,<br />

X,<br />

Y)<br />

+ ∑dBin(<br />

n,<br />

X,<br />

Y)<br />

M<br />

M<br />

CIL<br />

( n,<br />

X,<br />

Y)<br />

> X<br />

CIL<br />

( n,<br />

X,<br />

Y)<br />

> X<br />

Err(<br />

n,<br />

X,<br />

Y)<br />

= n−1<br />

dBin n,<br />

X,<br />

Y<br />

∑<br />

Y=<br />

1<br />

X,<br />

n<br />

8<br />

( )<br />

M<br />

un<strong>de</strong> dBin(X,Y) este probabilitatea distribuţiei binomiale, CI este limita inferioarǎ a intervalului<br />

M<br />

<strong>de</strong> încre<strong>de</strong>re <strong>de</strong>termiat prin metoda M, iar CIU<br />

este limita inferioarǎ a intervalului <strong>de</strong> încre<strong>de</strong>re<br />

<strong>de</strong>termiat prin metoda M.<br />

În <strong>de</strong>terminarea intervalului <strong>de</strong> confi<strong>de</strong>nţǎ s-a generat un eşantion cu distribuţie binomialǎ. În acest<br />

sens s-au implementat în PHP funcţii care genereazǎ coeficientul binomial şi distribuţia <strong>de</strong><br />

probabilitate. Totodatǎ s-au evaluat şi timpii <strong>de</strong> execuţie necesari pentru calculul eşantionului ce<br />

urmeazǎ o distribuiţie binomialǎ observându-se cǎ optimizarea parametrului X/n în loc <strong>de</strong> X şi a lui<br />

(n-X)/n în loc <strong>de</strong> (n-X) duce la creşterea performanţei.<br />

Întervalul <strong>de</strong> confi<strong>de</strong>nţă în cazul distribuţiei binomiale pentru o singură variabilă este dat <strong>de</strong> formula<br />

CII ( X)<br />

= ( CIL(<br />

X)<br />

, CIU<br />

( X)<br />

) , un<strong>de</strong> CIL(X) şi CIU(X) sunt limita inferioară, respective superioară a<br />

intervalului <strong>de</strong> confi<strong>de</strong>nţă. Au fost calculate şi evaluate o serie <strong>de</strong> meto<strong>de</strong> diferite utilizate şi<br />

raportate în literatura <strong>de</strong> specialitate pentru calcularea intervalului <strong>de</strong> confi<strong>de</strong>nţă.<br />

Următorul tabel conţine meto<strong>de</strong>le supuse evaluării:<br />

156<br />

L


Metoda Formula intervalului <strong>de</strong> încre<strong>de</strong>re<br />

0 . 5<br />

X ± z(<br />

X(<br />

n − X n)<br />

) + c ,<br />

Wald un<strong>de</strong> c=0(corectia standard);<br />

c=0.5 (corectia la continuitate)<br />

2<br />

X + z<br />

n ⋅<br />

2<br />

1 2<br />

2 ± z(<br />

z 4 + X(<br />

1−<br />

X n)<br />

)<br />

2<br />

n + z<br />

Wilson<br />

Corecţia la continuitate:<br />

2<br />

2<br />

X + z 2 − z(<br />

( z −1<br />

n ) 4 + X(<br />

1−<br />

( X −1)<br />

n)<br />

+ 1 2<br />

n ⋅<br />

2<br />

n + z<br />

2<br />

2<br />

X + z 2 + z(<br />

( z −1<br />

n ) 4 + X(<br />

1−<br />

( X −1)<br />

n)<br />

+ 1 2<br />

n ⋅<br />

2<br />

n + z<br />

sin ( arcsin X n z 2 n )<br />

2<br />

± sau 0 (X=0) sau 1 (X=1)<br />

Corecţia la continuitate:<br />

sin ( arcsin ( X 0.<br />

5)<br />

( n 3 4)<br />

z 2 n )<br />

2<br />

ArcSin<br />

± + ±<br />

sin arcsin X 0.<br />

5 n z 2 n<br />

2<br />

± ±<br />

sin 2<br />

( )<br />

( )<br />

( ( ) )<br />

( X + 3 8 ± 0.<br />

5)<br />

n + 3 4 ± z 2<br />

( arcsin<br />

n + 0.<br />

5)<br />

1 2<br />

1 2<br />

2<br />

2<br />

2<br />

2<br />

( X + z 2)<br />

( n + z − ( n ⋅ X + z 2)<br />

)( n + z )<br />

Agresti-<br />

Coull<br />

2<br />

X + z<br />

n ⋅<br />

2 ± z<br />

2<br />

n + z<br />

1 2<br />

Logit<br />

−1<br />

⎡<br />

1 2<br />

⎛<br />

⎞ ⎤<br />

⎢ ⎜ X ⎛<br />

⎞<br />

⎜ ⎛ n ⎞<br />

n ⋅ 1−<br />

1+<br />

exp ± z⎜<br />

⎟ ⎟⎟<br />

⎥ pentru 0


1.2<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

1.2<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

Metoda Wald<br />

0<br />

0 1 2 3 4 5 6 7 8 9 10<br />

1<br />

Metoda Wald_C<br />

0<br />

0 1 2 3 4 5 6 7 8 9 10<br />

1.2<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

Metoda Wilson<br />

0<br />

0 1 2 3 4 5 6 7 8 9 10<br />

1.2<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

Metoda Wilson_C<br />

0<br />

0 1 2 3 4 5 6 7 8 9 10<br />

158<br />

Limita inferioara<br />

Limita superioara<br />

Limita inferioara<br />

Limita superioara<br />

Limita inferioara<br />

Limita superioara<br />

Limita inferioara<br />

Limita superioara


1.2<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

Metoda ArcS<br />

0<br />

0 1 2 3 4 5 6 7 8 9 10<br />

1.2<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

Metoda ArcS1<br />

0<br />

0 1 2 3 4 5 6 7 8 9 10<br />

1.2<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

Metoda ArcS2<br />

0<br />

0 1 2 3 4 5 6 7 8 9 10<br />

1.2<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

Metoda ArcS3<br />

0<br />

0 1 2 3 4 5 6 7 8 9 10<br />

159<br />

Limita inferioara<br />

Limita superioara<br />

Limita inferioara<br />

Limita superioara<br />

Limita inferioara<br />

Limita superioara<br />

Limita inferioara<br />

Limita superioara


Pentru eşantione a cǎror mǎrime este <strong>de</strong> la 7 la 1000, s-au aplicat 12 meto<strong>de</strong> <strong>de</strong> evaluare a<br />

intervalului <strong>de</strong> încre<strong>de</strong>re.<br />

Tabelul <strong>de</strong> mai jos redǎ meto<strong>de</strong>le folosite pentru <strong>de</strong>terminarea intervalului <strong>de</strong> încre<strong>de</strong>re şi notaţiile<br />

folosite:<br />

Metodă Notaţie<br />

Wald Wald<br />

Wald cc (corectat la continuitate) WaldC<br />

Agresti-Coull AC<br />

Agresti-coull cc ACC1<br />

Agresti-Coull cc ACC2<br />

Wilson Wilson<br />

Wilson cc WilsonC<br />

ArcSine ArcS<br />

ArcSine cc ArcSc1<br />

Arcsine cc ArcSc2<br />

Arcsine cc ArcSc3<br />

Logit Logit<br />

Logit cc LogitC<br />

Bayes (Fisher) BetaC11<br />

Cloppper-Pearson BetaC01<br />

Jeffreys BetaCJ0<br />

Beta cc Beta C00<br />

Beta cc Beta C10<br />

Beta cc Beta CJ1<br />

Beta cc Beta CJ2<br />

OptB Optimized<br />

Tabelul <strong>de</strong> mai jos conţine rezultatele evaluării meto<strong>de</strong>lor <strong>de</strong> calcul al intervalului <strong>de</strong> încre<strong>de</strong>re,<br />

valori ce au fost calculate pentru n = 20:<br />

Metoda AvgOE(0) AvgOE(1) StDOE(0) StDOE(1) SiDOE(0) SiDOE(1)<br />

Wald 11.96 10.82 9.35 9.57 11.46 11.01<br />

Wald_C 9.04 8.18 9.82 9.7 10.38 9.99<br />

AC 3.4 3.07 1.01 1.4 1.87 2.36<br />

ACC1 4.04 3.66 1.69 2.01 1.9 2.38<br />

ACC2 4.42 4 1.66 2.06 1.72 2.24<br />

Wilson 4.25 3.84 1.66 2.03 1.78 2.29<br />

Wilson_C 2.42 2.19 1.11 1.28 2.79 3.07<br />

ArcS 10.07 9.11 10.07 10.02 11.03 10.61<br />

ArcSc1 3.7 3.35 1.49 1.8 1.94 2.4<br />

ArcSc2 2.87 2.59 1.37 1.56 2.51 2.84<br />

ArcSc3 2.6 2.35 1.23 1.4 2.68 2.98<br />

Logit 3.81 3.44 1.21 1.62 1.67 2.22<br />

Logit_C 4.5 4.07 1.52 1.98 1.56 2.14<br />

BetaC00 5.02 4.54 2.65 2.94 2.58 2.9<br />

BetaC10 9.66 8.74 2.45 3.72 5.23 5.21<br />

BetaC01 3.17 2.87 1.43 1.66 2.29 2.67<br />

BetaC11 4.66 4.21 1.57 2.05 1.57 2.14<br />

BetaCJ0 4.66 4.22 1.49 1.99 1.49 2.09<br />

BetaCJ1 4.32 3.91 1.41 1.87 1.53 2.12<br />

BetaCJ2 4.95 4.48 1.38 1.98 1.34 2<br />

BetaCJA 4.32 3.91 1.41 1.87 1.53 2.12<br />

OptB 4.95 4.48 1.38 1.98 1.34 2<br />

160


Metoda AvADA(0) AvADA(1) AvADS(0) AvADS(1) S8DOE(0) S8DOE(1)<br />

Wald 6.83 6.83 7.05 6.86 23.47 23.18<br />

Wald_C 6.71 6.38 4.97 4.97 23.3 23.01<br />

AC 0.93 1.21 1.59 1.92 2.66 3.75<br />

ACC1 1.32 1.65 1.52 1.85 3.03 3.8<br />

ACC2 1.33 1.58 1.47 1.81 2.56 3.74<br />

Wilson 1.27 1.53 1.6 1.92 2.3 3.73<br />

Wilson_C 1 1.11 2.57 2.8 3.35 3.88<br />

ArcS 6.8 6.7 5.61 5.55 24.47 24.17<br />

ArcSc1 1.16 1.5 1.57 1.89 3.03 3.8<br />

ArcSc2 1.21 1.39 2.12 2.4 3.67 4.01<br />

ArcSc3 1.12 1.26 2.39 2.64 3.5 3.93<br />

Logit 0.95 1.31 1.41 1.75 2.61 3.75<br />

Logit_C 1.16 1.4 1.39 1.73 2.1 3.73<br />

BetaC00 2.21 2.47 2.09 2.37 3.93 4.15<br />

BetaC10 1.95 2.95 4.8 4.82 6.43 6.36<br />

BetaC01 1.19 1.4 2.04 2.32 3.06 3.8<br />

BetaC11 1.36 1.55 1.42 1.76 2.09 3.73<br />

BetaCJ0 1.24 1.52 1.23 1.58 2.58 3.74<br />

BetaCJ1 1.09 1.43 1.27 1.62 2.58 3.74<br />

BetaCJ2 1.23 1.49 1.18 1.54 1.93 3.72<br />

BetaCJA 1.09 1.43 1.27 1.62 2.58 3.74<br />

OptB 1.23 1.49 1.18 1.54 1.93 3.72<br />

Valorile obţinute pentru n=20, pentru meto<strong>de</strong>le menţionate sunt redate şi în graficele <strong>de</strong> mai<br />

jos (la toate meto<strong>de</strong>le se aplică principiul "0 the best"):<br />

14<br />

11.96<br />

12<br />

10 9.04<br />

8<br />

6<br />

4<br />

2<br />

0<br />

Wald<br />

Wald_C AC<br />

12 10.82<br />

10<br />

8<br />

6<br />

4<br />

2<br />

0<br />

8.18<br />

Wald<br />

Wald_C AC<br />

3.4 4.04 4.25<br />

4.42<br />

2.42<br />

3.66 4 3.84<br />

3.07<br />

2.19<br />

10.07<br />

ACC1<br />

ACC2<br />

Wilson<br />

Wilson_C<br />

ArcS<br />

ArcSc1<br />

ArcSc2<br />

9.11<br />

ACC1<br />

ACC2<br />

Wilson<br />

Wilson_C<br />

ArcS<br />

ArcSc1<br />

ArcSc2<br />

Metoda AvgOE(0)<br />

3.7 3.81<br />

2.872.6<br />

Metoda AvgOE(1)<br />

5.02<br />

4.5<br />

4.54<br />

3.35<br />

2.59 3.44 4.07<br />

2.35<br />

161<br />

9.66<br />

4.66 4.95 4.95<br />

4.66 4.32 4.32<br />

3.17<br />

ArcSc3<br />

Logit<br />

Logit_C<br />

BetaC00<br />

BetaC10<br />

BetaC01<br />

BetaC11<br />

BetaCJ0<br />

BetaCJ1<br />

BetaCJ2<br />

BetaCJA<br />

OptB<br />

8.74<br />

4.21 4.48 4.48<br />

3.91<br />

2.87<br />

4.22 3.91<br />

ArcSc3<br />

Logit<br />

Logit_C<br />

BetaC00<br />

BetaC10<br />

BetaC01<br />

BetaC11<br />

BetaCJ0<br />

BetaCJ1<br />

BetaCJ2<br />

BetaCJA<br />

OptB


12<br />

10<br />

8<br />

6<br />

4<br />

2<br />

0<br />

12<br />

10<br />

8<br />

6<br />

4<br />

2<br />

0<br />

9.35 9.82<br />

9.57 9.7<br />

14<br />

12 11.46<br />

10.38<br />

10<br />

8<br />

6<br />

4<br />

2<br />

0<br />

Wald<br />

Wald_C AC<br />

1.01 1.69 1.66 1.66 1.11<br />

1.4 2.01 2.03 2.06 1.28<br />

Metoda StDOE(0)<br />

10.07<br />

10.02<br />

Wald<br />

Wald_C<br />

AC<br />

ACC1<br />

ACC2<br />

Wilson<br />

Wilson_C<br />

ArcS<br />

ArcSc1<br />

2.65<br />

1.49<br />

1.57 1.41<br />

1.37<br />

1.38<br />

1.21 1.52 1.43 1.49 2.45<br />

1.23<br />

1.381.41<br />

Wald<br />

Wa ld_C<br />

AC<br />

ACC1<br />

ACC2<br />

Wilson<br />

Wilson_C<br />

ArcS<br />

ArcSc1<br />

ArcSc2<br />

ArcSc3<br />

Logit<br />

Logit_C<br />

BetaC00<br />

Be taC10<br />

Be taC01<br />

BetaC11<br />

BetaC J0<br />

Be taCJ1<br />

BetaCJ2<br />

BetaCJA<br />

OptB<br />

Metoda StDOE(1)<br />

1.8 1.561.4 1.621.982.943.721.66 1.99 1.98 1.98<br />

2.05 1.87 1.87<br />

Metoda SiDOE(0)<br />

11.03<br />

2.79<br />

2.58<br />

1.87 1.72 1.94<br />

1.9 1.78 2.51 1.671.56 2.68<br />

ACC1<br />

ACC2<br />

Wilson<br />

Wilson_C<br />

ArcS<br />

ArcSc1<br />

ArcSc2<br />

162<br />

ArcSc2<br />

ArcSc3<br />

Logit<br />

Logit_C<br />

BetaC00<br />

BetaC10<br />

BetaC01<br />

BetaC11<br />

BetaCJ0<br />

BetaCJ1<br />

BetaCJ2<br />

BetaCJA<br />

OptB<br />

5.23<br />

2.29<br />

1.57<br />

1.49<br />

1.53 1.53<br />

1.34 1.34<br />

ArcSc3<br />

Logit<br />

Logit_C<br />

BetaC00<br />

BetaC10<br />

BetaC01<br />

BetaC11<br />

BetaCJ0<br />

BetaCJ1<br />

BetaCJ2<br />

BetaCJA<br />

OptB


12 11.01<br />

9.99<br />

10<br />

8<br />

6<br />

4<br />

2<br />

0<br />

6<br />

5<br />

4<br />

3<br />

2<br />

1<br />

0<br />

Wald<br />

Wald_C AC<br />

8<br />

6.83<br />

7<br />

6.71<br />

8<br />

7<br />

6<br />

5<br />

4<br />

3<br />

2<br />

1<br />

0<br />

Wald<br />

Wald_C AC<br />

6.83 6.38<br />

Wald<br />

Wald_C AC<br />

10.61<br />

Metoda SiDOE(1)<br />

5.21<br />

2.36 2.29 3.07<br />

2.98<br />

2.4<br />

2.14 2.9 2.67<br />

2.38 2.84<br />

2.14 2.12<br />

2.24<br />

2.22<br />

2.09 2 2.12 2<br />

ACC1<br />

ACC2<br />

Wilson<br />

Wilson_C ArcS<br />

Arc Sc1<br />

6.8<br />

Arc Sc 2<br />

ArcSc3<br />

Logit<br />

Logit_C<br />

BetaC 00<br />

Metoda AvADA(0)<br />

BetaC10<br />

BetaC 01<br />

BetaC11<br />

BetaCJ0 BetaC J1<br />

BetaCJ2<br />

BetaCJA<br />

OptB<br />

0.93 1.32<br />

2.211.95 1 1.16 1.16 1.191.36 1.331.27<br />

1.21<br />

1.091.23 1.23<br />

1.12 0.95<br />

1.24 1.09<br />

ACC1<br />

ACC2<br />

Wilson<br />

Wilson_C Arc S<br />

ArcSc1<br />

1.21 1.651.581.53 1.11<br />

6.7<br />

ACC1<br />

ACC2<br />

Wilson<br />

Wilson_C ArcS<br />

ArcSc1<br />

ArcSc2<br />

Arc Sc3<br />

Logit<br />

Logit_C<br />

BetaC00<br />

BetaC10<br />

Metoda AvADA(0)<br />

BetaC 01<br />

BetaC 11<br />

BetaCJ0<br />

BetaCJ1<br />

BetaCJ2<br />

BetaCJA<br />

OptB<br />

2.95<br />

2.47<br />

1.5 1.4 1.4 1.55<br />

1.39<br />

1.52 1.49 1.49<br />

1.26<br />

1.31<br />

1.43 1.43<br />

163<br />

ArcSc2<br />

ArcSc3<br />

Logit<br />

Logit_C<br />

BetaC00<br />

BetaC10<br />

BetaC01<br />

BetaC11<br />

BetaCJ0<br />

BetaCJ1<br />

BetaCJ2<br />

BetaCJA<br />

OptB


30<br />

8<br />

7<br />

6<br />

5<br />

4<br />

3<br />

2<br />

1<br />

0<br />

8<br />

7<br />

6<br />

5<br />

4<br />

3<br />

2<br />

1<br />

0<br />

7.05<br />

4.97<br />

Wald<br />

Wald_C AC<br />

6.86<br />

4.97<br />

Wald<br />

Wald_C<br />

AC<br />

25<br />

23.47 23.3<br />

20<br />

15<br />

10<br />

5<br />

0<br />

30<br />

AC<br />

Wald<br />

Wald_C<br />

23.18<br />

25 23.01<br />

20<br />

15<br />

10<br />

5<br />

0<br />

Wald<br />

Wald_C<br />

2.57<br />

1.59 1.6<br />

Metoda AvADS(0)<br />

5.61<br />

2.39<br />

2.09<br />

1.52 2.12<br />

1.47 1.57 1.41<br />

1.39<br />

2.8<br />

1.92 1.92<br />

1.85 1.81<br />

ACC1<br />

ACC2<br />

Wilson<br />

Wilson_C<br />

ArcS<br />

ArcSc1<br />

ArcSc2<br />

5.55<br />

ACC1<br />

ACC2<br />

Wilson<br />

Wilson_C<br />

ArcS<br />

ArcSc1<br />

2.3 3.35<br />

2.66 3.03 2.56<br />

ACC1<br />

ACC2<br />

Wilson<br />

Wilson_C<br />

24.47<br />

24.17<br />

Metoda AvADS(1)<br />

2.64<br />

1.89 1.751.73 2.37<br />

2.4<br />

Metoda S8DOE(0)<br />

4.8<br />

2.04<br />

1.42 1.27 1.27<br />

1.23 1.18 1.18<br />

ArcSc3<br />

Logit<br />

Logit_C<br />

BetaC00<br />

BetaC10<br />

BetaC01<br />

BetaC11<br />

BetaCJ0<br />

BetaCJ1<br />

BetaCJ2<br />

BetaCJA<br />

OptB<br />

4.82<br />

2.32<br />

1.76 1.62 1.62<br />

1.58 1.54<br />

1.54<br />

ArcSc2<br />

ArcSc3<br />

Logit<br />

Logit_C<br />

BetaC00<br />

BetaC10<br />

BetaC01<br />

BetaC11<br />

BetaCJ0<br />

BetaCJ1<br />

BetaCJ2<br />

BetaCJA<br />

OptB<br />

3.93<br />

2.61<br />

6.43<br />

3.06<br />

3.03 3.5<br />

2.58<br />

3.67<br />

2.1<br />

2.09 2.58 2.58<br />

1.93 1.93<br />

ArcS<br />

ArcSc1<br />

ArcSc2<br />

ArcSc3<br />

Metoda S8DOE(1)<br />

Logit<br />

Logit_C<br />

BetaC00<br />

BetaC10<br />

BetaC01<br />

BetaC11<br />

BetaCJ0<br />

BetaCJ1<br />

BetaCJ2<br />

BetaCJA<br />

OptB<br />

6.36<br />

3.8 3.88 4.01<br />

3.8 3.72 3.72<br />

3.75 3.8 3.75 4.15 3.74<br />

3.743.73<br />

3.93 3.73 3.73 3.74 3.74<br />

AC<br />

ACC1<br />

ACC2<br />

Wilson<br />

Wilson_C<br />

ArcS<br />

ArcSc1<br />

ArcSc2<br />

ArcSc3<br />

164<br />

Logit<br />

Logit_C<br />

BetaC00<br />

BetaC10<br />

BetaC01<br />

BetaC11<br />

BetaCJ0<br />

BetaCJ1<br />

BetaCJ2<br />

BetaCJA<br />

OptB


Planificarea activităţilor experimentale urmează schema:<br />

÷ Selectare activitate biologică <strong>de</strong> interes (chimie medicală);<br />

÷ Selectare clasă <strong>de</strong> compuşi cu potenţă biologică (biochimie);<br />

÷ Design structură la nivel topologic (chimie matematică);<br />

÷ Design structură la nivel geometric (chimie cuantică);<br />

÷ Generare familie <strong>de</strong> <strong>de</strong>scriptori moleculari (chimie combinatorială);<br />

÷ Analiză structură-activitate (virtual screening);<br />

÷ Mo<strong>de</strong>lare matematică şi validare statistică (statistică aplicată);<br />

÷ Selecţie, mutaţie şi încrucişare mo<strong>de</strong>le (informatică aplicată);<br />

÷ Validare potenţă biologică (chimie medicală).<br />

Experimente <strong>de</strong>monstrative au fost <strong>de</strong>rulate pentru punctul <strong>de</strong> topire (MP) al aminoacizilor (fiind<br />

incluşi în analiză 31 <strong>de</strong> aminoacizi, dintre care 23 au format setul <strong>de</strong> învăţare) când s-a reuşit<br />

îmbunătăţirea capacităţii estimative <strong>de</strong> la o <strong>de</strong>terminare <strong>de</strong> 63% (folosind un mo<strong>de</strong>l structurăactivitate<br />

cu o variabilă in<strong>de</strong>pen<strong>de</strong>ntă) 99% (folosind un mo<strong>de</strong>l structură-activitate cu patru<br />

variabile in<strong>de</strong>pen<strong>de</strong>nte).<br />

2008A7. Proiectarea şi crearea bazelor <strong>de</strong> date pentru managementul cercetării şi a rezultatelor<br />

cercetării<br />

Baza <strong>de</strong> date şi aplicaţiile <strong>de</strong> gestiune a bazei <strong>de</strong> date au fost construite având ca suport arhitectura<br />

<strong>de</strong> calcul i386 (Jäntschi, 2003-I386), platforma <strong>de</strong> operare FreeBSD (Jäntschi, 2003-FBSD),<br />

serverul <strong>de</strong> baze <strong>de</strong> date MySQL (Jäntschi & Avram, 2002-IBLD) şi limbajul <strong>de</strong> scriptare şi<br />

interpretare PHP (Ştefu & others, 2002-FSD2), acesta oferind capabilităţi sporite <strong>de</strong> lucru eficient<br />

cu fişiere <strong>de</strong> date (Jäntschi & Zaharieva-Stoyanova, 2003-UFS). Combinaţia PHP + MySQL şi-a<br />

dovedit eficienţa, ea fiind anterior probată într-o serie <strong>de</strong> studii (Jäntschi, 2003-SQL1; Bolboacă &<br />

others, 2003; Jäntschi & others, 2003-SQLA; Bolboacă & others, 2003-TW2). Problema relaţionării<br />

datelor în baza <strong>de</strong> date a fost realizată beneficiind <strong>de</strong> experienţa acumulată din studii anterioare<br />

(Naşcu & Jäntschi, 2004-MCE1; Naşcu & Jäntschi, 2004-MCE2; Gligor & Jäntschi, 2005-PSEA).<br />

Pe parcursul <strong>de</strong>rulării activităţii s-a ivit oportunitatea valorificării noii experienţe dobândite într-o<br />

publicaţie (Bălan & others, 2008-SRDI).<br />

Baza <strong>de</strong> date nou realizată (<strong>de</strong>numită MDFV) are următoarea structură (repetitivă pentru fiecare set<br />

<strong>de</strong> compuşi supus investigaţiilor şi exemplificată pentru setul <strong>de</strong> 31 <strong>de</strong> aminoacizi):<br />

÷ Tabela 31aa_data (3 câmpuri, 31 înregistrări): Id (cheie primară), Mol (abreviere aminoacid),<br />

Hin (câmp binar conţinând <strong>de</strong>signul geometric al structurii obţinut din optimizarea geometrică a<br />

conformaţiei moleculare);<br />

÷ Tabela 31aa_prop (31 câmpuri, 1 înregistrare): Property (abreviere proprietate), Aib..Val<br />

(câmpuri numerice conţinând valoarea proprietăţii măsurate pentru fiecare compus);<br />

÷ Tabela 31aa_mdfv (1+31 câmpuri, 2387280 înregistrări): valorile <strong>de</strong>scriptorilor moleculari<br />

in<strong>de</strong>xate după un câmp cheie primară;<br />

÷ Tabela 31aa__MP (4+31 câmpuri, 7617 înregistrări - pentru MP) - conţinând mo<strong>de</strong>lele<br />

structură-activitate cu o variabilă in<strong>de</strong>pen<strong>de</strong>ntă pentru proprietatea MP obţinute în urma<br />

selecţiei pe baza concordanţei folosind algoritmul Goodman-Kruskal;<br />

÷ Tabela 31aa_qsar (6 câmpuri, număr variabil <strong>de</strong> înregistrări - 30 pentru MP) - conţinând<br />

mo<strong>de</strong>lele structură-activitate mai mult <strong>de</strong> o variabilă in<strong>de</strong>pen<strong>de</strong>ntă pentru setul 31aa obţinute în<br />

urma încrucişării folosind un algoritm genetic clasic.<br />

165


2008A8. Completarea bazelor <strong>de</strong> date cu cunoştinţele provenite din documentare şi actualizare<br />

documentare (O1/2007) şi respectiv managementul cunoştinţelor (O2/2007)<br />

Completarea bazelor <strong>de</strong> date cu cunoştinţele provenite din documentare şi Actualizare documentare<br />

şi respectiv Managementul cunoştinţelor a avut ca rezultat:<br />

÷ Actualizarea documentării cu privire la stadiul cunoaşterii a dus la inclu<strong>de</strong>rea în evi<strong>de</strong>nţe a unui<br />

număr <strong>de</strong> 321 <strong>de</strong> baze <strong>de</strong> date relevante pentru caracterizarea structurii şi proprietăţilor chimice<br />

ale compuşilor <strong>de</strong> interes medical, aşa cum s-au enumerat mai sus în secţiunea "Management<br />

cunoştinţe. I<strong>de</strong>ntificarea meto<strong>de</strong>lor <strong>de</strong> analiză. Chimie Medicală".<br />

÷ Baza <strong>de</strong> date a fost completată cu cunoştinţe provenite din Managementul cunoştinţelor prin<br />

inclu<strong>de</strong>rea în baza <strong>de</strong> programe a unui algoritm genetic clasic pentru încrucişarea variabilelor<br />

in<strong>de</strong>pen<strong>de</strong>nte aşa cum în lucrarea [<strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Mircea V.<br />

DIUDEA, Chromatographic Retention Times of Polychlorinated Biphenyls: from Structural Information<br />

to Property Characterization, International Journal of Molecular Sciences, 8(11), p. 1125-1157, 2007.<br />

CAS-AN 2008:423655; CCC&WOS: 000251238700005] a fost prima dată comunicată metoda.<br />

Adaptarea acesteia face ca pentru o funcţie obiectiv <strong>de</strong> estimare a proprietăţii măsurate folosind<br />

2 genotipuri (în cazul general putând fi un număr oarecare fixat <strong>de</strong> genotipuri, r), ecuaţia <strong>de</strong><br />

regresie este <strong>de</strong> forma: Ŷ = a0 + a1·Fenotip1 + a2·Fenotip2, (în general: Ŷ = a0 + Σ1≤i≤rai·Fenotipi),<br />

un<strong>de</strong>: Ŷ este estimatorul proprietăţii măsurate; a0..a2 sunt coeficienţii care rezultă din<br />

minimizarea pătratelor diferenţelor între valorile măsurate Y şi cele estimate prin intermediul lui<br />

Ŷ pentru setul <strong>de</strong> compuşi; Fenotip1=Fenotip(Genotip1) şi Fenotip2=Fenotip(Genotip2) sunt<br />

fenotipurile (şirurile <strong>de</strong> valori ale <strong>de</strong>scriptorilor moleculari obţinuţi prin operaţiile prescrise <strong>de</strong><br />

genotipurile Genotip1=d1p1I1O1f1M1L1 şi Genotip2=d2p2I2O2f2M2L2 pentru compuşi; Tăria<br />

(scorul) unei perechi <strong>de</strong> genotipuri (sau mai multe, pentru regresia multivariată) se exprimă prin<br />

coeficientul <strong>de</strong> <strong>de</strong>terminare asociat perechii <strong>de</strong> fenotipuri: r 2 (Y,a0+a1·Fenotip1+a2·Fenotip2).<br />

2008A9. Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese, workshop-uri) şi<br />

dobândirea <strong>de</strong> competenţe complementare (stagii <strong>de</strong> documentare/<strong>cercetare</strong> în străinătate)<br />

Fourth International Conference of Applied Mathematics and Computing<br />

÷ Organizator: Technical University of Plovdiv (TUP), Plovdiv, BG<br />

÷ Tip: conferinţă internaţională<br />

÷ Perioadă: 11-19 August 2008;<br />

÷ Deplasare: aferentă Obiectiv 3, Activitate 9;<br />

÷ Participanţi: <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Carmen E. STOENOIU;<br />

÷ Secţiuni ştiinţifice:<br />

o Combinatorics;<br />

o Graph theory;<br />

o ODE, PDE, difference equations;<br />

o Functional equations;<br />

o Integral and differential inequalities and inclusions;<br />

o Differential games;<br />

o Control theory;<br />

o Dynamical systems;<br />

o Probability, statistics and stochastic processes;<br />

o Statistical mechanics;<br />

o Quantum theory;<br />

o Relativity and gravitational theory;<br />

o Integral and differential operators;<br />

o Fractional calculus;<br />

o Special functions;<br />

166


o Generalized functions;<br />

o Operator research and algebraic analysis;<br />

o Fluid mechanics;<br />

o Mechanics of particles and systems;<br />

o Mathematical programming and optimization;<br />

o Approximation theory;<br />

o Numerical algebraic or transcen<strong>de</strong>ntal equations;<br />

o Numerical analysis for ordinary differential equations;<br />

o Numerical analysis for partial differential equations;<br />

o Numerical methods in complex analysis;<br />

o Numerical methods in linear algebra;<br />

o Numerical simulation;<br />

o Acceleration of convergence;<br />

o Interval arithmetic;<br />

o Information systems;<br />

o Software engineering;<br />

o Software technology;<br />

o System theory;<br />

o Theory of data;<br />

o Programming and image processing;<br />

o Pattern recognition;<br />

o Parallel and distributed algorithms;<br />

o Communication systems;<br />

o Computer ai<strong>de</strong>d <strong>de</strong>sign;<br />

o Computer arithmetic and numerical analysis;<br />

o Computer aspects of numerical algorithms;<br />

o Computer networks;<br />

o Concurrent and parallel computations;<br />

o Data base;<br />

o Discrete mathematics in relation to computer science;<br />

o Manufacturing systems;<br />

o Applications in mechanics, physics, chemistry, biology, technology, economics<br />

and industrial problems.<br />

17th European Symposium on Quantitative Structure-Activity Relationships & Omics<br />

Technologies and Systems Biology<br />

÷ Organizator: The Cheminformatics and QSAR Society (CI-QSAR), Uppsala, SE<br />

÷ Tip: simpozion<br />

÷ Perioadă: 20-27 Septembrie 2008;<br />

÷ Deplasare: aferentă Obiectiv 3, Activitate 9;<br />

÷ Participanţi: <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>;<br />

÷ Prezentări:<br />

o Session 1: QSAR in OMICS and Systems Biology<br />

2008:09:22:09.00: Top-Down Systems Biology and Integrative<br />

Approaches to Superorganism Medicine<br />

2008:09:22:10.00: Systems chemical biological studies on enzymatic<br />

metabolic networks and inhibitors<br />

2008:09:22:11.00: Potentialities of PLSand OPLS in 'OMICS' cancer<br />

diagnostics and elucidation of antiumour drugs mechanism of action<br />

2008:09:22:11.20: Building Blocks for Metabolic simulation: Automated<br />

elucidation of metabolite structures<br />

2008:09:22:11.40: Theoretical structural metabolomics<br />

2008:09:22:12.00: QSAR: <strong>de</strong>ad or alive?<br />

167


o Session 2: QSAR<br />

2008:09:22:14.00: Beyond QSAR<br />

2008:09:22:14.50: Linking chemical and biological similarity of small<br />

molecules<br />

2008:09:22:15.10: A Novel Conservative <strong>de</strong>sign for fast followers -<br />

Focused Hierarchical <strong>de</strong>sign of a pepti<strong>de</strong> library targeted at M.<br />

tuberculosis Ribonucleotid reductase<br />

2008:09:22:16.00: A QSAR study on indole-based PPAR-y agonists in<br />

respect to receptor binding and gene transactivation data<br />

2008:09:22:16.20: QSAR mo<strong>de</strong>lling of small datasets<br />

2008:09:22:16.40: QSAR for Estimation of human volume of distribution<br />

2008:09:22:17.00: Development of Fast, Interpretable 2D pharmacophore<br />

mo<strong>de</strong>ls for predicting hERG and NaV1.5 Cardiac Ion Channel safety<br />

liabilities using TRUST fingerprints<br />

2008:09:22:17.20: Global or local QSAR: is there a way out?<br />

o Session 3: QSAR and Natural Product Medicine<br />

2008:09:23:09.00: PLS-Trees and QSAR<br />

2008:09:23:09.45: Metabolomics in nutritional studies<br />

2008:09:23:12.00: SIRC/TCM: a Database of Traditional Chinese<br />

Medicine<br />

o Session 4: Molecular Mo<strong>de</strong>ling and Chemical Properties<br />

2008:09:23:14.00: Does pKa predictions matter anymore?<br />

2008:09:23:14.50: Cytotoxicity and 3D-QSAR Analysis of Lmaellarind<br />

against human hormone <strong>de</strong>pen<strong>de</strong>nt breast cancer (T47D) and Humane<br />

hormone in<strong>de</strong>pen<strong>de</strong>nt breast cancer (MDA-MB231)<br />

2008:09:23:15.10: GABAa and GABAc Receptors: Molecular mo<strong>de</strong>lling<br />

and QSAR analysis of selective ligands<br />

2008:09:23:15.30: Fast and accurate method for flexible ligand<br />

superposition and shape-based screening<br />

2008:09:23:16.20: Predicted 3D structures for Coupled Receptors G-<br />

Protein and ligand-GPCR complexes for agonists, antagonists, and<br />

inverse agonists<br />

2008:09:23:17.00: Design of New Chemical Entities as selective COX-2<br />

inhibitors using Structure optimisation by QSAR<br />

2008:09:23:17.20: A novel 3D QSAR metod exploiting protein flexibility<br />

to kinase inhibition<br />

2008:09:23:17.40: An automated metod to interface ligand- and structurebased<br />

drug <strong>de</strong>sign<br />

o Session 5: Combinatorial Chemistry and Virtual Screening<br />

2008:09:24:09.00: From Molecular Interaction Fields to Enzyme<br />

Inhibitors and Biochemical Networks<br />

2008:09:24:09.45 : Minimizing Benchmark Dataset Bias in Ligand Based<br />

viritual screening by maximum unbiased validation (MUV) Datasets<br />

2008:09:24:10.05: Data mining and comperative analysis of<br />

chemosensitivity and gene expression profiles for human tumor cell lines<br />

o Session 6: QSAR in Toxicology and Environmental Research<br />

2008:09:24:10.50: Human and mammalian toxic equivalency factors for<br />

dioxins and dioxin-like compounds: The who 2005 re-evaluation<br />

2008:09:24:11.35: A combined use of in vitro screening and<br />

cheminformatics approaches improves the accuracy of in vivo toxicity<br />

prediction for environmental chemicals<br />

2008:09:24:12.05: Prediction of cytochrome P450 inhibition by different<br />

168


approaches of QSAR mo<strong>de</strong>ling<br />

o Session 7: Case Studies in QSAR<br />

2008:09:25:09.00: Un<strong>de</strong>rstanding QSAR: Do we always use the correct<br />

structural mo<strong>de</strong>ls to establish affinity correlation?<br />

2008:09:25:09.50: Computer-ai<strong>de</strong>d drug <strong>de</strong>sign for the beta2-adrenergic<br />

receptor<br />

2008:09:25:12.00: QSAR investigation of novel compounds targeting the<br />

serotonin receptors<br />

2008:09:25:12.20: Docking and viritual screening for virus targets<br />

exploiting distributed grid technology<br />

o Session 8: QSAR in Chemical Risk Assessment<br />

2008:09:25:14.00: Advances in Toxico-Cheminformatics: Supporting a<br />

New Paradigm for Predictive Toxicology<br />

2008:09:25:14.45: Use of structural alerts to screen EINECS for<br />

substances of very high concern<br />

2008:09:25:15.05: Predicting Toxicity from Non-Test Data: Utilising in<br />

silico and in chemico information for Risk assessment<br />

2008:09:25:16.00: Computational Ecotoxicology to predict<br />

Biomagnification of contaminants<br />

2008:09:25:16.20: Similarity based assessment of Mo<strong>de</strong>l applicability<br />

domain and quantitative evaluation of reliability of the prediction<br />

2008:09:25:16.40: Using all the data in comprehensive risk assessment of<br />

the mutagenetic potential of drugs<br />

2008:09:25:17.00: Human Monitoring of Phtalates and Chemical Risk<br />

Assessment<br />

o Session 9: Emerging Technologies<br />

2008:09:26:09.00: Complex systems, QSAR, and control of stem cell fate<br />

2008:09:26:09.50: Proteochemometrics<br />

2008:09:26:10.10: From Mathematical chemistry to quantum and<br />

medicinal chemistry through genetic algorithms<br />

2008:09:26:10.50 GAUDI navigator, a new data mining platform<br />

2009A1. Crearea aplicaţiilor pentru interogarea bazei <strong>de</strong> date pentru managementul cercetării<br />

Problematica structurării eficiente a informaţiei în baza <strong>de</strong> date astfel încât să se poată beneficia <strong>de</strong><br />

facilităţile relaţionale <strong>de</strong> interogare a fost analizată în <strong>de</strong>taliu în studii anterioare (Jäntschi &<br />

Bolboacă, 2006-DDI; Jäntschi & others, 2006-RPRD) iar pe parcursul <strong>de</strong>sfăşurării activităţii a fost<br />

finalizat un nou studiu în acest subiect (Bălan & others, 2008-SRMS).<br />

Structura bazei <strong>de</strong> date MDFV nou create este următoarea:<br />

MDFV<br />

_mdfv<br />

31aa_<br />

CQd_<br />

sulfon_<br />

data mdfv prop qsar _MP ...<br />

... ... ... ... ...<br />

sulfon18_<br />

taxoids_<br />

169<br />

estro_<br />

triph_<br />

logBBB_<br />

...


Baza <strong>de</strong> date MDFV este alcătuită dintr-un tabel (_mdfv) şi o serie <strong>de</strong> constelaţii (grupuri <strong>de</strong><br />

tabele).<br />

Tabela `_mdfv` este tabela template (şablon) cuprinzând codul şi numele fiecărui <strong>de</strong>scriptor<br />

molecular <strong>de</strong> structură membru al familiei MDFV.<br />

Fiecare constelaţie <strong>de</strong> tabele a bazei <strong>de</strong> date MDFV are un număr <strong>de</strong> 4 tabele care se creează la<br />

fiecare set <strong>de</strong> molecule supus investigaţiei:<br />

÷ Tabela `data` conţine codul, <strong>de</strong>numirea şi structura (în format HyperChem) moleculelor setului<br />

investigat;<br />

÷ Tabela `prop` conţine valorile măsurate ale fiecărei activităţi observate pentru fiecare moleculă<br />

a setului;<br />

÷ Tabela `mdfv` conţine valorile calculate ale <strong>de</strong>scriptorilor familiei MDFV pentru fiecare<br />

moleculă a setului inclus în studiu;<br />

÷ Tabela `qsar` conţine ecuaţiile structură-activitate obţinute în urma analizei <strong>de</strong> regresie pentru<br />

toate activităţile investigate aferente setului supus studiului;<br />

Fiecare constelaţie <strong>de</strong> tabele a bazei <strong>de</strong> date MDFV mai are şi un număr variabil <strong>de</strong> tabele (numărul<br />

variabil <strong>de</strong> tabele este egal cu numărul <strong>de</strong> înregistrări în tabela `prop` aferente numărului <strong>de</strong><br />

activităţi experimentale pentru care s-a rulat studiul structură-activitate; <strong>de</strong>numirile acestor tabele au<br />

ca sufix <strong>de</strong>numirile activităţilor din tabela `prop`.<br />

S-a realizat aplicaţia care interoghează baza <strong>de</strong> date şi transferă programului <strong>de</strong> navigare pe Internet<br />

lista seturilor <strong>de</strong> molecule existente în baza <strong>de</strong> date MDFV; pentru aceasta se foloseşte adresa:<br />

http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs/MDFV/<br />

când se obţine rezultatul:<br />

Fiecare set <strong>de</strong> molecule din lista <strong>de</strong> mai sus poate avea stocate în baza <strong>de</strong> date 1 sau mai multe<br />

activităţi; aplicaţia realizată permite selectarea proprietăţii dorite din lista celor disponibile; un<br />

exemplu <strong>de</strong> navigare în lista activităţilor este dat <strong>de</strong> adresa:<br />

http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs/MDFV/?set=nitro<br />

când se obţine rezultatul:<br />

S-a realizat aplicaţia file_pdb_get.php care interoghează baza <strong>de</strong> date şi transformă informaţia <strong>de</strong><br />

structură moleculară din baza <strong>de</strong> date stocată în format HyperChem în informaţie stocată în format<br />

170


Bookhaven pe care o transferă programului <strong>de</strong> navigare pe Internet; structura moleculară se<br />

vizualizează folosind programul <strong>de</strong> navigare pe Internet (Internet Explorer în Windows) atunci când<br />

are instalată o librărie auxiliară (MDL Chime v. 2.6 SP6); prin integrarea suportului server şi client<br />

aplicaţia realizată permite vizualizarea 3D a structurii moleculare folosind navigatorul pentru<br />

Internet; un exemplu <strong>de</strong> vizualizare 3D a structurii moleculare se află la adresa:<br />

http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs/MDFV/?set=nitro&pdb=001_7416<br />

când se obţine rezultatul:<br />

S-a realizat aplicaţia care interoghează baza <strong>de</strong> date şi transferă programului <strong>de</strong> navigare pe Internet<br />

informaţia <strong>de</strong> structură moleculară din baza <strong>de</strong> date stocată în format HyperChem; un exemplu <strong>de</strong><br />

vizualizare text a structurii moleculare se află la adresa:<br />

http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs/MDFV/?set=nito&get=001_7416<br />

când se obţine rezultatul:<br />

Odată generate mo<strong>de</strong>lele structură-activitate cu ajutorul programelor <strong>de</strong>zvoltate, trebuie să fie<br />

posibilă interogarea bazei <strong>de</strong> date (a tabelei <strong>de</strong> set cu terminaţia _qsar) care să producă lista<br />

mo<strong>de</strong>lelor QSAR i<strong>de</strong>ntificate; în acest sens s-a realizat aplicaţia care să permită această operaţie; un<br />

exemplu în acest sens este vizualizarea relaţiilor structură-activitate pentru setul nitro şi activitatea<br />

logLD50, dată mai jos:<br />

http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs/MDFV/?set=31aa&property=logLD50<br />

când se obţine rezultatul:<br />

mol var r2 eq research<br />

y=-2.51986728389499E-001+GA5aCCDL*<br />

39 1 0.423803154745641 Link<br />

5.21558657163717E+000<br />

171


y= 6.74698673621303E+000+GA5aCCDL*-<br />

39 2 0.530654376498168 1.70258853068498E-001+TAtIFfDL*<br />

Link<br />

3.13582898594199E-001<br />

y= 6.42608063592238E+000+GA5aCCDL*-<br />

39 2 0.574491953815928 1.90355431095039E-001+TAxAIfDR*-<br />

Link<br />

3.82520782963772E+000<br />

y= 6.76467699947407E+000+GA5aCCDL*-<br />

39 2 0.582198432091616 2.68250910837082E-001+GMLiAPdI*-<br />

Link<br />

3.22593469107696E+000<br />

y= 9.47850382461388E+000+TAtIFfDL*<br />

39 2 0.58815416668693 5.14091975972415E-001+GAsaCcdR*-<br />

Link<br />

1.10567575078389E+000<br />

y= 6.26163608400332E+000+TAsFPIDL*-<br />

39 2 0.600267821983716 8.42045542648347E-001+GAsaCcdR*-<br />

Link<br />

1.30802112973012E+000<br />

y= 6.69552416046760E+000+TAfFPFDL*-<br />

39 2 0.644278113888757 9.78150753609102E-001+GAsaCcdR*-<br />

Link<br />

1.50831828914801E+000<br />

y= 6.34252467532257E+000+TAfFPFDL*-<br />

39 2 0.663845164400658 1.04296487704456E+000+GAsAIcdR*-<br />

Link<br />

1.30383647100216E+000<br />

y= 6.40007482263077E+000+TAfFPFDL*-<br />

39 2 0.668822860582434 1.12360870766758E+000+GAsaAcdR*-<br />

Link<br />

1.50830323984517E+000<br />

y= 8.22325743438927E+000+GA5aCCDL*-<br />

1.88533710470963E-001+TAtIFfDL*<br />

39 3 0.683015020335616 Link<br />

3.04685086129343E-001+GMLiAPdI*-<br />

3.16477930966330E+000<br />

y= 8.68188079248948E+000+GA5aCCDL*-<br />

1.99439316654648E-001+TAqPIFDR*-<br />

39 3 0.711717834291881 Link<br />

5.29736556552302E-003+GMLiAPdI*-<br />

3.37308192564265E+000<br />

y= 9.47575675391378E+000+GA5aCCDL*-<br />

1.94808177957800E-001+TAtAIfDR*-<br />

39 3 0.738711257236817 Link<br />

3.96221260445197E-001+GMLiAPdI*-<br />

4.11487187264147E+000<br />

y= 8.34822538239668E+000+TAfFPFDL*-<br />

9.60662413900666E-001+GAkCIcdL*-<br />

39 3 0.749766284163236 Link<br />

2.79525279544323E-001+GAsaCcdR*-<br />

1.13109726928306E+000<br />

y= 8.05048904505580E+000+TAfFPFDL*-<br />

1.01191512261529E+000+GAkCIcdL*-<br />

39 3 0.764633588116481 Link<br />

2.73198010939187E-001+GAsAIcdR*-<br />

9.94126168067764E-001<br />

y= 3.33691859158614E+000+GA5aCCDL*-<br />

1.59424590735126E-001+TAxAIfDR*-<br />

39 4 0.766643598194283 Link<br />

2.12827104660222E+000+GLvFaFDR*<br />

3.02942526551910E-002+TAsPifDL*<br />

172


1.21739507388622E+000<br />

y= 7.38149868242850E+000+GA5aCCDL*-<br />

1.54681779894843E-001+TAxAIfDR*-<br />

39 4 0.777185991913265 2.98863972048376E+000+GAkCIcdL*-<br />

Link<br />

3.12930072207785E-001+GAtFACDL*-<br />

7.36069962620339E-001<br />

y= 9.51027537370945E+000+GA5aCCDL*-<br />

1.51385020587630E-001+TAqPIFDR*-<br />

39 4 0.781634330171587 5.66709405265237E-003+GLbIPPdL*-<br />

Link<br />

3.78224354845121E-001+GMLiAPdI*-<br />

3.77723705042659E+000<br />

y= 3.33633641030288E+000+GA5aCCDL*-<br />

1.94876226261915E-001+TA1FPIDL*-<br />

39 4 0.784873793896405 4.23346842676077E-001+TLDFAIDL*<br />

Link<br />

4.01318298880704E-001+GMLiAPdI*-<br />

3.64590811981607E+000<br />

y= 6.02201396063550E+000+GA5aCCDL*-<br />

1.24589135140765E-001+GAbPPFdL*-<br />

39 4 0.802067501247866 5.48765716327511E-001+GAwPACDL*<br />

Link<br />

9.23482598792537E-001+GAZAAIDL*<br />

3.18120042599435E-001<br />

y= 9.77031338191638E+000+GA5aCCDL*-<br />

1.69264629070674E-001+TAtAIfDR*-<br />

39 4 0.804286530946939 4.07716403919092E-001+GMTPiCdL*-<br />

Link<br />

4.37418322056800E-001+GMLiAPdI*-<br />

4.33739000919138E+000<br />

y= 1.36123461166612E+001+GA5aCCDL*-<br />

1.54340240635941E-001+TAtAIfDR*-<br />

39 4 0.814105679893478 4.71424618541177E-001+GQ1PIfdL*-<br />

Link<br />

9.25363290053647E-001+GMLiAPdI*-<br />

4.08009171325853E+000<br />

y= 1.29633594351980E+001+GA5aCCDL*-<br />

1.78281216341697E-001+TAtPFfDR*-<br />

39 4 0.821473243777755 2.24609677097928E+000+GQ1PIfdL*-<br />

Link<br />

1.02316958895442E+000+GMLiAPdI*-<br />

3.60251165923635E+000<br />

y= 2.14872674323368E+000+GA5aCCDL*-<br />

1.83498321953278E-001+GATAPaDR*<br />

39 4 0.827782539556989 3.91672165448696E+001+GQ0AAiDL*<br />

Link<br />

3.53336909208376E-001+TAsPifDL*<br />

2.06282871618359E+000<br />

y= 7.77395091651078E+000+TAfFPFDL*-<br />

7.89048423146169E-001+GAkCIcdL*-<br />

39 4 0.843849931580623 2.93135152758776E-001+TAtIFFDI*<br />

Link<br />

1.02634578605081E+002+GAsAIcdR*-<br />

1.03916642897475E+000<br />

Pentru fiecare mo<strong>de</strong>l disponibil în baza <strong>de</strong> date, analiza <strong>de</strong> mo<strong>de</strong>l trebuie să permită vizualizarea<br />

rezultatelor; având în ve<strong>de</strong>re că aceasta reprezintă însă un rezultat al cercetării, interfaţa care<br />

permite această operaţie este protejată cu parolă; un exemplu în acest sens este următorul:<br />

173


http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs/MDFV/?set=nitro&property=logLD50&id=24<br />

când se obţine rezultatul după introducerea corespunzătoare a parolei <strong>de</strong> acces; aplicaţia realizată<br />

permite vizualizarea rezultatelor analizei <strong>de</strong> mo<strong>de</strong>l pentru mo<strong>de</strong>lul <strong>de</strong> regresie selectat; pentru setul<br />

(nitro), activitatea (logLD50) şi mo<strong>de</strong>lul (id) selectate mai sus, se <strong>de</strong>schi<strong>de</strong> o interfaţă care permite<br />

analiza <strong>de</strong> mo<strong>de</strong>l pe componente <strong>de</strong> interes, aşa cum arată captura <strong>de</strong> ecran <strong>de</strong> mai jos, urmată <strong>de</strong><br />

analiza pe componente, redată în a 2-a figură <strong>de</strong> mai jos:<br />

Mo<strong>de</strong>l<br />

Set Molecules<br />

Name Number<br />

Property<br />

Name<br />

Molecules<br />

Number<br />

In<strong>de</strong>pen<strong>de</strong>nt<br />

Variables<br />

Determination<br />

Coefficient<br />

nitro 39 logLD50 39 4 0.843849931580623<br />

174<br />

Structure-Activity<br />

Relationship<br />

7.77395091651078E+000+<br />

TAfFPFDL*-7.89048423146169E-001+<br />

GAkCIcdL*-2.93135152758776E-001+<br />

TAtIFFDI* 1.02634578605081E+002+<br />

GAsAIcdR*-1.03916642897475E+000<br />

Analysis<br />

No Mol Prop TAfFPFDL GAkCIcdL TAtIFFDI GAsAIcdR Estimated Diff%<br />

1 001_7416 5.855 -1.3428 7.202 0.004126 1.3089 5.786 1<br />

2 002_7452 3.384 -0.24485 8.068 0.008221 2.2322 4.126 20<br />

3 003_7434 5.617 0.29329 6.433 0.0008335 0.006739 5.735 2<br />

4 004_11761 6.815 -0.345 6.692 0.008463 0.4392 6.497 5<br />

5 005_8461 5.591 -0.3782 6.21 0.0011986 0.3994 5.960 6<br />

6 006_11813 5.176 -0.3757 8.094 0.0011986 1.2188 4.554 13<br />

7 007_12067 5.375 -0.3783 6.23 0.003584 0.6294 5.960 10<br />

8 008_8376 6.409 0.22035 6.626 0.003938 0.015569 6.046 6<br />

9 009_6946 7.378 -1.1922 7.585 0.007296 0.0645 7.173 3<br />

10 010_7423 6.282 -1.2171 7.09 3.166e-05 0.5752 6.061 4<br />

11 011_7475 6.62 -1.2309 7.669 0.007296 1.0707 6.133 8<br />

12 012_7447 7.719 -2.1631 5.219 0.007705 0.9793 7.724 0<br />

13 013_8492 8.769 -1.2309 4.642 0.007296 0.09741 8.032 9<br />

14 014_23108 7.944 -2.0756 5.996 0.005694 0.11535 8.119 2<br />

15 015_4338370 7.65 -1.0753 4.566 0.0079 0.6603 7.409 3<br />

16 016_6947 5.811 -1.7969 8.254 0.010268 2.0852 5.659 3<br />

17 017_11137 5.793 -1.8034 9.757 0.008221 1.5057 5.616 3<br />

18 018_980 5.308 -1.8087 10.752 0.007197 1.8329 4.883 8<br />

19 019_1493 3.401 -0.3719 9.344 0.0022138 1.7075 3.781 11


20 020_3613389 7.783 -1.627 5.661 0.004126 0.5393 7.261 7<br />

21 021_6954 5.298 0.22417 8.591 0.003261 0.9482 4.428 18<br />

22 022_6108 7.581 -3.0803 7.67 0.012619 1.1459 8.060 6<br />

23 023_8494 8.086 -3.034 7.94 0.015547 1.6165 7.756 4<br />

24 024_8489 6.04 -1.7214 5.469 0.005785 1.7859 6.267 4<br />

25 025_33096 5.704 -0.21674 8.844 0.015486 0.6829 6.232 9<br />

26 026_214168 6.052 -0.6002 8.531 0.010229 0.7655 6.001 1<br />

27 027_67967 5.298 -2.382 9.018 0.008027 2.3431 5.399 2<br />

28 028_6974 7.8 -2.8392 10.287 0.016055 0.7306 7.887 1<br />

29 029_67350 8.7 -3.449 5.913 0.009096 1.3666 8.276 5<br />

30 030_541 8.455 -2.5978 8.622 0.010162 0.6859 7.627 10<br />

31 031_12090 3.401 -1.657 11.613 0.00347 1.6802 4.287 23<br />

32 032_5111791 6.524 -1.1019 4.456 0.004624 1.1886 6.577 1<br />

33 033_8462 6.98 -1.4327 6.451 0.015287 2.0797 6.421 8<br />

34 034_7114 7.71 -1.6518 6.798 0.011366 1.0543 7.156 7<br />

35 035_7457 7.886 -1.4819 5.896 0.013735 1.0788 7.504 5<br />

36 036_97443 6.745 -2.1663 4.84 0.007304 1.2072 7.560 11<br />

37 037_11346 7.378 -3.0875 7.428 0.014112 1.1802 8.255 11<br />

38 038_15787 6.109 -0.7537 5.615 0.009721 0.10692 7.609 22<br />

39 039_94665 6.922 -1.5705 5.959 0.003249 0.06567 7.532 8<br />

175


2009A2. Construirea mo<strong>de</strong>lelor moleculare (chimie cuantică) & procesarea informaţiei<br />

moleculare (chimie matematică)<br />

Elaborarea mo<strong>de</strong>lelor matematice ale structurilor şi proceselor chimice a constituit subiect <strong>de</strong><br />

preocupări anterior realizării acestei activităţi (Jäntschi & Naşcu, 2002-FSD3; Jäntschi & Naşcu,<br />

2002-NDT; Jäntschi & Pică, 2002-NKC; Jäntschi & Ungureşan, 2002-PCEI; Jäntschi & Pică, 2003-<br />

ORM; Jäntschi & Pică, 2003-NCDR; Jäntschi, 2003-KB). O serie <strong>de</strong> studii recente (Jäntschi &<br />

others, 2007-FVCT; Stoenoiu & others, 2007-MFI) au pregătit terenul pentru seria <strong>de</strong> rezultate care<br />

au fost valorificate din <strong>de</strong>rularea acestei activităţi în cadrul proiectului (Ştefu & others, 2008-<br />

MHHS; Stoenoiu & others, 2008-MFET; Jäntschi & others, 2008-IEbT; Jäntschi & Diu<strong>de</strong>a, 2009sGPV;<br />

Jäntschi & others, 2009-CCPI; Jäntschi & Bolboacă, 2009-CPRI; Jäntschi & Bolboacă,<br />

2009-EDFD) şi chiar rezultate care au apărut după finalizarea activităţii (Jäntschi & Diu<strong>de</strong>a, 2011-<br />

C16V).<br />

Mo<strong>de</strong>lele moleculare s-au implementat modularizat folosind clase; astfel informaţia structurii<br />

moleculare s-a implementat la 5 nivele, aşa cum rezultă în continuare.<br />

Procesarea informaţiei la nivel atomic (legat <strong>de</strong> valenţă, masă atomică, sarcină electrică parţială,<br />

afinitate pentru electroni, punct <strong>de</strong> topire în stare fundamentală, număr <strong>de</strong> protoni situaţi în<br />

vecinătatea imediată în structură, coordonate <strong>de</strong> geometrie tridimensională, legăturile cu<br />

heteroatomii învecinaţi) sunt obţinute pentru fiecare atom al unei structuri analizate pornind <strong>de</strong> la<br />

structura în format HyperChem şi folosind o bază <strong>de</strong> date cu constante atomice <strong>de</strong> către funcţiile<br />

implementate în clasa class_<strong>de</strong>scriptor_1atoms.php.<br />

class ato_type{<br />

function __construct(){<br />

$this->mass["H"] = 1.0078; $this->elng["H"] = 2.1; $this->melt["H"] = 14; $this->elaf["H"] = -72.8;<br />

$this->mass["B"] = 10.810; $this->elng["B"] = 2.0; $this->melt["B"] = 2573; $this->elaf["B"] = -15;<br />

$this->mass["C"] = 12.011; $this->elng["C"] = 2.5; $this->melt["C"] = 3820; $this->elaf["C"] = -121;<br />

$this->mass["N"] = 14.007; $this->elng["N"] = 3.0; $this->melt["N"] = 63.29; $this->elaf["N"] = 31;<br />

$this->mass["O"] = 15.999; $this->elng["O"] = 3.5; $this->melt["O"] = 54.8; $this->elaf["O"] = -141;<br />

$this->mass["F"] = 18.998; $this->elng["F"] = 4.0; $this->melt["F"] = 54; $this->elaf["F"] = -333;<br />

$this->mass["AL"]= 26.982; $this->elng["AL"]= 1.5; $this->melt["AL"]= 933; $this->elaf["AL"]= -44;<br />

$this->mass["SI"]= 28.086; $this->elng["SI"]= 1.8; $this->melt["SI"]= 1683; $this->elaf["SI"]= -135;<br />

$this->mass["P"] = 30.974; $this->elng["P"] = 2.1; $this->melt["P"] = 317.3; $this->elaf["P"] = -60;<br />

$this->mass["S"] = 32.066; $this->elng["S"] = 2.5; $this->melt["S"] = 386; $this->elaf["S"] = -200.4;<br />

$this->mass["CL"]= 35.453; $this->elng["CL"]= 3.0; $this->melt["CL"]= 172; $this->elaf["CL"]= -348;<br />

$this->mass["FE"]= 55.847; $this->elng["FE"]= 1.8; $this->melt["FE"]= 1808; $this->elaf["FE"]= -44;<br />

$this->mass["CU"]= 63.546; $this->elng["CU"]= 1.9; $this->melt["CU"]= 1357; $this->elaf["CU"]= -118.3;<br />

$this->mass["GA"]= 69.723; $this->elng["GA"]= 1.6; $this->melt["GA"]= 303; $this->elaf["GA"]= -36;<br />

$this->mass["GE"]= 72.610; $this->elng["GE"]= 1.8; $this->melt["GE"]= 1211; $this->elaf["GE"]= -116;<br />

$this->mass["AS"]= 74.923; $this->elng["AS"]= 2.0; $this->melt["AS"]= 1090; $this->elaf["AS"]= -77;<br />

$this->mass["SE"]= 78.960; $this->elng["SE"]= 2.4; $this->melt["SE"]= 490; $this->elaf["SE"]= -195;<br />

$this->mass["BR"]= 79.904; $this->elng["BR"]= 2.8; $this->melt["BR"]= 266; $this->elaf["BR"]= -324;<br />

$this->mass["IN"]= 114.82; $this->elng["IN"]= 1.7; $this->melt["IN"]= 429; $this->elaf["IN"]= -34;<br />

$this->mass["SN"]= 118.71; $this->elng["SN"]= 1.8; $this->melt["SN"]= 505; $this->elaf["SN"]= -121;<br />

$this->mass["SB"]= 121.75; $this->elng["SB"]= 1.9; $this->melt["SB"]= 904; $this->elaf["SB"]= -101;<br />

$this->mass["TE"]= 127.60; $this->elng["TE"]= 2.1; $this->melt["TE"]= 722.7; $this->elaf["TE"]= -190.2;<br />

$this->mass["I"] = 126.90; $this->elng["I"] = 2.5; $this->melt["I"] = 387; $this->elaf["I"] = -295;<br />

}<br />

}<br />

class hin_file{<br />

var $n=0;<br />

function __construct($mol){<br />

$q=mysql_query("SELECT `hin` FROM `".setd."_data` WHERE `mol`='".$mol."'");<br />

if(!$q)die("SELECT HIN ERROR!\r\n");<br />

$n=mysql_num_rows($q);<br />

if($n===1){<br />

$r=mysql_fetch_array($q);<br />

mysql_free_result($q);<br />

$text=$r[0];<br />

}else die("MORE THAN ONE HIN!");<br />

$a=explo<strong>de</strong>("mol 1",$text);<br />

if(count($a)3)die("data is more or less than a molecule.\r\n");<br />

$text=$a[1];unset($a);$a=explo<strong>de</strong>("\r\n",$text);unset($text);<br />

$n=count($a);for($i=0;$in=count($atom);<br />

$this->text=$atom;<br />

176


}<br />

function atom_info($atom,&$cnv_tool){<br />

$list=explo<strong>de</strong>(" ",$atom);<br />

//echo($atom."\r\n");<br />

//die();<br />

$n=count($list);<br />

for($i=12;$iatom[]=array_values($list);<br />

}<br />

function create_structure(){<br />

$conversion_tool=array("s" => 1,"d" => 2, "t" => 3, "a" => 1.5);<br />

for($i=0;$in;$i++){<br />

$this->atom_info($this->text[$i],$conversion_tool);<br />

$this->proton[]=0;<br />

}<br />

}<br />

function remove_atoms($remove_list=0){<br />

if($remove_list){<br />

if(!is_array($remove_list))<br />

$this->remove_a_atom($remove_list);<br />

else{<br />

$n=count($remove_list);<br />

for($i=0;$iremove_a_atom($remove_list[$i]);<br />

}<br />

}<br />

}<br />

unset($this->text);<br />

}<br />

function remove_a_atom($atom){<br />

$at_li=array();<br />

for($i=0;$in;$i++){<br />

if($atom==$this->atom[$i][1]){<br />

$at_li[]=$i;<br />

for($j=0;$jatom[$j][$k]==$this->atom[$i][0]){<br />

if($atom=="H"){<br />

$this->proton[$j]++;<br />

unset($this->proton[$i]);<br />

}<br />

unset($this->atom[$j][$k]);<br />

unset($this->atom[$j][$k+1]);<br />

$this->atom[$j][6]--;<br />

$this->atom[$j]=array_values($this->atom[$j]);<br />

break;<br />

}<br />

}<br />

}<br />

for($j=$i+1;$jn;$j++){<br />

for($k=7;$katom[$j]);$k+=2){<br />

if($this->atom[$j][$k]==$this->atom[$i][0]){<br />

if($atom=="H"){<br />

$this->proton[$j]++;<br />

unset($this->proton[$i]);<br />

}<br />

unset($this->atom[$j][$k]);<br />

unset($this->atom[$j][$k+1]);<br />

$this->atom[$j][6]--;<br />

$this->atom[$j]=array_values($this->atom[$j]);<br />

break;<br />

}<br />

}<br />

}<br />

}<br />

}<br />

$n=count($at_li);<br />

if($n){<br />

for($i=0;$iatom[$at_li[$i]]);<br />

$this->n--;<br />

}<br />

$this->atom=array_values($this->atom);<br />

$this->proton=array_values($this->proton);<br />

}<br />

177


}<br />

function create_in<strong>de</strong>x(){<br />

for($i=0;$in;$i++){<br />

$this->in<strong>de</strong>x[$i]=$this->atom[$i][0];<br />

}<br />

}<br />

function create_topology(){<br />

$this->m=0;<br />

for($i=0;$in;$i++){<br />

//$this->in<strong>de</strong>x[$i]=$this->atom[$i][0];<br />

$label[$this->atom[$i][0]]=$i;<br />

$this->topology["count"][$i]=$this->atom[$i][6];<br />

$this->m+=$this->topology["count"][$i];<br />

}<br />

$this->m/=2;<br />

for($i=0;$in;$i++){<br />

for($j=0;$jtopology["count"][$i];$j++){<br />

$this->topology["edges"][$i][$j]=$label[$this->atom[$i][7+2*$j]];<br />

}<br />

}<br />

}<br />

function create_chemistry(&$a){<br />

for($i=0;$in;$i++){<br />

$this->chemstry[$i]=strtoupper($this->atom[$i][1]);<br />

$this->property["mass"][$i]=$a->mass[$this->chemstry[$i]];//M<br />

$this->property["elng"][$i]=$a->elng[$this->chemstry[$i]];//E<br />

$this->property["melt"][$i]=$a->melt[$this->chemstry[$i]];//L<br />

$this->property["elaf"][$i]=$a->elaf[$this->chemstry[$i]];//A<br />

$this->property["char"][$i]=$this->atom[$i][5];//Q<br />

$this->property["prot"][$i]=$this->proton[$i];//H<br />

$this->property["card"][$i]=1;//1<br />

$this->geometry["x"][$i]=$this->atom[$i][2];<br />

$this->geometry["y"][$i]=$this->atom[$i][3];<br />

$this->geometry["z"][$i]=$this->atom[$i][4];<br />

}<br />

unset($this->in<strong>de</strong>x);<br />

unset($this->proton);<br />

unset($this->chemstry);<br />

unset($this->atom);<br />

}<br />

function tmp_edve_cut($v){<br />

for($i=0;$itopology["count"][$v];$i++){<br />

for($j=0;$jtopology["count"][$this->tmp_edge[$v][$i]];$j++){<br />

if($this->tmp_edge[$this->tmp_edge[$v][$i]][$j]==$v){<br />

unset($this->tmp_edge[$this->tmp_edge[$v][$i]][$j]);<br />

break;<br />

}<br />

}<br />

}<br />

unset($this->tmp_edge[$v]);<br />

}<br />

function tmp_vert_cut($v){<br />

unset($this->tmp_edge[$v]);<br />

}<br />

function tmp_edge_cut($v1,$v2){<br />

for($j=0;$jtopology["count"][$v1];$j++){<br />

if($this->tmp_edge[$v1][$j]==$v2){<br />

unset($this->tmp_edge[$v1][$j]);<br />

$this->tmp_edge[$v1]=array_values($this->tmp_edge[$v1]);<br />

break;<br />

}<br />

}<br />

for($j=0;$jtopology["count"][$v2];$j++){<br />

if($this->tmp_edge[$v2][$j]==$v1){<br />

unset($this->tmp_edge[$v2][$j]);<br />

$this->tmp_edge[$v2]=array_values($this->tmp_edge[$v2]);<br />

break;<br />

}<br />

}<br />

}<br />

function create_matrix_distance(&$edges = NULL){<br />

if($edges==NULL){<br />

$edges=&$this->topology["edges"];<br />

$this->distance["t"]=array();<br />

$mat_a=&$this->distance["t"];<br />

for($i=0;$in;$i++){<br />

$this->distance["g"][$i][$i]=0;<br />

$this->distance["v"][$i][$i]=array(1,1,1);<br />

for($j=$i+1;$jn;$j++){<br />

178


}else{<br />

}<br />

}<br />

$this->tmp_dist=array();<br />

$mat_a=&$this->tmp_dist;<br />

$this->distance["v"][$i][$j]=array(<br />

$this->geometry["x"][$i]-$this->geometry["x"][$j],<br />

$this->geometry["y"][$i]-$this->geometry["y"][$j],<br />

$this->geometry["z"][$i]-$this->geometry["z"][$j]<br />

);<br />

$this->distance["g"][$i][$j]=pow(pow($this->distance["v"][$i][$j][0],2)+<br />

pow($this->distance["v"][$i][$j][1],2)+pow($this->distance["v"][$i][$j][2],2),0.5);<br />

$this->distance["v"][$i][$j][0]/=$this->distance["g"][$i][$j];<br />

$this->distance["v"][$i][$j][1]/=$this->distance["g"][$i][$j];<br />

$this->distance["v"][$i][$j][2]/=$this->distance["g"][$i][$j];<br />

$this->distance["v"][$j][$i]=array(<br />

-$this->distance["v"][$i][$j][0],<br />

-$this->distance["v"][$i][$j][1],<br />

-$this->distance["v"][$i][$j][2],<br />

);<br />

$this->distance["g"][$j][$i]=$this->distance["g"][$i][$j];<br />

}<br />

for($i=0;$in;$i++){<br />

for($j=0;$jm+1;<br />

}<br />

$mat[$i][$i]=0;<br />

for($j=$i+1;$jn;$j++){<br />

$mat[$i][$j]=$this->m+1;<br />

}<br />

}<br />

foreach($edges as $i => &$v){<br />

foreach($edges[$i] as $j => &$v){<br />

$mat[$i][$edges[$i][$j]]=1;<br />

}<br />

}<br />

for($k=0;$kn;$k++){<br />

for($i=0;$in;$i++){<br />

for($j=0;$jn;$j++){<br />

if($mat[$i][$k]+$mat[$k][$j]adjcency=array();<br />

$mat_a=&$this->adjcency;<br />

for($i=0;$in;$i++){<br />

$mat[$i]=array_fill(0,$this->n,0);<br />

}<br />

foreach($this->topology["edges"] as $i => &$v){<br />

foreach($this->topology["edges"][$i] as $j => &$v){<br />

$mat[$i][$this->topology["edges"][$i][$j]]=1;<br />

}<br />

}<br />

$mat_a=$mat;<br />

}<br />

function create_fragments(){<br />

for($vi=0;$vin;$vi++){<br />

$this->tmp_edge=$this->topology["edges"];<br />

$this->tmp_edve_cut($vi);<br />

$this->create_matrix_distance($this->tmp_edge);<br />

$chek_list=array_keys($this->tmp_dist);<br />

$i=0;$n_i=$this->n;<br />

do{<br />

$fr[$i][0]=$chek_list[0];<br />

for($j=1;$jtmp_dist[$fr[$i][0]][$chek_list[$j]]m){<br />

$fr[$i][]=$chek_list[$j];<br />

unset($chek_list[$j]);<br />

}<br />

}<br />

unset($chek_list[0]);<br />

$n_i=count($chek_list);<br />

if(!$n_i)break;<br />

179


}<br />

$i++;<br />

$chek_list=array_values($chek_list);<br />

}while(1);<br />

//modified !!!!!!!!!!!!<br />

$n_i=count($fr);<br />

for($i=0;$ifragment[$vi]=array_values($fr);<br />

//modified !!!!!!!! from $this->fragment[$vi]=$fr;<br />

unset($this->tmp_edge);<br />

unset($this->tmp_dist);<br />

unset($fr);<br />

}<br />

function display_all_fragments_subgraphs(){<br />

$ret="";<br />

for($i=0;$in;$i++){<br />

$ret.="\{".$i."} -> ".$this->display_fragments($i," ","{}"," ","\r\n");<br />

$ret.=$this->display_subgraphs($i)."\r\n";<br />

}<br />

return $ret;<br />

}<br />

function display_all_fragments(){<br />

$ret="";<br />

for($i=0;$in;$i++){<br />

$ret.="\{".$i."} -> ".$this->display_fragments($i," ","{}"," ","\r\n");<br />

}<br />

return $ret;<br />

}<br />

function display_fragments($v,$s1,$s3,$s2,$s4){<br />

$n=count($this->fragment[$v]);<br />

for($i=0;$ifragment[$v][$i])==1)&&($v==$this->fragment[$v][$i][0])){<br />

$ret[]=" X ";<br />

$uns=$i;<br />

continue;<br />

}<br />

*/<br />

$ret[]=$s3[0].$this->display_a_fragment($v,$i,$s1).$s3[1];<br />

}<br />

//unset($this->fragment[$v][$uns]);<br />

//$this->fragment[$v]=array_values($this->fragment[$v]);<br />

return implo<strong>de</strong>($s2,$ret).$s4;<br />

}<br />

function display_a_fragment($v,$f,$s){<br />

return implo<strong>de</strong>($s,$this->fragment[$v][$f]);<br />

}<br />

function display_all_subgraphs(){<br />

$ret="";<br />

for($i=0;$in;$i++){<br />

$ret.=$this->display_subgraphs($i)."\r\n";<br />

}<br />

return $ret;<br />

}<br />

function display_subgraphs($v){<br />

$n=count($this->fragment[$v]);<br />

$ret="\{".$v."} -> ";<br />

for($i=0;$idisplay_a_subgraph($v,$i,"")." ";<br />

}<br />

return $ret;<br />

}<br />

function display_a_subgraph($v,$f,$s){<br />

$n=count($this->fragedge[$v][$f]);<br />

if($n==0){<br />

$vll="(".$s.")";<br />

}else{<br />

$vl=array();<br />

for($i=0;$ifragedge[$v][$f][$i]).")";<br />

}<br />

$vll=implo<strong>de</strong>(",",$vl);<br />

180


}<br />

}<br />

return "({".implo<strong>de</strong>(",",$this->fragment[$v][$f])."},{".$vll."})";<br />

}<br />

Procesarea informaţiei pentru perechi <strong>de</strong> atomi înzestraţi cu trăsăturile (proprietăţile) <strong>de</strong> mai sus ce<br />

referă aplicarea mo<strong>de</strong>lelor <strong>de</strong> interacţiune pentru perechi <strong>de</strong> atomi este realizată <strong>de</strong> funcţiile<br />

implementate în clasa class_<strong>de</strong>scriptor_2pairs.php; sunt implementate:<br />

÷ 2 mo<strong>de</strong>le <strong>de</strong> interacţiune pereche bazate exclusiv pe distanţa (geometrică sau topologică) între<br />

atomi (proporţionalitate directă şi respectiv reciprocă);<br />

÷ 8 mo<strong>de</strong>le <strong>de</strong> interacţiune pereche bazate exclusiv pe proprietatea atomică (geometrică sau<br />

topologică) între atomi (valenţă, masă atomică, sarcină electrică parţială, afinitate pentru<br />

electroni, punct <strong>de</strong> topire în stare fundamentală, număr <strong>de</strong> protoni situaţi în vecinătatea imediată<br />

în structură, numărul <strong>de</strong> legături cu heteroatomii învecinaţi);<br />

÷ 8 mo<strong>de</strong>le <strong>de</strong> interacţiune bazate pe forţa elastică;<br />

÷ 8 mo<strong>de</strong>le <strong>de</strong> interacţiune bazate pe energia unei forţe <strong>de</strong> natură elastică;<br />

÷ 8 mo<strong>de</strong>le <strong>de</strong> interacţiune ce caracterizează interacţiunea invers proporţională cu distanţa;<br />

÷ 8 mo<strong>de</strong>le <strong>de</strong> interacţiune ce caracterizează interacţiunea invers proporţională cu pătratul<br />

distanţei;<br />

÷ 8 mo<strong>de</strong>le <strong>de</strong> interacţiune ce caracterizează interacţiunea invers proporţională cu puterea a 3-a a<br />

distanţei;<br />

÷ 8 mo<strong>de</strong>le <strong>de</strong> interacţiune ce caracterizează interacţiunea invers proporţională cu puterea a 4-a a<br />

distanţei;<br />

function create_pd_<strong>de</strong>scriptor($n,$pp,$dd,&$p,&$d,&$e){<br />

for($i=0;$ip[$pp][$j],$d->d[$dd][$i][$j]);<br />

$e[$i][$j]=$pd->f;<br />

}<br />

}<br />

}<br />

class distance_object{<br />

function __construct(&$dst){<br />

$this->n=2;<br />

$this->d[0]=$dst["t"];<br />

$this->d[1]=$dst["g"];<br />

}<br />

}<br />

class versor_object_g{<br />

function __construct(&$dst){<br />

$this->v=$dst["v"];<br />

}<br />

function val($k,$i,$j){<br />

return $this->v[$i][$j][$k];<br />

}<br />

}<br />

class versor_object_t{<br />

function val($k,$i,$j){<br />

return 1;<br />

}<br />

}<br />

class property_object{<br />

function __construct(&$pro){<br />

$this->n=7;<br />

$this->p[0]=$pro["card"];//C<br />

$this->p[1]=$pro["prot"];//H<br />

$this->p[2]=$pro["mass"];//M<br />

$this->p[3]=$pro["elng"];//E<br />

$this->p[4]=$pro["char"];//Q<br />

$this->p[5]=$pro["melt"];//L<br />

$this->p[6]=$pro["elaf"];//A<br />

}<br />

}<br />

class <strong>de</strong>scriptor_pair{<br />

function __construct($p1,$p2,$d12){<br />

$this->n=58;<br />

//init distance<br />

181


$this->d12=$d12;<br />

$this->d12_0=$this->d12*$this->d12;<br />

if($this->d12)<br />

$this->d12_1=1.0/$this->d12;<br />

else<br />

$this->d12_1=(float)"INF";<br />

$this->d12_2=$this->d12_1*$this->d12_1;<br />

$this->d12_3=$this->d12_2*$this->d12_1;<br />

$this->d12_4=$this->d12_2*$this->d12_2;<br />

//init property<br />

$this->p1=$p1;<br />

$this->p2=$p2;<br />

$this->p12=$this->p1*$this->p2;<br />

$this->p12_2=pow($this->p12,0.5);<br />

//distance<br />

$this->f[0] =$this->d_J();<br />

$this->f[1] =$this->d_1_J();<br />

//property<br />

$this->f[2] =$this->d_O();<br />

if($this->p1) $this->f[3] =$this->d_1_O(); else $this->f[3]=(float)"INF";<br />

$this->f[4] =$this->d_P();<br />

if($this->p2) $this->f[5] =$this->d_1_P(); else $this->f[5]=(float)"INF";<br />

$this->f[6] =$this->d_Q();<br />

if($this->p12) $this->f[7] =$this->d_1_Q(); else $this->f[7]=(float)"INF";<br />

$this->f[8] =$this->d_R();<br />

if($this->p12_2) $this->f[9] =$this->d_1_R(); else $this->f[9]=(float)"INF";<br />

//elastic force<br />

$this->f[10] =$this->d_K();<br />

if($this->p1) $this->f[11] =$this->d_1_K(); else $this->f[11]=(float)"INF";<br />

$this->f[12] =$this->d_L();<br />

if($this->p2) $this->f[13] =$this->d_1_L(); else $this->f[13]=(float)"INF";<br />

$this->f[14] =$this->d_M();<br />

if($this->p12) $this->f[15] =$this->d_1_M(); else $this->f[15]=(float)"INF";<br />

$this->f[16] =$this->d_N();<br />

if($this->p12_2) $this->f[17] =$this->d_1_N(); else $this->f[17]=(float)"INF";<br />

//energy from elastic force<br />

$this->f[18] =$this->d_W();<br />

if($this->p1) $this->f[19] =$this->d_1_W(); else $this->f[19]=(float)"INF";<br />

$this->f[20] =$this->d_X();<br />

if($this->p2) $this->f[21] =$this->d_1_X(); else $this->f[21]=(float)"INF";<br />

$this->f[22] =$this->d_Y();<br />

if($this->p12) $this->f[23] =$this->d_1_Y(); else $this->f[23]=(float)"INF";<br />

$this->f[24] =$this->d_Z();<br />

if($this->p12_2) $this->f[25] =$this->d_1_Z(); else $this->f[25]=(float)"INF";<br />

//potential, field, force 1<br />

$this->f[26] =$this->d_S();<br />

if($this->p1) $this->f[27] =$this->d_1_S(); else $this->f[27]=(float)"INF";<br />

$this->f[28] =$this->d_T();<br />

if($this->p2) $this->f[29] =$this->d_1_T(); else $this->f[29]=(float)"INF";<br />

$this->f[30] =$this->d_U();<br />

if($this->p12) $this->f[31] =$this->d_1_U(); else $this->f[31]=(float)"INF";<br />

$this->f[32] =$this->d_V();<br />

if($this->p12_2) $this->f[33] =$this->d_1_V(); else $this->f[33]=(float)"INF";<br />

//potential, field, force 2<br />

$this->f[34] =$this->d_F();<br />

if($this->p1) $this->f[35] =$this->d_1_F(); else $this->f[35]=(float)"INF";<br />

$this->f[36] =$this->d_G();<br />

if($this->p2) $this->f[37] =$this->d_1_G(); else $this->f[37]=(float)"INF";<br />

$this->f[38] =$this->d_H();<br />

if($this->p12) $this->f[39] =$this->d_1_H(); else $this->f[39]=(float)"INF";<br />

$this->f[40] =$this->d_I();<br />

if($this->p12_2) $this->f[41] =$this->d_1_I(); else $this->f[41]=(float)"INF";<br />

//potential, field, force 3<br />

$this->f[42] =$this->d_A();<br />

if($this->p1) $this->f[43] =$this->d_1_A(); else $this->f[43]=(float)"INF";<br />

$this->f[44] =$this->d_B();<br />

if($this->p2) $this->f[45] =$this->d_1_B(); else $this->f[45]=(float)"INF";<br />

$this->f[46] =$this->d_C();<br />

if($this->p12) $this->f[47] =$this->d_1_C(); else $this->f[47]=(float)"INF";<br />

$this->f[48] =$this->d_D();<br />

if($this->p12_2) $this->f[49] =$this->d_1_D(); else $this->f[49]=(float)"INF";<br />

//potential, field, force 4<br />

$this->f[50] =$this->d_E_0();<br />

if($this->p1) $this->f[51] =$this->d_E_1(); else $this->f[51]=(float)"INF";<br />

$this->f[52] =$this->d_E_2();<br />

if($this->p2) $this->f[53] =$this->d_E_3(); else $this->f[53]=(float)"INF";<br />

$this->f[54] =$this->d_E_4();<br />

if($this->p12) $this->f[55] =$this->d_E_5(); else $this->f[55]=(float)"INF";<br />

$this->f[56] =$this->d_E_6();<br />

182


if($this->p12_2) $this->f[57] =$this->d_E_7(); else $this->f[57]=(float)"INF";<br />

unset($this->p1);<br />

unset($this->p2);<br />

unset($this->p12);<br />

unset($this->p12_2);<br />

unset($this->d12);<br />

unset($this->d12_0);<br />

unset($this->d12_1);<br />

unset($this->d12_2);<br />

unset($this->d12_3);<br />

unset($this->d12_4);<br />

}<br />

//distance<br />

function d_J(){ return $this->d12; }//J=D<br />

function d_1_J(){ return $this->d12_1; } //j=1/D<br />

//property<br />

function d_O(){ return $this->p1; } //O=P1<br />

function d_1_O(){ return 1.0/$this->p1; } //o=1/P1<br />

function d_P(){ return $this->p2; } //P=P2<br />

function d_1_P(){ return 1.0/$this->p2; } //p=1/P2<br />

function d_Q(){ return $this->p12; } //Q=P1P2<br />

function d_1_Q(){ return 1.0/$this->p12; } //q=1/P1P2<br />

function d_R(){ return $this->p12_2; } //R=sqrt(P1P2)<br />

function d_1_R(){ return 1.0/$this->p12_2; } //r=1/sqrt(P1P2)<br />

//elastic force<br />

function d_K(){ return $this->p1*$this->d12; } //K=P1D<br />

function d_1_K(){ return $this->d12/$this->p1; } //k=(1/P1)D<br />

function d_L(){ return $this->p2*$this->d12; } //L=P2D<br />

function d_1_L(){ return $this->d12/$this->p2; } //l=(1/P2)D<br />

function d_M(){ return $this->p12*$this->d12; } //M=P1P2D<br />

function d_1_M(){ return $this->d12/$this->p12; } //m=(1/P1P2)D<br />

function d_N(){ return $this->p12_2*$this->d12; } //N=sqrt(P1P2)D<br />

function d_1_N(){ return $this->d12/$this->p12_2; } //n=(1/sqrt(P1P2))D<br />

//energy from elastic force<br />

function d_W(){ return $this->p1*$this->d12_0; } //W=P1D2<br />

function d_1_W(){ return $this->d12_0/$this->p1; } //w=(1/P1)D2<br />

function d_X(){ return $this->p2*$this->d12_0; } //X=P2D2<br />

function d_1_X(){ return $this->d12_0/$this->p2; } //x=(1/P2)D2<br />

function d_Y(){ return $this->p12*$this->d12_0; } //Y=P1P2D2<br />

function d_1_Y(){ return $this->d12_0/$this->p12; } //y=(1/P1P2)D2<br />

function d_Z(){ return $this->p12_2*$this->d12_0; } //Z=sqrt(P1P2)D2<br />

function d_1_Z(){ return $this->d12_0/$this->p12_2; } //z=(1/sqrt(P1P2))D2<br />

//potential, field, force 1<br />

function d_S(){ return $this->p1*$this->d12_1; } //S=P1/D<br />

function d_1_S(){ return $this->d12_1/$this->p1; } //s=(1/P1)/D<br />

function d_T(){ return $this->p2*$this->d12_1; } //T=P2/D<br />

function d_1_T(){ return $this->d12_1/$this->p2; } //t=(1/P2)/D<br />

function d_U(){ return $this->p12*$this->d12_1; } //U=P1P2/D<br />

function d_1_U(){ return $this->d12_1/$this->p12; } //u=(1/P1P2)/D<br />

function d_V(){ return $this->p12_2*$this->d12_1; } //V=sqrt(P1P2)/D<br />

function d_1_V(){ return $this->d12_1/$this->p12_2; } //v=(1/sqrt(P1P2))/D<br />

//potential, field, force 2<br />

function d_F(){ return $this->p1*$this->d12_2; } //F=P1/D2<br />

function d_1_F(){ return $this->d12_2/$this->p1; } //f=(1/P1)/D2<br />

function d_G(){ return $this->p2*$this->d12_2; } //G=P2/D2<br />

function d_1_G(){ return $this->d12_2/$this->p2; } //g=(1/P2)/D2<br />

function d_H(){ return $this->p12*$this->d12_2; } //H=P1P2/D2<br />

function d_1_H(){ return $this->d12_2/$this->p12; } //h=(1/P1P2)/D2<br />

function d_I(){ return $this->p12_2*$this->d12_2; } //I=sqrt(P1P2)/D2<br />

function d_1_I(){ return $this->d12_2/$this->p12_2; } //i=(1/sqrt(P1P2))/D2<br />

//potential, field, force 3<br />

function d_A(){ return $this->p1*$this->d12_3; } //A=P1/D3<br />

function d_1_A(){ return $this->d12_3/$this->p1; } //a=(1/P1)/D3<br />

function d_B(){ return $this->p2*$this->d12_3; } //B=P2/D3<br />

function d_1_B(){ return $this->d12_3/$this->p2; } //b=(1/P2)/D3<br />

function d_C(){ return $this->p12*$this->d12_3; } //C=P1P2/D3<br />

function d_1_C(){ return $this->d12_3/$this->p12; } //c=(1/P1P2)/D3<br />

function d_D(){ return $this->p12_2*$this->d12_3; } //D=sqrt(P1P2)/D3<br />

function d_1_D(){ return $this->d12_3/$this->p12_2; } //d=(1/sqrt(P1P2))/D3<br />

//potential, field, force 4<br />

function d_E_0(){ return $this->p1*$this->d12_4; } //0=P1/D4<br />

function d_E_1(){ return $this->d12_4/$this->p1; } //1=(1/P1)/D4<br />

function d_E_2(){ return $this->p2*$this->d12_4; } //2=P2/D4<br />

function d_E_3(){ return $this->d12_4/$this->p2; } //3=(1/P2)/D4<br />

function d_E_4(){ return $this->p12*$this->d12_4; } //4=P1P2/D4<br />

function d_E_5(){ return $this->d12_4/$this->p12; } //5=(1/P1P2)/D4<br />

function d_E_6(){ return $this->p12_2*$this->d12_4; } //6=sqrt(P1P2)/D4<br />

function d_E_7(){ return $this->d12_4/$this->p12_2; } //7=(1/sqrt(P1P2))/D4<br />

183


}<br />

Procesarea informaţiei <strong>de</strong> interacţiune la nivelul fragmentului molecular este realizată prin<br />

suprapunerea interacţiunilor pereche obţinute anterior folosind o serie <strong>de</strong> mo<strong>de</strong>le <strong>de</strong> suprapunere a<br />

interacţiunilor; funcţiile implementate în clasa class_<strong>de</strong>scriptor_3fragm.php implementează:<br />

÷ 2 tipuri <strong>de</strong> suprapuneri vectoriale folosind drept reper sistemul <strong>de</strong> coordonate <strong>de</strong> referinţă al<br />

moleculei (suprapuneri scalare pe proiecţiile axiale ale sistemului <strong>de</strong> coordonate folosit);<br />

÷ 2 tipuri <strong>de</strong> suprapuneri vectoriale folosind drept reper un sistem <strong>de</strong> coordonate local al<br />

fragmentului - calculat ca centru <strong>de</strong> proprietate - (suprapuneri scalare pe proiecţiile axiale ale<br />

sistemului <strong>de</strong> coordonate folosit);<br />

÷ 2 tipuri <strong>de</strong> suprapuneri scalare (ignorând orientarea vectorială şi folosind valoarea absolută) -<br />

interacţiune <strong>de</strong> tip potenţial;<br />

÷ 2 tipuri <strong>de</strong> selecţii ale valorilor maxime <strong>de</strong> interacţiune dintre interacţiunile existente în<br />

fragment între perechi <strong>de</strong> atomi;<br />

÷ 2 tipuri <strong>de</strong> selecţii ale valorilor minime <strong>de</strong> interacţiune dintre interacţiunile existente în fragment<br />

între perechi <strong>de</strong> atomi;<br />

class <strong>de</strong>scriptor_fragment{<br />

//versori<br />

//<strong>de</strong>scriptori <strong>de</strong> proprietate -> 1 proprietate, 1 distanta, 1 <strong>de</strong>scriptor<br />

//un fragment -> un fragment & un varf<br />

//->meto<strong>de</strong> <strong>de</strong> suprapunere<br />

function __construct($vx){<br />

$this->v=$vx;<br />

$this->n=10;<br />

$this->f=array();<br />

}<br />

function calculate($e,&$fr,&$s,&$v){<br />

$this->spp_fr_field($e,$fr,$s,$v,0);/*f*/<br />

$this->spp_vx_field($e,$fr,$s,$v,1);/*F*/<br />

$this->spp_fr_prcen($e,$fr,$s,$v,2);/*c*/<br />

$this->spp_vx_prcen($e,$fr,$s,$v,3);/*C*/<br />

$this->spp_fr_poten($e,$fr,$s,$v,4);/*p*/<br />

$this->spp_vx_poten($e,$fr,$s,$v,5);/*P*/<br />

$this->spp_fr_maxfr($e,$fr,$s,$v,6);/*a*/<br />

$this->spp_vx_maxvx($e,$fr,$s,$v,7);/*A*/<br />

$this->spp_fr_minfr($e,$fr,$s,$v,8);/*i*/<br />

$this->spp_vx_minvx($e,$fr,$s,$v,9);/*I*/<br />

}<br />

function spp_fr_field($e,&$fr,&$s,&$v,$a){<br />

//suprapune proiectii axiale<br />

//interactii in fragment, in<strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> varf<br />

$this->n=count($fr);<br />

$fr_f_x=0.0;<br />

$fr_f_y=0.0;<br />

$fr_f_z=0.0;<br />

for($i=0;$in-1;$i++){<br />

for($j=$i+1;$jn;$j++){<br />

$val=$s[$fr[$i]][$fr[$j]][$e];<br />

$fr_f_x+=$val*abs($v->val(0,$fr[$i],$fr[$j]));<br />

$fr_f_y+=$val*abs($v->val(1,$fr[$i],$fr[$j]));<br />

$fr_f_z+=$val*abs($v->val(2,$fr[$i],$fr[$j]));<br />

}<br />

}<br />

$fr_f_t=pow(pow($fr_f_x,2)+pow($fr_f_y,2)+pow($fr_f_z,2),0.5);<br />

if(!$fr_f_t) $fr_f_t=1.0;<br />

$fr_f_x/=$fr_f_t;<br />

$fr_f_y/=$fr_f_t;<br />

$fr_f_z/=$fr_f_t;<br />

$this->f[$a]=array($fr_f_t,$fr_f_x,$fr_f_y,$fr_f_z);<br />

}<br />

function spp_vx_field($e,&$fr,&$s,&$v,$a){<br />

//suprapune proiectii axiale<br />

//interactii ale fragmentului cu varful<br />

$fr_f_x=0.0;<br />

$fr_f_y=0.0;<br />

$fr_f_z=0.0;<br />

for($i=0;$in;$i++){<br />

$val=$s[$this->v][$fr[$i]][$e];<br />

$fr_f_x+=$val*$v->val(0,$this->v,$fr[$i]);<br />

$fr_f_y+=$val*$v->val(1,$this->v,$fr[$i]);<br />

$fr_f_z+=$val*$v->val(2,$this->v,$fr[$i]);<br />

}<br />

184


$fr_f_t=pow(pow($fr_f_x,2)+pow($fr_f_y,2)+pow($fr_f_z,2),0.5);<br />

if(!$fr_f_t) $fr_f_t=1.0;<br />

$fr_f_x/=$fr_f_t;<br />

$fr_f_y/=$fr_f_t;<br />

$fr_f_z/=$fr_f_t;<br />

$this->f[$a]=array($fr_f_t,$fr_f_x,$fr_f_y,$fr_f_z);<br />

}<br />

function spp_fr_prcen($e,&$fr,&$s,&$v,$a){<br />

//calculeaza centru <strong>de</strong> <strong>de</strong>scriptor<br />

$fr_f_t=0.0;<br />

$fr_f_x=0.0;<br />

$fr_f_y=0.0;<br />

$fr_f_z=0.0;<br />

for($i=0;$in-1;$i++){<br />

for($j=$i+1;$jn;$j++){<br />

$val=$s[$fr[$i]][$fr[$j]][$e];<br />

$fr_f_t+=$val;<br />

$fr_f_x+=$val*abs($v->val(0,$fr[$i],$fr[$j]));<br />

$fr_f_y+=$val*abs($v->val(1,$fr[$i],$fr[$j]));<br />

$fr_f_z+=$val*abs($v->val(2,$fr[$i],$fr[$j]));<br />

}<br />

}<br />

if(!$fr_f_t) $fr_f_t=1.0;<br />

$fr_f_x/=$fr_f_t;<br />

$fr_f_y/=$fr_f_t;<br />

$fr_f_z/=$fr_f_t;<br />

$this->f[$a]=array($fr_f_t,$fr_f_x,$fr_f_y,$fr_f_z);<br />

}<br />

function spp_vx_prcen($e,&$fr,&$s,&$v,$a){<br />

//calculeaza centru <strong>de</strong> <strong>de</strong>scriptor<br />

$fr_f_t=0.0;<br />

$fr_f_x=0.0;<br />

$fr_f_y=0.0;<br />

$fr_f_z=0.0;<br />

for($i=0;$in;$i++){<br />

$val=$s[$this->v][$fr[$i]][$e];<br />

$fr_f_t+=$val;<br />

$fr_f_x+=$val*$v->val(0,$this->v,$fr[$i]);<br />

$fr_f_y+=$val*$v->val(1,$this->v,$fr[$i]);<br />

$fr_f_z+=$val*$v->val(2,$this->v,$fr[$i]);<br />

}<br />

if(!$fr_f_t) $fr_f_t=1.0;<br />

$fr_f_x/=$fr_f_t;<br />

$fr_f_y/=$fr_f_t;<br />

$fr_f_z/=$fr_f_t;<br />

$this->f[$a]=array($fr_f_t,$fr_f_x,$fr_f_y,$fr_f_z);<br />

}<br />

function spp_fr_poten($e,&$fr,&$s,&$v,$a){<br />

//mediaza versori & suprapune valori <strong>de</strong>scriptori<br />

$fr_f_t=0.0;<br />

$fr_f_x=0.0;<br />

$fr_f_y=0.0;<br />

$fr_f_z=0.0;<br />

for($i=0;$in-1;$i++){<br />

for($j=$i+1;$jn;$j++){<br />

$val=$s[$fr[$i]][$fr[$j]][$e];<br />

$fr_f_t+=$val;<br />

$fr_f_x+=abs($v->val(0,$fr[$i],$fr[$j]));<br />

$fr_f_y+=abs($v->val(1,$fr[$i],$fr[$j]));<br />

$fr_f_z+=abs($v->val(2,$fr[$i],$fr[$j]));<br />

}<br />

}<br />

if($this->nf[$a]=array(0.0,0.0,0.0,0.0);<br />

}else{<br />

$val=$this->n*($this->n-1)/2;<br />

$fr_f_x/=$val;<br />

$fr_f_y/=$val;<br />

$fr_f_z/=$val;<br />

$this->f[$a]=array($fr_f_t,$fr_f_x,$fr_f_y,$fr_f_z);<br />

}<br />

}<br />

function spp_vx_poten($e,&$fr,&$s,&$v,$a){<br />

//mediaza versori & suprapune valori <strong>de</strong>scriptori<br />

$fr_f_t=0.0;<br />

$fr_f_x=0.0;<br />

$fr_f_y=0.0;<br />

$fr_f_z=0.0;<br />

for($i=0;$in;$i++){<br />

185


$val=$s[$this->v][$fr[$i]][$e];<br />

$fr_f_t+=$val;<br />

$fr_f_x+=$v->val(0,$this->v,$fr[$i]);<br />

$fr_f_y+=$v->val(1,$this->v,$fr[$i]);<br />

$fr_f_z+=$v->val(2,$this->v,$fr[$i]);<br />

}<br />

$fr_f_x/=$this->n;<br />

$fr_f_y/=$this->n;<br />

$fr_f_z/=$this->n;<br />

$this->f[$a]=array($fr_f_t,$fr_f_x,$fr_f_y,$fr_f_z);<br />

}<br />

function spp_fr_maxfr($e,&$fr,&$s,&$v,$a){<br />

//maxim valori <strong>de</strong>scriptori<br />

$ret=array(0.0,0.0,0.0,0.0);<br />

for($i=0;$in-1;$i++){<br />

for($j=$i+1;$jn;$j++){<br />

$val=$s[$fr[$i]][$fr[$j]][$e];<br />

if($val>$ret[0]){<br />

$ret[0]=$val;<br />

$ret[1]=abs($v->val(0,$fr[$i],$fr[$j]));<br />

$ret[2]=abs($v->val(1,$fr[$i],$fr[$j]));<br />

$ret[3]=abs($v->val(2,$fr[$i],$fr[$j]));<br />

}<br />

}<br />

}<br />

$this->f[$a]=$ret;<br />

}<br />

function spp_vx_maxvx($e,&$fr,&$s,&$v,$a){<br />

//maxim valori <strong>de</strong>scriptori<br />

$ret=array(0.0,0.0,0.0,0.0);<br />

for($i=0;$in;$i++){<br />

$val=$s[$this->v][$fr[$i]][$e];<br />

if($val>$ret[0]){<br />

$ret[0]=$val;<br />

$ret[1]=abs($v->val(0,$this->v,$fr[$i]));<br />

$ret[2]=abs($v->val(1,$this->v,$fr[$i]));<br />

$ret[3]=abs($v->val(2,$this->v,$fr[$i]));<br />

}<br />

}<br />

$this->f[$a]=$ret;<br />

}<br />

function spp_fr_minfr($e,&$fr,&$s,&$v,$a){<br />

//minim valori <strong>de</strong>scriptori<br />

if($this->nf[$a]=array(0.0,0.0,0.0,0.0);<br />

return;<br />

}else{<br />

$ret[0]=$s[$fr[0]][$fr[1]][$e];<br />

$ret[1]=abs($v->val(0,$fr[0],$fr[1]));<br />

$ret[2]=abs($v->val(1,$fr[0],$fr[1]));<br />

$ret[3]=abs($v->val(2,$fr[0],$fr[1]));<br />

for($i=0;$in-1;$i++){<br />

for($j=$i+1;$jn;$j++){<br />

$val=$s[$fr[$i]][$fr[$j]][$e];<br />

if($valval(0,$fr[$i],$fr[$j]));<br />

$ret[2]=abs($v->val(1,$fr[$i],$fr[$j]));<br />

$ret[3]=abs($v->val(2,$fr[$i],$fr[$j]));<br />

}<br />

}<br />

}<br />

}<br />

$this->f[$a]=$ret;<br />

}<br />

function spp_vx_minvx($e,&$fr,&$s,&$v,$a){<br />

//minim valori <strong>de</strong>scriptori<br />

$ret[0]=$s[$this->v][$fr[0]][$e];<br />

$ret[1]=abs($v->val(0,$this->v,$fr[0]));<br />

$ret[2]=abs($v->val(1,$this->v,$fr[0]));<br />

$ret[3]=abs($v->val(2,$this->v,$fr[0]));<br />

for($i=1;$in;$i++){<br />

$val=$s[$this->v][$fr[$i]][$e];<br />

if($valval(0,$this->v,$fr[$i]));<br />

$ret[2]=abs($v->val(1,$this->v,$fr[$i]));<br />

$ret[3]=abs($v->val(2,$this->v,$fr[$i]));<br />

}<br />

186


}<br />

}<br />

$this->f[$a]=$ret;<br />

}<br />

Interacţiunile din interiorul unui fragment se cumulează la nivel <strong>de</strong> atom pentru toate fragmentele ce<br />

rezultă prin <strong>de</strong>localizarea atomului consi<strong>de</strong>rat din structura moleculară; suprapunerile la acest nivel<br />

sunt realizate <strong>de</strong> funcţiile implementate în clasa class_<strong>de</strong>scriptor_4vertx.php; la acest nivel au loc<br />

din nou suprapuneri <strong>de</strong> acelaşi tip (dar distincte ca modalitate <strong>de</strong> calcul) ca cele <strong>de</strong> la pasul anterior,<br />

şi anume:<br />

÷ 2 tipuri <strong>de</strong> suprapuneri vectoriale folosind drept reper sistemul <strong>de</strong> coordonate <strong>de</strong> referinţă al<br />

moleculei (suprapuneri scalare pe proiecţiile axiale ale sistemului <strong>de</strong> coordonate folosit);<br />

÷ 2 tipuri <strong>de</strong> suprapuneri vectoriale folosind drept reper un sistem <strong>de</strong> coordonate local al atomului<br />

- calculat ca centru <strong>de</strong> proprietate - (suprapuneri scalare pe proiecţiile axiale ale sistemului <strong>de</strong><br />

coordonate folosit);<br />

÷ 2 tipuri <strong>de</strong> suprapuneri scalare (ignorând orientarea vectorială şi folosind valoarea absolută) -<br />

interacţiune <strong>de</strong> tip potenţial;<br />

÷ 2 tipuri <strong>de</strong> selecţii ale valorilor maxime <strong>de</strong> interacţiune dintre interacţiunile existente în<br />

fragmentele atomului;<br />

÷ 2 tipuri <strong>de</strong> selecţii ale valorilor minime <strong>de</strong> interacţiune dintre interacţiunile existente în<br />

fragmentele atomului;<br />

class <strong>de</strong>scriptor_vertex{<br />

function __construct($e,$vx,&$fr,&$s,&$v){<br />

$this->v=$vx;<br />

$this->n=count($fr);<br />

$local = new <strong>de</strong>scriptor_fragment($vx);<br />

$this->m=$local->n;<br />

for($i=0;$in;$i++){<br />

$local->calculate($e,$fr[$i],$s,$v);<br />

$this->d[$i]=$local->f;<br />

}<br />

}<br />

function calculate(){<br />

$this->superposing_max_0(0);//A<br />

$this->superposing_max_1(1);//a<br />

$this->superposing_min_0(2);//I<br />

$this->superposing_min_1(3);//i<br />

$this->superposing_field(4);//F<br />

$this->superposing_poten(5);//P<br />

$this->superposing_centr(6);//C<br />

unset($this->d);<br />

$this->n=7;<br />

}<br />

function superposing_max_0($r){//A<br />

$ret=$this->d[0];<br />

for($i=1;$in;$i++){<br />

for($j=0;$jm;$j++){//fFcCpP<br />

if($ret[$j][0]d[$i][$j][0]) $ret[$j]=$this->d[$i][$j];<br />

}<br />

}<br />

$this->f[$r]=$ret;<br />

}<br />

function superposing_min_0($r){//a<br />

$ret=$this->d[0];<br />

for($i=1;$in;$i++){<br />

for($j=0;$jm;$j++){//fFcCpP<br />

if($ret[$j][0]>$this->d[$i][$j][0]) $ret[$j]=$this->d[$i][$j];<br />

}<br />

}<br />

$this->f[$r]=$ret;<br />

}<br />

function superposing_max_1($r){//I<br />

$ret=$this->d[0];<br />

$retv=pow($ret[1],2)+pow($ret[2],2)+pow($ret[3],2);<br />

for($i=1;$in;$i++){<br />

for($j=0;$jm;$j++){//fFcCpP<br />

$dv=pow($this->d[$i][$j][1],2)+pow($this->d[$i][$j][2],2)+pow($this->d[$i][$j][3],2);<br />

if($retvd[$i][$j];<br />

$retv=$dv;<br />

}<br />

187


}<br />

}<br />

$this->f[$r]=$ret;<br />

}<br />

function superposing_min_1($r){//i<br />

$ret=$this->d[0];<br />

$retv=pow($ret[1],2)+pow($ret[2],2)+pow($ret[3],2);<br />

for($i=1;$in;$i++){<br />

for($j=0;$jm;$j++){//fFcCpP<br />

$dv=pow($this->d[$i][$j][1],2)+pow($this->d[$i][$j][2],2)+pow($this->d[$i][$j][3],2);<br />

if($retv>$dv){<br />

$ret[$j]=$this->d[$i][$j];<br />

$retv=$dv;<br />

}<br />

}<br />

}<br />

$this->f[$r]=$ret;<br />

}<br />

function superposing_field($r){//F<br />

for($j=0;$jm;$j++){<br />

$ret[$j]=array(0.0,0.0,0.0,0.0);<br />

}<br />

for($i=0;$in;$i++){<br />

for($j=0;$jm;$j++){//fFcCpP<br />

$ret[$j][1]+=$this->d[$i][$j][0]*$this->d[$i][$j][1];<br />

$ret[$j][2]+=$this->d[$i][$j][0]*$this->d[$i][$j][2];<br />

$ret[$j][3]+=$this->d[$i][$j][0]*$this->d[$i][$j][3];<br />

}<br />

}<br />

for($j=0;$jm;$j++){<br />

$ret[$j][0]=pow(pow($ret[$j][1],2)+pow($ret[$j][2],2)+pow($ret[$j][3],2),0.5);<br />

}<br />

$this->f[$r]=$ret;<br />

}<br />

function superposing_poten($r){//P<br />

for($j=0;$jm;$j++){<br />

$ret[$j]=array(0.0,0.0,0.0,0.0);<br />

}<br />

for($i=0;$in;$i++){<br />

for($j=0;$jm;$j++){//fFcCpP<br />

for($k=0;$kd[$i][$j][$k];<br />

}<br />

}<br />

}<br />

$this->f[$r]=$ret;<br />

}<br />

function superposing_centr($r){//C<br />

for($j=0;$jm;$j++){<br />

$ret[$j]=array(0.0,0.0,0.0,0.0);<br />

}<br />

for($i=0;$in;$i++){<br />

for($j=0;$jm;$j++){//fFcCpP<br />

$ret[$j][0]+=$this->d[$i][$j][0];<br />

for($k=1;$kd[$i][$j][$k]);<br />

}<br />

}<br />

}<br />

$this->f[$r]=$ret;<br />

}<br />

}<br />

Interacţiunile din interiorul unei molecule se cumulează <strong>de</strong> la nivel <strong>de</strong> atom; suprapunerile la acest<br />

nivel sunt realizate <strong>de</strong> funcţiile implementate în clasa class_<strong>de</strong>scriptor_5molec.php; la acest nivel<br />

au loc din nou suprapuneri <strong>de</strong> acelaşi tip (dar distincte ca modalitate <strong>de</strong> calcul) ca cele <strong>de</strong> la ultimii<br />

doi paşi realizaţi anterior, şi anume:<br />

÷ 2 tipuri <strong>de</strong> suprapuneri vectoriale folosind drept reper sistemul <strong>de</strong> coordonate <strong>de</strong> referinţă al<br />

moleculei (suprapuneri scalare pe proiecţiile axiale ale sistemului <strong>de</strong> coordonate folosit);<br />

÷ 2 tipuri <strong>de</strong> suprapuneri vectoriale folosind drept reper un sistem <strong>de</strong> coordonate local al<br />

moleculei - calculat ca centru <strong>de</strong> proprietate - (suprapuneri scalare pe proiecţiile axiale ale<br />

sistemului <strong>de</strong> coordonate folosit);<br />

÷ 2 tipuri <strong>de</strong> suprapuneri scalare (ignorând orientarea vectorială şi folosind valoarea absolută) -<br />

interacţiune <strong>de</strong> tip potenţial;<br />

188


÷ 2 tipuri <strong>de</strong> selecţii ale valorilor maxime <strong>de</strong> interacţiune dintre interacţiunile existente în atomii<br />

moleculei;<br />

÷ 2 tipuri <strong>de</strong> selecţii ale valorilor minime <strong>de</strong> interacţiune dintre interacţiunile existente în atomii<br />

moleculei;<br />

class <strong>de</strong>scriptor_molecule{<br />

function __construct($e,&$fr,&$s,&$v){<br />

$this->n=count($fr);<br />

for($i=0;$in;$i++){<br />

$local = new <strong>de</strong>scriptor_vertex($e,$i,$fr[$i],$s,$v);<br />

$local->calculate();<br />

$this->m=$local->n;<br />

$this->p=$local->m;<br />

$this->d[$i]=$local->f;<br />

}<br />

}<br />

function calculate(){<br />

$this->superposing_max_0(0);//A<br />

$this->superposing_max_1(1);//a<br />

$this->superposing_min_0(2);//I<br />

$this->superposing_min_1(3);//i<br />

$this->superposing_field(4);//F<br />

$this->superposing_poten(5);//P<br />

$this->superposing_centr(6);//C<br />

unset($this->d);<br />

}<br />

function sprint(&$contor,&$mol/*$fp*/){//$s $md="AaIiFPC" $vd="AaIiFPC" $fd="fFcCpPaAiI"<br />

$m=count($this->f);<br />

$n=count($this->f[0]);<br />

$p=count($this->f[0][0]);<br />

for($i=0;$iformats($md[$i])."\r\n");//$s.$sd[$i]."I"<br />

if($md[$i]){<br />

$contor++;<br />

$q=mysql_query("UPDATE `".setd."_mdfv` SET `".$mol."` = '".$this->formats(1.00/$md[$i])."' WHERE `id`='".$contor."'");<br />

$contor++;<br />

$q=mysql_query("UPDATE `".setd."_mdfv` SET `".$mol."` = '".$this->formats(log($md[$i]))."' WHERE `id`='".$contor."'");<br />

//fputs($fp,$this->formats(1.00/$md[$i])."\r\n");//$s.$sd[$i]."R"<br />

//fputs($fp,$this->formats(log($md[$i]))."\r\n");//$s.$sd[$i]."L"<br />

}else{<br />

$contor++;<br />

$q=mysql_query("UPDATE `".setd."_mdfv` SET `".$mol."` = 'INF' WHERE `id`='".$contor."'");<br />

$contor++;<br />

$q=mysql_query("UPDATE `".setd."_mdfv` SET `".$mol."` = 'INF' WHERE `id`='".$contor."'");<br />

//fputs($fp,"INF\r\n");//$s.$sd[$i]."R"<br />

//fputs($fp,"INF\r\n");//$s.$sd[$i]."L"<br />

}<br />

//////////////////////////<br />

}<br />

}<br />

function formats($value){<br />

$prec=4;<br />

if(!is_finite($value))<br />

return (float)"INF";<br />

$nr_cifre=round(log(abs($value),10));<br />

$value*=pow(10,-$nr_cifre);<br />

$value=sprintf("%.".$prec."f",$value);<br />

$value*=pow(10,$nr_cifre);<br />

return $value;<br />

}<br />

function superposing_max_0($r){//A<br />

$ret=$this->d[0];<br />

189


for($i=1;$in;$i++){//vertices<br />

for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />

for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />

if($ret[$j][$k][0]d[$i][$j][$k][0])<br />

$ret[$j][$k]=$this->d[$i][$j][$k];<br />

}<br />

}<br />

}<br />

$this->f[$r]=$ret;<br />

}<br />

function superposing_min_0($r){//a<br />

$ret=$this->d[0];<br />

for($i=1;$in;$i++){//vertices<br />

for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />

for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />

if($ret[$j][$k][0]>$this->d[$i][$j][$k][0])<br />

$ret[$j][$k]=$this->d[$i][$j][$k];<br />

}<br />

}<br />

}<br />

$this->f[$r]=$ret;<br />

}<br />

function superposing_max_1($r){//I<br />

$ret=$this->d[0];<br />

$retv=pow($ret[0][0][1],2)+pow($ret[0][0][2],2)+pow($ret[0][0][3],2);<br />

for($i=1;$in;$i++){//vertices<br />

for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />

for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />

$dv=pow($this->d[$i][$j][$k][1],2)+pow($this->d[$i][$j][$k][2],2)+pow($this->d[$i][$j][$k][3],2);<br />

if($retvd[$i][$j][$k];<br />

$retv=$dv;<br />

}<br />

}<br />

}<br />

}<br />

$this->f[$r]=$ret;<br />

}<br />

function superposing_min_1($r){//i<br />

$ret=$this->d[0];<br />

$retv=pow($ret[0][0][1],2)+pow($ret[0][0][2],2)+pow($ret[0][0][3],2);<br />

for($i=1;$in;$i++){//vertices<br />

for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />

for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />

$dv=pow($this->d[$i][$j][$k][1],2)+pow($this->d[$i][$j][$k][2],2)+pow($this->d[$i][$j][$k][3],2);<br />

if($retv>$dv){<br />

$ret[$j][$k]=$this->d[$i][$j][$k];<br />

$retv=$dv;<br />

}<br />

}<br />

}<br />

}<br />

$this->f[$r]=$ret;<br />

}<br />

function superposing_field($r){//F<br />

for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />

for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />

$ret[$j][$k]=array(0.0,0.0,0.0,0.0);<br />

}<br />

}<br />

for($i=0;$in;$i++){//vertices<br />

for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />

for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />

$ret[$j][$k][1]+=$this->d[$i][$j][$k][0]*$this->d[$i][$j][$k][1];<br />

$ret[$j][$k][2]+=$this->d[$i][$j][$k][0]*$this->d[$i][$j][$k][2];<br />

$ret[$j][$k][3]+=$this->d[$i][$j][$k][0]*$this->d[$i][$j][$k][3];<br />

}<br />

}<br />

}<br />

for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />

for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />

$ret[$j][$k][0]=pow(pow($ret[$j][$k][1],2)+pow($ret[$j][$k][2],2)+pow($ret[$j][$k][3],2),0.5);<br />

}<br />

}<br />

$this->f[$r]=$ret;<br />

}<br />

function superposing_poten($r){//P<br />

for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />

for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />

190


}<br />

$ret[$j][$k]=array(0.0,0.0,0.0,0.0);<br />

}<br />

for($i=0;$in;$i++){//vertices<br />

for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />

for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />

for($l=0;$ld[$i][$j][$k][$l];<br />

}<br />

}<br />

}<br />

}<br />

$this->f[$r]=$ret;<br />

}<br />

function superposing_centr($r){//C<br />

for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />

for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />

$ret[$j][$k]=array(0.0,0.0,0.0,0.0);<br />

}<br />

}<br />

for($i=0;$in;$i++){//vertices<br />

for($j=0;$jm;$j++){//vertex_<strong>de</strong>scriptors<br />

for($k=0;$kp;$k++){//fragment_<strong>de</strong>scriptors<br />

$ret[$j][$k][0]+=$this->d[$i][$j][$k][0];<br />

for($l=1;$ld[$i][$j][$k][$l]);<br />

}<br />

}<br />

}<br />

}<br />

$this->f[$r]=$ret;<br />

}<br />

}<br />

În final, trei tipuri <strong>de</strong> linearizări reprezintă alternative <strong>de</strong> calcul, care însă datorită simplităţii<br />

(directă, reciprocă, logaritm) nu au mai necesitat <strong>de</strong>finirea şi implementarea unei clase în acest sens,<br />

fiind calculate după construcţia efectivă a fiecărui <strong>de</strong>scriptor molecular pe calea <strong>de</strong>scrisă mai sus şi<br />

fiind apoi stocate în baza <strong>de</strong> date (tabela <strong>de</strong> set cu terminaţia _mdfv).<br />

O serie <strong>de</strong> 8 aplicaţii procesează informaţia moleculară şi materializează familia <strong>de</strong> <strong>de</strong>scriptori<br />

pentru un set <strong>de</strong> molecule; aplicaţiile realizate sunt <strong>de</strong>scrise în continuare.<br />

0_mdfv_set_<strong>de</strong>f.php - iniţializează variabilele <strong>de</strong> mediu pentru realizarea conexiunii la baza <strong>de</strong> date<br />

şi iniţializează variabila ce <strong>de</strong>fineşte setul supus investigaţiei.<br />

<strong>de</strong>fine("host","172.27.211.5");<br />

<strong>de</strong>fine("user","XXXX");<br />

<strong>de</strong>fine("pass","YYYY");<br />

<strong>de</strong>fine("mdfv","MDFV");<br />

<strong>de</strong>fine("setd","taxoids");<br />

$c=@mysql_connect(host,user,pass);<br />

if($c===FALSE){<br />

echo("Host, User, or Pass Wrong and/or Not avaliable.\r\n");<br />

echo("Application cannot continue.\r\n");<br />

return(FALSE);<br />

}<br />

$q=@mysql_query("USE `".mdfv."`");<br />

if($q===FALSE){<br />

echo("Database ".mdfv." inexistent or not granted.\r\n");<br />

echo("Application cannot continue.\r\n");<br />

return(FALSE);<br />

}<br />

return FALSE;<br />

1_mdfv_set_init.php - materializează şablonul (macheta) structurii tabelelor <strong>de</strong> date (_data), pentru<br />

<strong>de</strong>scriptorii <strong>de</strong> structură (_mdfv), pentru activităţile experimentale observate (_prop) şi pentru<br />

relaţiile structură-activitate ce urmează a fi obţinute; alocă spaţiu în baza <strong>de</strong> date pentru <strong>de</strong>scriptorii<br />

<strong>de</strong> structură ce urmează a fi calculaţi.<br />

$test=@inclu<strong>de</strong>("0_mdfv_set_<strong>de</strong>f.php");<br />

if($test===FALSE){<br />

echo("Missing important <strong>de</strong>finitions for MDFV (0_mdfv_set_<strong>de</strong>f.php).\r\n");<br />

echo("Application cannot continue.\r\n");<br />

return(FALSE);<br />

}<br />

if(<strong>de</strong>fined("setd")===FALSE){<br />

echo("Constant 'setd' un<strong>de</strong>fined. Application cannot continue.\r\n");<br />

return(FALSE);<br />

191


}<br />

$query="SHOW TABLES FROM `".mdfv."` LIKE '_mdfv'";<br />

$q=@mysql_query($query);<br />

if(!$q){<br />

echo($query." :ERROR!\r\n");<br />

return(FALSE);<br />

}<br />

$n=mysql_num_rows($q);<br />

mysql_free_result($q);<br />

if($n==0){<br />

echo("Table `_mdfv` must be created!\r\n");<br />

$query="CREATE TABLE `_mdfv` (`id` BIGINT NOT NULL AUTO_INCREMENT, `name` VARCHAR(8) NOT NULL, PRIMARY<br />

KEY(`id`))";<br />

$q=@mysql_query($query);<br />

if(!$q){<br />

echo($query." :ERROR!\r\n");<br />

return(FALSE);<br />

}<br />

$test=@inclu<strong>de</strong>("class_<strong>de</strong>scriptor_0names.php");<br />

if($test===FALSE){<br />

echo("Missing important <strong>de</strong>finitions for MDFV (class_<strong>de</strong>scriptor_0names.php).\r\n");<br />

echo("Application cannot continue.\r\n");<br />

return(FALSE);<br />

}<br />

$f = new <strong>de</strong>scriptor_names();<br />

$f->sprint();<br />

unset($f);<br />

//return(FALSE);<br />

}<br />

$test=@dir(setd);<br />

if($test===FALSE){<br />

echo("Directory '".setd."' does not exists. Please check manualy.\r\n");<br />

echo("Application cannot continue.\r\n");<br />

return(FALSE);<br />

}<br />

$hin_files=array();<br />

while(TRUE){<br />

$entry = $test->read();<br />

if($entry === FALSE)break;<br />

$hin=explo<strong>de</strong>(".hin",$entry);<br />

if(count($hin)>2){<br />

echo("Hin processing error. Application cannot continue.\r\n");<br />

return(FALSE);<br />

}elseif(count($hin)close();<br />

if(count($hin_files)0){<br />

echo("Tables `".setd."_%` already exist into `".mdfv."` database. Drop them and try again!\r\n");<br />

return(FALSE);<br />

}<br />

$query="CREATE TABLE `".setd."_data` (`id` INT NOT NULL AUTO_INCREMENT, `mol` VARCHAR(255) NOT NULL, `hin` LONGTEXT<br />

NOT NULL, PRIMARY KEY(`id`))";<br />

$q=@mysql_query($query);<br />

if(!$q){<br />

echo($query." :ERROR!\r\n");<br />

return(FALSE);<br />

}<br />

echo("`".setd."_data` table created.\r\n");<br />

foreach($hin_files as $k => $v){<br />

$query="INSERT INTO `".setd."_data` (`mol`,`hin`) VALUES<br />

('".addslashes($v)."','".addslashes(file_get_contents(setd."/".$v.".hin"))."')";<br />

$q=@mysql_query($query);<br />

192


if(!$q){<br />

}<br />

echo($query." :ERROR!\r\n");<br />

return(FALSE);<br />

}<br />

echo("*hin files uploa<strong>de</strong>d into `".setd."_data` table.\r\n");<br />

$query="CREATE TABLE `".setd."_prop` (`property` VARCHAR(255) NOT NULL, ";<br />

$query.="`".implo<strong>de</strong>("` DOUBLE NOT NULL DEFAULT '1e101', `",$hin_files)."` DOUBLE NOT NULL DEFAULT '1e101'";<br />

$query.=")";<br />

$q=@mysql_query($query);<br />

if(!$q){<br />

echo($query." :ERROR!\r\n");<br />

return(FALSE);<br />

}<br />

echo("`".setd."_prop` table created for further usage.\r\n");<br />

$query="CREATE TABLE `".setd."_mdfv` (`id` BIGINT NOT NULL AUTO_INCREMENT,";<br />

$query.="`".implo<strong>de</strong>("` DOUBLE NOT NULL, `",$hin_files)."` DOUBLE NOT NULL,";<br />

$query.=" PRIMARY KEY(`id`))";<br />

$q=@mysql_query($query);<br />

if(!$q){<br />

echo($query." :ERROR!\r\n");<br />

return(FALSE);<br />

}<br />

echo("`".setd."_mdfv` table created.\r\n");<br />

$query="INSERT INTO `".setd."_mdfv` (`id`) SELECT `id` FROM `_mdfv`";<br />

$q=@mysql_query($query);<br />

if(!$q){<br />

echo($query." :ERROR!\r\n");<br />

return(FALSE);<br />

}<br />

echo("space allocated for mdfv <strong>de</strong>scriptors into `".setd."_data` table.\r\n");<br />

2_mdfv_set_calc.php - foloseşte o parte din clasele <strong>de</strong>finite (<strong>de</strong> la 1 la 5) pentru a calcula familia <strong>de</strong><br />

<strong>de</strong>scriptori pentru moleculele setului supus investigaţiei; stochează rezultatele în baza <strong>de</strong> date în<br />

tabela <strong>de</strong> set cu terminaţia _mdfv.<br />

require_once("class_jobs.php");<br />

require_once("class_<strong>de</strong>scriptor_1atoms.php");<br />

require_once("class_<strong>de</strong>scriptor_2pairs.php");<br />

require_once("class_<strong>de</strong>scriptor_3fragm.php");<br />

require_once("class_<strong>de</strong>scriptor_4vertx.php");<br />

require_once("class_<strong>de</strong>scriptor_5molec.php");<br />

$test=@inclu<strong>de</strong>("0_mdfv_set_<strong>de</strong>f.php");<br />

if($test===FALSE){<br />

echo("Missing important <strong>de</strong>finitions for MDFV (0_mdfv_set_<strong>de</strong>f.php).\r\n");<br />

echo("Application cannot continue.\r\n");<br />

return(FALSE);<br />

}<br />

if(<strong>de</strong>fined("setd")===FALSE){<br />

echo("Constant 'setd' un<strong>de</strong>fined. Application cannot continue.\r\n");<br />

return(FALSE);<br />

}<br />

$job = new job_list(array()/*array("033_7282","034_11507","037_7892","038_6403","046_8900","047_8058","049_7296","051_8003")*/);<br />

$a = new ato_type();<br />

for($i=0;$in;$i++){<br />

$m = new hin_file($job->m[$i]);<br />

$m->create_structure();<br />

$m->remove_atoms("H");<br />

$m->create_topology();<br />

$m->create_chemistry($a);<br />

$m->create_matrix_adjacency();<br />

$m->create_matrix_distance();<br />

unset($m->geometry);<br />

$m->create_fragments();<br />

unset($m->topology);<br />

unset($m->adjcency);<br />

//echo($m->display_all_fragments());<br />

$d = new distance_object($m->distance);<br />

$v[0] = new versor_object_t($m->distance);<br />

$v[1] = new versor_object_g($m->distance);<br />

unset($m->distance);<br />

$p = new property_object($m->property);<br />

unset($m->property);<br />

echo($i."\t[".memory_get_usage()."]\t".$job->m[$i]."\r\n");<br />

compute_molecule($m->n,$m->fragment,$p,$d,$v,$job->m[$i]);<br />

unset($m->fragment);<br />

unset($v);<br />

unset($d);<br />

unset($p);<br />

193


unset($m);<br />

}<br />

unset($a);<br />

unset($job);<br />

die();<br />

function compute_molecule($n,&$fr,&$p,&$d,&$v,&$mol){<br />

//$dd="TG"; $pp="CHMEQLA"; $ee="JjOoPpQqRrKkLlMmNnWwXxYyZzSsTtUuVvFfGgHhIiAaBbCcDd01234567";<br />

$contor=0;<br />

//$fp=@fopen($fn,"w+");<br />

//if(!$fp)die("die from fopen: open of ".$fn." fails.\r\n");<br />

for($id=0;$idn;$id++){<br />

for($ip=0;$ipn;$ip++){<br />

create_pd_<strong>de</strong>scriptor($n,$ip,$id,$p,$d,$e);<br />

for($ie=0;$iecalculate();<br />

$md->sprint($contor,$mol/*$fp*/);//$dd[$id].$pp[$ip].$ee[$ie]<br />

unset($md);<br />

}<br />

unset($e);<br />

}<br />

}<br />

//fclose($fp);<br />

}<br />

3_mdfv_prop_<strong>de</strong>f.php - iniţializează variabilele <strong>de</strong> mediu pentru o activitate supusă analizei.<br />

$test=@inclu<strong>de</strong>("0_mdfv_set_<strong>de</strong>f.php");<br />

if($test===FALSE){<br />

echo("Missing important <strong>de</strong>finitions for MDFV (0_mdfv_set_<strong>de</strong>f.php).\r\n");<br />

echo("Application cannot continue.\r\n");<br />

return(FALSE);<br />

}<br />

if(<strong>de</strong>fined("setd")===FALSE){<br />

echo("Constant 'setd' un<strong>de</strong>fined. Application cannot continue.\r\n");<br />

return(FALSE);<br />

}<br />

<strong>de</strong>fine("propd","logIC50");<br />

<strong>de</strong>fine("nact",1e100);<br />

<strong>de</strong>fine("dcnt",2387280);<br />

<strong>de</strong>fine("clas",3);<br />

<strong>de</strong>fine("bige",1e+14);<br />

<strong>de</strong>fine("lowe",1e-14);<br />

<strong>de</strong>fine("uppe",0.90);<br />

<strong>de</strong>fine("boto",0.10);<br />

//return FALSE;<br />

4_mdfv_prop_upload.php - încarcă în baza <strong>de</strong> date în tabela cu terminaţia _prop dintr-un fişier local<br />

valorile activităţii pentru moleculele setului investigat.<br />

$test=@inclu<strong>de</strong>("3_mdfv_prop_<strong>de</strong>f.php");<br />

if($test===FALSE){<br />

echo("Missing important <strong>de</strong>finitions for MDFV (3_mdfv_prop_<strong>de</strong>f.php).\r\n");<br />

echo("Application cannot continue.\r\n");<br />

return(FALSE);<br />

}<br />

if(<strong>de</strong>fined("propd")===FALSE){<br />

echo("Constant 'setd' un<strong>de</strong>fined. Application cannot continue.\r\n");<br />

return(FALSE);<br />

}<br />

$q=@mysql_query("SELECT * FROM `".setd."_prop` WHERE `property` = '".propd."'");<br />

if(!$q){<br />

echo(propd." property SELECT in `".setd."_prop` table ERROR!\r\n");<br />

return(FALSE);<br />

}<br />

$n=mysql_num_rows($q);<br />

if($n>0){<br />

echo(propd." property already found in `".setd."_prop` table. :ERROR!\r\n");<br />

return(FALSE);<br />

}<br />

mysql_free_result($q);<br />

$a=@file_get_contents(setd."/_".propd.".txt");<br />

if($a===FALSE){<br />

echo(setd."/_".propd.".txt file NOT FOUND. Application cannot continue.\r\n");<br />

return(FALSE);<br />

}<br />

$b=explo<strong>de</strong>("\r\n",$a);<br />

if(!(count(explo<strong>de</strong>("\t",$b[0]))==2)){<br />

echo(setd."/_".propd.".txt file DID NOT CONTAINS TWO COLUMNS. Application cannot continue.\r\n");<br />

return(FALSE);<br />

194


}<br />

unset($a);<br />

$query="INSERT INTO `".setd."_prop` (`property`";<br />

for($i=0;$i


$y_values=array();<br />

foreach($r as $k => $v){<br />

if($vbrowse_names();<br />

die("normal shutdown.\r\n");<br />

class <strong>de</strong>scriptor_filter{<br />

function __construct(&$m_list,&$y_list){<br />

$this->m=count($m_list);<br />

$this->ml=$m_list;<br />

$this->y=$y_list;<br />

$this->x=array();<br />

$this->my1=$this->m1($this->y);<br />

$this->dy2=$this->m2($this->y,$this->y)-$this->my1*$this->my1;<br />

$this->mx1=0.0;<br />

$this->dx2=0.0;<br />

$this->r2=0.0;<br />

$this->qs="SELECT `".implo<strong>de</strong>("`, `",$m_list)."` FROM `".setd."_mdfv` WHERE `id` = ";<br />

$this->qi="INSERT INTO `".setd."__".propd."` VALUES ('',";<br />

$this->qk="SELECT `".implo<strong>de</strong>("`, `",$m_list)."` FROM `".setd."__".propd."` WHERE `kc` = ";<br />

$this->qn="SELECT `name` FROM `_mdfv` WHERE `id` = ";<br />

$this->l=array();<br />

$this->n=0;<br />

}<br />

function coef_r2(){<br />

$mxy=$this->m2($this->x,$this->y);<br />

$this->r2=pow($mxy-$this->mx1*$this->my1,2)/($this->dx2*$this->dy2);<br />

}<br />

function coeg_r2(&$y){<br />

$m1y=$this->m1($y);<br />

$m2y=$m1y*$m1y;<br />

$my2=$this->m2($y,$y);<br />

$dy2=$my2-$m2y;<br />

if(!$dy2)return(-1.0);<br />

$mxy=$this->m2($y,$this->x);<br />

return pow($mxy-$this->mx1*$m1y,2)/($this->dx2*$dy2);<br />

}<br />

function get_mdfv(&$id){<br />

$q=mysql_query($this->qs."'".$id."'");<br />

$this->x=mysql_fetch_row($q);<br />

mysql_free_result($q);<br />

}<br />

function table_insert($i,$k){<br />

$q=mysql_query($this->qn."'".$i."'");<br />

if(!$q)die("SELECT NAME ERROR!");<br />

$n=mysql_fetch_row($q);<br />

mysql_free_result($q);<br />

$query=$this->qi."'".$n[0]."','".$k."','".$this->r2."','".implo<strong>de</strong>("', '",$this->x)."')";<br />

$q=mysql_query($query);<br />

if(!$q) die($query." :insert error\r\n");<br />

}<br />

function table_select($k){<br />

$q=mysql_query($this->qk."'".$k."'");<br />

if(!$q) die("select error\r\n");<br />

return($q);<br />

}<br />

function in<strong>de</strong>x(){<br />

$val=$this->r2*pow(10,clas);<br />

$val=trim(sprintf("%.0f",$val));<br />

return($val);<br />

}<br />

function one_row(){<br />

196


$ok=$this->check_finite();if(!$ok)return(FALSE);<br />

$ok=$this->check_similarity();if(!$ok)return(FALSE);<br />

$ok=$this->check_too_big();if($ok)return(FALSE);<br />

$ok=$this->check_too_low();if($ok)return(FALSE);<br />

$this->mx1=$this->m1($this->x);<br />

$m2x=$this->mx1*$this->mx1;<br />

$mx2=$this->m2($this->x,$this->x);<br />

$this->dx2=$mx2-$m2x;<br />

if(!$this->dx2)return(FALSE);<br />

return(TRUE);<br />

}<br />

function check_similarity(){<br />

$is_same=1;<br />

for($i=1;$im;$i++){<br />

if($this->x[$i]==$this->x[0]){<br />

$is_same++;<br />

}else break;<br />

}<br />

return ($is_same$this->m);<br />

}<br />

function check_finite(){<br />

$is_finite=TRUE;<br />

for($i=0;$im;$i++){<br />

if(strtoupper($this->x[$i])=="INF"){<br />

$is_finite=FALSE;<br />

break;<br />

}<br />

$this->x[$i]=(float)$this->x[$i];<br />

}<br />

return $is_finite;<br />

}<br />

function check_too_big(){<br />

$is_big=FALSE;<br />

for($i=0;$im;$i++){<br />

if(abs($this->x[$i])>bige){<br />

$is_big=TRUE;<br />

break;<br />

}<br />

}<br />

return $is_big;<br />

}<br />

function check_too_low(){<br />

$is_low=FALSE;<br />

for($i=0;$im;$i++){<br />

if($this->x[$i])<br />

if(abs($this->x[$i])m;<br />

}<br />

function m2(&$v,&$u){<br />

$rez=0;<br />

for($i=0;$im;$i++)<br />

$rez+=$v[$i]*$u[$i];<br />

return $rez/$this->m;<br />

}<br />

function browse_names(){<br />

$maxr=0.0;<br />

$number_of=0;<br />

for($i=1;$il))." ".sprintf("%5d",$number_of)." [".memory_get_usage()."] ".sprintf("%.4f",$maxr)."<br />

".$q."\r\n");<br />

$this->get_mdfv($i);<br />

$finite=$this->one_row();<br />

if(!$finite)continue;<br />

$this->coef_r2();<br />

if($this->r2r2;<br />

$k=$this->in<strong>de</strong>x();<br />

if(array_key_exists($k,$this->l)===TRUE){//<strong>de</strong> imbunatatit cu corelatii incrucisate<br />

197


}<br />

}else{<br />

}<br />

$q=$this->table_select($k);<br />

$is_already=FALSE;<br />

for(;$r=mysql_fetch_row($q);){<br />

$new_r2=$this->coeg_r2($r);<br />

if($new_r2uppe){//0.90<br />

$is_already=TRUE;<br />

break;<br />

}<br />

}<br />

mysql_free_result($q);<br />

if(!$is_already){<br />

$this->table_insert($i,$k);<br />

$number_of++;<br />

}<br />

$this->table_insert($i,$k);<br />

$this->l[$k]=$i;<br />

}<br />

$this->n=count($this->l);<br />

echo("classes: ".$this->n."\r\n");<br />

echo("members: ".$number_of."\r\n");<br />

echo($maxr."\r\n");<br />

}<br />

6_mdfv_prop_kusk.php - calculează statistica Jarque-Bera (valoarea Chi Square pentru boltire şi<br />

asimetrie simultane) a activităţii experimentale observate şi a fiecărui <strong>de</strong>scriptor calificat <strong>de</strong><br />

impunerile anterioare (5_mdfv_prop_init.php); calculează coeficientul <strong>de</strong> <strong>de</strong>terminare dintre<br />

activitate şi <strong>de</strong>scriptor; <strong>de</strong>scalifică (şterge din tabelă) <strong>de</strong>scriptorii care simultan prezintă o <strong>de</strong>părtare<br />

<strong>de</strong> la normalitate mai mare <strong>de</strong>cât cea existentă în activitatea experimentală observată şi au o<br />

<strong>de</strong>terminare mai mică <strong>de</strong>cât o valoare <strong>de</strong> prag (<strong>de</strong>finită în 3_mdfv_prop_<strong>de</strong>f.php).<br />

require_once("/usr/home/lori/MDFV/Probability_Distributions_Library/ChiSqrDistribution.php");<br />

$test=@inclu<strong>de</strong>("3_mdfv_prop_<strong>de</strong>f.php");<br />

if($test===FALSE)<br />

{echo("Missing important <strong>de</strong>finitions for MDFV (3_mdfv_prop_<strong>de</strong>f.php).\r\nApplication cannot continue.\r\n");return(FALSE);}<br />

if(<strong>de</strong>fined("propd")===FALSE){echo("Constant 'setd' un<strong>de</strong>fined. Application cannot continue.\r\n");return(FALSE);}<br />

$q=@mysql_query("SELECT * FROM `".setd."_prop` WHERE `property` = '".propd."'");<br />

if(!$q){echo(propd." property SELECT in `".setd."_prop` table ERROR!\r\n");return(FALSE);}<br />

$n=mysql_num_rows($q);<br />

if(($n1)){echo(propd." property not properly <strong>de</strong>fined in `".setd."_prop` table. :ERROR!\r\n");return(FALSE);}<br />

$r=mysql_fetch_array($q,MYSQL_ASSOC);<br />

array_shift($r);<br />

$mols=array();$Y=array();foreach($r as $k => $v){if($vCDF($JB);<br />

$Y_JB=$JB;<br />

$Y_p=$pchi22;<br />

//echo("PTrueX2JB2/2=".(1.0-$chi22->CDF($JB/2))."\r\n");<br />

//echo("Property `".propd."` found into database (`".setd."_prop` table).\r\n");<br />

//echo("Var\tKurt\tSkew\tJBera\tpTrue\tr2\r\n");<br />

//echo("Y\t".$Y_ku."\t".$Y_sk."\t".$JB."\t".$pchi22."\t".(1.0)."\r\n");<br />

$query="SHOW TABLES FROM `".mdfv."` LIKE '".setd."__".propd."'";<br />

$q=@mysql_query($query);if(!$q){echo($query." :ERROR!\r\n");return(FALSE);}$n=mysql_num_rows($q);mysql_free_result($q);<br />

if($n


$q=mysql_query($query_prop."'".$mdfvprop[$j]."'");<br />

if(!$q)die($query_prop."'".$mdfvprop[$j]."' :ERROR!\r\n");<br />

$X=mysql_fetch_row($q);<br />

mysql_free_result($q);<br />

$X_m=m1($X,$n_mol);<br />

$X_ku=g2_s($X_m,$X,$n_mol);<br />

$X_sk=g1_s($X_m,$X,$n_mol);<br />

$JB=$n_mol*(pow($X_sk,2)+pow($X_ku,2)/4.0)/6.0;<br />

$chi22 = new ChiSqrDistribution(2);<br />

$pchi22=1.0-$chi22->CDF($JB);<br />

$X2m=m2($X,$X,$n_mol);<br />

$X2d=$X2m-$X_m*$X_m;<br />

$mXY=m2($X,$Y,$n_mol);<br />

$r20=$mXY-$X_m*$Y_m;<br />

$r21=$r20/$X2d;<br />

$r22=$r20/$Y2d;<br />

$r2=$r21*$r22;<br />

if(($JB$Y_JB)&&($r2_reject>0))$acceptance=FALSE;<br />

if($acceptance){<br />

//echo($mdfvprop[$j]."\t".$X_ku."\t".$X_sk."\t".$JB."\t".$pchi22."\t".$r2."\r\n");<br />

$cnt_acc++;<br />

}else{<br />

$query_<strong>de</strong>let="DELETE FROM `".setd."__".propd."` WHERE `id` = '".$mdfvprop[$j]."'";<br />

$q=mysql_query($query_<strong>de</strong>let);<br />

if(!$q)die($query_<strong>de</strong>let."'".$mdfvprop[$j]."' :ERROR!\r\n");<br />

}<br />

}<br />

$q=mysql_query("OPTIMIZE TABLE `".setd."__".propd."`");<br />

if(!$q)die("OPTIMIZE TABLE `".setd."__".propd."` ERROR!\r\n");<br />

echo("Remained <strong>de</strong>scriptors: ".$cnt_acc."\r\n");<br />

die();<br />

function m1(&$v,$m){$rez=0;for($i=0;$i


$mdfvprop[]=$r[0];<br />

}<br />

$n_<strong>de</strong>sc=count($mdfvprop);<br />

mysql_free_result($q);<br />

$query_prop="SELECT `".implo<strong>de</strong>("`, `",$mol_list)."` FROM `".setd."__".propd."` WHERE `id` = ";<br />

for($j1=0;$j1


2005-RIMC; Jäntschi & Bolboacă, 2006-OCPG) au constituit filtre în colectarea informaţiei<br />

medicale <strong>de</strong> activitate terapeutică.<br />

În cadrul activităţii <strong>de</strong> colectare a informaţiei medicale o serie <strong>de</strong> aspecte cu privire la confi<strong>de</strong>nţa în<br />

observaţiile experimentale (Drugan & others, 2003-BCI1; Bolboacă & Jäntschi, 2005-CILR;<br />

Bolboacă & Jäntschi, 2007BCIO) au constituit subiect <strong>de</strong> studiu având ca rezultat elaborarea unei<br />

serii <strong>de</strong> studii în acest subiect (Bolboacă & Jäntschi, 2008-ABCI; Bolboacă & Jäntschi, 2008-OCIB;<br />

Jäntschi & Bolboacă, 2010-EPCI).<br />

S-au căutat seturi <strong>de</strong> molecule cu potentă activitate terapeutică; s-au construit mo<strong>de</strong>le pentru<br />

structurile moleculelor seturilor folosind aplicaţia comercială HyperChem; s-au colectat valorile<br />

activităţilor experimentale observate.<br />

Denumirile în limba engleză ale activităţilor terapeutice colectate sunt: LC50/EC50 & NOEC &<br />

LOEC - fertilization of sea urchin & embryological <strong>de</strong>velopment of sea urchin & germination of sea<br />

urchin & zoospore germination of green macroalgae & germling length of green macroalgae &<br />

germling cell number of green macroalgae & survival and reproductive success of polychaete &<br />

redfish larvae survival & juveniles survival of opossum shrimp (LC50 = lethal concentration to<br />

50% of the test organisms; EC50 = effective concentration to 50% of the test organisms; NOEC =<br />

no observed effect concentration; LOEC = lowest observed effect concentration), inhibition<br />

activity, mutagenicity, antiallergic activity, anti-HIV-1 potencies, antituberculotic activity, growth<br />

inhibition activity, insecticidal activity, antioxidant efficacy, inhibition activity on carbonic<br />

anhydrase I & II & IV, herbicidal activity.<br />

Seria <strong>de</strong> lucrări selectate este după cum urmează:<br />

Nr Set n Total Clear 2var R2_old Ref R2_pred R2_est v Ref<br />

1 2<br />

1 23151_ 16 289206 93362 0.985 (4, n = 13) [ ] 0.997 0.995 3 [ ]<br />

0.741 (4, n = 16)<br />

2 23158 40 324181 99125 0.8 (5) [ ] 0.951 0.945 2<br />

3 36638_ 16 335657 105319 0.967 (?)<br />

4<br />

[ ] 0.994 0.991<br />

5<br />

3 [ ]<br />

4 41521_ 8 350233 86407 0.985 (5)<br />

0.913 (3)<br />

6<br />

[ ] 0.999 0.998<br />

7<br />

2 [ ]<br />

5 IChr10_ 10 324388 103237 0.9 (2)<br />

8<br />

[ ] 0.999 0.999<br />

9<br />

2 [ ]<br />

1<br />

Vijay K. Agrawal, Ravindra Srivastavaa and Padmakar V. Khadikarb, QSAR Studies on Some<br />

Antimalarial Sulfonami<strong>de</strong>s, Bioorganic & Medicinal Chemistry, 2001, 9, p. 3287–3293.<br />

2<br />

<strong>Lorentz</strong> <strong>JÄNTSCHI</strong> and Sorana BOLBOACA, Molecular Descriptors Family on Structure<br />

Activity Relationships 5. Antimalarial Activity of 2,4-Diamino-6-Quinazoline Sulfonami<strong>de</strong><br />

Derivates, Leonardo Journal of Sciences, 2006, Issue 8, p. 77-88.<br />

3<br />

Agrawala V.K., Khadikarb P.V., QSAR Prediction of Toxicity of Nitrobenzenes, Bioorganic &<br />

Medicinal Chemistry, 2001, 9, 3035–3040.<br />

4<br />

Brasquet C., Le Cloirec P., QSAR for Organics Adsorption Onto Activated Carbon In Water:<br />

What About The Use Of Neural Networks?, Wat. Res., 1999, 33(17), p. 3603-3608.<br />

5<br />

Jäntschi L., Water Activated Carbon Organics Adsorption Structure - Property Relationships,<br />

Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, 2004, Issue 5, p. 63-73.<br />

6<br />

Hasegawa K., Arakawa M., Funatsu K., 3D-QSAR study of insecticidal neonicotinoid compounds<br />

based on 3-way partial least squares mo<strong>de</strong>l, Chemometrics and Intelligent Laboratory Systems,<br />

1999, 47, p. 33–40.<br />

7<br />

Bolboacă S., Jäntschi ., Molecular Descriptors Family on Structure Activity Relationships 2.<br />

Insecticidal Activity of Neonicotinoid Compounds, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect,<br />

2005, Issue 6, 78-85.<br />

8<br />

Jäntschi L., Muresan S., Diu<strong>de</strong>a M., Mo<strong>de</strong>ling Molecular Refraction and Chromatographic<br />

Retention by Szeged Indices, Studia Universitatis Babes-Bolyai, Chemia, 2000, XLV(1-2), p. 313-<br />

318..<br />

9<br />

. Jäntschi L., MDF - A New QSAR/QSPR Molecular Descriptors Family, Leonardo Journal of<br />

Sciences, Aca<strong>de</strong>micDirect, 2004, Issue 4, p. 67-84.<br />

201<br />

3


7 Ta395_ 15 319867 102608 0.87 (2, n = 13)<br />

10<br />

[ ] 0.977 0.961<br />

11<br />

2 [ ]<br />

8 Tox395_ 14 319827 103411 0.8 (2, n = 13) 0.957 0.934 2<br />

9 Triazines_ 30 298462 74467 58694 0.97 (3)<br />

12<br />

[ ] 0.951 0.946<br />

13<br />

1 [ ]<br />

0.975 0.971 2<br />

0.983 0.976 3<br />

14<br />

0.989 0.985 4<br />

10 23167 31 305164 95123 0.366 (1, n = 31) [ ] 0.724 0.697 1<br />

0.861 (4, n = 31) 0.862 0.842 2<br />

0.930 (3, n = 27) 0.939 0.924 3<br />

11 23159 18 301889 101257 0.388 (1, n = 18)<br />

15<br />

[ ] 0.755 0.684<br />

16<br />

1 [ ]<br />

23159e 8 302983 0.839 (3, n = 18) 0.982 0.974 2<br />

0.899 (8) 0.758 1<br />

17<br />

0.968 (8) 0.898 2<br />

12 Dipepti<strong>de</strong>s 58 293236 93310 85533 0.782 (2) [ ] 0.85 0.836 2<br />

0.879 0.867 3<br />

0.904 0.883 4<br />

0.925 0.910 5<br />

13 22583_ 57 296965 95277 84408 0.888 (5, n = 37)<br />

18<br />

[ ] 0.783 0.766<br />

19<br />

2 [ ]<br />

0.885 (5, n = 20) 0.835 0.809 3<br />

0.883 (5, n = 57) 0.9 0.884 4<br />

10 Smith, C. J. Hansch C., Morton M. J., QSAR treatment of multiple toxicities: the mutagenicity<br />

and cytotoxicity of quinolines, Mutation Research, 1997, 379, p. 167–175.<br />

11 Jäntschi L., Bolboacă S., Molecular Descriptors Family on QSAR Mo<strong>de</strong>ling of Quinoline-based<br />

Compounds Biological Activities, The 10th Electronic Computational Chemistry Conference, April<br />

2005, http://eccc.monmouth.edu<br />

12 Diu<strong>de</strong>a M, Jäntschi L., Pejov L., Topological Substituent Descriptors, Leonardo Electronic<br />

Journal of Practices and Technologies, Aca<strong>de</strong>micDirect, 2002, 1, p. 1-18.<br />

13 Ţigan S., Jäntschi L., Bolboaca S., Mo<strong>de</strong>ling Herbicidal Activity of a Substituted Triazines Class<br />

by Integration of Compounds Complex Structural Information, Proceeding of the XXIII<br />

International Biometric Conference, Montreal, Canada, July 16-21, 2006.<br />

14 Wei D., Zhang A., Wu C., Han S., Wang L., Progressive study and robustness test of QSAR<br />

mo<strong>de</strong>l based on quantum chemical parameters for predicting BCF of selected polychlorinated<br />

organic compounds (PCOCs), Chemosphere, 2001, 44, p. 1421-1428.<br />

15 Baker J. R., Mihelcic J. R., Sabljic A., Reliable QSAR for estimating KOC for persistent organic<br />

pollutants: correlation with molecular connectivity indices, Chemosphere, 2001, 45, p. 213-221.<br />

16 . Jäntschi L., Delphi Client - Server Implementation of Multiple Linear Regression Findings: a<br />

QSAR/QSPR Application, Applied Medical Informatics, Cluj-Napoca, 2004, Issue 15, p. 48-55.<br />

17 . Diu<strong>de</strong>a M., Gutman I., Jäntschi L., Molecular Topology, 2nd Edition, Nova Science, Huntington,<br />

New York, 2002, 332 p. & & Opris D., Diu<strong>de</strong>a M. V., Pepti<strong>de</strong> Property Mo<strong>de</strong>ling by Cluj Indices,<br />

SAR/QSAR Environ. Res., 2001, 12, 159-179.<br />

18 Toropova A. A., Toropova A. P., Nesterova I. V., Nabiev O. M., Comparison of QSAR mo<strong>de</strong>ls of<br />

anti-HIV-1 potencies based on labeled hydrogen filled graph and graph of atomic orbitals, Journal<br />

of Molecular Structure (Theochem), 2003, xx, p. xxx–xxx &Castro E. A., Torrens F., Toropov A.<br />

A., Nesterov I. V., Nabiev O. M., QSAR Mo<strong>de</strong>ling ANTI-HIV-1 Activities by Optimization of<br />

Correlation Weights of Local Graph Invariants, Molecular Simulation, Taylor & Francis, 2004,<br />

30(10), p. 691-696.<br />

19 Sorana BOLBOACĂ, Ştefan ŢIGAN, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Molecular Descriptors Family on<br />

Structure-Activity Relationships on anti-HIV-1 Potencies of HEPTA and TIBO Derivatives, Assa<br />

Reichert, George Mihalaş, Lăcrămioara Stoicu-Tivadar, Ştefan Schulz, Rolf Engelbrech (Eds.),<br />

Proceedings of the European Fe<strong>de</strong>ration for Medical Informatics Special Topic Conference, April<br />

6-8, 2006, Timişoara, Romania, p. 222-226. ISBN: 3-89838-072-6 (Aka), 1-58603-614-9 (IOS<br />

Press), 973-625-303-1 (Editura Politehnica).<br />

202


0.918 0.9 5<br />

14 23110_ 69 332064 83793 70915 0.898 (5, n = 44)<br />

20<br />

[ ] 0.683 0.666 1<br />

0.918 (5, n = 25) 0.871 0.859 2<br />

0.900 (5, n = 69) 0.904 0.890 3<br />

0.923 0.913 4<br />

0.936 0.928 5<br />

15 PCB_rrt 209 297938 99806<br />

21<br />

[ ] 0.984 0.984 1<br />

0.997 0.997 2<br />

16 PCB_lkow 206 297938 100828 0.873 0.870<br />

22<br />

1 [ ]<br />

0.890 0.885 2<br />

0.917 0.909 4<br />

17 PCB_rrf 209 297926 98434 0.628 0.619<br />

23<br />

1 [ ]<br />

0.693 0.682 2<br />

0.737 0.717 4<br />

18 40846_1 40 - - 70943 0.753 (6, n=40)<br />

24<br />

[ ] 0.628 0.606 1<br />

0.700 (5, n=36) 0.806 0.789 2<br />

0.909 (5, n=20)<br />

0.917 (7, n=20)<br />

0.918 0.891 4<br />

19 40846_2 40 - - 70954 0.719 (7, n=40) 0.551 0.516<br />

25<br />

1 [ ]<br />

0.876 (7, n=36) 0.785 0.756 2<br />

0.902 (6, n=20) 0.904 0.88 4<br />

20 40846_4 40 - - 70943 0.632 (4, n=40) 0.556 0.523<br />

26<br />

1 [ ]<br />

0.769 (5, n=36) 0.752 0.728 2<br />

0.760 (3, n=20)<br />

0.822 (4, n=20)<br />

0.92 0.903 4<br />

21 26449 10 298110 94843<br />

27<br />

[ ] 0.8248<br />

28<br />

0.6966 1 [ ]<br />

20 Toporov A. A., Toporova A. P., QSAR mo<strong>de</strong>ling of toxicity on optimization of correlation<br />

weights of Morgan exten<strong>de</strong>d connectivity, Journal of Molecular Structure (Theochem), 2002, 578, p.<br />

129-134.<br />

21 Eisler R., Belisle A. A., Planar PCB Hazards to Fish, Wildlife, and Invertebrates: A Synoptic<br />

Review, Biological Report 31 and Contaminant Hazard Reviews Report 31, 1996, IV, p.75,<br />

http://www.pwrc.usgs.gov/infobase/eisler/CHR_31_Planar_PCBs.pdf.<br />

22 <strong>Lorentz</strong> <strong>JÄNTSCHI</strong> and Sorana BOLBOACĂ, Molecular Descriptors Family on Structure<br />

Activity Relationships 6. Octanol-Water Partition Coefficient of Polychlorinated Biphenyls,<br />

Leonardo Electronic Journal of Practices and Technologies, Aca<strong>de</strong>micDirect, 2006, Issue 8, p. 71-<br />

86.<br />

23 Jäntschi L., QSPR on Estimating of Polychlorinated Biphenyls Relative Response Factor using<br />

Molecular Descriptors Family, Leonardo Electronic Journal of Practices and Technologies,<br />

Aca<strong>de</strong>micDirect, 2004, Issue 5, p. 67-84.<br />

24 Supuran C. T., Clare B. W., Carbonic anhydrase inhibitors – Part 57: Quantum chemical QSAR<br />

of a group of 1,3,4-thiadiazole- and 1,3,4-thiadiazoline disulfonami<strong>de</strong>s with carbonic anhydrase<br />

inhibitory properties, Eur. J. Med. Chem, 1999, 34, p. 41-50.<br />

25 <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mihaela Ligia UNGUREŞAN, Sorana-Daniela BOLBOACĂ, Integration of<br />

Complex Structural Information in Mo<strong>de</strong>ling of Inhibition Activity on Carbonic Anhydrase II of<br />

Substituted Disulfonami<strong>de</strong>s, Applied Medical Informatics, Vol. 17, No. 3, 4/2005, p. 12-21.<br />

26 L. Jäntschi, S. Bolboaca, Mo<strong>de</strong>lling the Inhibitory Activity on Carbonic Anhydrase IV of<br />

Substituted Thiadiazole- and Thiadiazoline- Disulfonami<strong>de</strong>s: Integration of Structure Information,<br />

Proceedings of the 1st European Chemistry Congress, Budapest, Hungary, August 27-31, 2006.<br />

27 Ungwitayatorn J., Pickert M., Frahm A.W., Quantitative structure-activity relationship (QSAR)<br />

study of polyhydroxyxanthones, Pharmaceutica Acta Helvetiae, 1997, 72, p. 23-29.<br />

28 Bolboacă S, Jäntschi L. Molecular Descriptors Family on Structure Activity Relationships 3.<br />

Antituberculotic Activity of some Polyhydroxyxanthones, Leonardo Journal of Sciences,<br />

Aca<strong>de</strong>micDirect, 2005, Issue 7, p. 58-64.<br />

203


0.9974 0.9948 2<br />

22 RRC_lbr 30 - 98604<br />

29<br />

86409 r = 0.955 (2, n = 30) ? [ ] 0.7153 0.6755 1<br />

0.8972 0.8745 2<br />

0.9737 0.9650 4<br />

0.9739 0.9637 4<br />

23 RRC_lkow 30 - - 86388 0.70769 0.6586<br />

30<br />

1 [ ]<br />

0.89433 0.8659 2<br />

0.97805 0.9680 4<br />

24 RRC_pka 30 - - 86373 0.68471 0.6418 1<br />

0.85106 0.8198 2<br />

0.96052 0.9490 4<br />

0.96147 0.9464 4<br />

0.96377 0.9474 4<br />

25 MR10 10 349553 107692 r2 = 0.9755 (2, n=10)<br />

31<br />

[ ] 0.9919 0.9884<br />

32<br />

1 [ ]<br />

0.99996 0.9999 2<br />

26 52344 8 r 2 = 0.78 (1, n=8)<br />

33<br />

[ ] 0.90397 0.8316<br />

34<br />

1 [ ]<br />

r 2 = 0.71 (1, n=8) 0.99946 0.9988 2<br />

r 2 = 0.81 (2, n=8) 0.99978 0.99935 2<br />

r 2 = 0.97 (4, n=8) 0.99980 0.99937 2<br />

27 52730 10 0.9664 0.9466<br />

35<br />

1 [ ]<br />

0.9983 0.9965 2<br />

28 19654 23 r 2 = 0.8865 (3, n= 23)<br />

36<br />

[ ] 0.9222 0.9049 1<br />

0.9895 0.9778 2<br />

0.9973 0.9956 4<br />

0.9978 0.9839 4<br />

29 3300_ 35 r 2 = -0.979 (5, n=35)<br />

37<br />

[ ] 0.8295 0.8111 1<br />

0.9172 0.9029 2<br />

0.9184 0.9039 2<br />

0.9655 0.9564 4<br />

29 IVANCIUC O, Artificial neural netwoeks applications. Part 4. Quantitative structure-activity<br />

relationships for the estimation of the relative toxicity of phenols for Tetrahymena, Revue<br />

Roumanian <strong>de</strong> Chinie, 1998, 43 (3), 255-260.<br />

30 <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana-Daniela BOLBOACĂ, Mihaela UNGUREŞAN, Mo<strong>de</strong>ling the<br />

Octanol-Water Partition Coefficient of Substituted Phenols by the Use of Structure Information,<br />

Proceedings of the 3rd Humboldt Conference on Computational Chemistry, Varna, Bulgaria, May<br />

25-27, 2006.<br />

31 Jäntschi L., Mureşan S., Diu<strong>de</strong>a M.V., Mo<strong>de</strong>ling molar refraction and chromatographic retention<br />

by Szeged Indices, Studia Universitatis Babeş-Bolyai, Chemia, 2000, XLV(1-2), p. 313-318<br />

32 <strong>Lorentz</strong> <strong>JÄNTSCHI</strong> and Sorana BOLBOACĂ, Molecular Descriptors Family on Structure<br />

Activity Relationships 4. Molar Refraction of Cyclic Organophosphorus Compounds, Leonardo<br />

Electronic Journal of Practices and Technologies, Aca<strong>de</strong>micDirect, 2005, Issue 7, p. 55-102.<br />

33 Shertzer GH, Tabor MW, Hogan ITD, Brown JS, Sainsbury M. Molecular mo<strong>de</strong>ling parameters<br />

predict antioxidant efficacy of 3-indolyl compounds. Arch Toxicol 1996;70:830-4.<br />

34 Sorana BOLBOACĂ, Claudia FILIP, Ştefan ŢIGAN, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Antioxidant Efficacy<br />

of 3-Indolyl Derivates by Complex Information Integration, Clujul Medical, 2006.<br />

35 Sorana Daniela BOBLOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>. Mo<strong>de</strong>ling of Structure-Toxicity Relationship<br />

of Alkyl Metal Compounds by Integration of Complex Structural Information. Terapeutics,<br />

Pharmacology and Clinical Toxicology, 2006, X(1), p. 110-114.<br />

36 Yu-xin Zhou, Lu Xu, Ya-ping Wu, Bai-li Liu, A QSAR study of the antiallergic activities of<br />

substituted benzami<strong>de</strong>s and their structures, Chemometrics and Intelligent Laboratory Systems,<br />

1999, 45, 95-100.<br />

37 Hiroshi Morita, Akira Gonda, Lan Wei, Koichi Takeya, and Hi<strong>de</strong>ji Itokawa, 3D QSAR ANALYSIS<br />

OF TAXOIDS FROM TAXUS CUSPIDATA VAR. NANA BY COMPARATIVE MOLECULAR<br />

FIELD APPROACH, Bioorganic & Medicinal Chemistry Letters, 1997, Vol. 7, No. 18, pp. 2387-<br />

2392.<br />

204


0.9665 0.9525 4<br />

30 33504 73 r = 0.9892 (1, n= 73)<br />

38<br />

[ ] 0.9912 0.9908 1<br />

r = 0.9857 (1, n= 73) 0.9982 0.9980 2<br />

r = 0.9961 (2, n= 73)<br />

r = 0.9953 (2, n= 73)<br />

r = 0.9986 (3, n= 73)<br />

r = 0.9984 (3, n= 73)<br />

r = 0.9974 (3, n= 73)<br />

Heats of atomization<br />

r = 1.0000 (4, n= 38)<br />

Heats of vaporization<br />

r = 0.9985 (4, n= 47)<br />

Heats of formation<br />

r = 0.9964 (2, n= 38)<br />

Molar volumes<br />

r = 0.9897 (2, n= 46)<br />

0.9982 0.9980 2<br />

31 31572 24 r 2 = 0.771 (1, n = 37)<br />

r<br />

39<br />

[ ]<br />

2 = 0.894 (4, n = 38)<br />

r 2 = 0.953 (4, n = 37)<br />

r 2 = 0.951 (4, n = 38)<br />

2009A4. Construirea mo<strong>de</strong>lelor Structură - Activitate folosind instrumentele specifice <strong>de</strong>zvoltate<br />

O serie <strong>de</strong> lucrări (Jäntschi, 2004-MDF; Jäntschi, 2005-MDF1; Jäntschi & others, 2005-CSII;<br />

Jäntschi & Bolboacă, 2006-OMDF; Jäntschi & Bolboacă, 2006-MDFR; Jäntschi & Diu<strong>de</strong>a, 2006-<br />

SPV; Jäntschi & Bolboacă, 2007-RMDF; Bolboacă & Jäntschi, 2007-SPBP; Jäntschi & Bolboacă,<br />

2007-MDFC; Jäntschi & Bolboacă, 2007-MDFA; Jäntschi & Bolboacă, 2007-MDFE) cumulează<br />

cunoştinţele prealabile în legătură cu instrumentele specifice <strong>de</strong>zvoltate, iar <strong>de</strong>rularea activităţii a<br />

permis obţinerea <strong>de</strong> noi rezultate (Jäntschi & Bolboacă, 2008-EMGT).<br />

Seturile supuse investigaţiei structură-activitate cu ajutorul instrumentelor <strong>de</strong>zvoltate (MDF şi<br />

MDFV) sunt interogabile online din cele două baze <strong>de</strong> date (MDF şi MDFV); adresa este<br />

următoarea:<br />

http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs/<br />

Mo<strong>de</strong>lele structură-activitate obţinute sunt disponibile online pentru acele seturi <strong>de</strong> molecule pentru<br />

care s-a realizat şi valorificat (prin publicare) obţinerea relaţiilor (semi)cantitative structurăactivitate,<br />

sQSARs.<br />

Mo<strong>de</strong>lele stocate în baza <strong>de</strong> date MDF sunt redate în tabelul <strong>de</strong> mai jos:<br />

Nr Set Mo<strong>de</strong>l r2 v m<br />

y=-62.361371746820275+<br />

lSDmwMt*6.372504386827629+<br />

1 IChr10_ iHPDEQg*0.058693170881799<br />

0.999221607 2 10<br />

y=20.460137586773501+<br />

lHMrtCt*-6.961293758269948+<br />

2 IChr10_ iBPmTEt*-969.172867908018304 0.998805743 2 10<br />

y=2.582556947454996+<br />

3 36638_<br />

lPMDVQg*0.002969357191374+<br />

IsPrVHg*-22.592449746207965<br />

0.977605386 2 16<br />

38 Andrey Toropova, Alla Toropovab, Temur Ismailovb, Danail Bonchev, 3D weighting of<br />

molecular <strong>de</strong>scriptors for QSPWQSAR by the method of i<strong>de</strong>al symmetry (MIS). 1. Application to<br />

boiling points of alkanes, Journal of Molecular Structure (Theochem) 1998, 424, pp. 237-247.<br />

39 M. H. ABRAHAM, R. KUMARSINGH, J. E. COMETTO-MUNIZ, W. S. CAIN, A Quantitative<br />

Structure-Activity Relationship (QSAR) for a Draize Eye Irritation Database, Toxicology in Vitro,<br />

1998, 12, 201-207.<br />

205


4 36638_<br />

y=2.585556625918434+<br />

lPMDVQg*0.002984666705928+<br />

IsPmVHg*-22.108669187753978<br />

y=2.577163501835581+<br />

IiMMWHt*0.853020387909027+<br />

0.976781931 2 16<br />

5 36638_ lPMDVQg*0.002947685825620<br />

y=2.745069935843683+<br />

IiMMWHt*0.964882719278833+<br />

IFMmkHg*0.002015868714906+<br />

0.981091504 2 16<br />

6 36638_ LPDMVQg*0.002704618929348<br />

y=2.568663834381964+<br />

IiMMWHt*0.857321758795370+<br />

lPMDVQg*0.002952308975991+<br />

0.992472044 3 16<br />

7 36638_ iFMdFQg*0.000000000000802<br />

y=2.572960050395093+<br />

IiMMWHt*0.862026691653915+<br />

lPMDVQg*0.002975951926473+<br />

0.994462046 3 16<br />

8 36638_ iSPMtQg*0.000359275274073<br />

y=2.573205449280688+<br />

IiMMWHt*0.862522334633554+<br />

lPMDVQg*0.002984079061001+<br />

0.994961682 3 16<br />

9 36638_ ibPMtQg*0.000060106252532<br />

y=5.085278949837590+<br />

imMrFHt*-357.296321414089600+<br />

0.995018995 3 16<br />

10 PCB_rrf_ iHDdFHg*2.156138113196185<br />

y=6.055340736461524+<br />

imMrFHt*-416.942003738513088+<br />

iHDdFHg*2.313956389789302+<br />

iMMMjQg*1.829475297508006+<br />

0.692921683 2 209<br />

11 PCB_rrf_ iAMrVQg*-0.002506945942322<br />

y=16.624223709106445+<br />

lfDMWHt*-0.216979935765266+<br />

0.736793462 4 209<br />

12 23159e_ IbmrTEt*-0.683317601680756<br />

y=18.090740203857424+<br />

lfDMWHt*-0.217230200767517+<br />

0.98164165 2 14<br />

13 23159e_ IbmrtEt*-0.770600378513336<br />

y=-4.488118053335837+<br />

INDRLQt*8.348191853294373+<br />

0.981111884 2 14<br />

14 Ta395_ lHPmTMt*1.965121565280751<br />

y=-1.293780346589664+<br />

liMrSQg*0.223497432069395+<br />

0.976574132 2 15<br />

15 Tox395_ ASPrVQg*0.095534977438483<br />

y=-1.272088763676020+<br />

lIMrSQg*0.223829242224039+<br />

0.95585816 2 14<br />

16 Tox395_ ASPrVQg*0.095600357852137<br />

y=-0.717673381133009+<br />

lsMrSQg*0.225050651084089+<br />

0.955056854 2 14<br />

17 Tox395_ ASPrVQg*0.098706316363904<br />

y=-1.575004492205578+<br />

lNMrSQg*0.205885242323993+<br />

0.957735266 2 14<br />

18 Tox395_ ASPrVQg*0.092984460101768<br />

0.956820302 2 14<br />

19 Tox395_ y=-1.597971465629698+ 0.955928148 2 14<br />

206


20 41521_<br />

lNMrEQg*0.336843860556055+<br />

ASPrVQg*0.094660231172752<br />

y=15.977082257070075+<br />

lAPRkHg*4.411577306950580+<br />

iAPmEQg*-0.004799303305105<br />

y=15.557416220778391+<br />

lHPDKHg*-4.447021764795913+<br />

0.998675191 2 8<br />

21 41521_ iBPmEQg*-0.045008303244039<br />

y=15.977082257072571+<br />

lHPRKHg*-4.411577306951695+<br />

0.9990247 2 8<br />

22 41521_ iAPmEQg*-0.004799303305106<br />

y=43.344306644672435+<br />

ImMdsEg*-2.208255961271429+<br />

0.998675191 2 8<br />

23 41521_ lIMMFQt*3.740518408044116<br />

y=19.406881564985923+<br />

lGDrtMg*21.873029005600086+<br />

0.999125495 2 8<br />

24 MR10_ lAmrVGg*-164.023794938214048<br />

y=17.394528468178550+<br />

lGDmSMt*28.247433444091738+<br />

0.999797892 2 10<br />

25 MR10_ lAmrfEt*-83.965315146143757<br />

y=-19.112864129011363+<br />

lHPDOQg*2.317497007317971+<br />

0.999958406 2 10<br />

26 26449t_ IsMRKGg*19.343096061022083<br />

y=-5.342090912944618+<br />

ISDrSQg*-0.000836073645555+<br />

0.997345142 2 10<br />

27 52344_ iSmrJQt*-33.145388286106125<br />

y=-13.259851363534467+<br />

IAPdwCg*7.421342259908507+<br />

0.999457098 2 8<br />

28 52344_ lSDMkMg*-1.203325361332910<br />

y=7.182585269595931+<br />

lbPMkHg*-1.097130469643120+<br />

0.99978832 2 8<br />

29 52344_ iAPrVGt*-33.244348016071162<br />

y=82487.779927956544000+<br />

iSDmtQg*-4291.591445441648640+<br />

0.999803127 2 8<br />

30 DevMTOp00_ lAMrFEt*-24751.302374423369600<br />

y=-5.211074704460113+<br />

IAPMLMt*0.000744091093604+<br />

0.999997516 2 8<br />

31 DevMTOp01_ lmPmlQg*2.674299018254657<br />

y=8.572782794598863+<br />

anPrdQg*-0.062403551223709+<br />

1 2 5<br />

32 DevMTOp02_ IsmRLQt*233.992406665280768<br />

y=21.577675933246624+<br />

iHDRkMg*-0.004324723908977+<br />

0.999966002 2 7<br />

33 DevMTOp03_ inMrPQg*11.108974534804655<br />

y=6.946100250910472+<br />

iGDREHg*-10.090383646214632+<br />

0.999152012 2 8<br />

34 DevMTOp04_ lnDDVQg*-1.391295355575833<br />

y=5.972901448850221+<br />

AHDmtQg*382.966792379103488+<br />

0.999779572 2 8<br />

35 DevMTOp05_ inMDqQg*-5.152599794558495<br />

0.9992016 2 8<br />

36 DevMTOp06_<br />

y=4.258542471386298+<br />

lGPMqGg*-55.309513051550080+ 0.999981768 2 7<br />

207


37 DevMTOp07_<br />

IBPrJHt*-0.016924218996259<br />

y=16.997960609979277+<br />

iAMrECt*-14.724870628170749+<br />

aAPmfQt*-0.105749387186883<br />

y=2.299452498508210+<br />

LsDmjQg*-1.172330969315326+<br />

0.999603803 2 8<br />

38 DevMTOp08_ lAMrDHt*-6.960913760516673<br />

y=49.601873825853658+<br />

IAMrDQg*-0.353928603916190+<br />

0.999959098 2 7<br />

39 DevMTOp09_ iBPRwMt*31653.215583361798400<br />

y=-4.563145600075828+<br />

isMdsGg*-0.076556062852060+<br />

0.999903215 2 7<br />

40 DevMTOp10_ lsDDkQg*-1.431507685251379<br />

y=-39.637026030878438+<br />

iGPMpEg*14.697649143241879+<br />

0.999898517 2 7<br />

41 DevMTOp11_ lPDDpEg*0.044063759116077<br />

y=-252.938700802085632+<br />

lMMRSGt*24.401713743828797+<br />

0.9999946 2 6<br />

42 DevMTOp12_ lsPmpMg*-28.277181303483437<br />

y=28.031130403667130+<br />

IHMRFEg*-0.897288952138859+<br />

0.999253357 2 8<br />

43 DevMTOp14_ INPmsQt*-13455.651827727787520<br />

y=-269.701345715687040+<br />

iIMMoEg*32.790755969495002+<br />

0.99957823 2 8<br />

44 DevMTOp15_ IHmrlEt*1058.588149821219040<br />

y=-4.591222054726206+<br />

asDmkQg*0.003446474307407+<br />

0.999995588 2 6<br />

45 DevMTOp16_ IGMmTHt*2.246662887026612<br />

y=0.276515007162331+<br />

iIPdqQg*1.456930890306632+<br />

0.99894463 2 8<br />

46 DevMTOp17_ iImrSCg*-0.008375218150532<br />

y=5.277557317326950+<br />

iGMmSQt*-0.925518492017054+<br />

0.999544921 2 8<br />

47 DevMTOp18_ IIPdwQg*-561.357019867305216<br />

y=484.609231791737472+<br />

iADDOMg*-6893.174261695466240+<br />

0.999999653 2 6<br />

48 DevMTOp19_ lmPmLMt*-52.452348531199731<br />

y=-76.465419087381811+<br />

lGPrfGt*11.765097022456481+<br />

0.999942872 2 7<br />

49 DevMTOp20_ iGPMqMg*14.548142362264151<br />

y=-0.466773345458314+<br />

ISPRfEt*0.658065324549722+<br />

0.999179456 2 8<br />

50 DevMTOp21_ imDrwEt*-688.623604086868352<br />

y=35.886964607142445+<br />

lIDrdQg*8.293607635627836+<br />

0.999019748 2 8<br />

51 DevMTOp22_ isMdPQg*0.001557300106484<br />

y=-267.218704057874592+<br />

lsPmkEg*-20.968463155992515+<br />

0.999927658 2 7<br />

52 DevMTOp23_ lSmRFGt*51.184666540653107<br />

0.999864996 2 8<br />

y=0.355538934447154+<br />

53 DevMTOp24_<br />

IsPDPHg*99.897075577592973+<br />

InDRLQg*-0.736739109598832<br />

0.9999568 2 7<br />

208


54 DevMTOp25_<br />

y=1.893045064859439+<br />

lBMDVQg*4.089050756254091+<br />

iHDrDQt*-42.497588982800794<br />

y=-2.260942771393344+<br />

ASMmVQt*0.036537920618985+<br />

0.999931515 2 7<br />

55 RRC433_lbr_ lfDdOQg*-0.216319157172228<br />

y=-3.294716228841605+<br />

ASMmVQt*0.034759339883385+<br />

lfDdOQg*-0.326175236962887+<br />

InMrLQg*0.079023124090750+<br />

0.897264116 2 30<br />

56 RRC433_lbr_ LsDMpQg*-0.346227342563766<br />

y=-3.309083909227967+<br />

ASMmVQt*0.035359451252071+<br />

lfDdOQg*-0.326340537986437+<br />

InMrLQt*0.083521027478412+<br />

0.973702913 4 30<br />

57 RRC433_lbr_ LsDMpQg*-0.353965995278507<br />

y=1.068504837149195+<br />

isDDkGg*0.003385972696729+<br />

0.973908851 4 30<br />

58 RRC433_lkow_ IMmrKQg*-0.401342461954502<br />

y=0.086887657603207+<br />

isDDkGg*0.005559930394138+<br />

IMmrKQg*-0.416458920866538+<br />

lPMDKQg*0.009409040694936+<br />

0.894339198 2 30<br />

59 RRC433_lkow_ lFMMKQg*-0.077972151747497<br />

y=12.145778693743030+<br />

AHMMVQg*-1.759312774646531+<br />

0.978050343 4 30<br />

60 RRC433_pka_ inDmwHg*-1.423171133335602<br />

y=12.250129572666588+<br />

AHMMVQg*-1.878604996401587+<br />

inDmwHg*-1.409105150926869+<br />

IimRJQg*-1.255850637865408+<br />

0.85106015 2 30<br />

61 RRC433_pka_ AsPrwQg*-551.820132942366464<br />

y=12.266395089058967+<br />

AHMMVQg*-1.886964796625174+<br />

inDmwHg*-1.431793246534204+<br />

IImRJQg*-1.492725761439522+<br />

0.96048211 4 30<br />

62 RRC433_pka_ IHDrsQg*-132.763291817560480<br />

y=13.187486747004316+<br />

AHMMVQg*-1.628307288455412+<br />

inDmwHg*-1.315727674279415+<br />

LBMRlQg*-0.450392531615080+<br />

0.961458919 4 30<br />

63 RRC433_pka_ AHDmEQg*-3.537408893070444<br />

y=2.799163315535306+<br />

IbMmpMg*28.064230202549747+<br />

0.963779329 4 30<br />

64 52730_ LPPROQg*0.081524293438233<br />

y=3.982186750193776+<br />

iImrKHt*1.516060326175799+<br />

0.99763089 2 10<br />

65 DHFR_ liMDWHg*2.357039692152132<br />

y=-1.172577695940167+<br />

lImrKHt*-4.863206399509672+<br />

0.85627596 2 67<br />

66 DHFR_ IiMDWHg*5.474142782322419<br />

0.857180673 2 67<br />

67 DHFR_ y=3.261481723647712+ 0.858873758 2 67<br />

209


lImrKHt*-4.900679297589359+<br />

lIMDWHg*2.313684191877673<br />

y=22.783498446732483+<br />

IbMmSHt*-0.044781937978148+<br />

inPRjHg*0.036908423922842+<br />

68 DHFR_ lsMMTGg*2.276594353795319<br />

0.887769256 3 67<br />

y=3.766172816092689+<br />

iImrKHt*1.630691978329184+<br />

liMDWHg*2.398496510115706+<br />

LSPmEQg*-0.085551239269939+<br />

69 DHFR_ IIDrJQt*0.293720167343832<br />

0.905161273 4 67<br />

70 DHFR_<br />

y=3.781999644467336+<br />

iImrKHt*1.619894894103214+<br />

liMDWHg*2.371371074452369+<br />

IsDrJQt*6.402293814267814+<br />

LSPmEQg*-0.085177985460006<br />

y=-5.746809646380628+<br />

IiPdJHg*11.956269601549317+<br />

0.905784714 4 67<br />

71 a_acids_ iHMmVQg*0.065716945111961<br />

y=11.256459289110492+<br />

iHmrsGg*0.389578813720558+<br />

0.984823373 2 12<br />

72 a_acids_ iiPDOHg*-2.366249952762924<br />

y=9.387440286015163+<br />

lIPrVGt*6.088203345034852+<br />

0.987102214 2 12<br />

73 a_acids_ IHDDKHg*0.381482245798468<br />

y=-8.951974935678216+<br />

lIMdFGg*-9.901521373121243+<br />

0.98835913 2 12<br />

74 34121bad_ IAPmTCt*36.243596058596800<br />

y=13.360278625318943+<br />

iIPRLGg*-4.412916051903299+<br />

0.509261534 2 76<br />

75 34121nopt_ LiMmwQg*0.421902462393154<br />

y=0.183306719129093+<br />

IFDDpGg*-0.000068304771741+<br />

0.622248309 2 76<br />

76 19654_ ISDrFMt*-0.000001260853126<br />

y=-0.008829461052500+<br />

isDRtHg*-0.000051338532157+<br />

0.984019252 2 23<br />

77 19654_ iHMMtHg*0.130030477933933<br />

y=0.046790454181503+<br />

ismRSEg*-0.000172348201588+<br />

0.988351291 2 23<br />

78 19654_ isDRTCg*0.000030999802774<br />

0.98955647 2 23<br />

y=7.616547989246049+<br />

lIDrpMg*1.001309641822330+<br />

lsPrJGt*-1.069779866848350+<br />

ismRSEg*-0.000163062657210+<br />

79 19654_ isDRTCg*0.000029929545873<br />

0.996248249 4 23<br />

y=2.733124886439780+<br />

lmDDKMg*-0.286110586112610+<br />

imPrdQt*-1.789020475582959+<br />

ismRSEg*-0.000161361248412+<br />

80 19654_ isDRTCg*0.000029725595809<br />

0.997851065 4 23<br />

81 19654_<br />

y=6.884466558075200+<br />

liMRsCg*0.921784722969737+<br />

0.996819148 4 23<br />

210


82 19654_<br />

lIDRFMg*-1.317553545161115+<br />

isDRtHg*-0.000050399261806+<br />

iHMMtHg*0.135432046071406<br />

y=-0.146575674440346+<br />

imMRkMg*0.000902003747302+<br />

imMDVQg*-0.322525717918453+<br />

isDRtHg*-0.000052364343767+<br />

iHMMtHg*0.139074684280391<br />

y=-17.709380801328218+<br />

isMdTHg*0.002306275036298+<br />

0.997260489 4 23<br />

83 3300_ IiDrQHg*77.216162936821005<br />

0.918384193 2 34<br />

84 3300_<br />

y=-17.092683014823635+<br />

iHDmkQt*0.688855852114620+<br />

AsDmtQg*205224.367519787520000+<br />

isMdTHg*0.002310828590955+<br />

IiDrQHg*72.349612191442458<br />

y=-4.303662300109863+<br />

lIDrFEg*-19.435102462768554+<br />

0.966514933 4 34<br />

85 22583_ IiMMsGg*11.070854187011718<br />

y=-4.358335018157959+<br />

lIDrFEg*-19.590654373168944+<br />

0.782257676 2 57<br />

86 22583_ IiMMSGg*11.005515098571777<br />

0.783080041 2 57<br />

y=16.697563171386717+<br />

InMdTHg*-9.215051651000977+<br />

lfDMwEt*-0.860860228538513+<br />

87 22583_ AsMrKQt*141.058273315429680 0.835162103 3 57<br />

y=-5.146468639373779+<br />

lIDrFEg*-18.882848739624022+<br />

IiMMSGg*9.991197586059570+<br />

iFDmkHg*-0.000023631801014+<br />

88 22583_ inMrEQt*-1.860737323760986<br />

0.900917828 4 57<br />

y=17.723573684692381+<br />

InMdTHg*-7.113586425781251+<br />

lFDMwEt*-1.234191298484802+<br />

AiMrKQt*8.357679367065430+<br />

ImDMtQt*659184.625000000000000+<br />

89 22583_ lIMdEMg*-5.981501102447510<br />

0.917499542 5 57<br />

90 22583_<br />

y=10.439790725708008+<br />

InMdTHg*-6.621389389038086+<br />

lFDMwEt*-1.115040302276611+<br />

AiMrKQt*7.575278282165527+<br />

IMDMtQt*782467.875000000000000+<br />

iIMdTMg*18.747991561889648<br />

y=-323.024772597417024+<br />

liDmEHt*-105.929211454059789+<br />

0.917872667 5 57<br />

91 33504_ IADmwHt*17.760000133301725<br />

y=-129.202920028528064+<br />

lGDrtGt*-67.450781570303091+<br />

0.998191949 2 73<br />

92 33504_ IbDrfHt*4.889627699125125<br />

0.998194885 2 73<br />

y=6.272650515627022+<br />

93 23158c_<br />

iiMdLGg*-24.465622121014768+<br />

AsPmVQt*7.416438629162940<br />

0.949331559 2 40<br />

211


94 23158c_<br />

y=-8.925568204084518+<br />

lIMdLGg*6.533652861276372+<br />

AsPmVQt*7.390652840339525<br />

y=-9.030826989310386+<br />

lIMdLGg*6.602715759615876+<br />

0.949405043 2 40<br />

95 23158c_ AIPmVQt*0.738833729895370<br />

y=-9.028650724880719+<br />

lIMdLGg*6.601183808052042+<br />

0.949450328 2 40<br />

96 23158c_ AiPmVQt*0.738839898477699<br />

y=7.413062019927823+<br />

iIMdLGg*-29.203947244192070+<br />

0.949451061 2 40<br />

97 23158c_ AsPmVQt*7.376749884182984<br />

y=7.483477154220049+<br />

iIMdLGg*-29.525257834273594+<br />

0.950945432 2 40<br />

98 23158c_ AIPmVQt*0.737465221651949<br />

y=7.481885945863868+<br />

iIMdLGg*-29.518679478761894+<br />

0.951085814 2 40<br />

99 23158c_ AiPmVQt*0.737471789565067<br />

y=6.372537492476300+<br />

IBMrkGg*-92.371378276225190+<br />

0.951086994 2 40<br />

100 23158c_ IsPmVQt*-7.281656762147562<br />

y = 3.5140+<br />

iNMRJQt*3.9523e-2+<br />

iSDRkQt*-9.1485+<br />

LsPrDQt*5.7624e-1+<br />

0.955679462 2 40<br />

101 31572_ IADRSHg*-1.1986e-1<br />

y = -10.573+<br />

IIMmSCg*63.140+<br />

0.958313838 4 24<br />

102 31572_ lIMRVCg*-5.1308<br />

y = 3.9864+<br />

LsPrDQt*6.4877e-1+<br />

0.830588637 2 24<br />

103 31572_ IADRSHg*-1.2942e-1<br />

y=3.309258874208278+<br />

ABmrtQg*-14.191657164410053+<br />

0.811092657 2 24<br />

104 23110_ iGPrfHt*0.960433156574692<br />

y=3.255577576284918+<br />

ABmrsQg*-9.655480534462673+<br />

0.870389569 2 69<br />

105 23110_ iGPrfHt*1.003843270199119<br />

y=3.468032235802128+<br />

ABmrtQg*-14.109591667547505+<br />

iGPrfHt*1.000897643171127+<br />

iImrfQt*-0.000035842320734+<br />

0.870762905 2 69<br />

106 23110_ aHDRdQt*-0.019679357321205<br />

y=3.649903008444890+<br />

IBDMWQt*0.668182102284062+<br />

iIPmWHt*0.139974134207539+<br />

IMPrkQg*0.000238539437306+<br />

0.923419436 4 69<br />

107 23110_ aHPMwQt*-0.000458937750242<br />

y=3.635644435882568+<br />

ABDmtQg*-11.895344734191895+<br />

ISDRLQt*0.000576242397074+<br />

0.922112869 4 69<br />

108 23110_ iIPrwHt*0.130846872925758<br />

0.901068389 3 69<br />

212


y=3.463929176330566+<br />

ABDmtQg*-13.019453048706056+<br />

iHPrwHt*1.618527054786682+<br />

109 23110_ aIPMwQt*-0.000028133128581<br />

0.902104378 3 69<br />

y=3.494592428207398+<br />

ABDmtQg*-13.096261978149414+<br />

iHPmwHt*1.626412868499756+<br />

110 23110_ aIPMwQt*-0.000028470527468<br />

0.902782798 3 69<br />

y=3.821168899536133+<br />

aHPMwQt*-0.000338123209076+<br />

iIPmWHt*0.132829502224922+<br />

111 23110_ IBPMWQt*0.756949245929718<br />

0.904430389 3 69<br />

y=3.719008207321167+<br />

aHPMwQt*-0.000501490896568+<br />

iIPmWHt*0.142897620797157+<br />

IBPMWQt*0.778551995754242+<br />

iFMMfGt*-0.000000000418976+<br />

112 23110_ IMPrkQg*0.000253266363870<br />

0.936299264 5 69<br />

113 23110_<br />

y=3.719301223754883+<br />

aHPMwQt*-0.000501317554154+<br />

iIPmWHt*0.142888113856316+<br />

IBPMWQt*0.778867542743683+<br />

iFmRFMt*-0.000000309545300+<br />

IMPrkQg*0.000253249396337<br />

y=3.937699079513550+<br />

iSPRtQg*0.051902804523706+<br />

0.936396182 5 69<br />

114 23167_ imDrkQt*-5.906542778015137<br />

y=3.934797048568726+<br />

aSPRtQg*0.051960568875074+<br />

0.861876726 2 31<br />

115 23167_ imDrkQt*-5.895822048187256<br />

y=3.937698841094971+<br />

imDrkQt*-5.906543731689453+<br />

0.860438466 2 31<br />

116 23167_ iSPRtQg*0.051902808248997<br />

y=3.934797048568726+<br />

imDrkQt*-5.895823001861572+<br />

0.861882389 2 31<br />

117 23167_ aSPRtQg*0.051960572600365<br />

y=3.832609653472900+<br />

IsMRKQg*-8.327919006347656+<br />

0.860438466 2 31<br />

118 23167_ AHPROQg*0.280586481094360<br />

0.8681795 2 31<br />

y=4.057913303375244+<br />

imDrkQt*-4.935928344726563+<br />

LHDROQg*0.097806222736835+<br />

119 23167_ aSPRtQg*0.059412382543087<br />

0.938799143 3 31<br />

120 23167_<br />

y=4.060825824737549+<br />

imDrkQt*-4.952915191650390+<br />

LHDROQg*0.097219981253147+<br />

iSPRtQg*0.059157751500607<br />

y=1.742758248357947+<br />

inPRlQg*0.100852680149301+<br />

0.939431727 3 31<br />

121 408461_ lPDMqMg*0.003099560484118<br />

0.80557016 2 40<br />

122 408461_<br />

y=1.139803152319389+<br />

inPRlQg*0.087893430183274+<br />

0.917551726 4 40<br />

213


lPDMoMg*0.003517539776609+<br />

iAMRqQg*2.431579364841151+<br />

inMRkQt*1.038853874815755<br />

y=-4.447927898225615+<br />

imDdSCg*2.435295979512419+<br />

123 408462_ iiMrqQg*0.094635156307397<br />

0.785285688 2 40<br />

124 408462_<br />

y=-9.985955210032028+<br />

imDdSCg*4.564366234578961+<br />

isDrqQg*0.002945010877990+<br />

IIMDQQg*5.203670331019382+<br />

lmMrsGg*1.483206222543829<br />

y=0.802847494580493+<br />

inPRlQg*0.111337641528975+<br />

0.903722129 4 40<br />

125 408464_ iHMMTQt*0.000000009980546<br />

0.75212455 2 40<br />

126 408464_<br />

y=0.624897025648112+<br />

inPRlQg*0.105048221495900+<br />

iHMMTQt*0.000000009918681+<br />

IHMDTQg*-9.248476294178811+<br />

InPdJQg*1.727457275576125<br />

y=2.567506668233360+<br />

ibDMFHt*-1.471170216670452+<br />

0.920210241 4 40<br />

127 Dipepti<strong>de</strong>s_ ISPdlMg*0.117473661385305<br />

y=4.581803041430724+<br />

IHMdKEg*-0.039915577766273+<br />

0.84794137 2 58<br />

128 Dipepti<strong>de</strong>s_ IBPmpGg*0.639122246849638<br />

0.849074656 2 58<br />

y=2.208486080169678+<br />

IbMmjHg*0.248430266976357+<br />

IbPdPHg*0.020541135221720+<br />

129 Dipepti<strong>de</strong>s_ IBMRQCg*-0.265679538249969<br />

0.879454732 3 58<br />

y=15.605128288269043+<br />

ibDMFHt*-1.721762657165527+<br />

ISPdlMg*0.124963581562042+<br />

imDmFEt*-166.574951171875008+<br />

130 Dipepti<strong>de</strong>s_ ImPrSEt*-0.121208801865578<br />

0.903556645 4 58<br />

131 Dipepti<strong>de</strong>s_<br />

y=-7.197427749633789+<br />

IbMmjHg*0.236571803689003+<br />

IbPdPHg*0.020058955997229+<br />

IBMRQCg*-0.236558765172958+<br />

ImDmEEt*2.080404758453369+<br />

ImDrFEt*-0.038597311824560<br />

y=3.120874910401321+<br />

IIDDKGg*-0.441475190602858+<br />

0.925133169 5 58<br />

132 PCB_lkow_ IHDRKEg*0.044664834835730<br />

0.889745045 2 206<br />

y=3.039301324572242+<br />

IIDDKGg*-0.420795249377539+<br />

IHDRKEg*0.044187988743215+<br />

aHMmjQt*0.069692154874390+<br />

133 PCB_lkow_ aSMMjQg*-37.502291360990682 0.916807642 4 206<br />

134 PCB_lkow_<br />

y=-12.993183460296381+<br />

aHMmjQt*0.073027271465754+<br />

aSMMjQg*-41.685504895336179+<br />

iBMmwHg*1195.953967146027040+ 0.92728403 6 206<br />

214


iBMmwHg*1195.781250000000000+<br />

iFPMECg*0.000000000046040+<br />

inPRjQt*-0.053628481878679<br />

y=5.085278949837590+<br />

imMrFHt*-357.296321414089600+<br />

135 PCB_rrf_ iHDdFHg*2.156138113196185<br />

0.692921683 2 209<br />

136 PCB_rrf_<br />

y=6.055340736461524+<br />

imMrFHt*-416.942003738513088+<br />

iHDdFHg*2.313956389789302+<br />

iMMMjQg*1.829475297508006+<br />

iAMrVQg*-0.002506945942322<br />

y=5.522010734067013+<br />

iSMMWHg*-8112.253036635951360+<br />

0.736793462 4 209<br />

137 Triazines_ iSMmEQt*194.350344691394656 0.975281158 2 30<br />

y=1.741930263231576+<br />

iSMMWHg*-9261.099477423027200+<br />

iAMdEHg*10.338581077497056+<br />

138 Triazines_ INDRLQg*3.891633816915113<br />

0.983012783 3 30<br />

y=5.660616397857666+<br />

iSMmEQt*200.968338012695296+<br />

iSMMWHg*-9010.562500000001280+<br />

LHmrPQg*0.060792036354542+<br />

139 Triazines_ INPRJQg*2.838208675384522<br />

0.988145828 4 30<br />

y=5.753315448760986+<br />

iSMmEQt*198.759780883789088+<br />

iSMMWHg*-9006.287109375000320+<br />

LADmkQt*-0.071008183062077+<br />

140 Triazines_ INPRJQg*2.863457918167114<br />

0.988538325 4 30<br />

141 Triazines_<br />

y=5.974672317504883+<br />

iSMmEQt*197.155532836914080+<br />

iSMMWHg*-9045.324218750000640+<br />

LBDmkQt*-0.069745272397995+<br />

INPRJQg*2.900454759597779<br />

y=-5.989828784974575+<br />

ISDmsHt*0.023998570742623+<br />

0.98857367 4 30<br />

142 PCB_rrt_ lADrtHg*-1.022659619437935<br />

y=8.908911583895442E+000+<br />

liPRLCg*5.130496472711478E+000+<br />

0.997201518 2 209<br />

143 34121_ IAPRVQg*-4.006474847883577E+001<br />

y=3.184913714944090E+000+<br />

iAPrWCt*-7.367710068568820E+001+<br />

0.530525286 2 76<br />

144 34121_ imPdlMg*2.743775705121285E+000<br />

y=1.394098640420996E+001+<br />

lBDDPQg*4.455875932852346E+000+<br />

0.539820496 2 76<br />

145 34121_ IbPDPQg*-9.162168698947033E+000 0.548704368 2 76<br />

y=1.186554369769341E+001+<br />

imMRjQg*-3.194956703543156E-001+<br />

INMMwQg*2.201541664377901E+003+<br />

lBDDPQg*3.723218963557573E+000+<br />

146 34121_ IbPDPQg*-7.692180382738973E+000 0.67843743 4 76<br />

147 34121_<br />

y=1.121850860583595E+001+<br />

imMRjQg*-3.744935336220445E-001+ 0.697382796 4 76<br />

215


148 34121_<br />

imDDKQg*7.994101026398718E-001+<br />

lBDDPQg*4.758667402431983E+000+<br />

IbPDPQg*-7.950113079258346E+000<br />

y=1.094115134180832E+001+<br />

imMRjQg*-3.710272139159518E-001+<br />

imPDKQg*8.467292793176487E-001+<br />

lBDDPQg*4.730475798631939E+000+<br />

IbPDPQg*-7.809163830375249E+000<br />

y=9.353880712342770E-001+<br />

IHMdpMg*2.405448896100415E+002+<br />

0.714731788 4 76<br />

149 JCCS2001_ IHMdOMg*-9.877864464810714E-002<br />

y=1.031856753982042E+000+<br />

IHMdoMg*4.817499113970195E+001+<br />

0.883683364 2 47<br />

150 JCCS2001_ IHMdOCg*-3.550966400040491E+000 0.88733564 2 47<br />

y=2.021528030038608E+000+<br />

iAPMLHg*-2.119616905782861E+001+<br />

aAPrwQt*-1.683039388077890E-004+<br />

IHMdoMg*4.587595185744087E+001+<br />

151 JCCS2001_ IHMdOCg*-3.404948579625964E+000 0.937366326 4 47<br />

y=2.628600269530879E+000+<br />

iAPMLHg*-2.670560915091208E+001+<br />

imDrDQg*-5.893439946409806E+000+<br />

IHMdpMg*2.156046225910141E+002+<br />

152 JCCS2001_ IHMdOMg*-9.297899627956369E-002 0.940027138 4 47<br />

y=8.140489476203218E-001+<br />

lmDRsQg*-5.205699955284682E-002+<br />

iAPrtQg*1.837718043971574E-003+<br />

IHMdpMg*2.408973139743459E+002+<br />

153 JCCS2001_ IHMdOMg*-9.638490508381616E-002 0.940331599 4 47<br />

y=-8.200569073048715E+000+<br />

lmPrsCg*-9.942578337233752E-001+<br />

IIMdPQg*1.475164370718451E+002+<br />

154 3300_ IHDrFHt*7.958746115790257E-001 0.941640524 3 34<br />

155 3300_<br />

y=-7.395268591280339E+000+<br />

lmPrVQt*-2.344557159714253E-001+<br />

iNMMkQg*-2.851107205952929E-002+<br />

lmPrsCg*-1.112393160040784E+000+<br />

IIMdPQg*1.932535706999829E+002+<br />

IHDrFHt*7.483860535215806E-001<br />

y=-62.361371746820275+<br />

lSDmwMt*6.372504386827629+<br />

0.975828003 5 34<br />

156 15aacidsCHI_ iHPDEQg*0.058693170881799<br />

y=-62.361371746820275+<br />

lSDmwMt*6.372504386827629+<br />

0.99 3 15<br />

157 15aacidsDM_ iHPDEQg*0.058693170881799<br />

y=-62.361371746820275+<br />

lSDmwMt*6.372504386827629+<br />

0.99 3 15<br />

158 15aacidsEHu_ iHPDEQg*0.058693170881799<br />

y=-62.361371746820275+<br />

lSDmwMt*6.372504386827629+<br />

0.99 3 15<br />

159 15aacidsHTH_ iHPDEQg*0.058693170881799<br />

0.99 3 15<br />

160 15aacidsHyE_ y=-62.361371746820275+ 0.99 3 15<br />

216


161 15aacidsHyd_<br />

lSDmwMt*6.372504386827629+<br />

iHPDEQg*0.058693170881799<br />

y=-62.361371746820275+<br />

lSDmwMt*6.372504386827629+<br />

iHPDEQg*0.058693170881799<br />

y=-62.361371746820275+<br />

lSDmwMt*6.372504386827629+<br />

0.99 3 15<br />

162 15aacidsKDH_ iHPDEQg*0.058693170881799<br />

y=-62.361371746820275+<br />

lSDmwMt*6.372504386827629+<br />

0.99 3 15<br />

163 15aacidsLPH_ iHPDEQg*0.058693170881799<br />

y=-62.361371746820275+<br />

lSDmwMt*6.372504386827629+<br />

0.99 3 15<br />

164 15aacidsLac_ iHPDEQg*0.058693170881799<br />

y=-62.361371746820275+<br />

lSDmwMt*6.372504386827629+<br />

0.99 3 15<br />

165 15aacidsLogP_ iHPDEQg*0.058693170881799<br />

y=-62.361371746820275+<br />

lSDmwMt*6.372504386827629+<br />

0.99 3 15<br />

166 15aacidsMR_ iHPDEQg*0.058693170881799<br />

y=-62.361371746820275+<br />

lSDmwMt*6.372504386827629+<br />

0.99 3 15<br />

167 15aacidsPol_ iHPDEQg*0.058693170881799<br />

y=-62.361371746820275+<br />

lSDmwMt*6.372504386827629+<br />

0.99 3 15<br />

168 15aacidsRef_ iHPDEQg*0.058693170881799<br />

y=-62.361371746820275+<br />

lSDmwMt*6.372504386827629+<br />

0.99 3 15<br />

169 15aacidsSlb_ iHPDEQg*0.058693170881799<br />

y=-3.899995456511689E+000+<br />

iHDMkMg*5.656940765236902E-002+<br />

0.99 3 15<br />

170 cqdmdfv_ IHDDfMg*5.237900484407559E-002<br />

y=-3.863052189141237E+000+<br />

iHDMkMg*5.685380086944401E-002+<br />

0.791717722 2 37<br />

171 cqdmdfv_ IHDDFMg*5.119539422851146E-002<br />

y=4.983642390909260E+000+<br />

IiDDFMg*1.095693192033933E+000+<br />

0.792894457 2 37<br />

172 cqdmdfv_ IGPRSHg*-2.866877787558061E+000 0.837765633 2 37<br />

y=8.729908076844302E+000+<br />

IfMmkEt*-3.193361463363008E+002+<br />

iFPDJQg*7.052011286452327E-003+<br />

IHDMkMg*-6.940338868451494E+002+<br />

173 cqdmdfv_ IHDDFMg*5.265590211048012E-002 0.902243362 4 37<br />

y=9.114670320012248E+000+<br />

IFMmkEg*-1.075642411355964E+004+<br />

ifPDJQg*1.326584216201407E-002+<br />

IHDMkMg*-7.437831566808608E+002+<br />

174 cqdmdfv_ IHDDFMg*5.301240391684132E-002 0.90226774 4 37<br />

175 cqdmdfv_<br />

y=7.867373431327034E+000+<br />

IHMmlHt*2.253830286409211E+000+<br />

IHDDfHg*2.173108607718223E+000+<br />

IHDMkMg*-1.281502744982768E+003 0.873686181 3 37<br />

217


y=1.003396546771776E+001+<br />

IHMmlHt*2.269406814666561E+000+<br />

lHDDfHg*2.658929646993912E+000+<br />

176 cqdmdfv_ IHDMkMg*-1.287456019297492E+003 0.878203069 3 37<br />

y=8.198277549218441E+000+<br />

IFMMwHt*-4.060849064392680E-006+<br />

iGMdKQg*-3.223920991936599E-001+<br />

IHDMlGg*4.022926700181765E+001+<br />

iGPDJQg*3.428375813105643E+000+<br />

177 cqdmdfv_ IHDMkMg*-2.863067426695822E+003 0.932284995 5 37<br />

y=8.196619870093642E+000+<br />

IFMRwHt*-4.090535037179962E-006+<br />

iGMdKQg*-3.223966410814169E-001+<br />

IHDMlGg*4.024536545952987E+001+<br />

iGPDJQg*3.428953982552353E+000+<br />

178 cqdmdfv_ IHDMkMg*-2.863886206931033E+003 0.932302619 5 37<br />

y=7.875540309968831E+000+<br />

iGMdKQg*-3.178216723715206E-001+<br />

IFDrfHt*-3.712320549172804E-004+<br />

IHDMlGg*4.300507686737912E+001+<br />

iGPDJQg*3.467470958104024E+000+<br />

179 cqdmdfv_ IHDMkMg*-2.995984495901780E+003 0.93235562 5 37<br />

y=1.017765046541389E+001+<br />

IGDMlQt*1.033819008180921E+000+<br />

IbMDpHg*9.506440434006870E-003+<br />

IHMmlHt*2.986180487676706E+000+<br />

lHDDfHg*3.120537844300812E+000+<br />

180 cqdmdfv_ IHDMkMg*-1.693877987674947E+003 0.930544951 5 37<br />

y=1.021449314660090E+001+<br />

lmMmEHg*-2.768917870643550E+000+<br />

imMmsHg*-1.332239024874281E+001+<br />

IHDMlGg*6.254578659016686E+001+<br />

iGPDJQg*2.557922177945907E+000+<br />

181 cqdmdfv_ IHDMkMg*-3.682822869950283E+003 0.9361187 5 37<br />

182 cqdmdfv_<br />

Legendă:<br />

y=9.437272554095401E+000+<br />

ImMmEHg*-7.326534943461503E-001+<br />

imMmtHg*-7.887482194328009E+000+<br />

IHDMlGg*5.981435730123702E+001+<br />

iGPDJQg*2.221188846182277E+000+<br />

IHDMkMg*-3.478875295297901E+003 0.936874282 5 37<br />

÷ Nr: număr current;<br />

÷ Set: <strong>de</strong>numirea setului <strong>de</strong> molecule investigat;<br />

÷ Mo<strong>de</strong>l: mo<strong>de</strong>lul QSAR obţinut;<br />

÷ r2: coeficientul <strong>de</strong> <strong>de</strong>terminare între activitatea observată şi valoarea sa prezisă<br />

<strong>de</strong> ecuaţia <strong>de</strong> regresie folosind <strong>de</strong>scriptorii <strong>de</strong> structură MDF calculaţi<br />

÷ v: numărul <strong>de</strong> <strong>de</strong>scriptori <strong>de</strong> structură folosiţi <strong>de</strong> mo<strong>de</strong>lul QSAR obţinut;<br />

÷ m: munărul <strong>de</strong> molecule din setul supus investigaţiei.<br />

2009A5. Obţinerea relaţiilor (semi)Cantitative Structură-Activitate, sQSARs<br />

218


Relaţii semicantitative structură-activitate s-au obţinut pe parcursul <strong>de</strong>sfăşurării cercetării atât în<br />

2008 cât şi în 2009, fiind cuprinse şi astfel valorificate în publicaţii.<br />

S-a <strong>de</strong>zvoltat şi documentat o aplicaţie bazată pe algoritm genetic pentru obţinerea relaţiilor<br />

semicantitative structură-activitate; aplicaţia constituie subiectul unei lucrări care este în prezent sub<br />

formă <strong>de</strong> manuscript <strong>de</strong>pozitat online (ArXiv http://arxiv.org/abs/0906.4846) fiind trimis spre<br />

publicare la o revistă <strong>de</strong> specialitate.<br />

Analiza cu privire la obţinerea relaţiilor (semi)cantitative structură-activitate, sQSARs s-a efectuat<br />

pe un set voluminos <strong>de</strong> date (206 compuşi) pentru a evita selecţia bazată pe şansă.<br />

Rolul algoritmului genetic se regăseşte prin următoarea analogie. Conceptul <strong>de</strong> familie este Species<br />

comun în biologie, organismele vii fiind clasificate după o structură arborescentă, una<br />

dintre acestea fiind ilustrată alăturat.<br />

Genus<br />

Şi în ceea ce priveşte compuşii chimici, relaţiile <strong>de</strong> înrudire între aceştia sunt exprimate<br />

Family<br />

prin intermediul apartenenţei la o clasă sau alta, aici însă existând mai multe sisteme <strong>de</strong><br />

clasificare, în funcţie <strong>de</strong> prezenţa unui atom sau grupe <strong>de</strong> atomi în moleculă, <strong>de</strong><br />

Or<strong>de</strong>r<br />

proprietăţile fizico-chimice sau biologice ale acestora.<br />

O clasificare a compuşilor organici după grupările funcţionale pe care aceştia le posedă este Class<br />

ilustrată alăturat.<br />

Este astfel justificat să presupunem că construcţia şi utilizarea <strong>de</strong> familii <strong>de</strong> <strong>de</strong>scriptori Phylum<br />

pentru obţinerea <strong>de</strong> ecuaţii qSPAR este calea naturală <strong>de</strong> urmat. Analiza topologică a unei<br />

structuri moleculare ne conduce în mod inevitabil la familii <strong>de</strong> <strong>de</strong>scriptori moleculari, Kingdom<br />

având la dispoziţie o serie <strong>de</strong> matrici pătratice care cumulează caracteristici moleculare<br />

<strong>de</strong>rivate din structură (Matricea <strong>de</strong> Adiacenţă, Matricea <strong>de</strong> Inci<strong>de</strong>nţă, Matricea <strong>de</strong> Distanţă, Domain<br />

Matricea <strong>de</strong> Detur, Matrici combinatoriale, Szeged, Cluj, şi altele) şi o serie <strong>de</strong> modalităţi<br />

<strong>de</strong> cumulare a valorilor conţinute în aceste matrici (indici pe matrici pătratice).<br />

Trei familii <strong>de</strong> <strong>de</strong>scriptori fac subiectul cercetării:<br />

÷ FPIF (Fragmental Property In<strong>de</strong>x Family);<br />

÷ MDF (Molecular Descriptors Family);<br />

÷ MDFV (Molecular Descriptors Family Vertex).<br />

FPIF (Jäntschi şi Diu<strong>de</strong>a, 2000) este o metodă matriceală bazată pe matrice pătratice <strong>de</strong> proprietăţi<br />

<strong>de</strong>rivate din structură. Astfel foloseşte: topologia moleculară (dA(b,c) - distanţa topologică în<br />

structura `A` <strong>de</strong> la atomul `b` la atomul `c`; δA(b,c) - <strong>de</strong>turul - i.e. cea mai lungă cale - topologică în<br />

structura `A` <strong>de</strong> la atomul `b` la atomul `c`; WA(b,c) - mulţimea drumurilor în structura `A` <strong>de</strong> la<br />

atomul `b` la atomul `c`; PA(b,c) - mulţimea căilor în structura `A` <strong>de</strong> la atomul `b` la atomul `c`;<br />

DA(b,c) - mulţimea căilor distanţă în structura `A` <strong>de</strong> la atomul `b` la atomul `c`; ΔA(b,c) - mulţimea<br />

căilor <strong>de</strong>tur în structura `A` <strong>de</strong> la atomul `b` la atomul `c`; A\p - structura ce rezultă din înlăturarea<br />

atomilor conţinuţi în calea `p` şi legăturilor pe care aceştia le formează în structura A exceptând<br />

capetele căii) pentru a obţine pentru fiecare pereche <strong>de</strong> atomi un set <strong>de</strong> atomi vecini utilizând în<br />

acest scop un set <strong>de</strong> 6 criterii (FC - criteriu fragmentare): Sz: SzDi - Szi,j={x | x Atom} un<strong>de</strong><br />

dMoleculă(x,i)


IP1 - semi-suma elementelor din matrice; IP2 - semi-suma pătratelor elementelor din matrice; IE1 -<br />

semi-suma elementelor din matricea ce rezultă din înmulţirea matricei <strong>de</strong> proprietate cu matricea <strong>de</strong><br />

adiacenţă; IE2 - semi-suma pătratelor elementelor din matricea ce rezultă din înmulţirea matricei <strong>de</strong><br />

proprietate cu matricea <strong>de</strong> adiacenţă; operator <strong>de</strong> linearizare (LO): I - funcţia i<strong>de</strong>ntitate f(x)=x; R -<br />

reciproca f(x)=1/x; L - logaritmul f(x)=ln(x);<br />

Astfel, familia FPIF este constituită dintr-un număr <strong>de</strong> membrii egal cu înmulţirea tuturor<br />

posibilităţilor <strong>de</strong> alegere <strong>de</strong> mai sus (2·2·4·8·6·5·4·3 = 46080), astfel:<br />

÷ FPIF = IM×DM×AP×PD×FC×SM×MI×LO<br />

÷ IM = {R, D};<br />

÷ DM = {T, G};<br />

÷ AP = {M, E, C, Q};<br />

÷ PD = {p, d, 1/p, 1/d, pd, p/d, p/d 2 , p 2 /d 2 };<br />

÷ FC = {SzDi, SzDe, CjDi, CjDe, CfDi, CfDe};<br />

÷ SM = {S, P, A, G, H};<br />

÷ MI = {IP1, IP2, IE1, IE2};<br />

÷ LO = {I, R, L}.<br />

MDF (Jäntschi, 2004) este o metodă bazată pe fragmente moleculare obţinute din perechi <strong>de</strong><br />

vârfuri. În mod similar cu metoda FPIF, metoda MDF foloseşte doi operatori <strong>de</strong> distanţă (DO):<br />

topologică (t) şi geometrică (g), şase proprietăţi atomice (AP): cardinalitate (C), număr <strong>de</strong> atomi <strong>de</strong><br />

hidrogen direct legaţi (H), masa atomică relativă (M), electronegativitatea (E), electronegativitatea<br />

<strong>de</strong> grup (G) şi sarcina atomică parţială (Q), douăzeci şi patru <strong>de</strong> <strong>de</strong>scriptori <strong>de</strong> interacţiune (ID):<br />

D(d), d(1/d), O(p1), o(1/p1), P(p1p2), p(1/p1p2), Q(√p1p2), q(1/√p1p2), J(p1d), j(1/p1d), K(p1p2d),<br />

k(1/p1p2d), L(d√p1p2), l(1/d√p1p2), V(p1/d), E(p1/d2), W(p1 2 /d), w(p1p2/d), F(p1 2 /d 2 ), f(p1p2/d 2 ),<br />

S(p1 2 /d 3 ), s(p1p2/d 3 ), T(p1 2 /d 4 ), t(p1p2/d 4 ), şase modalităţi <strong>de</strong> interacţiune (IM): `R` şi `r` - mo<strong>de</strong>le<br />

rare, `M` şi `m` - mo<strong>de</strong>le medii, şi `D` şi `d` - mo<strong>de</strong>le <strong>de</strong>nse - fiecare dintre ele relativ la primul<br />

atom al fragmentului şi respectiv la atomul referinţă exterior fragmentului, patru meto<strong>de</strong> <strong>de</strong><br />

fragmentare (FC): `m` - minimale, `M` - maximale, `D` - Szeged, `P` - Cluj pe căi, nouăsprezece<br />

modalităţi <strong>de</strong> suprapunere globală a interacţiunii fragmentelor (SF - formula <strong>de</strong> suprapunere): grupul<br />

<strong>de</strong> mărimi ( `m` - selectează cea mai mică valoare; `M` - cea mai mare valoare; `n` - cea mai mică<br />

valoare absolută; `N` - cea mai mare valoare absolută); grupul <strong>de</strong> medii ( `S` - suma; `A` - media<br />

aritmetică după numărul <strong>de</strong> proprietăţi <strong>de</strong> fragmente; `a` - media aritmetică după numărul <strong>de</strong><br />

fragmente; `B` - media aritmetică după numărul <strong>de</strong> atomi; `b` - media aritmetică după numărul <strong>de</strong><br />

legături); grupul geometric (`P` - multiplicare; `G` - medie geometrică după numărul <strong>de</strong> proprietăţi<br />

<strong>de</strong> fragmente; `g` - medie geometrică după numărul <strong>de</strong> fragmente; `F` - medie geometrică după<br />

numărul <strong>de</strong> atomi; `f`` - media geometrică după numărul <strong>de</strong> legături); grupul armonic (`s` - suma<br />

armonică; `H` - medie armonică după numărul <strong>de</strong> proprietăţi <strong>de</strong> fragmente; `h` - medie armonică<br />

după numărul <strong>de</strong> fragmente; `I` - medie armonică după numărul <strong>de</strong> atomi; `i` - media armonică<br />

după numărul <strong>de</strong> legături), şi şase operatori <strong>de</strong> linearizare (LO): `I` - i<strong>de</strong>ntitate (f(x)=x), `i` - inversa<br />

(f(x)=1/x), `A` - valoare absolută (f(x)=|x|), `a` - inversul valorii absolute (f(x)=1/|x|), `L` - logaritm<br />

(f(x)=ln(x)), şi `l` - logaritmul valorii absolute (f(x)=ln(|x|)).<br />

Astfel, familia MDF este constituită dintr-un număr <strong>de</strong> membrii egal cu înmulţirea tuturor<br />

posibilităţilor <strong>de</strong> alegere <strong>de</strong> mai sus (2·6·6·24·4·19·6 = 787968), astfel:<br />

÷ MDF = DM×AP×ID×IM×FC×SM×LO<br />

÷ DM = {t, g};<br />

÷ AP = {C, H, M, E, G, Q};<br />

÷ PD = {d, 1/d, p1, 1/p1, p1p2, 1/p1p2, √p1p2, 1/√p1p2, p1d, 1/p1d, p1p2d, 1/p1p2d, d√p1p2, 1/d√p1p2,<br />

p1/d, p1/d2, p1 2 /d, p1p2/d, p1 2 /d 2 , p1p2/d 2 , p1 2 /d 3 , p1p2/d 3 , p1 2 /d 4 , p1p2/d 4 };<br />

÷ IM = {r, R, m, M, d, D}<br />

÷ FC = {m, M, D, P};<br />

÷ SF = {m, M, n, N, S, A, a, B, b, P, G, g, F, f, s, H, h, I, i};<br />

÷ LO = {I, i, A, a, L, l}.<br />

220


MDFV (Jäntschi şi Bolboacă, 2008) este o metodă bazată pe vârfuri în locul perechilor <strong>de</strong><br />

vârfuri, în care sunt implementate două valori pentru operatorul <strong>de</strong> distanţă (DO), şapte proprietăţi<br />

atomice (AP), cincizeci şi opt <strong>de</strong> <strong>de</strong>scriptori <strong>de</strong> interacţiune (ID), şapte meto<strong>de</strong> <strong>de</strong> suprapunere la<br />

nivel <strong>de</strong> fragment (SF) şi la nivel <strong>de</strong> moleculă (SM), zece tipuri <strong>de</strong> interacţiune (IT), două unităţi <strong>de</strong><br />

exprimare (EU - unitate <strong>de</strong> <strong>de</strong>scriptor molecular `D` şi unitate <strong>de</strong> distanţă (coordonată centru)<br />

<strong>de</strong>scriptor molecular `d`), şi trei operatori <strong>de</strong> linearizare (LO: I - i<strong>de</strong>ntitate, R - reciproc, L -<br />

logaritm).<br />

Astfel, familia MDF este constituită dintr-un număr <strong>de</strong> membrii egal cu înmulţirea tuturor<br />

posibilităţilor <strong>de</strong> alegere <strong>de</strong> mai sus (2·7·58·7·7·10·2·3 = 2387280), astfel:<br />

÷ MDFV = DO×AP×ID×SF×SM×IT×EU×LO;<br />

÷ DO = {T, G};<br />

÷ AP = {C, H, M, E, Q, L, A};<br />

÷ ID = {J, j, O, o, P, p, Q, q, R, r, K, k, L, l, M, m, N, n, W, w, X, x, Y, y, Z, z, S, s, T, t, U, u, V,<br />

v, F, f, G, g, H, h, I, i, A, a, B, b, C, c, D, d, 0, 1, 2, 3, 4, 5, 6, 7};<br />

÷ SF = {A, a, I, i, F, P, C};<br />

÷ SM = {A, a, I, i, F, P, C};<br />

÷ IT = {f, F, c, C, p, P, a, A, i, I};<br />

÷ EU = {D, d};<br />

÷ LO = {I, R, L}<br />

Obţinerea unei ecuaţii qSPAR cu membrii ai unei familii <strong>de</strong> <strong>de</strong>scriptori este o problemă simplă<br />

atunci când se caută regresii liniare simple, tot ceea ce trebuie făcut rezumându-se la calcularea<br />

valorilor pentru fiecare membru al familiei şi efectuarea regresiei liniare între valorile acestuia<br />

pentru fiecare moleculă în parte şi valorile măsurate ale proprietăţii/activităţii observate.<br />

Problema regresiei liniare multiple cu doi membrii ai unei familii <strong>de</strong> <strong>de</strong>scriptori este o problemă<br />

relativ simplă, când trebuie să se caute care este cea mai bună ecuaţie <strong>de</strong> regresie ce conţine o<br />

pereche <strong>de</strong> <strong>de</strong>scriptori moleculari. Complexitatea problemei însă începe să apară, numărul <strong>de</strong><br />

combinaţii din spaţiul <strong>de</strong> căutare fiind <strong>de</strong>ja aici semnificativ pentru o căutare sistematică <strong>de</strong> fiecare<br />

cu fiecare (presupunând că toţi <strong>de</strong>scriptorii sunt valizi, numărul total <strong>de</strong> combinaţii este <strong>de</strong> 1.1·10 9<br />

pentru FPIF, 3.1·10 11 pentru MDF, şi 2.8·10 12 pentru MDFV).<br />

Începând cu trei <strong>de</strong>scriptori şi continuând cu valorile superioare ale acestuia problema regresiei<br />

liniare multiple cu membrii ai unei familii <strong>de</strong> <strong>de</strong>scriptori este o problemă dificilă, spaţiul <strong>de</strong> căutare<br />

crescând exponenţial cu numărul <strong>de</strong> <strong>de</strong>scriptori implicaţi în regresie multiplă şi timpul <strong>de</strong> execuţie<br />

ieşind din timpul real.<br />

Implementarea şi utilizarea unui algoritm genetic conferă avantajul unei căutări euristice în locul<br />

unei căutări sistematice care ar implica explorarea întregului număr <strong>de</strong> posibilităţi <strong>de</strong> combinare a<br />

<strong>de</strong>scriptorilor pentru a forma ecuaţia <strong>de</strong> regresie liniară.<br />

Construcţia unui <strong>de</strong>scriptor membru al unei familii <strong>de</strong> <strong>de</strong>scriptori poate fi privită ca execuţia unui<br />

cod genetic <strong>de</strong>finit <strong>de</strong> numele <strong>de</strong>scriptorului (FPIF = IM×DM×AP×PD×FC×SM×MI×LO; MDF =<br />

DM×AP×ID×IM×FC×SM×LO; MDFV = DO×AP×ID×SF×SM×IT×EU×LO) ceea ce înseamnă că familia <strong>de</strong><br />

<strong>de</strong>scriptori <strong>de</strong>fineşte materialul genetic al populaţiei, în timp ce valorile pe care le capătă un<br />

<strong>de</strong>scriptor pentru setul <strong>de</strong> molecule investigat <strong>de</strong>fineşte un individ al populaţiei.<br />

Tăria (scorul) unui individ se asociază cu performanţa acestuia într-o ecuaţie qSPAR care îl conţine,<br />

şi obiectivul evoluţiei este obţinerea unei cât mai bune ecuaţii <strong>de</strong> regresie.<br />

Obiectivul căutării <strong>de</strong>vine astfel găsirea submulţimii {Xi}1≤i≤n a mulţimii {Xi}1≤i≤N care asigură cea<br />

mai mare semnificaţie statistică pentru ecuaţia <strong>de</strong> regresie (1) sau (2) prin intermediul<br />

semnificaţiilor date <strong>de</strong> coeficientul <strong>de</strong> corelaţie (ecuaţia 5) fie prin intermediul semnificaţiei date <strong>de</strong><br />

valorile Stu<strong>de</strong>nt t (ecuaţia 17).<br />

40 41<br />

Fiecare genă [ ] codifică câte un operator folosit în construcţia cromozomului [ ] unui <strong>de</strong>scriptor<br />

[ 40 ] genă = una din valorile <strong>de</strong> pe coloana Gene a Tabelului 36; ex. IM pentru FPIF<br />

[ 41 ] cromozom = secvenţa <strong>de</strong> gene a unei familii în Tabelul 36; ex. DMAPIDIMFCSMLO pentru MDF<br />

221


molecular. Fiecare <strong>de</strong>scriptor al unei familii <strong>de</strong> <strong>de</strong>scriptori este un genotip [ 42 ] şi toţi împreună<br />

constituie materialul genetic [ 43 ] al familiei respective.<br />

Spaţiul <strong>de</strong> căutare al familiilor <strong>de</strong> <strong>de</strong>scriptori moleculari<br />

Familie Gene Genom<br />

FPIF<br />

(©2000)<br />

MDF<br />

(©2005)<br />

MDFV<br />

(©2008)<br />

SAPF<br />

(©2009)<br />

IM R D<br />

DM T G<br />

AP M E C Q<br />

PD __p__ __d__ _1/p_ _1/d_ _p*d_ _p/d_ _p/d2 p2/d2<br />

FC si se ji je fi fe<br />

SM S P A G H<br />

MI P_ P2 E_ E2<br />

LO I R L<br />

DM t g<br />

AP C H M E G Q<br />

ID D d O o P p Q q J j K k L l V E W w F f S s T t<br />

IM r R m M d D<br />

FC m M D P<br />

SM m M n N S A a B b P G g F f s H h I i<br />

LO I i A a L l<br />

DO T G<br />

AP C H M E Q L A<br />

ID<br />

J j O o P p Q q R r K k L l M m N n W w X x Y y Z z S s T<br />

t U u V v F f G g H h I i A a B b C c D d 0 1 2 3 4 5 6 7<br />

SF A a I i F P C<br />

SM A a I i F P C<br />

IT f F c C p P a A i I<br />

EU D d<br />

LO I R L<br />

CF D P C<br />

DO T G<br />

AP C H M E A<br />

DP I E H G A Q S<br />

PP I E H G A Q S<br />

OM S M<br />

MP I E H G A Q S<br />

LO I A S T Q R L<br />

Numărul <strong>de</strong> valori pe care le codifică fiecare genă variază <strong>de</strong> la 2 valori (în cazul genei ce codifică<br />

tipul <strong>de</strong> metrică <strong>de</strong> distanţă - topologică şi geometrică - DM pentru FPIF şi MDF şi DO pentru<br />

MDFV şi SAPF) până la 58 <strong>de</strong> valori în cazul <strong>de</strong>scriptorului <strong>de</strong> interacţiune ID al familiei MDFV.<br />

Volumul materialului genetic variază şi Tabelul 37 sumarizează aceste variaţii:<br />

Volumele familiilor <strong>de</strong> <strong>de</strong>scriptori moleculari<br />

Familie Gene Volum (N)<br />

FPIF (©2000) IM:2 DM:2 AP:4 PD:8 FC:6 SM:5 MI:4 LO:3 46080<br />

MDF (©2005) DM:2 AP:6 ID:6 IM:24 FC:4 SM:19 LO:6 787968<br />

MDFV (©2008) DO:2 AP:7 ID:58 SF:7 SM:7 IT:10 EU:2 LO:3 2387280<br />

[ 42 ] genotip = o concretizare posibilă a valorilor fiecărei gene a unui cromozom; ex. TCJtAAfDI pentru MDFV<br />

[ 43 ] material genetic = mulţimea tuturor combinaţiilor posibile <strong>de</strong> valori <strong>de</strong> pe coloana Genom în tabelul 36; ex. {D, P,<br />

C} × {T,G} × {C,H,M,E,A} × {I,E,H,G,A,Q,S} × {S,M} × {I,E,H,G,A,Q,S} × {I,E,H,G,A,Q,S} × {I,A,S,T,Q,R,L}<br />

pentru SAPF<br />

222


SAPF (©2009) CF:3 DO:2 AP:5 DP:6 PP:6 OM:2 MP:6 LO:6 77760<br />

Mărimea spaţiului <strong>de</strong> căutare (VS) se calculează în funcţie <strong>de</strong> volumul familiei <strong>de</strong> <strong>de</strong>scriptori<br />

moleculari (N) şi ordinul <strong>de</strong> multiplicitate al regresiei multiple (`n`) cu formula:<br />

n N − j+<br />

1 ⎛ N⎞<br />

VS<br />

= ∏ = ⎜ ⎟<br />

(20)<br />

j=<br />

1 j ⎝ n ⎠<br />

Volumul spaţiului <strong>de</strong> căutare dat <strong>de</strong> ecuaţia (20) permite exprimarea complexităţii calcului necesar<br />

pentru a parcurge întreg spaţiul <strong>de</strong> căutare, această valoare fiind dublată <strong>de</strong>oarece căutarea se poate<br />

face pe baza ecuaţiei (1) sau ecuaţiei (2), ecuaţii care folosesc expresii diferite <strong>de</strong> calcul al<br />

parametrilor ecuaţiei <strong>de</strong> regresie.<br />

Metodologia algoritmilor genetici presupune prelevarea iniţială (întâmplător sau <strong>de</strong>terministic) a<br />

unui eşantion [ 44 ] <strong>de</strong> cromozomi din materialul genetic format dintr-un şir <strong>de</strong> <strong>de</strong>scriptori X1, ..., Xp<br />

45 46<br />

care este supus procesului <strong>de</strong> evoluţie [<br />

] în cultivar [ ]. Algoritmul genetic [ 47 ] operează astfel<br />

asupra eşantionului care suferă modificări în fiecare generaţie [ 48 ]. Fiecare mulţime <strong>de</strong> `n`<br />

<strong>de</strong>scriptori distincţi reprezintă un punct în spaţiul <strong>de</strong> căutare [<br />

ilă [ ].<br />

49 ] şi în acelaşi timp o soluţie<br />

50<br />

posib<br />

Operatorii <strong>de</strong> bază ai unui algoritm genetic sunt încrucişarea şi mutaţia cromozomilor. Încrucişarea<br />

[ 51 ] a două genotipuri presupune alegerea unei porţiuni <strong>de</strong> încrucişat <strong>de</strong>-a lungul şirului <strong>de</strong> gene<br />

(întâmplător sau <strong>de</strong>terministic) şi valorile celor două porţiuni <strong>de</strong> şiruri sunt schimbate între ele, când<br />

rezultă doi <strong>de</strong>scen<strong>de</strong>nţi. Mutaţia [ 52 ] unui genotip presupune modificarea unei valori a unei gene a<br />

cromozomului cu o altă valoare din lista valorilor posibile pentru gena respectivă. Rezultatul<br />

încrucişării şi al mutaţiei este obţinerea <strong>de</strong> <strong>de</strong>scen<strong>de</strong>nţi [ 53 ] sau fii.<br />

··· ··· ···<br />

site încrucişare părinţi<br />

··· ··· ···<br />

recombinare fii<br />

··· ··· ···<br />

··· ··· ···<br />

··· ··· părinte<br />

mutaţie<br />

genă supusă mutaţiei<br />

genă mutantă<br />

··· ··· fiu<br />

Încrucişare Mutaţie<br />

Selecţia [ 54 ] genotipurilor este operaţia prealabilă necesară încrucişării şi mutaţiei şi se face pe baza<br />

unui scor <strong>de</strong> selecţie [ 55 ]. Cel puţin o parte a <strong>de</strong>scen<strong>de</strong>nţilor reprezintă <strong>de</strong>scriptori viabili [ 56 ] putând<br />

[ 44 ] eşantion = submulţime a materialului genetic al familiei <strong>de</strong> <strong>de</strong>scriptori moleculari; ex. {DTCIISII, DTCIESII,<br />

DTCGISII} reprezintă un eşantion <strong>de</strong> volum 3 al materialului genetic al SAPF<br />

[ 45 ] evoluţie = proces genetic complex care implică procese <strong>de</strong> selecţie, încrucişare şi mutaţie<br />

[ 46 ] cultivar = spaţiu (<strong>de</strong> memorie, virtual) în care genotipurile sunt transformate în fenotipuri prin aplicarea operatorilor<br />

<strong>de</strong>finiţi <strong>de</strong> valorile genelor pentru întreg setul <strong>de</strong> `m` molecule supus studiului; fenotipul asociat genotipului este astfel<br />

un şir <strong>de</strong> `m` valori numerice (câte una pentru fiecare moleculă a setului)<br />

[ 47 ] algoritm genetic = algoritm care <strong>de</strong>scrie prin instrucţiuni procesul <strong>de</strong> evoluţie asupra eşantionului<br />

[ 48 ] generaţie = una din iteraţiile algoritmului genetic<br />

[ 49 ] spaţiul <strong>de</strong> căutare = mulţimea posibilităţilor <strong>de</strong> selecţie a `n` <strong>de</strong>scriptori din `VS` posibilităţi (relaţia 20)<br />

[ 50 ] soluţie posibilă = o ecuaţie <strong>de</strong> regresie cu `n` <strong>de</strong>scriptori distincţi <strong>de</strong>finită <strong>de</strong> relaţia (1) sau (2)<br />

[ 51 ] încrucişarea = procesul prin care o porţiune a materialului genetic al unui cromozom este înlocuită <strong>de</strong> porţiunea<br />

corespunzătoare a altui cromozom şi viceversa; încrucişarea este făcută în speranţa că dacă se recombină porţiuni <strong>de</strong><br />

genotipuri <strong>de</strong> succes, atunci acest proces este probabil să producă <strong>de</strong>scen<strong>de</strong>nţi chiar mai buni <strong>de</strong>cât părinţii din care<br />

provin<br />

[ 52 ] Mutaţie = operatorul care introduce modificări noi (inexistente în eşantionul unei generaţii); ceea ce este<br />

caracteristic în general mutaţiei şi implicit şi operatorului acesteia corespon<strong>de</strong>nt în algoritmii genetici este că ea se<br />

petrece cu o probabilitate scăzută, fiind <strong>de</strong>ci aplicată cu o probabilitate scăzută<br />

[ 53 ] Descen<strong>de</strong>nţi = genotipurile obţinute din încrucişarea şi eventual mutaţia indivizilor din eşantion<br />

[ 54 ] Selecţie = operatorul cu ajutorul căruia se extrage din eşantion mai mulţi indivizi care participă la înmulţire<br />

[ 55 ] Scor <strong>de</strong> selecţie = valoare numerică asociată individului din eşantion calculată pe baza (sau exprimată din) tăriei<br />

fenotipului în cultivar<br />

223


face atunci parte din soluţii candidate ale generaţiilor următoare. Descen<strong>de</strong>nţii viabili înlocuiesc o<br />

parte corespunzătoare a indivizilor din eşantion în urma unui proces <strong>de</strong> supravieţuire [ 57 ] aplicat<br />

indivizilor din eşantion pe baza unui scor <strong>de</strong> supravieţuire [ 58 ]. Un alt parametru al algoritmului<br />

59 60<br />

genetic îl reprezintă obiectivul evoluţiei [ ] care este urmărit pe baza unei funcţii obiectiv [ ].<br />

Urmărirea obiectivului evoluţiei se face odată la fiecare generaţie selectând din eşantion acei<br />

indivizi care maximizează sau, după caz minimizează valoarea funcţiei obiectiv (acei indivizi care<br />

fac parte din cea mai bună ecuaţie <strong>de</strong> regresie obţinută pe baza indivizilor din cultivar). Se poate<br />

opta ca indivizii care ating obiectivul evoluţiei într-o generaţie să fie păstraţi în eşantion, caz în care<br />

acestora nu li se mai aplică procesul <strong>de</strong> supravieţuire, ei fiind automat incluşi în eşantionul<br />

generaţiei următoare.<br />

Aşa cum rezultă din aplicarea procesului <strong>de</strong> supravieţuire, nu toţi indivizii unei generaţii<br />

supravieţuiesc şi sunt incluşi în generaţia următoare. Motivul acestui fapt este păstrarea unui număr<br />

constant <strong>de</strong> genotipuri în eşantionul <strong>de</strong>zvoltat în cultivar, astfel încât numărul <strong>de</strong> indivizi înlocuiţi<br />

din eşantion este egal cu numărul <strong>de</strong> <strong>de</strong>scen<strong>de</strong>nţi viabili obţinuţi în urma selecţiei, încrucişării şi<br />

mutaţiei.<br />

Selecţia şi supravieţuirea având la bază scorurile <strong>de</strong> selecţie şi <strong>de</strong> supravieţuire se realizează<br />

folosind o modalitate <strong>de</strong> selecţie şi supravieţuire [ 61 ]. Tabelul următor redă modalităţile <strong>de</strong> selecţie<br />

şi supravieţuire folosite.<br />

Selecţie (şi supravieţuire) în algoritmii genetici<br />

Metodă Expresia funcţiei <strong>de</strong> scor Selecţie Comentarii<br />

Proporţional pi=fi/Σifi Şansa <strong>de</strong> selecţie este proporţională cu<br />

scorul (utilizând probabilitatea pi în<br />

selecţie)<br />

Deterministic i | fi = max. Selecţia indivizilor este făcută pe baza celui<br />

fi=Fitness(Cromozom_i) sau min. mai tare (sau celui mai slab) individ<br />

(elitism)<br />

Turnir (fi,fj) Perechi <strong>de</strong> indivizi concurează între ei<br />

max. sau pentru selecţie (din nou este selectat cel<br />

min. mai tare sau cel mai slab)<br />

Normalizare gi=(fi-N0)(fmax.-fmin.)/(N1- pi=gi/Σigi O scală fixă [N0,N1] normalizează scorul<br />

[ 56 ] Viabilitatea (unui <strong>de</strong>scriptor molecular) = referă potenţialul acestuia <strong>de</strong> a fi folosit în regresii; un <strong>de</strong>scriptor este<br />

viabil dacă (ceea ce urmează referă fenotipul acestuia, viabilitatea referind astfel manifestarea fenotipică) cel puţin are<br />

valori reale şi finite pentru toate moleculele din set şi nu are toate valorile i<strong>de</strong>ntice; suplimentar i se pot impune şi alte<br />

condiţii, cum ar fi o variabilitate rezonabilă (prin intermediul unui coeficientul <strong>de</strong> variaţie), o abatere <strong>de</strong> la normalitate<br />

rezonabilă (prin intermediul unui test <strong>de</strong> normalitate cum este Jarque-Bera) şi o capacitate <strong>de</strong> explicare a proprietăţii<br />

măsurate rezonabilă (prin intermediul coeficientului <strong>de</strong> <strong>de</strong>terminare din regresia liniară simplă cu proprietatea<br />

măsurată).<br />

[ 57 ] Supravieţuire = operatorul cu ajutorul căruia se extrage din eşantion mai mulţi indivizi care vor fi înlocuiţi în<br />

eşantion <strong>de</strong> către <strong>de</strong>scen<strong>de</strong>nţi<br />

[ 58 ] Scor <strong>de</strong> supravieţuire = valoare numerică asociată individului din eşantion care poate fi o valoare obţinută atât pe<br />

baza caracteristicilor genotipice ale individului (asociind o măsură a similarităţii acestuia cu alte genotipuri din cultivar<br />

în scopul menţinerii diversităţii materialului genetic) cât şi pe baza trăsăturilor fenotipice ale individului (asociind o<br />

măsură a similarităţii acestuia cu alte fenotipuri din cultivar în scopul menţinerii diversităţii fenotipice)<br />

[ 59 ] Obiectivul evoluţiei = parametrul sau caracteristica (unei ecuaţii <strong>de</strong> regresie) care constituie subiectul optimizării<br />

(minimizare - ex. suma pătratelor diferenţelor între (erorilor) valoarea măsurată şi cea explicată <strong>de</strong> mo<strong>de</strong>l; maximizare -<br />

ex. coeficientul <strong>de</strong> <strong>de</strong>terminare)<br />

[ 60 ] Funcţia obiectiv = algoritmul (procedura) <strong>de</strong> calcul al parametrului sau caracteristicii ce constituie obiectivul<br />

evoluţiei eşantionului.<br />

[ 61 ] modalitate <strong>de</strong> selecţie şi modalitate <strong>de</strong> supravieţuire = metodă <strong>de</strong> extragere a unui individ din eşantion ce foloseşte<br />

drept parametru valorile scorurilor (<strong>de</strong> selecţie şi respectiv <strong>de</strong> supravieţuire) ale indivizilor ce compun eşantionul; ceea<br />

ce Tabelul 38 prezintă în mod formal exprimă faptul că se folosesc trei alternative <strong>de</strong> selecţie (proporţional,<br />

<strong>de</strong>terministic şi turnir) care se pot aplica valorilor scorurilor sau rangurilor scorurilor (când selecţia e bazată pe valorile<br />

rangurilor în locul valorilor scorurilor); <strong>de</strong> asemenea, valoarea scorului poate fi supusă unui proces <strong>de</strong> normalizare care<br />

corectează (ajustează relativ) scorurile indivizilor din cultivar în raport cu două valori (una <strong>de</strong> minim şi alta <strong>de</strong> maxim)<br />

care se actualizează global în fiecare generaţie pe parcursul întregii evoluţii a eşantionului în cultivar<br />

224


N0) fenotipurilor între generaţii diferite<br />

Ranguri hi=Rank(fi)(fmax.-fmin.)/Size pi=hi/Σihi Şansa este proporţională cu rangul scorului<br />

un<strong>de</strong>: Rank(·): rangul; Size: volum genom<br />

Următoarele remarci cu privire la utilizarea unui algoritm genetic <strong>de</strong>finesc cadrul <strong>de</strong> operare al<br />

acestuia:<br />

÷ Utilizând doar selecţia nu va reuşi <strong>de</strong>cât să copieze (cloneze) cel mai bun individ al său în<br />

întregul eşantion;<br />

÷ Utilizând doar mutaţia nu va reuşi <strong>de</strong>cât să parcurgă întâmplător spaţiul <strong>de</strong> căutare;<br />

÷ Utilizând doar selecţia urmată <strong>de</strong> încrucişare va reuşi să conveargă către o soluţie bună (un<br />

optim local) dar nu sub-optimală (în apropierea celei optime);<br />

÷ Utilizând doar selecţia urmată <strong>de</strong> mutaţie se creează algoritmi paraleli, toleranţi la perturbaţii în<br />

căutarea <strong>de</strong> punctelor <strong>de</strong> maxim local (în terminologia în engleză: hill-climbing);<br />

÷ Utilizarea selecţiei urmate <strong>de</strong> mutaţie şi încrucişare asigură toate caracteristicile <strong>de</strong> <strong>de</strong>finire ale<br />

unui algoritm genetic;<br />

Se poate verifica că ecuaţia (20) <strong>de</strong>fineşte o problemă dificilă [ ]. Astfel, reprezentând grafic<br />

ecuaţia (20) pentru diferite valori ale volumului familiei <strong>de</strong> <strong>de</strong>scriptori moleculari (`N`) date în<br />

Tabelul 37 şi pentru diferite ordine <strong>de</strong> multiplicitate (`n`) se obţin reprezentările <strong>de</strong> mai jos care<br />

susţin faptul că ecuaţia (20) <strong>de</strong>fineşte o problemă dificilă.<br />

1.E+40<br />

1.E+35<br />

1.E+30<br />

1.E+25<br />

1.E+20<br />

1.E+15<br />

1.E+10<br />

1.E+05<br />

1.E+00<br />

VS = VS(46080(FPIF),n)<br />

y = 18.844e 8.8472n<br />

R 2 = 0.9995<br />

1 2 3 4 5 6 7 8 9 10<br />

2.E+18<br />

1.E+18<br />

0.E+00<br />

62<br />

VS = VS(N,3)<br />

y = 0.166N 3<br />

R 2 = 1<br />

0.E+00 1.E+06 2.E+06<br />

Complexitatea exponenţială a regresiilor multiple cu familii <strong>de</strong> <strong>de</strong>scriptori moleculari<br />

Pentru a rezolva o problemă dificilă un algoritm genetic generează întâmplător (sau iniţiază cu<br />

valori pre<strong>de</strong>finite) un eşantion <strong>de</strong> un volum dat <strong>de</strong> genotipuri (volum ce va fi păstrat constant pe<br />

toată durata evoluţiei).<br />

Algoritmul genetic evoluează astfel:<br />

÷ Repetă<br />

Pasul_1: Utilizând operatorul <strong>de</strong> selecţie selectează perechi <strong>de</strong> cromozomi;<br />

Pasul_2: Calculează scorul <strong>de</strong> selecţie al genotipurilor; calculează scorul <strong>de</strong><br />

supravieţuire al genotipurilor; calculează funcţia obiectiv a fenotipurilor şi obţine grupul<br />

<strong>de</strong>scriptorilor din eşantion ce întrunesc obiectivul în generaţie şi eventual inclu<strong>de</strong> în<br />

generaţia următoare automat genotipurile din acest grup;<br />

Pasul_3: Cu o mică probabilitate şi utilizând o funcţie discretă <strong>de</strong> probabilitate uniformă<br />

alege porţiunea <strong>de</strong> mutat şi mută genotipurile selectate (părinţi);<br />

Pasul_4: Utilizând o funcţie discretă <strong>de</strong> probabilitate uniformă alege porţiunea <strong>de</strong><br />

încrucişat şi produce <strong>de</strong>scen<strong>de</strong>nţi ai acestora (<strong>de</strong>scen<strong>de</strong>nţi);<br />

Pasul_5: Cu o mică probabilitate şi utilizând o funcţie discretă <strong>de</strong> probabilitate uniformă<br />

alege porţiunea <strong>de</strong> mutat şi mută genotipurile <strong>de</strong>scen<strong>de</strong>nţilor (fii);<br />

Pasul_6: Utilizând operatorul <strong>de</strong> supravieţuire înlocuieşte o parte din părinţi cu fii;<br />

[ 62 ] problemă dificilă = problemă a cărei rezolvare <strong>de</strong> către cel mai bun algoritm (care ar putea fi imaginat) necesită un<br />

timp <strong>de</strong> execuţie care creşte exponenţial în funcţie <strong>de</strong> volumul datelor problemei (şi în acelaşi timp <strong>de</strong> intrare ale<br />

algoritmului); <strong>de</strong>numirea <strong>de</strong> probleme dificile vine <strong>de</strong> la faptul că <strong>de</strong>oarece chiar şi cel mai bun algoritm (care ar putea<br />

fi imaginat) va fi probabil ineficient pe date <strong>de</strong> intrare reale (din practică)<br />

225


÷ Până când (condiţie care reprezintă condiţia <strong>de</strong> sfârşit a algoritmului)<br />

Se satisface o condiţie impusă cu privire la valoarea funcţiei obiectiv (atinge o valoare<br />

impusă) sau se realizează un număr dat <strong>de</strong> iteraţii (evoluţii).<br />

t+1<br />

cel mai bun fenotip<br />

selecţie<br />

scor<br />

t+1<br />

scor<br />

Ilustrarea unui algoritm genetic<br />

În implementarea algoritmului s-a ţinut seama <strong>de</strong> următoarele consi<strong>de</strong>rente:<br />

÷ Calculele necesare pentru obţinerea valorilor unui <strong>de</strong>scriptor molecular sunt complexe,<br />

implicând fragmentarea grafului molecular, calcularea distanţelor topologice şi geometrice în<br />

moleculă, aplicare <strong>de</strong> mo<strong>de</strong>le <strong>de</strong> suprapunere a interacţiunilor, fiecare necesitând un timp <strong>de</strong><br />

execuţie şi o memorie <strong>de</strong> lucru consi<strong>de</strong>rabile, astfel încât populaţia <strong>de</strong> <strong>de</strong>scriptori trebuie<br />

generată şi stocată în prealabil execuţiei algoritmului genetic; este stocată într-o bază <strong>de</strong> date<br />

pentru MDF şi MDFV; este stocată în fişiere text cu format impus pentru FPIF şi SAPF.<br />

÷ Volumul <strong>de</strong> informaţie al populaţiei <strong>de</strong> <strong>de</strong>scriptori este consi<strong>de</strong>rabil (ex. tabela<br />

`PCB_lkow_tmpx` care stochează a şasea parte din <strong>de</strong>scriptorii MDF (131328) calculaţi pentru<br />

206 PCBs - din totalul <strong>de</strong> 209 - pentru care există măsurat în aceleaşi condiţii experimentale<br />

coeficientul <strong>de</strong> partiţie octanol-apă ocupă peste 200Mb - atât în stocare fizică pe disc cât şi în<br />

memoria internă) astfel încât manipularea acestui volum <strong>de</strong> informaţie ridică serioase provocări<br />

<strong>de</strong> optimizare a memoriei <strong>de</strong> lucru şi vitezei <strong>de</strong> calcul; alegerea mediului <strong>de</strong> programare a ţinut<br />

seama <strong>de</strong> aceste consi<strong>de</strong>rente; s-a ales drept mediu <strong>de</strong> implementare FreePascal [ 63 ] un mediu <strong>de</strong><br />

programare freeware multi-platformă bazat pe limbajul Pascal, recunoscut pentru viteza <strong>de</strong><br />

calcul şi economia <strong>de</strong> memorie.<br />

÷ Întrucât evoluţia algoritmului genetic se doreşte a fi rapidă, accesul şi interogarea repetată a<br />

bazei <strong>de</strong> date pentru obţinerea valorilor unui <strong>de</strong>scriptor molecular la moleculele din setul <strong>de</strong><br />

lucru încetineşte consi<strong>de</strong>rabil viteza <strong>de</strong> lucru, astfel încât soluţia aleasă a fost stocarea în<br />

memoria internă a imaginii bazei <strong>de</strong> date, cu cost suplimentar în ceea ce priveşte memoria <strong>de</strong><br />

lucru, dar cu câştig <strong>de</strong>osebit în ceea ce priveşte viteza <strong>de</strong> lucru.<br />

÷ Nu toţi <strong>de</strong>scriptorii din familie (una dintre FPIF, MDF, MDFV sau SAPF) întrunesc condiţiile<br />

reale <strong>de</strong> existenţă (să aibă valori reale şi finite pentru toate moleculele din setul consi<strong>de</strong>rat; să nu<br />

aibă valori banale - i<strong>de</strong>ntice pentru toate moleculele din set); mai mult, impunerea <strong>de</strong> condiţii<br />

suplimentare cu privire la variabilitate, capacitate <strong>de</strong> explicare şi normalitate reduce şi mai mult<br />

setul <strong>de</strong> <strong>de</strong>scriptori candidaţi în regresii multiple pentru setul <strong>de</strong> molecule consi<strong>de</strong>rat; stocarea<br />

valorilor acestor <strong>de</strong>scriptori în memoria internă ar fi lipsită <strong>de</strong> sens, şi astfel s-a impus realizarea<br />

acestei selecţii în preambulul execuţiei efective a algoritmului genetic, introducând o variabilă<br />

care conţine două valori <strong>de</strong> a<strong>de</strong>văr (T/F) pentru validitatea <strong>de</strong>scriptorului molecular la setul <strong>de</strong><br />

molecule consi<strong>de</strong>rat; mai mult, practic stocarea unei fracţii din totalul <strong>de</strong>scriptorilor moleculari<br />

(fapt valabil pentru toate familiile <strong>de</strong> <strong>de</strong>scriptori) s-a făcut pe seama renunţării la o genă din<br />

secvenţa cromozomului familiei - operatorul <strong>de</strong> linearizare - fapt care însă trebuie compensat în<br />

execuţia algoritmului genetic; astfel s-au mai introdus un număr <strong>de</strong> variabile cu două valori <strong>de</strong><br />

[ 63 ] FreePascal, http://freepascal.org<br />

selecţie<br />

t<br />

încrucişare<br />

226<br />

t+1<br />

mutaţie


a<strong>de</strong>văr (T/F) pentru fiecare operator <strong>de</strong> linearizare (câte 6 pentru MDF şi SAPF şi câte 3 pentru<br />

FPIF şi MDFV), fiecare conţinând valoarea <strong>de</strong> a<strong>de</strong>văr a validităţii <strong>de</strong>scriptorului molecular<br />

respectiv în urma linearizării - numit în continuare fenotip; astfel, variabila globală <strong>de</strong>finită<br />

pentru fracţia <strong>de</strong> <strong>de</strong>scriptori stocată intern a căpătat o nouă semnificaţie, şi anume a<strong>de</strong>vărat (T)<br />

dacă cel puţin unul dintre fenotipurile sale este valid.<br />

÷ O serie <strong>de</strong> parametrii <strong>de</strong> statistică <strong>de</strong>scriptivă sunt esenţiali (şi implicaţi în mod repetat) pentru<br />

analiza <strong>de</strong> regresie (valori medii, momente) astfel încât s-a impus calcularea prealabilă a<br />

acestora pentru fenotipurile vali<strong>de</strong> incluse în eşantion.<br />

÷ Programul evolutiv [ 64 ] rezultat trebuie să fie gândit astfel încât să poată lucra cu oricare<br />

familie <strong>de</strong> <strong>de</strong>scriptori moleculari (incluzând <strong>de</strong>sigur cele 4 familii expuse mai sus - FPIF, MDF,<br />

MDFV, SAPF) şi să poată fi parametrizat; soluţia <strong>de</strong> implementare aleasă este crearea şi<br />

utilizarea <strong>de</strong> fişiere <strong>de</strong> configurare.<br />

Programul evolutiv foloseşte un fişier <strong>de</strong> configurare pentru conexiunea la baza <strong>de</strong> date ce<br />

stochează familia <strong>de</strong> <strong>de</strong>scriptori moleculari, conform schemei <strong>de</strong> mai jos:<br />

Staţie <strong>de</strong> lucru<br />

Server<br />

└ Program evolutiv<br />

└ Bază <strong>de</strong> date<br />

└ Tabelă măsurători experimentale<br />

└ Tabelă <strong>de</strong>scriptori moleculari<br />

Conexiunea la serverul ce stochează baza <strong>de</strong> date a familiei <strong>de</strong> <strong>de</strong>scriptori moleculari<br />

O conexiune la un server <strong>de</strong> baze <strong>de</strong> date impune protocoale <strong>de</strong> securitate. De asemenea execuţia<br />

efectivă a programului impune cunoaşterea numelui bazei <strong>de</strong> date şi a tabelelor, în ipoteza asumată<br />

că structura tabelelor este aceeaşi şi in<strong>de</strong>pen<strong>de</strong>ntă <strong>de</strong> familia <strong>de</strong> <strong>de</strong>scriptori moleculari şi setul <strong>de</strong><br />

molecule consi<strong>de</strong>rat.<br />

Astfel, fişierul <strong>de</strong> configurare <strong>de</strong>numit `c_galg.cfg` conţinutul redat în Tabelul 39 exemplificând<br />

pentru familia MDF, setul PCB.<br />

Programul implementat foloseşte o librărie dinamică (`mysql4.dll`) ce implementează protocoalele<br />

<strong>de</strong> securitate necesare (SHA256) pentru a se conecta la serverul ce conţine baza <strong>de</strong> date <strong>de</strong> interes<br />

folosind valorile date în fişierul <strong>de</strong> configurare pentru aprametrii `Host=`, `User=` şi `Pass=` astfel:<br />

se citeşte conţinutul fişierului <strong>de</strong> configurare cu procedura `g_mydb` (Algoritmul 1) şi se realizează<br />

conexiunea cu procedura `c_to` (Algoritmul 2).<br />

Structura fişierului <strong>de</strong> configurare `c_galg.cfg`<br />

Parametru Valoare Comentarii<br />

Host= 172.27.211.5 Adresa IP a serverului<br />

User= **** Numele şi parola utilizatorului cu drept <strong>de</strong> citire pe baza <strong>de</strong> date<br />

Pass= ******** ce conţine valorile <strong>de</strong>scriptorilor moleculari pentru setul <strong>de</strong><br />

molecule supus investigaţiei<br />

Mydb= MDFSARs Numele bazei <strong>de</strong> date<br />

TabE= PCB_lkow_data Numele tabelei conţinând datele experimentale<br />

TabM= PCB_lkow_tmpx Numele tabelei conţinând familia <strong>de</strong> <strong>de</strong>scriptori moleculari<br />

Algoritmul 1. Citirea fişierului <strong>de</strong> configurare `c_galg.cfg`<br />

Antet procedure g_mydb(var d:S0T);<br />

Procedură var f:text;i:I0T;<br />

begin<br />

SetLength(d,6);<br />

assign(f,mfi[0]);<br />

{$I-}reset(f);{$I+}<br />

if(ioresult0)then m_exit('Err cfg File '+mfi[0]+' N/A!');<br />

for i:=0 to 5 do g_finf(f,myc[i],d[i]);<br />

close(f);<br />

end;<br />

Date <strong>de</strong> Variabilele globale<br />

intrare ÷ mfi[0]=`c_galg.cfg`<br />

÷ myc[0..5]=(`Host`, `User`, `Pass`, `Mydb`, `TabE`, `TabM`)<br />

[ 64 ] program evolutiv = în accepţiunea generală este un program ce implementează un algoritm genetic<br />

227


Date <strong>de</strong><br />

ieşire<br />

d:array[0..5]of string;<br />

Algoritm ÷ Se alocă memorie pentru valorile ce urmează a fi citite din<br />

fişierul <strong>de</strong> configurare<br />

÷ Se verifică accesibilitatea fişierului <strong>de</strong> configurare; în caz<br />

afirmativ se <strong>de</strong>schi<strong>de</strong>, in caz contrar se produce ieşirea din<br />

program prin afişarea unui mesaj<br />

÷ Se citeşte fiecare valoare a parametrilor din fişier<br />

Algoritmul 2. Conexiunea la o bază <strong>de</strong> date MySQL<br />

Antet function c_to(var q:TMYSQL;var s:PMYSQL;var m:S0T):B_T;<br />

Procedură begin<br />

mysql_init(PMySQL(@q));<br />

s:=mysql_real_connect(PMysql(@q),pch(m[0]),pch(m[1]),pch(m[2]),nil,0,nil,0);<br />

if(s=Nil)then begin<br />

Writeln(st<strong>de</strong>rr,'NR MySQLd:',mysql_errno(@q),' ',mysql_error(@q));<br />

c_to:=FALSE;exit;<br />

end;<br />

if(mysql_select_db(s,pch(m[3]))


S5 String[255] Şir <strong>de</strong> maxim 255 caractere<br />

S9 String[99] Şir <strong>de</strong> maxim 99 caractere<br />

C8 array[0..12]of S3 Şir <strong>de</strong> 13 şiruri <strong>de</strong> 13 caractere<br />

S0T Array of S9 Şir (<strong>de</strong> număr variabil) <strong>de</strong> şiruri <strong>de</strong> maxim 9 caractere<br />

B1T Array of B0T Şir <strong>de</strong> numere întregi (max. 255)<br />

I1T Array of I0T Şir <strong>de</strong> numere întregi (max. 32767)<br />

L1T Array of L0T Şir <strong>de</strong> numere întregi (max. 2147483647)<br />

B2T Array of B1T Şir <strong>de</strong> şiruri <strong>de</strong> numere întregi (max. 255)<br />

R1T Array of R0T Şir <strong>de</strong> valori reale (Descriptor)<br />

R2T Array of R1T Şir <strong>de</strong> şiruri <strong>de</strong> valori reale (Familie)<br />

R3T Array of R2T Şir <strong>de</strong> şiruri <strong>de</strong> şiruri <strong>de</strong> valori reale (Clică)<br />

BAT Array of Array[0..6]of B_T Şir <strong>de</strong> (maxim) 7 şiruri <strong>de</strong> valori <strong>de</strong> a<strong>de</strong>văr<br />

Programul foloseşte o serie <strong>de</strong> constante globale (accesibile din orice secvenţă <strong>de</strong> program), care<br />

sunt redate în tabelul următor.<br />

Constante <strong>de</strong>finite în programul evolutiv `ga_v2_0p.exe`<br />

Constantă Expresie <strong>de</strong> <strong>de</strong>finire Comentarii<br />

mfi array[0..3]of S3=( 'c_galg.cfg', 'c_galg.cgt', 'c_galg.cga', Denumiri fişiere <strong>de</strong><br />

'c_galg.txt' )<br />

configurare<br />

mfo array[0..6]of S3=( {0}'cfg.txt', {1}'reg.txt', {2}'phe.txt', Denumiri fişiere <strong>de</strong> rezultate<br />

{3}'sam.txt', {4}'gen.txt', {5}'fit.txt', {6}'evo.txt' )<br />

myc array[0..5]of S3=( 'Host', 'User', 'Pass', 'Mydb', 'TabE',<br />

'TabM' )<br />

Denumiri parametrii <strong>de</strong><br />

configurare pentru baza <strong>de</strong><br />

date<br />

gda array[0..1]of S3=( 'Genes', 'Addre' ) Denumiri parametrii <strong>de</strong><br />

configurare ai codului<br />

genetic<br />

nys array[0..1]of S3=( 'No', 'Yes' ) Denumiri valori <strong>de</strong> a<strong>de</strong>văr<br />

sps C8=( 'r2', 'se', 'Mt', 'Hr', 'dr', 'me', 'dt', '', '', '', '', '', '' ) Denumiri funcţii obiectiv<br />

sos C8=( 'min', 'max', 'avg', '', '', '', '', '', '', '', '', '', '' ) Denumiri obiective<br />

sss C8=( 'proportional', '<strong>de</strong>terministic', 'tournament', '', '', '', Denumiri meto<strong>de</strong> <strong>de</strong> selecţie<br />

'', '', '', '', '', '', '' )<br />

şi supravieţuire<br />

ses C8=( 'nalive', 'r2_min', 'se_min', 'Mt_min', 'Hr_min', Denumiri funcţii <strong>de</strong> selecţie<br />

'r2_max', 'se_max', 'Mt_max', 'Hr_max', 'r2_avg',<br />

'se_avg', 'Mt_avg', 'Hr_avg' )<br />

sds C8=( 'm0', 'm1', 'm2', 'm3', 'm4', 'mx', 'my', 'v0', 'g1', 'g2', Denumiri parametrii statistici<br />

'jb', 'r1', 'r2' )<br />

<strong>de</strong>scriptivi<br />

col array[0..5]of Char=( 'I'{x}, 'A'{|x|}, 'l'{ln(x)}, Denumiri operatori <strong>de</strong><br />

'L'{ln(abs(x)}, 'i'{1/x}, 'a'{1/|x|} )<br />

linearizare<br />

max_real 1e90 Valoare reală maximă<br />

min_real 1e-90 Valoare nenulă minimă<br />

Programul evolutiv implementat (aflat în forma actuală - Martie 2009 - la a 3-a versiune a sa,<br />

stabilă) foloseşte o singură clasă (sau obiect) pentru toate datele şi operaţiile necesare algoritmului<br />

genetic. O serie <strong>de</strong> proceduri se află însă în exteriorul acestei clase (cum este cazul celor expuse în<br />

Algoritmul 1 şi Algoritmul 2), fiind prealabile procesului evolutiv şi având ca scop doar<br />

iniţializarea variabilelor necesare. Algoritmii exteriori clasei alţii <strong>de</strong>cât cei <strong>de</strong> mai sus sunt redaţi<br />

împreună în Algoritmi 3. Secvenţa <strong>de</strong> program principal este redată în Algoritm 4.<br />

Algoritmi 3. Alte operaţii cu baza <strong>de</strong> date şi fişiere <strong>de</strong> configurare<br />

Antet şi procedure g_finf(var f:Text;s:S9;var o:S9);var i:I0T;<br />

procedură begin<br />

readln(f,o);i:=pos('=',o);if(i=0)then m_exit('Err cfg VAR=VAL found:'+o);<br />

g_finf if(copy(o,1,i-1)s)then m_exit('Err cfg Exp '+s+'=VAL found:'+o);<br />

<strong>de</strong>lete(o,1,i);if(length(o)


Algoritm Verifică existenţa şi în caz <strong>de</strong> succes citeşte o linie din fişierul<br />

g_finf <strong>de</strong> configurare transmis ca parametru<br />

Antet şi procedure q_exe(var s:PMYSQL;Q:S5);<br />

procedură begin<br />

if(mysql_query(s,pch(Q))0)do begin if(j>99)then m_exit('MydB err-1');<br />

my_re s[j+1]:=b[i][j];j:=j+1;end;if(j=0)then s:='' else s[0]:=chr(j);<br />

val(s,r,j);if(j0)then m_exit('MydB err-2');my_re:=r;<br />

end;<br />

Algoritm Preia caracter cu caracter o valoare reală din baza <strong>de</strong> date şi o<br />

my_re converteşte la număr real în precizie extinsă<br />

Antet şi procedure p_y0(var r:PMYSQL_RES;var d:R1T;nm:L0T);var i:L0T;b:TMYSQL_ROW;<br />

procedură begin<br />

for i:=0 to nm do begin b:=mysql_fetch_row(r);d[i]:=my_re(b,0);end;<br />

p_y0 mysql_free_result(r);<br />

end;<br />

Algoritm Preia din baza <strong>de</strong> date şirul <strong>de</strong> valori experimentale pentru setul<br />

p_y0 <strong>de</strong> molecule<br />

Antet şi procedure p_xx(var r:PMYSQL_RES;var d:R2T;nm,ni:L0T);var j,i:L0T;b:TMYSQL_ROW;<br />

procedură begin<br />

for j:=0 to ni do begin b:=mysql_fetch_row(r);<br />

p_xx for i:=0 to nm do d[j][i]:=my_re(b,i);<br />

if(j mod 10000=0)then write(j div 1000,'K ');<br />

end;<br />

mysql_free_result(r);write(ni+1,' ');<br />

end;<br />

Algoritm Preia din baza <strong>de</strong> date matricea conţinând valorile <strong>de</strong>scriptorilor<br />

p_xx moleculari pentru setul <strong>de</strong> molecule<br />

Antet şi function pch(var s:S9):PChar;<br />

procedură begin<br />

if(s[length(s)]chr(0))then s:=s+chr(0);pch:=@s[1];<br />

pch end;<br />

Algoritm Converteşte un tip String (şir <strong>de</strong> caractere cu lungime fixă) la tip<br />

pch PChar (şir <strong>de</strong> caractere cu lungime variabilă)<br />

Antet şi procedure sch(var s:S9);<br />

procedură begin<br />

if(s[length(s)]=chr(0))then <strong>de</strong>lete(s,length(s),1);<br />

sch end;<br />

Algoritm Converteşte un tip PChar (şir <strong>de</strong> caractere cu lungime variabilă) la<br />

sch tip String (şir <strong>de</strong> caractere cu lungime fixă)<br />

Antet şi procedure m_exit(s:string[255]);<br />

procedură begin<br />

writeln(s);readln;halt;<br />

m_exit end;<br />

Algoritm Produce ieşirea din program prin afişarea unui mesaj <strong>de</strong> eroare<br />

m_exit<br />

Algoritm 4. Programul principal al aplicaţiei `ga_v2_0p.exe`<br />

Variabile qmysql:TMYSQL;sock:PMYSQL;recbuf:PMYSQL_RES;<br />

t:B_T;qr:QWord;qc:DWord;My_Data:S0T;MDF:SAR_Fam;<br />

Procedură begin g_mydb(My_Data);MDF.CF_Ge;<br />

repeat t:=c_to(qmysql,sock,My_Data);sleep(1500);until(t);<br />

q_exe(sock,'SELECT * FROM `'+My_Data[4]+'`');q_ret(sock,recbuf,qr,qc);<br />

with(MDF)do begin<br />

m0n:=qr;m1n:=m0n-1;SetLength(y_v,m0n);SetLength(x_v,i0n);<br />

for qc:=i1n downto 0 do SetLength(x_v[qc],m0n);p_y0(recbuf,y_v,m1n);<br />

end;<br />

write('n_pop=',MDF.i0n,' m0n=',MDF.m0n);write(' SELECT Y Ok. ');<br />

q_exe(sock,'SELECT * FROM `'+My_Data[5]+'`');<br />

q_ret(sock,recbuf,qr,qc);p_xx(recbuf,MDF.x_v,MDF.m1n,MDF.i1n);<br />

writeln('SELECT X''s Ok.');mysql_close(sock);<br />

with(MDF)do begin<br />

CF_Cu(My_Data);if(d_c>0)then DC0(My_Data);if(d_r+d_p+d_s+d_g+d_t+d_e>0)then D0;<br />

230


end;<br />

with(MDF)do<br />

repeat<br />

CF_Rs;SA_Frst;<br />

repeat<br />

FT_PH;FT_SA;SL_Fit;SL_Mak;SV_Fit;SV_Mak;<br />

if(d_t>0)then DF1;SA_Next;if(d_t>0)then DF2;<br />

until(e1i>e1n);<br />

if(d_c>0)then DC2;<br />

until(e0i>e0n);<br />

write('Done.');readln;<br />

end.<br />

Algoritm ÷ Citeşte fişierul <strong>de</strong> configurare al conexiunii la baza <strong>de</strong> date<br />

÷ Citeşte codul genetic al familiei <strong>de</strong> <strong>de</strong>scriptori moleculari<br />

÷ Alocă spaţiu <strong>de</strong> memorie pentru codul genetic<br />

÷ Construieşte tablouri <strong>de</strong> conversie adresă cod genetic<br />

÷ Conectează la baza <strong>de</strong> date şi selectează informaţia din tabela cu<br />

valori experimentale (ce dă şi numărul <strong>de</strong> molecule din set)<br />

÷ Alocă spaţiu <strong>de</strong> memorie pentru valorile experimentale şi valorile<br />

<strong>de</strong>scriptorilor familiei; citeşte valorile experimentale din baza<br />

<strong>de</strong> date<br />

÷ Afişează volumul populaţiei <strong>de</strong> <strong>de</strong>scriptori (pe baza calcului din<br />

codul genetic) şi numărul <strong>de</strong> molecule din set<br />

÷ Selectează şi citeşte valorile <strong>de</strong>scriptorilor pentru moleculele<br />

din set<br />

÷ Citeşte fişierul <strong>de</strong> configurare al cultivarului (`c_galg.cga`)<br />

÷ Creează fişierele <strong>de</strong> ieşire necesare (<strong>de</strong>finite mai sus)<br />

÷ Repetă<br />

o Iniţializează valorile <strong>de</strong> minim şi maxim global<br />

o Creează prima generaţie a evoluţiei<br />

o Repetă<br />

Construieşte fenotipurile; calculează parametrii <strong>de</strong><br />

statistică <strong>de</strong>scriptivă; face toate ecuaţiile <strong>de</strong><br />

regresie multiplă posibile cu fenotipuri din cultivar<br />

şi păstrează parametrii <strong>de</strong> regresie; cumulează<br />

scorurile <strong>de</strong> selecţie ale fenotipurilor; iniţializează<br />

scorurile <strong>de</strong> selecţie ale genotipurilor<br />

Calculează scorurile <strong>de</strong> selecţie ale genotipurilor pe<br />

baza scorurilor obţinute <strong>de</strong> la fenotipuri în pasul<br />

anterior<br />

Extrage scorul <strong>de</strong> selecţie (cel <strong>de</strong>finit în fişierul <strong>de</strong><br />

configurare) din lista scorurilor <strong>de</strong> selecţie<br />

calculate pentru genotipuri; normalizează scorurile<br />

(dacă normalizarea este activată în fişierul <strong>de</strong><br />

configurare); converteşte scorurile la ranguri <strong>de</strong><br />

scoruri (dacă opţiunea ranguri este activată în<br />

fişierul <strong>de</strong> configurare)<br />

Face selecţia unui număr <strong>de</strong>finit <strong>de</strong> genotipuri (număr<br />

par) folosind metoda specificată în fişierul <strong>de</strong><br />

configurare<br />

Calculează scorul <strong>de</strong> supravieţuire al genotipurilor<br />

Construieşte noua generaţie astfel:<br />

• mută părinţi cu probabilitatea <strong>de</strong>finită în<br />

fişierul <strong>de</strong> configurare<br />

• încrucişează perechi <strong>de</strong> părinţi în număr <strong>de</strong>finit<br />

în fişierul <strong>de</strong> configurare<br />

• mută fii cu probabilitatea <strong>de</strong>finită în fişierul<br />

<strong>de</strong> configurare<br />

• numără <strong>de</strong>scen<strong>de</strong>nţii adaptaţi<br />

• înlocuieşte părinţi cu <strong>de</strong>scen<strong>de</strong>nţi folosind<br />

metoda <strong>de</strong> supravieţuire <strong>de</strong>finită în fişierul <strong>de</strong><br />

configurare<br />

o Până când numărul <strong>de</strong> generaţii impus în fişierul <strong>de</strong><br />

231


configurare este atins<br />

÷ Până când numărul <strong>de</strong> repetiţii ale execuţiei algoritmului genetic<br />

specificat în fişierul <strong>de</strong> configurare este atins<br />

Fişierul `c_galg.cga` conţine configuraţia <strong>de</strong> execuţie a programului.<br />

Configuraţia <strong>de</strong> execuţie a programului evolutiv `ga_v2_0p.exe`<br />

Parametru Valoare Comentarii<br />

a_v_ADAPT_Variance= 0 ≤ a_v Valoarea minimă impusă unui fenotip<br />

(real) (Xi) pentru a fi consi<strong>de</strong>rat adaptat la<br />

cultivar; calculată cu expresia:<br />

m<br />

m ⎛<br />

⎞<br />

∑⎜Xi, j −∑Xi,<br />

k m⎟<br />

j=<br />

1 ⎝ k=<br />

1<br />

AD(Xi)=<br />

⎠<br />

2<br />

⎛ m ⎞<br />

⎜ | Xi,<br />

j | ⎟<br />

⎜∑<br />

⎟<br />

⎝ j=<br />

1 ⎠<br />

ajb_ADAPT_JarqueBera= 0 ≤ ajb Valoarea maximă a abaterii relative <strong>de</strong><br />

(real) la normalitate impusă unui fenotip;<br />

calculată cu expresia:<br />

2<br />

2<br />

JB(<br />

Xi<br />

) 4g1<br />

( Xi<br />

) + g 2(<br />

Xi<br />

)<br />

rJB(Xi)= = 2<br />

2<br />

JB(<br />

Y)<br />

4g<br />

( Y)<br />

+ g ( Y)<br />

1<br />

2<br />

a_c_ADAPT_Correlation= 0 ≤ a_c ≤ 1 Valoarea minimă a <strong>de</strong>terminării impusă<br />

unui fenotip; calculată cu expresia:<br />

r 2 (Xi,Y) - ecuaţia (5)<br />

sn0_SAMPLE_Size= rn0 ≤ sn0 Volumul eşantionului <strong>de</strong> material<br />

genetic supus înmulţirii în cultivar<br />

rn0_REGRESSION_Multiple= 1 ≤ rn0 Ordinul <strong>de</strong> multiplicitate al regresiei<br />

e1n_GENERATIONS_max= 1 ≤ e1n Numărul <strong>de</strong> generaţii în care materialul<br />

genetic evoluează în cultivar (întreg;<br />

zeci, sute <strong>de</strong> mii)<br />

g_r_GENERATIONS_first_rich= Yes/No Dacă procesului <strong>de</strong> selecţie aleatorie a<br />

materialului genetic iniţial i se impune<br />

să colecteze doar genotipuri viabile<br />

cn0_CROSSOVER_Pairs= 1 ≤ cn0 Numărul <strong>de</strong> perechi (<strong>de</strong> părinţi) care se<br />

încrucişează într-o generaţie<br />

m_m_MUTATION_Genes= 1 ≤ m_m Numărul <strong>de</strong> gene care se mută atunci<br />

când mutaţia apare<br />

mpp_MUTATION_Parent_probability= 0 ≤ mpp < 1 Probabilitatea <strong>de</strong> apariţie a mutaţiei<br />

înainte <strong>de</strong> încrucişare<br />

mcp_MUTATION_Child_probability= 0 ≤ mcp < 1 Probabilitatea <strong>de</strong> apariţie a mutaţiei<br />

după încrucişare<br />

b_p_SELECTION_parameter= r2/se/Mt/Hr Funcţia obiectiv<br />

÷ r2=r 2 (Y,Ŷ): coeficientul <strong>de</strong><br />

<strong>de</strong>terminare dat <strong>de</strong> ecuaţia (5)<br />

÷ se=<br />

m<br />

∑<br />

j=<br />

1<br />

− Y ) ˆ ( Y<br />

n ⎛ 1 p ⎞<br />

÷ Mt= ⎜ ∑= t ( Xi<br />

) ⎟ ; p=fMt<br />

⎝ n i 1 ⎠<br />

2p<br />

2 p<br />

log2<br />

( r + ( 1−<br />

r ) )<br />

÷ Hr=<br />

; p = fHr<br />

1−<br />

p<br />

b_o_SELECTION_objective= max/min Obiectivul funcţiei obiectiv<br />

232<br />

i<br />

i<br />

2<br />

1/<br />

p<br />

2


sfs_FITNESS_strategy= proportional/ Metoda (strategia) <strong>de</strong> selecţie a<br />

<strong>de</strong>terministic/ genotipurilor candidate la încrucişare şi<br />

tournament mutaţie<br />

sfn_FITNESS_normalized= Yes/No Dacă scorurile <strong>de</strong> selecţie sunt<br />

normalizate între generaţii<br />

sfr_FITNESS_ranks= Yes/No Dacă se folosesc rangurile scorurilor <strong>de</strong><br />

selecţie în locul scorurilor <strong>de</strong> selecţie<br />

sfa_FITNESS_accuracy= 1000 ≤ sfa Dă numărul <strong>de</strong> cifre semnificative la<br />

care se rotunjesc scorurile <strong>de</strong> selecţie<br />

sff_FITTEST_function= nalive/ Valoarea scorului <strong>de</strong> selecţie;<br />

r2_min/ ÷ nalive - numărul <strong>de</strong> ecuaţii <strong>de</strong> regresie<br />

se_min/ ce conţin fenotipuri ale genotipului;<br />

Mt_min/ ÷ XX_min - cea mai mică valoare a lui<br />

Hr_min/ XX care apare într-o ecuaţie <strong>de</strong><br />

r2_max/ regresie validă ce conţine un fenotip<br />

se_max/ al genotipului;<br />

Mt_max/ ÷ XX_max - cea mai mare valoare a lui<br />

Hr_max/ XX care apare într-o ecuaţie <strong>de</strong><br />

r2_avg/ regresie validă ce conţine un fenotip<br />

se_avg/ al genotipului;<br />

Mt_avg/ ÷ XX_avg - valoarea medie a lui XX<br />

Hr_avg obţinută din toate ecuaţiile <strong>de</strong> regresie<br />

vali<strong>de</strong> ce conţin un fenotip al<br />

genotipului;<br />

Ecuaţie <strong>de</strong> regresie validă - ecuaţie care:<br />

÷ este unic <strong>de</strong>terminată;<br />

÷ are estimator viabil (Ŷ verifică <strong>de</strong><br />

asemenea condiţiile impuse<br />

fenotipurilor ce compun ecuaţia)<br />

÷ toţi coeficienţii ecuaţiei sunt<br />

semnificativi statistic (≠0) la nivel <strong>de</strong><br />

semnificaţie <strong>de</strong> 95% (Stu<strong>de</strong>nt t)<br />

r2 = r Y) ; p=p(fr2) ˆ 2p<br />

( Y,<br />

m<br />

i − Yˆ se =∑ | Y<br />

j=<br />

1<br />

i<br />

|<br />

p<br />

; p=p(fse)<br />

Mt şi Hr au aceeaşi semnificaţie ca în<br />

formula <strong>de</strong> <strong>de</strong>finiţie a lui b_p<br />

sfo_FITTEST_objective= min/max Obiectivul scorului <strong>de</strong> selecţie<br />

fr2_FITTEST_r2_p= real (1.0) puterea la care se ridică coeficientul <strong>de</strong><br />

<strong>de</strong>terminare ca scor <strong>de</strong> selecţie<br />

fse_FITTEST_se_p= real (1.0) puterea sumelor modulelor diferenţelor<br />

între măsurat şi estimat ca scor <strong>de</strong><br />

selecţie<br />

fMt_FITTEST_Mt_p= real (1.0) puterea din formula mediei Minkowski<br />

a valorilor Stu<strong>de</strong>nt t ai coeficienţilor<br />

ecuaţiei <strong>de</strong> regresie ca scor <strong>de</strong> selecţie<br />

fHr_FITTEST_Hr_p= real (1.0) puterea din formula entropiei Renyi a<br />

clasificării cantitate explicată (r 2 ) vs.<br />

cantitate ne-explicată (1-r 2 ) <strong>de</strong> ecuaţia<br />

<strong>de</strong> regresie ca scor <strong>de</strong> selecţie<br />

p din SVP(Xi,Xj)=|Fit(Xi)-Fit(Xj)| p v_p_SURVIVAL_phenotyping_p= real (1.0)<br />

,<br />

233


v_g_SURVIVAL__genotyping_p= real (1.0)<br />

un<strong>de</strong> Fit(Phe) este valoare scorului <strong>de</strong><br />

selecţie al fenotipului Phe<br />

p<br />

⎛ NCD(<br />

Xi<br />

, X j)<br />

⎞<br />

p în SVG(Xi,Xj)= ⎜<br />

NC ⎟ ,<br />

⎝<br />

⎠<br />

un<strong>de</strong> NC numărul <strong>de</strong> gene din<br />

cromozom iar NCD(Xi,Xj) numărul <strong>de</strong><br />

valori diferite ale genelor lui Xi faţă <strong>de</strong><br />

vfs_SURVIVAL_strategy= proportional/ Metoda (strategia) <strong>de</strong> supravieţuire a<br />

<strong>de</strong>terministic/ genotipurilor candidate la înlocuire <strong>de</strong><br />

tournament către <strong>de</strong>scen<strong>de</strong>nţi aplicată pe expresia:<br />

2<br />

SVP(<br />

Xi<br />

, X j)<br />

+ SVG(<br />

Xi<br />

, X j)<br />

vfr_SURVIVAL_ranks= Yes/No Dacă se folosesc rangurile scorurilor <strong>de</strong><br />

supravieţuire în locul scorurilor <strong>de</strong><br />

supravieţuire<br />

d_d_SHOW_<strong>de</strong>scriptive_m0= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

parametrul statistic <strong>de</strong>scriptiv m0<br />

(media modulelor)<br />

j 1<br />

m0(Xi)=<br />

m<br />

d_d_SHOW_<strong>de</strong>scriptive_m1= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

parametrul statistic <strong>de</strong>scriptiv m1<br />

(media aritmetică)<br />

Xi,<br />

j<br />

j 1<br />

m1(Xi)=<br />

m<br />

d_d_SHOW_<strong>de</strong>scriptive_m2= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

parametrul statistic <strong>de</strong>scriptiv m2<br />

(momentul central <strong>de</strong> ordin 2)<br />

j 1<br />

m2(Xi)=<br />

m<br />

d_d_SHOW_<strong>de</strong>scriptive_m3= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

parametrul statistic <strong>de</strong>scriptiv m3<br />

(momentul central <strong>de</strong> ordin 3)<br />

Xj<br />

m<br />

∑<br />

=<br />

m<br />

∑<br />

=<br />

m<br />

∑<br />

=<br />

| X<br />

( X<br />

i,<br />

j<br />

i,<br />

j<br />

|<br />

−<br />

m1(<br />

X<br />

m1(<br />

X<br />

j 1<br />

m3(Xi)=<br />

m<br />

d_d_SHOW_<strong>de</strong>scriptive_m4= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

parametrul statistic <strong>de</strong>scriptiv m4<br />

(momentul central <strong>de</strong> ordin 4)<br />

j 1<br />

m4(Xi)=<br />

m<br />

d_d_SHOW_<strong>de</strong>scriptive_mx= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

234<br />

m<br />

∑<br />

=<br />

m<br />

∑<br />

=<br />

( X<br />

( X<br />

i,<br />

j<br />

i,<br />

j<br />

−<br />

−<br />

m1(<br />

X<br />

i<br />

i<br />

i<br />

))<br />

))<br />

))<br />

2<br />

3<br />

4


parametrul statistic <strong>de</strong>scriptiv mx<br />

(media pătratelor valorilor)<br />

X<br />

j= 1<br />

mx(Xi)=<br />

m<br />

d_d_SHOW_<strong>de</strong>scriptive_my= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

parametrul statistic <strong>de</strong>scriptiv my<br />

(media produselor cu valorile măsurate)<br />

Xi,<br />

jYj<br />

j= 1<br />

my(Xi)=<br />

m<br />

d_d_SHOW_<strong>de</strong>scriptive_v0= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

parametrul statistic <strong>de</strong>scriptiv v0<br />

(varianţa relativă la valorile absolute)<br />

m<br />

2<br />

∑( Xi,<br />

j − m1(<br />

Xi<br />

))<br />

j=<br />

1<br />

v0(Xi)=<br />

2<br />

m0<br />

( Xi<br />

)<br />

d_d_SHOW_<strong>de</strong>scriptive_g1= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

parametrul statistic <strong>de</strong>scriptiv g1<br />

(asimetria observabilei)<br />

m3( Xi<br />

)<br />

g1(Xi)= 3/<br />

2<br />

m2 ( Xi<br />

)<br />

d_d_SHOW_<strong>de</strong>scriptive_g2= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

parametrul statistic <strong>de</strong>scriptiv g1<br />

(excesul <strong>de</strong> boltire al observabilei)<br />

m4(<br />

Xi<br />

)<br />

g2(Xi)= 2<br />

m2<br />

( Xi<br />

)<br />

d_d_SHOW_<strong>de</strong>scriptive_jb= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

parametrul statistic <strong>de</strong>scriptiv jb<br />

(valoarea X 2 a testului Jarque-Bera)<br />

2<br />

2<br />

g1 ( Xi<br />

) + g2<br />

( Xi<br />

) 4<br />

jb(Xi)=<br />

6<br />

d_d_SHOW_<strong>de</strong>scriptive_r1= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

parametrul statistic <strong>de</strong>scriptiv r1<br />

(coeficientul <strong>de</strong> corelaţie cu valorile<br />

măsurate)<br />

r1(Xi)=r(Xi,Y) - ecuaţia (5)<br />

d_d_SHOW_<strong>de</strong>scriptive_r2= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

parametrul statistic <strong>de</strong>scriptiv r1<br />

(coeficientul <strong>de</strong> <strong>de</strong>terminare cu valorile<br />

măsurate)<br />

r2(Xi)=r 2 (Xi,Y)<br />

d_f_SHOW_fitness_nalive= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

valoarea scorului <strong>de</strong> selecţie nalive<br />

d_f_SHOW_fitness_r2_min= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

valoarea scorului <strong>de</strong> selecţie r2_min<br />

d_f_SHOW_fitness_se_min= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

valoarea scorului <strong>de</strong> selecţie se_min<br />

235<br />

m<br />

∑<br />

m<br />

∑<br />

2<br />

i,<br />

j


d_f_SHOW_fitness_Mt_min= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

valoarea scorului <strong>de</strong> selecţie Mt_min<br />

d_f_SHOW_fitness_Hr_min= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

valoarea scorului <strong>de</strong> selecţie Hr_min<br />

d_f_SHOW_fitness_r2_max= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

valoarea scorului <strong>de</strong> selecţie r2_max<br />

d_f_SHOW_fitness_se_max= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

valoarea scorului <strong>de</strong> selecţie se_max<br />

d_f_SHOW_fitness_Mt_max= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

valoarea scorului <strong>de</strong> selecţie Mt_max<br />

d_f_SHOW_fitness_Hr_max= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

valoarea scorului <strong>de</strong> selecţie Hr_max<br />

d_f_SHOW_fitness_r2_avg= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

valoarea scorului <strong>de</strong> selecţie r2_avg<br />

d_f_SHOW_fitness_se_avg= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

valoarea scorului <strong>de</strong> selecţie se_avg<br />

d_f_SHOW_fitness_Mt_avg= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

valoarea scorului <strong>de</strong> selecţie Mt_avg<br />

d_f_SHOW_fitness_Hr_avg= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

valoarea scorului <strong>de</strong> selecţie Hr_avg<br />

d_c_SHOW_configuration= Yes/No Dacă se generează fişier <strong>de</strong> ieşire<br />

conţinând valorile parametrilor <strong>de</strong><br />

configuraţie<br />

d_m_SHOW_mols= Yes/No Dacă se scrie în fişierele <strong>de</strong> ieşire<br />

valorile <strong>de</strong>scriptorilor pentru fiecare<br />

moleculă a setului <strong>de</strong> date<br />

d_r_SHOW_regressions= Yes/No Dacă se generează fişier <strong>de</strong> ieşire<br />

conţinând toate ecuaţiile <strong>de</strong> regresie<br />

vali<strong>de</strong> pentru fiecare generaţie<br />

d_p_SHOW_phenotypes= Yes/No Dacă se scriu în fişierele <strong>de</strong> ieşire<br />

valorile corespunzătoare pentru fiecare<br />

d_s_SHOW_genotypes= Yes/No fenotip/genotip din generaţie<br />

d_t_SHOW_fittests= Yes/No Dacă se scriu în fişierele <strong>de</strong> ieşire<br />

valorile scorurilor <strong>de</strong> selecţie<br />

d_g_SHOW_generations= Yes/No Dacă se generează fişier <strong>de</strong> ieşire<br />

conţinând generaţiile unei evoluţii<br />

d_e_SHOW_evolutions= Yes/No Dacă se generează fişier <strong>de</strong> ieşire<br />

conţinând evoluţiile unei execuţii<br />

e0n_RUNS_number= 2 Numărul <strong>de</strong> execuţii in<strong>de</strong>pen<strong>de</strong>nte<br />

b_k_RUNS_kepp_best_in_sample= Yes/No Dacă păstrează genotipurile<br />

fenotipurilor din cea mai bună regresie<br />

în eşantion<br />

b_f_RUNS_get_best_from_file= Yes/No Dacă se preiau (parţial sau total)<br />

genotipurile primei generaţii din fişier<br />

<strong>de</strong> intrare (`c_galg.txt`)<br />

Tipul abstract <strong>de</strong> date `SAR_Fam` conţine toate datele, procedurile şi funcţiile necesare<br />

algoritmului genetic pentru evoluţie şi sunt redate în Algoritm 5.<br />

Algoritm 5. Tipul abstract <strong>de</strong> date SAR_Fam: date şi operaţii pentru regresii multiple pe familii<br />

<strong>de</strong> <strong>de</strong>scriptori moleculari folosind algoritm genetic<br />

Variabile Semnificaţii<br />

f:Text; Pointer către fişier <strong>de</strong> intrare sau ieşire<br />

236


d_n:S9; Variabilă folosită la pentru adăugarea la <strong>de</strong>numirea unui fişier <strong>de</strong> ieşire a<br />

unui număr aleatoriu pentru a face distincţie între 2 execuţii consecutive<br />

pe acelaşi set <strong>de</strong> molecule<br />

g0s,g1s:S9; Conţin valorile configurate în fişierul <strong>de</strong> configurare `c_galg.cgt` prin<br />

parametrii `Genes=` şi `Addre=`<br />

g2a:S0T; Genele cromozomului sub formă <strong>de</strong> şir <strong>de</strong> şiruri <strong>de</strong> caractere<br />

g3a:S0T; Adresele materialului genetic sub formă <strong>de</strong> şir <strong>de</strong> şiruri <strong>de</strong> caractere<br />

g4a:S0T; Codul genetic sub formă <strong>de</strong> şir <strong>de</strong> şiruri <strong>de</strong> caractere<br />

b_n:B_T; Variabilă conţinând o valoare <strong>de</strong> a<strong>de</strong>văr (nu are semnificaţie asociată)<br />

d_m, d_r, d_p, d_s,<br />

d_g, d_e, d_c, d_t,<br />

g_r, b_p, b_o, sfn,<br />

sfr, sfs, vfr, vfs,<br />

sff, sfo, b_k,<br />

b_f:B0T;<br />

Valori <strong>de</strong> a<strong>de</strong>văr conţinând opţiunile sub formă <strong>de</strong> valori numerice întregi<br />

între 0 şi 255 citite din fişierul <strong>de</strong> configurare `c_galg.cga` - vezi Tabelul<br />

45<br />

x_b:BAT; Şir <strong>de</strong> şiruri <strong>de</strong> valori <strong>de</strong> a<strong>de</strong>văr referind viabilitatea genotipurilor [0] şi<br />

fenotipurilor asociate [1..6]<br />

s0c:B2T; Şir <strong>de</strong> şiruri <strong>de</strong> întregi reprezentând şirul codurilor genetice în eşantion<br />

c0c:B2T; Şir <strong>de</strong> şiruri <strong>de</strong> întregi reprezentând şirul codurilor genetice <strong>de</strong>scen<strong>de</strong>nţi<br />

e0i,e0n:I0T; Numărul execuţiei in<strong>de</strong>pen<strong>de</strong>nte şi numărul total <strong>de</strong> execuţii planificate<br />

e2i:I0T; Ultima generaţie în care s-a produs evoluţie<br />

gn0,gn1:I0T; Numărul <strong>de</strong> gene în cromozom (şi numărul <strong>de</strong> gene minus 1)<br />

cn0,cn1,cn2:I0T; Numărul <strong>de</strong> încrucişări într-o generaţie; cn1=cn0-1; cn2=2·cn0-1<br />

m_m:I0T; Numărul <strong>de</strong> gene supuse mutaţiei într-o mutaţie<br />

sn0,sn1:I0T; Volumul eşantionului (numărul <strong>de</strong> genotipuri)<br />

sn2,sn3:I0T; Numărul <strong>de</strong> genotipuri viabile (într-un moment dat al execuţiei)<br />

pn0,pn1:I0T; Numărul <strong>de</strong> fenotipuri (<strong>de</strong> şase ori numărul <strong>de</strong> genotipuri); pn1=pn0-1<br />

pn2,pn3:I0T; Numărul <strong>de</strong> fenotipuri viabile (într-un moment dat al execuţiei)<br />

rn0,rn1,rnp:I0T; Ordinul <strong>de</strong> multiplicitate al regresiei; rn1=rn0-1; rnp=rn0+1<br />

sdn:I0T; Numărul <strong>de</strong> scoruri <strong>de</strong> selecţie distincte<br />

v_n:I0T; Număr <strong>de</strong> genotipuri viabile în supravieţuire<br />

vdn:I0T; Numărul <strong>de</strong> scoruri <strong>de</strong> supravieţuire distincte<br />

e1i,e1n:L0T; Numărul generaţiei şi numărul total <strong>de</strong> generaţii într-o execuţie<br />

m0n,m1n:L0T; Numărul <strong>de</strong> molecule în setul investigat; m1n=m0n-1<br />

i0n,i1n:L0T; Numărul <strong>de</strong> <strong>de</strong>scriptori în familie (volumul populaţiei <strong>de</strong> <strong>de</strong>scriptori)<br />

sfa:L0T; Număr folosit la rotunjirea scorurilor <strong>de</strong> selecţie (cifre semnificative)<br />

t_0,t_1:R0T; Valorile Stu<strong>de</strong>nt t ale pragurilor la semnificaţie <strong>de</strong> 95% probabilitate <strong>de</strong><br />

succes pentru regresia liniară multiplă după mo<strong>de</strong>lul ecuaţiei (1) - t_0 şi<br />

ecuaţiei (2) - t_1; aproximate cu funcţia ST_t025(df:I0T)<br />

m2n:R0T; Numărul <strong>de</strong> molecule în setul investigat (ca valoare reală); n2n=m0n<br />

a_v,ajb,a_c:R0T; Valorile pentru adaptare preluate din fişierul `c_galg.cga`<br />

fr2,fse:R0T; Valorile parametrului p din formula <strong>de</strong> scor <strong>de</strong> selecţie pentru r2 şi se<br />

fMt,fHr:R0T; Valorile parametrului p din formula <strong>de</strong> scor <strong>de</strong> selecţie pentru Mt şi Hr<br />

mpp,mcp:R0T; Probabilităţile <strong>de</strong> mutaţie înainte (mmp) şi după (mcp) încrucişare<br />

v_p,v_g:R0T; Valorile p din expresiile scorurilor <strong>de</strong> supravieţuire (fenotip, genotip)<br />

e0v,e1v:R0T; Valori din expresia <strong>de</strong> normalizare a scorului <strong>de</strong> selecţie (min, max)<br />

g5a,g6a,g7a:B1T; Şiruri pentru conversia genotip ↔ adresă<br />

d_f,d_d:B1T; Şiruri <strong>de</strong> valori <strong>de</strong> a<strong>de</strong>văr <strong>de</strong>finind afişarea statisticilor <strong>de</strong>scriptive şi<br />

scorurilor <strong>de</strong> selecţie<br />

r0o,b0o:B1T; Operatorii fenotipurilor implicate în regresia: curentă şi cea mai bună<br />

p0o:B1T; Adresele fenotipurilor din cultivar (legături către genotipuri)<br />

r0i:I1T; Indicii fenotipurilor regresiei curente: (0,1,2,...) → (...,m-2,m-1,m)<br />

237


0p,b0s:I1T; Adresele fenotipurilor implicate în regresia: curentă şi cea mai bună<br />

r0p:I1T; Operatorii fenotipurilor din cultivar (legături către genotipuri)<br />

p0i,s0i:I1T; Scoruri <strong>de</strong> selecţie pentru fenotipuri şi genotipuri<br />

v1i:I1T; Scoruri <strong>de</strong> supravieţuire pentru genotipuri<br />

g8a:L1T; Şir auxiliar în conversia genotip ↔ adresă<br />

s0a,c0a:L1T; Adrese (absolute) ale genotipurilor din eşantion şi ale <strong>de</strong>scen<strong>de</strong>nţilor<br />

f1f,f1d,f1c:L1T; Scoruri <strong>de</strong> selecţie şi supravieţuire rotunjite; şirul valorilor lor distincte;<br />

v1f,v1d,v1c:L1T;<br />

numărul <strong>de</strong> valori i<strong>de</strong>ntice pentru fiecare valoare distinctă<br />

f1r:L1T; Şir suplimentar necesar în înlocuirea valorilor cu rangurile acestora<br />

f1s,v2s:L1T; Şirurile părinţilor din eşantion în procesul <strong>de</strong> selecţie şi supravieţuire<br />

y_v,y_d:R1T; Valori experimentale şi statistica <strong>de</strong>scriptivă a acestora<br />

r_b,r_t:R1T; Coeficienţii din ecuaţia <strong>de</strong> regresie, valorile Stu<strong>de</strong>nt t asociate acestora<br />

r0r:R1T; (r2,se,tr,Hr,df_r,me,df_t) pentru regresia curentă<br />

y_e,r_d:R1T; Valori experimentale şi statistica <strong>de</strong>scriptivă a acestora<br />

f0r,f0f,f0g:R1T; Scorurile <strong>de</strong> selecţie pentru regresia, fenotipul şi genotipul curente<br />

v0p,v0g:R1T; Scorurile <strong>de</strong> supravieţuire din similaritatea fenotipică şi genotipică<br />

v0s,v1s:R1T; Scorurile <strong>de</strong> supravieţuire cumulate şi valori distincte ale acestora<br />

x_v:R2T; Familia <strong>de</strong> <strong>de</strong>scriptori moleculari<br />

r0a,r0c:R2T; Matricea sistemului <strong>de</strong> ecuaţii în regresia multiplă şi inversa sa<br />

rmx:R2T; Valorile mediilor M(Xi,Xj) între valorile fenotipice<br />

b_r:R2T; Memorează parametrii celei mai bune regresii (obiectivul algoritmului)<br />

f0s:R2T; Scorurile <strong>de</strong> selecţie pentru fiecare genotip al eşantionului<br />

p0v,p0d,f0p:R3T; Valorile, statistica <strong>de</strong>scriptivă, scoruri <strong>de</strong> selecţie pentru fiecare fenotip<br />

Operaţii Descriere<br />

function ST_Out0<br />

(z:R0T):B_T;<br />

Testează dacă un număr real se află sub limita inferioară (min_real) în<br />

vecinătatea lui 0<br />

function ST_Out1<br />

(z:R0T):B_T;<br />

Testează dacă un număr real se află peste limita superioară (max_real)<br />

procedure ST0Aliv<br />

;<br />

Obţine valorile <strong>de</strong> a<strong>de</strong>văr ale viabilităţii fenotipurilor şi genotipurilor<br />

familiei <strong>de</strong> <strong>de</strong>scriptori moleculari<br />

function ST_XX<br />

(var x,y:R1T):R0T;<br />

Calculează media M(Xi,Xj) a două fenotipuri<br />

function ST_t025<br />

(df:I0T):R0T;<br />

Aproximează cu o formulă dublu exponenţială Stu<strong>de</strong>nt t din numărul <strong>de</strong><br />

gra<strong>de</strong> <strong>de</strong> libertate<br />

procedure ST0Desc Calculează simultan 13 parametrii <strong>de</strong> statistică <strong>de</strong>scriptivă: m0, m1, m2,<br />

(var y,s:R1T);<br />

m3, m4, mx, my, v0, g1, g2, jb, r1, r2<br />

function ST_Desc Calculează cei 13 parametrii <strong>de</strong> statistică <strong>de</strong>scriptivă şi obţine răspuns cu<br />

(var y,s:R1T):B_T;<br />

privire la viabilitatea fenotipului<br />

procedure CF_Ge Citeşte codul genetic al familiei <strong>de</strong> <strong>de</strong>scriptori moleculari din fişierul<br />

;<br />

`c_galg.cgt`<br />

procedure CF_Cu Citeşte configuraţia <strong>de</strong> execuţie a programului evolutiv din fişierul<br />

(var d:S0T);<br />

`c_galg.cga`<br />

procedure CF_Cd Verifică consistenţa şi prelucrează o linie <strong>de</strong> <strong>de</strong>finiţie (`Genes=` sau<br />

(s:S9;var x:S0T);<br />

`Addre=`) din fişierul <strong>de</strong> <strong>de</strong>finire a codului genetic<br />

procedure CF_Rs; Iniţializează valorile <strong>de</strong> minim şi maxim pentru funcţia obiectiv asigurând<br />

astfel in<strong>de</strong>pen<strong>de</strong>nţa între execuţiile succesive ale algoritmului genetic<br />

function CF_St<br />

(s:S9):S3;<br />

Citeşte secvenţa <strong>de</strong> <strong>de</strong>finire a unei gene din fişierul <strong>de</strong> <strong>de</strong>finire a codului<br />

genetic<br />

function CF_Ar Citeşte o opţiune <strong>de</strong> tip şir <strong>de</strong> opţiuni (<strong>de</strong>finite în Tabelul 42 şi<br />

(s:S9;var<br />

l:C8):B0T;<br />

exemplificate în Tabelul 45) din fişierul <strong>de</strong> configurare a execuţiei<br />

programului evolutiv<br />

function CF_NY Citeşte o opţiune <strong>de</strong> tip Yes/No (menţionate în Tabelul 45) din fişierul <strong>de</strong><br />

238


(s:S9):B0T; configurare a execuţiei programului evolutiv<br />

function CF_In<br />

(s:S9):I0T;<br />

function CF_Lo<br />

(s:S9):L0T;<br />

Citeşte o valoare întreagă din fişierul <strong>de</strong> configurare a execuţiei<br />

programului evolutiv<br />

function CF_RT<br />

(s:S9):R0T;<br />

Citeşte o valoare reală din fişierul <strong>de</strong> configurare a execuţiei programului<br />

evolutiv<br />

procedure GC_GS<br />

(var g:B1T;var<br />

s:S3);<br />

Converteşte cod genetic (secvenţă <strong>de</strong> numere) în şir <strong>de</strong> caractere<br />

procedure GC_SG<br />

(var s:S3;var<br />

g:B1T);<br />

Converteşte şir <strong>de</strong> caractere în cod genetic (secvenţă <strong>de</strong> numere)<br />

procedure GC_PG<br />

(i:I0T);<br />

Converteşte o adresă <strong>de</strong> genotip în cod genetic corespunzător<br />

procedure GC_GP<br />

(i:I0T);<br />

Converteşte un cod genetic în adresa genotipului corespunzător<br />

procedure GC_Cr<br />

(l:I0T);<br />

Încrucişează al `l`-lea cu al `l+1`-lea genotip<br />

procedure GC_Mu<br />

(j:I0T);<br />

Mută al `j`-le genotip<br />

procedure GC_GG<br />

(var s,d:B1T);<br />

Copiază codul genetic al genotipului `s` în genotipul `d`<br />

procedure GC_CA; Calculează adresa unui genotip<br />

procedure RG_PH;<br />

function<br />

RG_do:B_T;<br />

Obţine adresele şi operatorii fenotipurilor selectate pentru regresia curentă<br />

Pentru toate combinaţiile unice posibile <strong>de</strong> n (numărul <strong>de</strong> fenotipuri<br />

viabile în cultivar) câte p (ordinul <strong>de</strong> multiplicitate al regresiei multiple)<br />

încearcă obţinerea unei regresii multiple cu coeficienţi semnificativi<br />

statistic <strong>de</strong> tipul (eq.1); dacă rezultatul încercării eşuează datorită obţinerii<br />

unui coeficient liber nesemnificativ statistic atunci încearcă obţinerea unei<br />

regresii multiple cu coeficienţi semnificativi statistic <strong>de</strong> tipul (eq.2)<br />

procedure RG_M0; Construieşte matricea sistemului ([a]), matricea coeficienţilor ([b]) şi<br />

matricea unitate ([c]) în ve<strong>de</strong>rea obţinerii soluţiei (în [b]) şi matricei<br />

inverse (în [c]) pentru calculul semnificaţiilor coeficienţilor (în [t]) pentru<br />

ecuaţia <strong>de</strong> regresie <strong>de</strong>finită <strong>de</strong> (eq.1):<br />

⎛M(<br />

Y)<br />

⎞<br />

⎜ ⎟<br />

⎜M(<br />

X1Y)<br />

⎟<br />

b= ⎜...<br />

⎟<br />

⎜ ⎟<br />

⎜ ⎟<br />

⎝M(<br />

XnY)<br />

⎠<br />

⎛1<br />

⎜<br />

⎜M(<br />

X1)<br />

a= ⎜...<br />

⎜<br />

⎝M(<br />

Xn<br />

)<br />

M(<br />

X1)<br />

M(<br />

X1X1)<br />

...<br />

M(<br />

XnX<br />

1)<br />

...<br />

...<br />

...<br />

...<br />

⎛1/<br />

m<br />

⎜<br />

⎜0<br />

c= ⎜... ⎜<br />

⎝0<br />

0<br />

1/<br />

m<br />

...<br />

0<br />

...<br />

...<br />

...<br />

...<br />

0 ⎞<br />

⎟<br />

0 ⎟<br />

... ⎟<br />

⎟<br />

1/<br />

m⎟<br />

⎠<br />

M(<br />

Xn<br />

) ⎞<br />

⎟<br />

M(<br />

X1Xn<br />

) ⎟<br />

... ⎟<br />

⎟<br />

M(<br />

X X ) ⎟<br />

n n ⎠<br />

procedure RG_M1; Construieşte matricea sistemului ([a]), matricea coeficienţilor ([b]) şi<br />

matricea unitate ([c]) în ve<strong>de</strong>rea obţinerii soluţiei (în [b]) şi matricei<br />

inverse (în [c]) pentru calculul semnificaţiilor coeficienţilor (în [t]) pentru<br />

ecuaţia <strong>de</strong> regresie <strong>de</strong>finită <strong>de</strong> (eq.2):<br />

⎛ ⎞<br />

⎜ ⎟<br />

⎜M(<br />

X1Y)<br />

⎟<br />

b= ⎜...<br />

⎟<br />

⎜ ⎟<br />

⎜ ⎟<br />

⎝ M(<br />

XnY)<br />

⎠<br />

⎛<br />

⎜<br />

⎜<br />

a= ⎜<br />

⎜<br />

⎝<br />

( X1X1)<br />

...<br />

M(<br />

XnX<br />

1)<br />

239<br />

...<br />

...<br />

...<br />

⎞<br />

⎟<br />

M(<br />

X1X<br />

) ⎟<br />

... ⎟<br />

⎟<br />

M(<br />

X X ) ⎟<br />

n n ⎠<br />

M n


function<br />

RG_G0:B_T;<br />

function<br />

RG_G1:B_T;<br />

function<br />

RG_Es:B_T;<br />

function<br />

RG_Ov:B_T;<br />

⎛<br />

⎞<br />

⎜<br />

⎟<br />

⎜ 1/<br />

m ... 0 ⎟<br />

c= ⎜ ... ... ... ⎟<br />

⎜<br />

⎟<br />

⎜<br />

⎟<br />

⎝ 0 ... 1/<br />

m⎠<br />

Aplică algoritmul <strong>de</strong> rezolvare Gauss pentru sistemul <strong>de</strong> (p+1) ecuaţii<br />

calculat <strong>de</strong> funcţia RG_M0: [b][a][c] → [coef][I][c -1 ]<br />

Aplică algoritmul <strong>de</strong> rezolvare Gauss pentru sistemul <strong>de</strong> (p) ecuaţii<br />

calculat <strong>de</strong> funcţia RG_M1: [b][a][c] → [coef][I][c -1 ]<br />

Calculează Ŷ după eq. (1) sau eq. (2)<br />

Calculează valorile Stu<strong>de</strong>nt t utilizând ecuaţiile (20) şi (21)<br />

Calculează r2, se, Mt şi Hr<br />

Construieşte combinaţiile posibile a n elemente luate câte p (toate<br />

regresiile posibile luate o singură dată cu fenotipuri din cultivar) după<br />

schema din exemplu:<br />

Fie următoarele fenotipuri viabile în cultivar:<br />

÷ X8; X23; X47; X112; X145<br />

Acestea au indicii:<br />

÷ 8; 23; 47; 112; 145<br />

Iar indici <strong>de</strong> indici sunt în total <strong>de</strong> 5 (n=5 în ecuaţiile <strong>de</strong> mai sus):<br />

÷ 1(8); 2(23); 3(47); 4(112); 5(145)<br />

Presupunând că se caută regresii multiple <strong>de</strong> ordin <strong>de</strong> multiplicitate 3<br />

(p=3), combinaţiile posibile <strong>de</strong> indici <strong>de</strong> indici sunt:<br />

÷ 1; 2; 3 ÷ 1; 3; 4 ÷ 2; 3; 4<br />

÷ 1; 2; 4 ÷ 1; 3; 5 ÷ 2; 3; 5<br />

÷ 1; 2; 5 ÷ 1; 4; 5 ÷ 3; 4; 5<br />

Indicii <strong>de</strong>scriptorilor fiind:<br />

÷ 8; 23; 47 ÷ 8; 47; 112 ÷ 23; 47; 112<br />

÷ 8; 23; 112 ÷ 8; 47; 145 ÷ 23; 47; 145<br />

÷ 8; 23; 145 ÷ 8; 112; 145 ÷ 47; 112; 145<br />

Iar ecuaţiile <strong>de</strong> regresie <strong>de</strong> căutat fiind:<br />

Ŷ=a0+a1X8+a2X23+a3X47; Ŷ=a0X8+a1X23+a2X47;<br />

Ŷ=a0+a1X8+a2X23+a3X112; Ŷ=a0X8+a1X23+a2X112;<br />

Ŷ=a0+a1X8+a2X23+a3X145; Ŷ=a0X8+a1X23+a2X145;<br />

Ŷ=a0+a1X8+a2X47+a3X112; Ŷ=a0X8+a1X47+a2X112;<br />

Ŷ=a0+a1X8+a2X47+a3X145; Ŷ=a0X8+a1X47+a2X145;<br />

Ŷ=a0+a1X8+a2X112+a3X145; Ŷ=a0X8+a1X112+a2X145;<br />

Ŷ=a0+a1X23+a2X47+a3X112; Ŷ=a0X23+a1X47+a2X112;<br />

Ŷ=a0+a1X23+a2X47+a3X145; Ŷ=a0X23+a1X47+a2X145;<br />

Ŷ=a0+a1X47+a2X112+a3X145; Ŷ=a0X47+a1X112+a2X145;<br />

procedure SA_PIni<br />

(i:I0T);<br />

Transformă genotipurile la fenotipuri în cultivar folosind operatorii <strong>de</strong><br />

linearizare <strong>de</strong>finiţi (Tabelul 42 constanta `col`)<br />

procedure SA_PAli<br />

;<br />

Numără fenotipurile viabile din cultivar<br />

procedure SA_SAli<br />

;<br />

Numără genotipurile distincte asociate fenotipurilor viabile din cultivar<br />

procedure SA_Frst<br />

;<br />

Construieşte prima generaţie <strong>de</strong> genotipuri (primul eşantion al populaţiei<br />

<strong>de</strong> <strong>de</strong>scriptori moleculari) folosind selecţia întâmplătoare eventual (dacă<br />

este impus în fişierul <strong>de</strong> configurare) impunând viabilitatea genotipurilor<br />

şi eventual (dacă este impus în fişierul <strong>de</strong> configurare) impunând un set <strong>de</strong><br />

genotipuri (preluate din fişier)<br />

procedure SA_Next Construieşte noua generaţie astfel:<br />

240


; ÷ mută părinţi cu probabilitatea <strong>de</strong>finită în fişierul <strong>de</strong> configurare<br />

÷ încrucişează perechi <strong>de</strong> părinţi în număr <strong>de</strong>finit în fişierul <strong>de</strong><br />

configurare<br />

÷ mută fii cu probabilitatea <strong>de</strong>finită în fişierul <strong>de</strong> configurare<br />

÷ numără <strong>de</strong>scen<strong>de</strong>nţii adaptaţi<br />

÷ înlocuieşte părinţi cu <strong>de</strong>scen<strong>de</strong>nţi folosind metoda <strong>de</strong> supravieţuire<br />

<strong>de</strong>finită în fişierul <strong>de</strong> configurare<br />

procedure SL_SV Înlocuieşte părinţi selectaţi <strong>de</strong> metoda <strong>de</strong> supravieţuire cu <strong>de</strong>scen<strong>de</strong>nţi<br />

(l:B0T;var i:B0T);<br />

viabili rezultaţi în urma procesului <strong>de</strong> selecţie, încrucişare şi mutaţie<br />

procedure SL_Fit ÷ Calculează scorul <strong>de</strong> selecţie al genotipurilor<br />

;<br />

÷ Nomalizează scorurile (dacă e activată normalizarea în fişierul <strong>de</strong><br />

configurare)<br />

÷ Rotunjeşte valorile la numărul <strong>de</strong>finit (în fişierul <strong>de</strong> configurare) <strong>de</strong><br />

cifre semnificative<br />

÷ Construieşte rangurile şi înlocuieşte valorile cu ranguri (dacă sunt<br />

activate rangurile în fişierul <strong>de</strong> configurare)<br />

÷ Sortează valorile<br />

procedure SL_Pro Date <strong>de</strong> intrare:<br />

;<br />

÷ FS_Array - Şirul scorurilor <strong>de</strong> selecţie;<br />

procedure SL_Det<br />

;<br />

(partea comună)<br />

÷ N_Sel - Număr <strong>de</strong> selecţii (dublul numărului <strong>de</strong> perechi <strong>de</strong> încrucişat);<br />

Algoritm (Construcţia claselor <strong>de</strong> frecvenţe):<br />

÷ Pune valorile distincte din FS_Array în FSD_Array;<br />

÷ Pune numărul <strong>de</strong> apariţii ale valorilor din FS_Array în FSC_Array;<br />

÷ Sortează ascen<strong>de</strong>nt după FSD_Array ambele FSD_Array şi FSC_Array;<br />

÷ Partea distinctă (vezi mai jos)<br />

Date <strong>de</strong> ieşire:<br />

÷ Genotipurile selectate în variabila Selected_Genotypes_Array<br />

procedure SL_Pro Face selecţia proporţională după scorurile <strong>de</strong> selecţie astfel:<br />

;<br />

÷ Atribuie Empty la Selected_Genotypes_Array (→)<br />

÷ Pentru fiecare selecţie <strong>de</strong> la 1 la N_Sel:<br />

o Calculează suma scorurilor <strong>de</strong> selecţie pentru genotipurile care nu au<br />

fost selectate încă → FS_Sum<br />

o Generează întâmplător (distribuţie uniformă) un număr între 0 şi<br />

FS_Sum (inclusiv) şi → FS_Freq<br />

o Găseşte primul indice Group din FSD_Array pentru care FS_Freq ≤<br />

Σi≤GroupFSD_Array[i]*FSC_Array[i]<br />

o Generează un număr întâmplător (distribuţie uniformă) între 1 şi<br />

FSC_Array[i] şi → FSD_Next<br />

o Pune valoarea FSD_Array[Group] situată pe poziţia FSD_Next în<br />

FS_Array dintre cele care nu au fost selectate încă →<br />

Selected_Genotypes_Array<br />

o Sca<strong>de</strong> o unitate din FSC_Array[Group] corespunzătoare valorii<br />

selectate<br />

procedure SL_Det Face selecţia <strong>de</strong>terministă după scorurile <strong>de</strong> selecţie astfel:<br />

;<br />

÷ Atribuie Empty la Selected_Genotypes_Array (→)<br />

÷ Zero → Already_Selected<br />

÷ Volumul eşantionului → Group (are cea mai mare valoare <strong>de</strong> selecţie în<br />

FSD_Array)<br />

÷ Cât timp Already_Selected + FSC_Array[Group]


o Sca<strong>de</strong> o unitate din Group<br />

÷ Cât timp Already_Selected


procedure SL_QSr<br />

(i,j:I0T);<br />

procedure SL_SrQ<br />

(l,r:I0T);<br />

şi respectiv<br />

procedure SV_QSr<br />

(i,j:I0T);<br />

procedure SV_SrQ<br />

(l,r:I0T);<br />

function SV_MGe<br />

(i,j:I0T):R0T;<br />

function SV_MPh<br />

(i,j:I0T):R0T;<br />

procedure SV_Fit<br />

;<br />

procedure SV_Pro<br />

;<br />

procedure SV_Det<br />

;<br />

65 66<br />

Sortează folosind algoritmul QuickSort [ , ] un şir <strong>de</strong> numere<br />

(necesitând 2·[log2(n)] încrucişări) ca în următorul exemplu:<br />

Poziţii 0 1 2 3 4 5 6 7 8 9<br />

Calculează similaritatea genotipică (a două genotipuri) cu formula<br />

SG(Xi,Xj)=(g_dif(Xi,Xj)/g_tot) p Şir iniţial<br />

Încrucişare<br />

3 1 4 1 5 9 2 6 5 5<br />

Pasul 1<br />

Încrucişare<br />

3 1 4 1 5 5 2 6 9 5<br />

Pasul 2<br />

Încrucişare<br />

1 1 4 3 5 5 2 6 9 5<br />

Pasul 3<br />

Încrucişare<br />

1 1 4 3 2 5 5 6 9 5<br />

Pasul 4<br />

Încrucişare<br />

1 1 2 3 4 5 5 6 9 5<br />

Pasul 5<br />

Încrucişare<br />

1 1 2 3 4 5 5 6 5 9<br />

Pasul 6 1 1 2 3 4 5 5 5 6 9<br />

Şir ordonat 1 1 2 3 4 5 5 5 6 9<br />

un<strong>de</strong> g_dif(Xi,Xj) = numărul <strong>de</strong> gene care<br />

au valori diferite în Xi vs. Xj, g_tot = numărul total <strong>de</strong> gene din cromozom,<br />

p = parametrul similarităţii genotipice <strong>de</strong>finit în fişierul <strong>de</strong> configurare<br />

`c_galg.cga`<br />

Calculează similaritatea fenotipică (a două fenotipuri) cu formula<br />

SP(Xi,Xj)=(fit(X1)-fit(X2)) p un<strong>de</strong> fit(X1) = scorul relativ (subunitar) <strong>de</strong><br />

selecţie al primului fenotip, fit(X2) = scorul relativ (subunitar) <strong>de</strong> selecţie<br />

al celui <strong>de</strong>-al doilea fenotip, p = parametrul similarităţii fenotipice <strong>de</strong>finit<br />

în fişierul <strong>de</strong> configurare `c_galg.cga`<br />

÷ Calculează scorul <strong>de</strong> similaritate genotipică (SSG) şi scorul <strong>de</strong><br />

similaritate fenotipică (SSP) folosind formulele:<br />

SSG(Xi)= min SG(<br />

X , X )) ; SSP(Xi)= min SP(<br />

X , X ))<br />

( i j<br />

j≠i<br />

( i j<br />

j≠i<br />

÷ Calculează scorul <strong>de</strong> supravieţuire (diversitate) cu formula:<br />

2<br />

SS(Xi)=<br />

SSG(<br />

Xi<br />

) + SSP(<br />

Xi<br />

)<br />

÷ Normalizează valorile (relativ la minimul şi maximul obţinut în<br />

generaţiile anterioare) dacă opţiunea <strong>de</strong> normalizare a fost activată în<br />

fişierul <strong>de</strong> configurare<br />

÷ Rotunjeşte valorile la precizia <strong>de</strong>finită în fişierul <strong>de</strong> configurare<br />

÷ Înlocuieşte valorile cu ranguri dacă opţiunea ranguri a fost activată în<br />

fişierul <strong>de</strong> configurare<br />

÷ Sortează valorile<br />

Date <strong>de</strong> intrare:<br />

÷ FV_Array - Şirul scorurilor <strong>de</strong> supravieţuire;<br />

÷ N_Srv - Număr <strong>de</strong> selecţii (numărul <strong>de</strong> <strong>de</strong>scen<strong>de</strong>nţi viabili);<br />

[ 65 ] (Sir) Charles A. R. HOARE. 1962. Quicksort. Computer Journal 5(1):10-15.<br />

[ 66 ] http://en.wikipedia.org/wiki/File:Sorting_quicksort_anim.gif<br />

243


(partea comună) Algoritm (Construcţia claselor <strong>de</strong> frecvenţe):<br />

÷ Pune valorile distincte din FV_Array în FVD_Array;<br />

÷ Pune numărul <strong>de</strong> apariţii ale valorilor din FV_Array în FVC_Array;<br />

÷ Sortează ascen<strong>de</strong>nt după FVD_Array ambele FVD_Array şi<br />

FVC_Array;<br />

÷ Partea distinctă (vezi mai jos)<br />

Date <strong>de</strong> ieşire:<br />

÷ Genotipurile selectate în variabila Ceased_Genotypes_Array<br />

procedure SV_Pro SV_Pro i<strong>de</strong>m cu SL_Pro pentru FV_Array, N_Srv, FVD_Array,<br />

;<br />

FVC_Array şi Ceased_Genotypes_Array în loc <strong>de</strong> FS_Array, N_Sel,<br />

FSD_Array, FSC_Array şi Selected_Genotypes_Array<br />

procedure SV_Det SV_Det i<strong>de</strong>m cu SL_Det pentru FV_Array, N_Srv, FVD_Array,<br />

;<br />

FVC_Array şi Ceased_Genotypes_Array în loc <strong>de</strong> FS_Array, N_Sel,<br />

FSD_Array, FSC_Array şi Selected_Genotypes_Array<br />

procedure SV_Tur SV_Tur i<strong>de</strong>m cu SL_Tur pentru FV_Array, N_Srv şi<br />

;<br />

Ceased_Genotypes_Array în loc <strong>de</strong> FS_Array, N_Sel şi<br />

Selected_Genotypes_Array<br />

procedure SV_Rnk Înlocuieşte valorile scorurilor <strong>de</strong> selecţie cu rangurile acestora; SV_Rnk<br />

;<br />

i<strong>de</strong>m cu SL_Rnk pentru FV_Array şi N_Srv în loc <strong>de</strong> FS_Array, N_Sel<br />

procedure SV_Mak În funcţie <strong>de</strong> opţiunea <strong>de</strong>finită în fişierul <strong>de</strong> configurare `c_galg.cga`<br />

;<br />

pentru metoda <strong>de</strong> supravieţuire aplică una dintre supravieţuirea<br />

proporţională, supravieţuirea <strong>de</strong>terministă şi supravieţuirea în turnir<br />

procedure FT_Ini Iniţializează scorurile <strong>de</strong> selecţie ale unui individ (din şirul <strong>de</strong> evoluţii, din<br />

(var x:R1T);<br />

şirul <strong>de</strong> generaţii, din şirul <strong>de</strong> genotipuri, din şirul <strong>de</strong> fenotipuri, din şirul<br />

<strong>de</strong> fenotipuri în regresie) cu valori limită (XX_min - un<strong>de</strong> XX una dintre<br />

r2, se, Mt sau Hr - cu max_real; XX_max cu min_real şi respectiv<br />

XX_avg cu 0)<br />

procedure FT_Set Aplică operatorii minim (pentru XX_min), maxim (pentru XX_max) şi<br />

(var s,d:R1T);<br />

sumă (pentru XX_avg) pentru doi indivizi cumulând numărul <strong>de</strong> indivizi<br />

procedure FT_Avg Împarte suma (pentru XX_avg) la numărul <strong>de</strong> indivizi<br />

(var x:R1T);<br />

procedure FT_Sav; Salvează în variabiele b_r, b0o şi b0s parametrii celei mai bune regresii<br />

(celui mai bun obiectiv) adică:<br />

÷ b_r[0]=(r2, se, Mt, Hr, df_r, me, df_t)<br />

o r2 - coeficientul <strong>de</strong> <strong>de</strong>terminare r 2 (Y,Ŷ)<br />

o se - suma pătratelor erorilor <strong>de</strong> explicare Σ(Y-Ŷ) 2<br />

o Mt - media Minkwski a semnificaţiilor date <strong>de</strong> parametrii Stu<strong>de</strong>nt t ai<br />

regresiei<br />

o df_r - numărul <strong>de</strong> gra<strong>de</strong> <strong>de</strong> libertate ai mo<strong>de</strong>lului (regresiei) - `p+1`<br />

pentru ecuaţia (1) şi `p` pentru ecuaţia (2)<br />

o me - eroarea medie <strong>de</strong> explicare (se/df_t)<br />

o df_t - gra<strong>de</strong>le <strong>de</strong> libertate ale observabilei (m-df_r)<br />

÷ b_r[1]=(m0, m1, m2, m3, m4, mx, my, v0, g1, g2, jb, ox, r2)<br />

o m0, m1, m2, m3, m4, mx, my, v0, g1, g2, jb, şi r2 cu semnificaţiile<br />

<strong>de</strong>finite în Tabelul 45; ox = 1 (ox = 0 semnifică că regresia nu are toţi<br />

parametrii semnificativi statistic sau sistemul <strong>de</strong> ecuaţii asociat nu<br />

admite soluţie unică; ox = 0 nu poate fi salvată drept soluţie care<br />

satisface obiectivul evoluţiei)<br />

÷ b_r[2]=(n_aliv, r2_min, se_min, Mt_min, Hr_min, r2_max, se_max,<br />

Mt_max, Hr_max, r2_avg, se_avg, Mt_avg, Hr_avg)<br />

o valorile referă regresia şi sunt <strong>de</strong>generate astfel:<br />

n_aliv = 1<br />

244


XX_min = XX_max = XX_avg = XX (XX = r2, se, Mt, Hr)<br />

÷ b_r[3]=(coef(0), coef(X1), ..., coef(Xp)) - ecuaţia (1) sau (2)<br />

o coef(0)=0.000 pentru ecuaţia (2)<br />

÷ b_r[4]=(t(0), t(X1), ..., t(Xp)) - ecuaţia (20) şi (21)<br />

o t(0)=0.000 pentru ecuaţia (2)<br />

÷ b0o = Şirul operatorilor <strong>de</strong> linearizare care au condus la transformarea<br />

genotipurilor în fenotipurile X1, ..., Xp<br />

÷ b0p = Şirul adreselor genotipurilor transformate în fenotipurile X1, ...,<br />

function FT_r2<br />

:R0T;<br />

Xp<br />

Calculează scorul <strong>de</strong> selecţie după formula (p=fr2 Tabelul 45):<br />

FT_r2(Y,Ŷ)=(r 2 (Y,Ŷ)) p<br />

function FT_se<br />

:R0T;<br />

Calculează scorul <strong>de</strong> selecţie după formula (p=fse Tabelul 45):<br />

FT_se(Y,Ŷ)=Σ|Y-Ŷ| p<br />

function FT_Mt<br />

:R0T;<br />

Calculează scorul <strong>de</strong> selecţie după formula (p=fMt Tabelul 45):<br />

n<br />

1/<br />

p<br />

⎛ 1 p ⎞<br />

FT_Mt(Y,Ŷ)= ⎜ ∑= t ( Xi<br />

) ⎟<br />

⎝ n i 1 ⎠<br />

function FT_Hr Calculează scorul <strong>de</strong> selecţie după formula (p=fHr Tabelul 45):<br />

:R0T; 2p<br />

2 p<br />

log ( r + ( 1−<br />

r ) )<br />

FT_Hr(Y,Ŷ)= 2<br />

1−<br />

p<br />

procedure FT_RG<br />

;<br />

Calculează parametrii {r2p, sep, Mtp, Hrp} pentru o regresie şi aplică<br />

operatorii {min, max, sum} pentru a obţine parametrii {n_aliv, r2_min,<br />

se_min, Mt_min, Hr_min, r2_max, se_max, Mt_max, Hr_max, r2_avg,<br />

se_avg, Mt_avg, Hr_avg} pentru o regresie<br />

procedure FT_PH<br />

;<br />

÷ Obţine şirul fenotipurilor viabile din cultivar<br />

÷ Efectuează toate regresiile posibile şi cumulează scoruri <strong>de</strong> selecţie<br />

pentru fenotipuri<br />

÷ Cumulează scoruri <strong>de</strong> selecţie pentru genotipuri<br />

÷ Cumulează scoruri <strong>de</strong> selecţie pentru generaţie<br />

procedure FT_SA<br />

;<br />

Transformă scorurile <strong>de</strong> selecţie cumulate pentru genotipuri în valori<br />

medii (pentru scorurile <strong>de</strong> tipul XX_avg)<br />

procedure D0<br />

;<br />

Creează (iniţializează) acele fişierele <strong>de</strong> ieşire pentru rezultate care au fost<br />

<strong>de</strong>finite în fişierul <strong>de</strong> configurare<br />

procedure DRY<br />

;<br />

Scrie într-un fişier <strong>de</strong> ieşire (dacă opţiunea d_r este activată în fişierul <strong>de</strong><br />

configurare) o linie <strong>de</strong> informaţii pentru valorile măsurate conţinând<br />

informaţiile activate pentru afişare în fişierul <strong>de</strong> configurare<br />

procedure DR1<br />

;<br />

Scrie în fişierul <strong>de</strong> ieşire (dacă opţiunea d_r este activată în fişierul <strong>de</strong><br />

configurare) o linie <strong>de</strong> informaţii pentru o ecuaţie <strong>de</strong> regresie conţinând<br />

informaţiile activate pentru afişare în fişierul <strong>de</strong> configurare<br />

procedure DPSG<br />

;<br />

Scrie în fişierele <strong>de</strong> ieşire informaţiile (activate pentru afişare în fişierul <strong>de</strong><br />

configurare) corespunzător fenotipurilor şi genotipurilor unei generaţii şi<br />

respectiv informaţia cumulată caracterizând generaţia<br />

procedure DE1<br />

;<br />

Scrie în fişierul <strong>de</strong> ieşire pentru evoluţii (dacă opţiunea d_e este activată în<br />

fişierul <strong>de</strong> configurare) o linie <strong>de</strong> informaţii pentru valorile măsurate<br />

conţinând informaţiile activate pentru afişare în fişierul <strong>de</strong> configurare<br />

procedure DF1<br />

;<br />

Scrie în fişierul <strong>de</strong> ieşire (dacă opţiunea d_f este activată în fişierul <strong>de</strong><br />

configurare) linii <strong>de</strong> informaţii conţinând genotipurile cu scorurile <strong>de</strong><br />

selecţie şi supravieţuire înainte <strong>de</strong> aplicarea mutaţiei şi încrucişării<br />

procedure DF2<br />

;<br />

Scrie în fişierul <strong>de</strong> ieşire (dacă opţiunea d_f este activată în fişierul <strong>de</strong><br />

configurare) linii <strong>de</strong> informaţii conţinând genotipurile cu scorurile <strong>de</strong><br />

selecţie şi supravieţuire după <strong>de</strong> aplicarea mutaţiei şi încrucişării<br />

245


procedure DC0 Scrie în fişierul <strong>de</strong> ieşire starea tuturor parametrilor <strong>de</strong> configurare <strong>de</strong>finiţi<br />

(var d:S0T);<br />

(în fişierele <strong>de</strong> configurare) la lansarea în execuţie a programului evolutiv<br />

procedure DC1 Produce un mesaj <strong>de</strong> panică cu privire la starea cultivarului dacă în timpul<br />

(s:S9);<br />

evoluţiei conţinutul acestuia se sărăceşte în asemenea măsură încât nu mai<br />

există suficiente fenotipuri viabile pentru a construi o ecuaţie <strong>de</strong> regresie;<br />

în acest caz se re-iniţializează cultivarul reconstruind prima sa generaţie<br />

(procedura SA_Frst)<br />

procedure DC2 Scrie o linie <strong>de</strong> informaţii în fişierul <strong>de</strong> ieşire ce caracterizează funcţia<br />

;<br />

obiectiv la sfârşitul unei execuţii in<strong>de</strong>pen<strong>de</strong>nte a algoritmului genetic<br />

2009A6. Validarea mo<strong>de</strong>lelor (TvT - Training versus Test, cv-loo - cross validation leave-one-out,<br />

CCA - Correlated Correlations Analysis)<br />

Validarea mo<strong>de</strong>lelor este unul din subiectele <strong>de</strong> actualitate (Bolboacă & Jäntschi, 2006-SPMA;<br />

Bolboacă & Jäntschi, 2007-SMMV; Bolboacă & Jäntschi, 2007-DMRM; Bolboacă & Jäntschi,<br />

2007-DMRM) oferind o arie <strong>de</strong> manifestare largă. Derularea activităţii a permis valorificarea unei<br />

serii <strong>de</strong> rezultate noi în ceea ce priveşte evaluarea capacităţii <strong>de</strong> estimare pentru mo<strong>de</strong>le având<br />

înglobate polinoame caracteristice (Bolboacă & Jäntschi, 2007-HGCP), metodologia <strong>de</strong> aplicare a<br />

instrumentelor statistice în evaluarea mo<strong>de</strong>lelor (Bolboacă & Jäntschi, 2008-SMMV), analiza <strong>de</strong><br />

aglomerare ca tehnică <strong>de</strong> validare (Bolboacă & Jäntschi, 2008-ICPT), cazuistica evaluării relaţiilor<br />

structură-activitate (Bolboacă & Jäntschi, 2008-SASA), cazuistica evaluării mo<strong>de</strong>lelor <strong>de</strong><br />

compoziţie chimică a amestecurilor (Bolboacă & others, 2008-SASM), măsuri statistice eficiente în<br />

evaluarea relaţiilor structură-activitate (Bolboacă & others, 2008-SqsV).<br />

Următoarele proceduri au fost implementate pe parcursul <strong>de</strong>rulării activităţii.<br />

Testul Grubbs <strong>de</strong> i<strong>de</strong>ntificare a abaterilor grosolane <strong>de</strong> la normalitate a fost implementat ca aplicaţie<br />

online care se găseşte la adresa şi foloseşte librării statistice pentru calculul distribuţiei Stu<strong>de</strong>nt t:<br />

http://l.aca<strong>de</strong>micdirect.org/Statistics/tests/Grubbs/<br />

if(array_key_exists("data",$_POST))<br />

$data=$_POST["data"];<br />

elseif(array_key_exists("data",$_GET))<br />

$data=$_GET["data"];<br />

else<br />

die("No data!");<br />

$Y=explo<strong>de</strong>("\r\n",$data);<br />

$tab=strpos("\t",$Y[0]);<br />

$m=count($Y);<br />

if(!($tab===FALSE)){<br />

$Z=explo<strong>de</strong>("\t",$Y[0]);$n=count($Z);<br />

for($i=0;$i


$p_max[$i]=1.0*$m-1.0*$m*$tdist->_getCDF($t_max[$i]);<br />

$p_all[$i]=2.0*$m-2.0*$m*$tdist->_getCDF($t_all[$i]);<br />

}<br />

echo("");<br />

echo("Parameter");for($i=0;$i0))die();<br />

if((strpos($_POST["file"],"/")>0))die();<br />

if((strpos($_POST["file"],"..")>0))die();<br />

$a=explo<strong>de</strong>("\r\n",file_get_contents($_POST["file"]));<br />

$y=array();<br />

for($i=0;$i


}else{<br />

$h[$l]++;<br />

}<br />

}$zn=count($z);<br />

array_multisort($z,SORT_ASC,$h);<br />

$hh=array();$hhs=0;<br />

for($i=0;$i


$d[$i][$k++]=$c[$i][$j];<br />

for($i=0;$i<br />

<br />

<br />

<br />


}<br />

function calc_eq(&$coef,&$val,&$rez){//predictie pentru fiecare molecula<br />

for($i=0;$i


for($i=0;$i


$coef_F=coef_F($y,$y_pred,count($c)-1);<br />

echo("Fisher test value F = ".spalare($coef_F)."");<br />

$coef_pF=coef_pF(count($c)-1,count($y)-1,$coef_F);<br />

echo("Probability of wrong (from F) pF = ".sprintf("%1.5f",$coef_pF*100)." % (".$coef_pF.")");<br />

for($i=1;$i<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />


mat_means($n,$m,$y,$x,$ma,$mb);<br />

red_gauss($mb,$ma,$n);<br />

echo("yy=".$mb[0]);<br />

for($i=1;$i


}<br />

function mat_means($n,$m,&$y,&$x,&$ma,&$mb){<br />

$ma[0][0] = 1;<br />

$mb[0] = m1($y,$m);<br />

for($k1=1;$k10)echo("YY");<br />

if($nyyy>0)echo("YYY");<br />

for($j=0;$j0)echo("".$yy[$j]);<br />

if($nyyy>0)echo("".$yyy[$j]);<br />

}<br />

echo("");<br />

}<br />

<strong>de</strong>fine("char160",chr(160));<br />

<strong>de</strong>fine("char13",chr(13));<br />

function find_first_local(&$s,&$a){<br />

$i=strlen($s)+1;<br />

if($i==1)return array(-1,0);<br />

$first_special=-1;<br />

for($j=0;$j$k){<br />

$first_special=$j;<br />

$i=$k;<br />

}<br />

}<br />

}<br />

return array($first_special,$i);<br />

}<br />

function preg_split_local($s,$a=array(' ','\t','\f')){//char160,char13<br />

$t=array();<br />

while(1){<br />

$i=strlen($s)+1;<br />

if($i==1)break;<br />

$first_special_pos=find_first_local($s,$a);<br />

while($first_special_pos[1]==0){<br />

list($r,$s)=explo<strong>de</strong>($a[$first_special_pos[0]],$s,2);<br />

254


}<br />

if(strlen($s)>0)<br />

$t[]=$s;<br />

return $t;<br />

$first_special_pos=find_first_local($s,$a);<br />

}<br />

if($first_special_pos[0]complementaryError($Z/SQRT2);<br />

$E=$Gauss->error($Z/SQRT2);<br />

echo("P(z &#8804; -Z) + P(Z &#8804; z) = ");<br />

if($CE= 0.0 ? $x : -$x);<br />

if($abs_x


}<br />

}elseif($abs_xerror($abs_x);<br />

}elseif($abs_x > 28.0){ $retval=0.0;<br />

}else{//1.25$accuracy)&&($i++NDist_CDF($x)-$prob;//Apply Newton-Raphson step<br />

if($errorNDist_PDF($x);<br />

if($pdf!=0.0){//Avoid division by zero<br />

$dx=$error/$pdf;<br />

$xNew=$x-$dx;<br />

}<br />

if(($xNew$xHi)||($pdf==0.0)){<br />

$xNew=($xLo+$xHi)/2.0;<br />

$dx=$xNew-$x;<br />

}<br />

$x=$xNew;<br />

}<br />

return $x;<br />

}<br />

2010A1. Aplicarea procedurilor QSAR şi colectarea informaţiei<br />

Ca rezultat al colectării informaţiei din aplicarea procedurilor QSAR o serie <strong>de</strong> rezultate noi au fost<br />

obţinute în cadrul proiectului (Bolboacă & Jäntschi, 2009-CCqD; Jäntschi & others, 2010-DqCC;<br />

Bolboacă & Jäntschi, 2010-DqPM; Bolboacă & others, 2011-DDNR).<br />

Pentru ca rezultatele observaţiei să capete consistenţă în ceea ce priveşte interpretarea statistică, mai<br />

256


este necesar ca să se asume ipoteza <strong>de</strong> convergenţă la normalitate asupra valorilor observate în<br />

eşantionul seriei <strong>de</strong> compuşi, spaţiul complet al acestora fiind în acest caz un exemplu tipic <strong>de</strong><br />

populaţie finită distribuită normal.<br />

O serie <strong>de</strong> măsuri statistice ce caracterizează o populaţie şi un eşantion sunt redate în următoarele<br />

două tabele.<br />

Măsuri statistice pentru caracterizarea variabilelor cantitative<br />

Măsură Referă Expresie Interpretare<br />

Suma valorilor Σ(·) -<br />

Numărul <strong>de</strong> valori Un şir |·| -<br />

Valoarea medie <strong>de</strong> numere E(·) = Σ(·)/|·| Valoarea aşteptată<br />

Ek(·) = E((X-E(X)) k Moment central <strong>de</strong> ordin k, k>1 ) -<br />

Media caracteristicii X O populaţie μ = μ(X) = E(X)<br />

Media observabilei Y Un eşantion m = m(Y) = E(Y) Tendinţa<br />

Estimatorul mediei<br />

caracteristicii X<br />

O populaţie M(Y) = m(Y)<br />

centrală<br />

Var(X) = E((X-μ) 2 Varianţa caracteristicii X ) Împrăştierea<br />

Deviaţia standard a<br />

caracteristicii X<br />

O populaţie<br />

σ = σ(X) = Var( X)<br />

Dispersia<br />

var = var(Y) = E((Y-E(Y)) 2 Varianţa observabilei Y ) Împrăştierea<br />

Deviaţia standard a<br />

observabilei Y<br />

Estimatorul varianţei<br />

caracteristicii X<br />

Estimatorul <strong>de</strong>viaţiei standard a<br />

caracteristicii X<br />

Un eşantion<br />

O populaţie<br />

s = s(Y) = var( Y)<br />

Dispersia<br />

VAR(Y) =<br />

| Y |<br />

| Y | −1 var(Y) Împrăştierea<br />

| Y |<br />

S = S(Y) = s(Y) Dispersia<br />

| Y | −1<br />

Statistici pentru caracterizarea <strong>de</strong>părtării <strong>de</strong> normalitate a variabilelor cantitative<br />

Simbol şi măsură Referă Expresie Mărimi care intervin<br />

γ1 = μ3/μ2 3/2<br />

γ1, Asimetria caracteristicii X<br />

β2, Boltirea caracteristicii X β2 = μ4/μ2 2<br />

γ2, Excesul <strong>de</strong> boltire al<br />

caracteristicii X<br />

O<br />

populaţie<br />

γ2 = β2-3<br />

μk = Ek(X), k>1<br />

g1 = m3/m2 3/2<br />

g1, Asimetria observabilei Y<br />

b2 = m4/m2 2<br />

b2, Boltirea observabilei Y<br />

g2, Excesul <strong>de</strong> boltire al<br />

observabilei Y<br />

Un<br />

eşantion<br />

g2 = b2-3<br />

mk = Ek(Y), k>1<br />

Estimatorul asimetriei<br />

caracteristicii X<br />

G1 =<br />

n Y ( n Y −1) M3/M2<br />

( n Y − 2)<br />

3/2<br />

Estimatorul boltirii<br />

caracteristicii X<br />

( n Y −1)(<br />

n Y + 1)<br />

B2 =<br />

M4/M2<br />

( n Y − 2)(<br />

n Y − 3)<br />

2<br />

nY = |Y|<br />

O<br />

populaţie<br />

n Y<br />

Mk =<br />

n Y −1 Estimatorul excesului <strong>de</strong><br />

boltire a caracteristicii X<br />

2<br />

( n Y −1)<br />

G2 = B2 - 3·<br />

( n Y − 2)(<br />

n Y − 3)<br />

Ek(Y),<br />

k>1<br />

Extragerea repetată <strong>de</strong> eşantioane (<strong>de</strong> volum dat) dintr-o populaţie face ca valorile obţinute să<br />

urmeze o distribuţie, numită distribuţia <strong>de</strong> eşantionare. Tabelul următor prezintă rezultatele care se<br />

obţin pentru varianţa mărimilor statistice prin extragerea repetată <strong>de</strong> eşantioane dintr-o populaţie.<br />

Când valorile parametrilor statistici ai populaţiei nu sunt cunoscute, dar se poate face presupunerea<br />

că distribuţia populaţiei se comportă suficient <strong>de</strong> bine [67], aceştia pot fi aproximaţi cu ajutorul<br />

[ 67 ] Teorema Limită Centrală<br />

÷ Cronologia contribuţiilor majore:<br />

257


estimatorilor acestora. Formulele <strong>de</strong> calcul aproximativ ale mediei şi varianţei pentru medie şi<br />

varianţă sunt redate în tabelul următor. Dacă se pot asuma ipoteze cu privire la distribuţia<br />

caracteristicii X în populaţie, atunci se pot obţine formule <strong>de</strong> calcul pentru parametrii statistici (ai<br />

populaţiei).<br />

Medii şi varianţe ale mediei şi varianţei observabilei Y ce rezultă din distribuţia <strong>de</strong> eşantionare<br />

din populaţia cu caracteristica X<br />

Mărime şi notaţie Valoare<br />

Media mediei, μ μ = μ(<br />

m(<br />

Y))<br />

= μ(<br />

X)<br />

Y<br />

Y<br />

Varianţa mediei,<br />

2<br />

σ Y<br />

Media varianţei, μ(s 2 )<br />

Varianţa varianţei, σ 2 (s 2 )<br />

σ<br />

2<br />

Y<br />

= σ<br />

2<br />

2<br />

μ(<br />

s ) = μ(<br />

s<br />

( m(<br />

Y))<br />

2<br />

( Y))<br />

2<br />

σ ( X)<br />

=<br />

n<br />

Y<br />

( n Y −1)<br />

2<br />

= σ<br />

n<br />

2 2 2 2 ( n<br />

σ ( s ) = σ ( s ( Y))<br />

=<br />

Y<br />

−1)<br />

Y<br />

3<br />

n Y<br />

( X)<br />

2<br />

μ<br />

4<br />

( X)<br />

−<br />

( n<br />

Y<br />

−1)(<br />

n<br />

n<br />

Y<br />

3<br />

Y<br />

− 3)<br />

μ<br />

Valori aproximative pentru mediile şi varianţele mediei şi varianţei observabilei Y în ipotezele<br />

teoremei limită centrale<br />

Mărime şi notaţie Aproximare<br />

Media mediei, μ μ ≅ m(<br />

Y)<br />

Y<br />

Y<br />

2<br />

Varianţa mediei, σ Y<br />

s ( Y)<br />

σ ≅ Y<br />

( n Y −1)<br />

2<br />

2<br />

Media varianţei, μ(s 2 )<br />

2 2<br />

μ ( s ) ≅ s ( Y)<br />

Varianţa varianţei, σ 2 (s 2 )<br />

2 2<br />

σ ( s ) ≅<br />

n Y −1)<br />

( n Y − 3)<br />

m4<br />

( Y)<br />

− m<br />

2<br />

n<br />

n ( n −1)<br />

( 2<br />

2<br />

Y<br />

Y Y<br />

( Y)<br />

Tabelele 1-19 dau expresiile acestor mărimi statistice (valabile pentru populaţie).<br />

Tabelul 1. Mărimi statistice ale distribuţiei discrete uniforme<br />

Mărime statistică Expresie <strong>de</strong> calcul<br />

Suport k ∈ {a, a+1, ..., b-1, b}<br />

Minim; Maxim<br />

Funcţia <strong>de</strong> probabilitate<br />

a; b<br />

1 ( b − a + 1)<br />

Funcţia <strong>de</strong> repartiţie ( [ k]<br />

− a + 1)<br />

( b − a + 1)<br />

Media şi mediana; varianţa<br />

a + b<br />

2<br />

2 ; ( b − a + 1)<br />

−1<br />

12<br />

( )<br />

( )<br />

o Abraham DE MOIVRE. 1733. Approximatio ad Summam Terminorum Binomii (a+b) n in Seriem expansi. In:<br />

Abraham DE MOIVRE. The Doctrine of Chance: or The Method of Calculating the Probability of Events in<br />

Play. W. Pearforn 1738: 235-243.<br />

o Joseph L. LAGRANGE. 1776. Mémoire sur l’utilité <strong>de</strong> la métho<strong>de</strong> <strong>de</strong> prendre le milieu entre les résultats <strong>de</strong><br />

plusieurs observations; dans lequel on examine les avantages <strong>de</strong> cette métho<strong>de</strong> par le calcul <strong>de</strong>s probabilités; et<br />

où l’on résoud différents problèmes relat ifs à cette matière. Miscellanea Taurinensia 5:167-232.<br />

o Pierre S. LAPLACE. 1812. Théorie Analytique <strong>de</strong>s Probabilités. Courcier, 465 p.<br />

o Aleksandr M. LIAPUNOV. 1901. Nouvelle forme du théoreme sur la limite <strong>de</strong>s probabilités. Mémoires <strong>de</strong><br />

l'Académie Impériale <strong>de</strong>s Sciences <strong>de</strong> St. Pétersbourg 12(5):1-24.<br />

÷ Enunţul teoremei (fie (Xn)n≥1 variabile in<strong>de</strong>pen<strong>de</strong>nte şi ∃δ>0 a.î. μ2+δ(Xn)


6((<br />

b − a + 1)<br />

Asimetria; excesul <strong>de</strong> boltire 0; −<br />

5((<br />

b − a + 1)<br />

Tabelul 2. Mărimi statistice ale distribuţiei discrete Bernoulli<br />

Mărime statistică Expresie <strong>de</strong> calcul<br />

Suport k ∈ {0,1}; p ∈ (0,1)<br />

Minim; Maxim 0; 1<br />

Funcţia <strong>de</strong> probabilitate (1-p), k = 0 p, k = 1<br />

Funcţia <strong>de</strong> repartiţie (1-p), k ∈ [0,1)<br />

1, 1 ≤ k<br />

Media; varianţa p; p(1-p)<br />

Asimetria; excesul <strong>de</strong> boltire 6p 6p<br />

1 p(<br />

1 p)<br />

2<br />

− + −<br />

2<br />

2<br />

+ 1)<br />

−1)<br />

0; ( ) ( )<br />

Tabelul 3. Mărimi statistice ale distribuţiei discrete binomiale<br />

Mărime statistică Expresie <strong>de</strong> calcul<br />

Suport k ∈ {0, ..., n}; p ∈ (0,1)<br />

Minim; Maxim 0; n<br />

Funcţia <strong>de</strong> probabilitate<br />

n!<br />

k n−k<br />

p ( 1−<br />

p)<br />

k!<br />

⋅(<br />

n − k)!<br />

Funcţia <strong>de</strong> repartiţie<br />

k n!<br />

i n−i<br />

∑ p ( 1−<br />

p)<br />

i=<br />

0 i!<br />

( n − i)!<br />

Media; varianţa np; np(1-p)<br />

Asimetria; excesul <strong>de</strong> boltire ( 1− 2p)<br />

1−<br />

6p(<br />

1−<br />

p)<br />

np(<br />

1−<br />

p)<br />

;<br />

np(<br />

1−<br />

p)<br />

Tabelul 4. Mărimi statistice ale distribuţiei discrete Poisson<br />

Mărime statistică Expresie <strong>de</strong> calcul<br />

Suport k = 0, 1, ...; λ ≥ 0<br />

Minim; Maxim 0; ∞<br />

Funcţia <strong>de</strong> probabilitate<br />

−λ<br />

k<br />

e λ k!<br />

Funcţia <strong>de</strong> repartiţie ∑ =<br />

i<br />

k<br />

0<br />

e<br />

−λ i<br />

λ<br />

Media; varianţa λ; λ<br />

Asimetria; excesul <strong>de</strong> boltire 1 λ ; 1 λ<br />

Tabelul 5. Mărimi statistice ale distribuţiei continue uniforme<br />

Mărime statistică Expresie <strong>de</strong> calcul<br />

Suport x ∈ [a, b]<br />

Minim; Maxim a; b<br />

Funcţia <strong>de</strong> probabilitate 1/(b-a)<br />

Funcţia <strong>de</strong> repartiţie (x-a)/(b-a)<br />

Media şi mediana; varianţa<br />

i!<br />

(a+b)/2; (b-a) 2 /12<br />

Asimetria; excesul <strong>de</strong> boltire 0; -6/5<br />

Tabelul 6. Mărimi statistice ale distribuţiei continue Cauchy-<strong>Lorentz</strong><br />

Mărime statistică Expresie <strong>de</strong> calcul<br />

Suport x ∈ (-∞,∞); x0 ∈ (-∞,∞); γ ∈ (0,∞)<br />

Minim; Maxim -∞; ∞<br />

1<br />

Funcţia <strong>de</strong> probabilitate<br />

259<br />

⎛<br />

⎜ ⎛ x − x<br />

γπ 1+<br />

⎜<br />

⎜<br />

⎝ ⎝ γ<br />

0<br />

2<br />

⎞<br />

⎟<br />

⎠<br />

⎞<br />

⎟<br />

⎟<br />


Funcţia <strong>de</strong> repartiţie<br />

1 ⎛ x − x 0 ⎞<br />

arctan⎜<br />

⎟ +<br />

π ⎝ γ ⎠<br />

Mediana şi moda x0<br />

Tabelul 7. Mărimi statistice ale distribuţiei continue Stu<strong>de</strong>nt t<br />

Mărime statistică Expresie <strong>de</strong> calcul<br />

Suport x ∈ (-∞,∞); ν ∈ (0,∞)<br />

Minim; Maxim -∞; ∞<br />

Funcţia <strong>de</strong> probabilitate<br />

⎛ ν + 1⎞<br />

Γ⎜<br />

⎟ 2<br />

⎝ 2 ⎠ ⎛ t ⎞<br />

⎜<br />

⎜1+<br />

⎟<br />

⎛ ν ⎞ ⎝ ν<br />

νπΓ⎜<br />

⎟<br />

⎠<br />

⎝ 2 ⎠<br />

⎛ ν+<br />

1 ⎞<br />

−⎜<br />

⎟<br />

⎝ 2 ⎠<br />

2 ( − x / ν)<br />

1<br />

2<br />

, Γ(<br />

z)<br />

=<br />

n<br />

∞<br />

∫<br />

0<br />

t<br />

e<br />

z−1<br />

−t<br />

Funcţia <strong>de</strong> repartiţie<br />

n<br />

+ 1⎞<br />

⎟⋅∑<br />

∏ 2 ⎠ n≥0<br />

n!<br />

i<br />

−<br />

Media; mediana; moda; varianţa<br />

1<br />

1 ⎛ ν<br />

( 1+<br />

2i)(<br />

ν + 1+<br />

2i)<br />

+ xΓ⎜<br />

2 ⎝<br />

= 0 2(<br />

3 + 2i)<br />

0 (ν > 1); 0; 0; ν ( ν − 2)<br />

, ν > 2<br />

Asimetria; excesul <strong>de</strong> boltire 0, ν > 3; 6 ( ν − 4)<br />

, ν > 4<br />

Tabelul 8. Mărimi statistice ale distribuţiei continue Fisher-Sne<strong>de</strong>cor F<br />

Mărime statistică Expresie <strong>de</strong> calcul<br />

Suport x ∈ [0,∞); d1,d2 ∈ (0,∞)<br />

Minim; Maxim 0; ∞<br />

Funcţia <strong>de</strong> probabilitate<br />

d 2 d<br />

( ( d1<br />

+ d2<br />

) 2)<br />

( d1)<br />

( d2<br />

)<br />

( d 2)<br />

Γ(<br />

d 2)<br />

( d x + d )<br />

Γ<br />

Γ<br />

1<br />

2<br />

1 2 2 d1<br />

2−1<br />

x<br />

1<br />

2<br />

( ) 2 d d +<br />

1<br />

2<br />

, Γ ( z)<br />

=<br />

Funcţia <strong>de</strong> repartiţie<br />

⎛ d<br />

⎞<br />

1x<br />

d1<br />

d2<br />

IB ⎜ , , ⎟<br />

⎝ d1x<br />

+ d2<br />

2 2 ⎠<br />

⎛ d1<br />

d2<br />

⎞<br />

IB⎜1,<br />

, ⎟ , IB(<br />

z,<br />

a,<br />

b)<br />

=<br />

⎝ 2 2 ⎠<br />

Media; moda<br />

d 2 d1<br />

− 2 d2<br />

, d2 > 2; , d1 > 2<br />

d − 2 d d + 2<br />

Varianţa; asimetria<br />

Excesul <strong>de</strong> boltire<br />

2<br />

1<br />

2<br />

2<br />

1<br />

2<br />

∞<br />

∫<br />

0<br />

t<br />

e<br />

z−1<br />

−t<br />

z<br />

∫<br />

0<br />

t<br />

dt<br />

a−1<br />

dt<br />

( 1−<br />

t)<br />

2<br />

2d2<br />

( d1<br />

+ d2<br />

− 2)<br />

( 2d1<br />

+ d2<br />

− 2)<br />

8(<br />

d2<br />

− 4)<br />

, d2 > 4;<br />

, d2 > 6<br />

2<br />

d ( d − 2)<br />

( d − 4)<br />

( d2<br />

− 6)<br />

d ( d + d − 2)<br />

3d<br />

3<br />

2<br />

+ ( 5d1<br />

−8)<br />

d2<br />

+ ( 5d1<br />

− 32 d1<br />

+ 20)<br />

d 2 − 22d1<br />

d ( d − 6)(<br />

d − 8)(<br />

d + d − 2)<br />

/ 12<br />

Tabelul 9. Mărimi statistice ale distribuţiei continue χ 2<br />

Mărime statistică Expresie <strong>de</strong> calcul<br />

Suport x ∈ [0,∞); d ∈ (0,∞)<br />

Minim; Maxim 0; ∞<br />

Funcţia <strong>de</strong> probabilitate<br />

1<br />

2<br />

2<br />

2<br />

2<br />

d 2 d 2−1<br />

−x<br />

2<br />

( 1 2)<br />

x e Γ(<br />

d 2)<br />

x 2<br />

∫ t<br />

0<br />

d 2−1<br />

−t<br />

Funcţia <strong>de</strong> repartiţie e dt Γ(<br />

d 2)<br />

1<br />

2<br />

1<br />

1<br />

2<br />

2<br />

, Γ ( z)<br />

=<br />

b−1 dt<br />

+ 44d1<br />

−16<br />

, d2 > 8<br />

∞<br />

∫<br />

0<br />

t<br />

e<br />

z−1<br />

−t<br />

Media; mediana; moda; varianţa d; ≅ d − 2 3 ; d - 2, d > 2; 2d<br />

asimetria; excesul <strong>de</strong> boltire 8 d ; 12 d<br />

Tabelul 10. Mărimi statistice ale distribuţiei continue exponenţiale<br />

Mărime statistică Expresie <strong>de</strong> calcul<br />

Suport x ∈ [0,∞); λ ∈ (0,∞)<br />

260<br />

dt


Minim; Maxim 0; ∞<br />

Funcţia <strong>de</strong> probabilitate<br />

x<br />

e λ −<br />

λ<br />

Funcţia <strong>de</strong> repartiţie<br />

−λx<br />

1−<br />

e<br />

Media; mediana; moda; varianţa; asimetria; excesul <strong>de</strong> boltire<br />

2<br />

1 λ ; ln( 2)<br />

λ ; 0; 1 λ ; 2; 6<br />

Tabelul 11. Mărimi statistice ale distribuţiei continue Weibull<br />

Mărime statistică Expresie <strong>de</strong> calcul<br />

Suport x ∈ [0,∞); λ, k ∈ (0,∞)<br />

Minim; Maxim 0; ∞<br />

Funcţia <strong>de</strong> probabilitate; −(xλ)<br />

1−<br />

e<br />

k<br />

funcţia <strong>de</strong> repartiţie<br />

k<br />

k−1<br />

−(<br />

x λ)<br />

kx e<br />

k<br />

λ ;<br />

μ = λΓ<br />

1+ 1<br />

1 k<br />

1 k<br />

; λ ln( 2)<br />

; λ ( k −1)<br />

k , k > 1<br />

Media; mediana; moda ( k ) ( ) ( )<br />

Varianţa; asimetria<br />

Excesul <strong>de</strong> boltire<br />

2 2<br />

2<br />

3<br />

σ = λ Γ(<br />

1+ 2 k)<br />

− μ ; γ 1 = Γ(<br />

+ 3 k)<br />

λ<br />

4<br />

3 2 2 4<br />

γ = λ Γ(<br />

+ 4 k)<br />

− 4γ<br />

σ μ − 6μ<br />

σ − μ<br />

2<br />

2 3<br />

( − 3μσ<br />

− μ )<br />

4<br />

( 1 ) σ<br />

1<br />

1 σ<br />

Tabelul 12. Mărimi statistice ale distribuţiei continue Log-normale<br />

Mărime statistică Expresie <strong>de</strong> calcul<br />

Suport x ∈ [0,∞); μ ∈ (-∞,∞); σ ∈ (0,∞)<br />

Minim; Maxim 0; ∞<br />

2 ( ln( x)<br />

−μ)<br />

−<br />

Funcţia <strong>de</strong> probabilitate 2<br />

2σ<br />

e ( xσ<br />

2π)<br />

Funcţia <strong>de</strong> repartiţie<br />

Media; mediana; moda; varianţa<br />

( ln( x)<br />

− μ (<br />

) )) = ∫ π<br />

−<br />

z<br />

1+ erf<br />

σ 2<br />

2<br />

t<br />

; erf ( z)<br />

2 e dt<br />

2<br />

2<br />

μ+ σ 2 μ μ−σ<br />

σ<br />

e ; e ; e ; ( e −<br />

2<br />

2<br />

Asimetria; excesul <strong>de</strong> boltire σ<br />

σ<br />

( e + 2)<br />

e −1<br />

; e<br />

2<br />

2<br />

2<br />

4σ<br />

1)<br />

e<br />

+ 2e<br />

2<br />

2μ+<br />

σ<br />

2<br />

3σ<br />

+ 3e<br />

Tabelul 13. Mărimi statistice ale distribuţiei continue Birnbaum-Saun<strong>de</strong>rs (a vieţii obosite)<br />

Mărime statistică Expresie <strong>de</strong> calcul<br />

Suport μ, β, γ ∈ (0,∞); x ∈ (μ,∞)<br />

Minim; Maxim μ; ∞<br />

Funcţia <strong>de</strong> probabilitate<br />

x − μ β<br />

+<br />

β x − μ<br />

N<br />

2γ(<br />

x − μ)<br />

0,<br />

1<br />

⎛⎛<br />

⎜⎜<br />

⎜⎜<br />

⎝⎝<br />

x<br />

− μ<br />

β<br />

x + 1/<br />

x<br />

Funcţia <strong>de</strong> probabilitate standard N , 1 ( x − 1/<br />

x ) γ)<br />

2γ(<br />

x − μ)<br />

Funcţia <strong>de</strong> repartiţie standard<br />

( x − 1/<br />

x ) γ)<br />

N0 , 1<br />

2<br />

2<br />

Media; varianţa (standard) 1 + γ 2;<br />

γ 1+<br />

5γ<br />

4<br />

−<br />

2<br />

2σ<br />

0<br />

− 6<br />

β ⎞<br />

⎟<br />

x − μ ⎟<br />

⎠<br />

N<br />

( z)<br />

=<br />

⎞<br />

γ⎟<br />

⎟<br />

⎠<br />

0 , 0,<br />

1 ∫<br />

−∞<br />

Tabelul 14. Mărimi statistice ale distribuţiei continue Gamma<br />

Mărime statistică Expresie <strong>de</strong> calcul<br />

Suport k, θ ∈ (0,∞); x ∈ [0,∞)<br />

Minim; Maxim 0; ∞<br />

Funcţia <strong>de</strong> probabilitate<br />

Funcţia <strong>de</strong> repartiţie<br />

x<br />

∫<br />

k 1 x k<br />

e θ − θ − −<br />

x θ<br />

k−1<br />

−t<br />

0<br />

t<br />

e<br />

dt<br />

Γ(<br />

k)<br />

, Γ(<br />

z)<br />

=<br />

∞<br />

∫<br />

0<br />

t<br />

e<br />

k−1<br />

−t<br />

261<br />

dt<br />

∞<br />

∫<br />

0<br />

t<br />

e<br />

z−1<br />

−t<br />

dt<br />

3<br />

z 2<br />

−t<br />

/ 2<br />

e<br />

dt<br />


Media; moda; varianţa kθ; (k-1)θ, k > 1; kθ 2<br />

Asimetria; excesul <strong>de</strong> boltire 2 k ; 6 k<br />

Tabelul 15. Mărimi statistice ale distribuţiei continue Laplace (dublu exponenţială)<br />

Mărime statistică Expresie <strong>de</strong> calcul<br />

Suport b ∈ (0,∞); μ, x ∈ (-∞,∞)<br />

Minim; Maxim -∞; ∞<br />

Funcţia <strong>de</strong> probabilitate<br />

−|<br />

x−μ|<br />

b<br />

e 2b<br />

Funcţia <strong>de</strong> repartiţie<br />

( x−μ<br />

) b<br />

e 2 , x < μ<br />

−(<br />

x−μ<br />

) b<br />

1−<br />

e 2 , μ ≤ x<br />

μ; μ; μ; 2b 2<br />

Media; mediana; moda; varianţa<br />

Asimetria; excesul <strong>de</strong> boltire 0; 3<br />

Tabelul 16. Mărimi statistice ale distribuţiei continue Gumbel (log-Weibull)<br />

Mărime statistică Expresie <strong>de</strong> calcul<br />

Suport β ∈ (0,∞); μ, x ∈ (-∞,∞)<br />

Minim; Maxim -∞; ∞<br />

exp − exp − ( x − μ)<br />

β β exp − ( x − μ)<br />

β<br />

Funcţia <strong>de</strong> probabilitate ( ( ) ) ( ) β<br />

Funcţia <strong>de</strong> repartiţie exp( − exp(<br />

− ( x − μ)<br />

β))<br />

Media; mediana; moda; varianţa<br />

μ+βγ; μ-β·ln(ln(2)); μ; π 2 β 2 /6<br />

Asimetria; excesul <strong>de</strong> boltire<br />

12 6ς(<br />

3)<br />

≅ 1.<br />

14 ; 12/5<br />

3<br />

π<br />

Tabelul 17. Mărimi statistice ale distribuţiei continue Beta<br />

Mărime statistică Expresie <strong>de</strong> calcul<br />

Suport α, β ∈ (0,∞); x ∈ [0,1]<br />

Minim; Maxim 0; 1<br />

α−1<br />

β−1<br />

Funcţia <strong>de</strong> probabilitate x ( 1−<br />

x)<br />

IB(<br />

1,<br />

α,<br />

β)<br />

;<br />

IB(<br />

z,<br />

a,<br />

b)<br />

=<br />

z<br />

∫<br />

0<br />

t<br />

a−1<br />

( 1−<br />

t)<br />

Funcţia <strong>de</strong> repartiţie IB( x,<br />

α, β) IB(<br />

1,<br />

α, β)<br />

Media; moda; varianţa<br />

α α −1 αβ<br />

; , α, β > 1;<br />

2<br />

α + β α + β − 2 ( α + β)<br />

( α + β + 1)<br />

Asimetria; excesul <strong>de</strong> boltire<br />

2(<br />

β − α)<br />

α + β + 1 α<br />

;<br />

( α + β + 2)<br />

αβ<br />

3<br />

b−1<br />

dt<br />

2<br />

− ( 2β<br />

−1)<br />

α − 2αβ(<br />

β + 2)<br />

+ ( β + 1)<br />

β<br />

αβ(<br />

α + β + 2)(<br />

α + β + 3)<br />

/ 6<br />

Tabelul 18. Mărimi statistice ale distribuţiei continue Gauss (normale)<br />

Mărime statistică Expresie <strong>de</strong> calcul<br />

Suport σ ∈ (0,∞); μ, x ∈ (-∞,∞)<br />

Minim; Maxim -∞; ∞<br />

2<br />

exp − ( x − μ)<br />

σ 2 σ 2π<br />

( ) ( )<br />

( 1 erf ( x − μ)<br />

( σ 2 ) 2 ; erf<br />

Funcţia <strong>de</strong> probabilitate ( )<br />

Funcţia <strong>de</strong> repartiţie<br />

μ; μ; μ; σ 2<br />

Media; moda; varianţa<br />

Asimetria; excesul <strong>de</strong> boltire 0; 0<br />

+ = ∫ π<br />

−t<br />

( z)<br />

2 e dt<br />

Tabelul 19. Alte mărimi statistice ale distribuţiei continue Gauss (normale)<br />

Mărime Populaţie (finită) <strong>de</strong> volum nX Eşantion <strong>de</strong> volum nY Estimator<br />

m; s 2 Media<br />

2<br />

μ = m; σ<br />

/(nY-1)<br />

μ = μ; X<br />

2<br />

σ = σ X<br />

2 /nX = s 2 /nY<br />

Y<br />

Y<br />

262<br />

z<br />

0<br />

2<br />

2


Varianţa<br />

Var γ1<br />

(nX-1)σ 2 /nX<br />

2<br />

2<br />

( n X −1)<br />

( n X −1)<br />

μ2<br />

−<br />

3 −1<br />

3<br />

n μ n ( n − 3)<br />

( n<br />

X<br />

X<br />

4<br />

X<br />

X<br />

6n<br />

X ( n X −1)<br />

− 2)(<br />

n + 1)(<br />

n<br />

X<br />

X<br />

−1<br />

+ 3)<br />

(nY-1)s 2 /nY<br />

2<br />

( n Y −1)<br />

( n Y −1)<br />

m2<br />

−<br />

3 −1<br />

3<br />

n m n ( n − 3)<br />

( n<br />

Y<br />

Y<br />

4<br />

Y<br />

Y<br />

6n<br />

Y ( n Y 1)<br />

− 2)(<br />

n + 1)(<br />

n<br />

Y<br />

Y<br />

2<br />

−1<br />

+ 3)<br />

s 2<br />

( n Y −1)<br />

m4<br />

( n Y − 3)<br />

m2<br />

− 2<br />

n n Y ( n Y −1)<br />

Y<br />

4<br />

4<br />

2σ<br />

( n Y −1)<br />

2s<br />

=<br />

≅<br />

n −1<br />

n 2<br />

Y<br />

− c4 2 ·var(g1)<br />

Y<br />

c4 - Vezi Tabelul 29<br />

2<br />

−1<br />

2<br />

−1<br />

24n<br />

X ( n X −1)<br />

( n X − 3)<br />

24n<br />

Y ( n Y −1)<br />

( n Y − 3)<br />

c4<br />

Var γ2<br />

( n X − 2)(<br />

n X + 3)(<br />

n X + 5)<br />

( n Y − 2)(<br />

n Y + 3)(<br />

n Y + 5)<br />

2 ·var(g2)<br />

c4 - Vezi Tabelul 29<br />

Pentru ca rezultatele observaţiei să capete consistenţă în ceea ce priveşte interpretarea statistică, mai<br />

este necesar ca să se asume ipoteza <strong>de</strong> convergenţă la normalitate asupra valorilor observate în<br />

eşantionul seriei <strong>de</strong> compuşi, spaţiul complet al acestora fiind în acest caz un exemplu tipic <strong>de</strong><br />

populaţie finită distribuită normal.<br />

Măsura apropierii unui şir <strong>de</strong> date <strong>de</strong> legea <strong>de</strong> distribuţie normală poate fi evaluată statistic folosind<br />

testul <strong>de</strong> normalitate Z. Practic testul Z se poate aplica pe orice statistică S a eşantionului pentru a<br />

verifica dacă se poate accepta (sau respinge) ipoteza (cu un anumit nivel <strong>de</strong> semnificaţie) că<br />

estimatorul acesteia aparţine unei populaţii distribuite normal.<br />

Tabelul 20 redă utilizarea testului Z pentru verificarea ipotezei <strong>de</strong> normalitate a populaţiei din care<br />

provine eşantionul. Testul Z măsoară care este diferenţa (în termeni <strong>de</strong> probabilitate statistică) între<br />

o statistică S (a eşantionului) şi parametrul statistic Σ (al populaţiei).<br />

Tabelul 20. Testul Z pentru verificarea ipotezei <strong>de</strong> normalitate<br />

Test Z Formule <strong>de</strong> calcul<br />

Z-statistică (S) S − Σ n X S − Σ n Y<br />

z =<br />

=<br />

σ(<br />

Σ)<br />

n −1<br />

σ(<br />

S)<br />

n −1<br />

Z-medie<br />

Z-varianţă<br />

Z-dispersie<br />

Z-asimetrie<br />

Z-exces-boltire<br />

z =<br />

z =<br />

z<br />

m − μ<br />

σ(<br />

m)<br />

( n<br />

( n<br />

Y<br />

−<br />

n<br />

E(<br />

s)<br />

− σ<br />

n<br />

X<br />

Y<br />

2<br />

n Y m − μ n Y m − μ<br />

=<br />

≅ n Y<br />

Y −1<br />

s n Y −1<br />

s<br />

−1)<br />

s<br />

/ n<br />

− σ<br />

n<br />

−1)<br />

s<br />

2<br />

2<br />

2 2<br />

Y<br />

2<br />

1)<br />

m4<br />

3<br />

Y<br />

Y<br />

2<br />

( n Y − 3)<br />

m2<br />

− 3<br />

n Y /( n Y −1)<br />

Y =<br />

n Y −1<br />

Y<br />

Y n<br />

2<br />

Y<br />

3<br />

( n Y −1)<br />

m4<br />

− ( n Y − 3)<br />

m2<br />

c s − σ<br />

c<br />

s<br />

−1<br />

4<br />

4<br />

= = = σ , c<br />

( s)<br />

2<br />

2<br />

4<br />

σ σ 1−<br />

c4<br />

1−<br />

c4<br />

E(<br />

g1)<br />

− γ<br />

z =<br />

σ(<br />

g )<br />

1<br />

E(<br />

g2<br />

) − γ<br />

z =<br />

σ(<br />

g )<br />

2<br />

1<br />

2<br />

= g<br />

=<br />

1<br />

( n<br />

+ 1)(<br />

n Y + 3)<br />

6(<br />

n − 2)<br />

Y<br />

Y<br />

( ( n + 1)<br />

g − 3(<br />

n −1)<br />

)<br />

Y<br />

2<br />

Y<br />

( n<br />

( ( n −1)<br />

2)<br />

− σ<br />

2<br />

Γ(<br />

n 2)<br />

=<br />

n −1<br />

(Cohran)<br />

Γ<br />

( n Y + 3)(<br />

n Y + 5)<br />

24n<br />

( n − 2)(<br />

n − 3)<br />

În aceste ipoteze, <strong>de</strong> înrudire a compuşilor atât sub aspect structural cât şi sub aspect al<br />

proprietăţii/activităţii măsurate, şi <strong>de</strong> distribuire normală a valorilor observate, se pot formula şi<br />

verifica (cu ajutorul testelor statistice) ipoteze <strong>de</strong> inferenţă (<strong>de</strong>pen<strong>de</strong>nţă) între structură şi<br />

activitatea/proprietatea măsurată.<br />

Relaţiile structură-activitate (SAR) şi respectiv relaţiile structură-proprietate (SPR) stabilesc<br />

legături funcţionale între structura compuşilor chimici şi proprietăţile măsurate <strong>de</strong> natură biologică<br />

(SAR) şi fizico-chimică (SPR) ale acestora.<br />

Relaţiile cantitative (q) care se stabilesc între structură şi activitate (qSAR) sau respectiv proprietate<br />

263<br />

Y<br />

Y<br />

Y<br />

n<br />

2


(qSPR) se exprimă prin intermediul unor ecuaţii care au un domeniu <strong>de</strong> aplicabilitate <strong>de</strong>finit cel mai<br />

frecvent <strong>de</strong> seria <strong>de</strong> compuşi pe care au fost obţinute şi <strong>de</strong> proprietatea sau activitatea supusă<br />

observaţiei.<br />

Unul din avantajele majore pe care le conferă obţinerea unei relaţii cantitative structurăactivitate/proprietate<br />

(qSPAR) este posibilitatea efectuării <strong>de</strong> predicţii cu privire la<br />

proprietatea/activitatea unor compuşi congeneri cu cei din seria pe care s-a obţinut relaţia qSPAR.<br />

De cele mai multe ori, o relaţie qSPAR are asociată, pe lângă domeniul <strong>de</strong> aplicabilitate şi o<br />

semnificaţie statistică. Cu cât semnificaţia statistică a unei relaţii qSPAR este mai mare, cu atât<br />

predicţia activităţii/proprietăţii pentru compuşi congeneri cu cei ai seriei pe care s-a obţinut relaţia<br />

qSPAR are şanse <strong>de</strong> reuşită mai mari.<br />

Aşa cum un singur atom sau o singură regiune a moleculei nu este singura responsabilă pentru<br />

manifestarea unei proprietăţi moleculare, nici relaţiile qSPAR nu se exprimă cu ajutorul unui singur<br />

<strong>de</strong>scriptor <strong>de</strong> structură. În mod frecvent în expresia unei ecuaţii qSPAR intră 2 sau mai mulţi<br />

<strong>de</strong>scriptori <strong>de</strong> structură. Este important însă <strong>de</strong> ştiut că odată cu creşterea numărului <strong>de</strong> <strong>de</strong>scriptori<br />

într-o ecuaţie qSPAR sca<strong>de</strong> şi semnificaţia statistică a parametrilor acesteia. Astfel, pe lângă<br />

căutarea celei mai potrivite ecuaţii sub aspectul maximizării <strong>de</strong>terminării statistice a<br />

proprietăţii/activităţii măsurate, mai apare şi problema minimizării numărului <strong>de</strong> variabile ce intră<br />

în această ecuaţie.<br />

Ecuaţia qSPAR este o ecuaţie <strong>de</strong> regresie multiplă între <strong>de</strong>scriptorii <strong>de</strong> structură asupra cărora se<br />

face ipoteza că nu sunt afectaţi <strong>de</strong> erori întâmplătoare (atâta vreme cât structura compusului<br />

respectiv este <strong>de</strong> asemenea o certitudine) şi proprietatea/activitatea măsurată (care este variabila<br />

<strong>de</strong>pen<strong>de</strong>ntă şi în acelaşi timp supusă erorii experimentale întâmplătoare).<br />

Ecuaţiile <strong>de</strong> regresie liniară (multiplă) au avantajul <strong>de</strong>scompunerii (liniare) a varianţei<br />

experimentale observate în varianţe aditive pentru (asociate) fiecare variabilă in<strong>de</strong>pen<strong>de</strong>ntă a<br />

ecuaţiei. Existenţa a două sau mai multe variabile in<strong>de</strong>pen<strong>de</strong>nte nu presupune absenţa corelaţiei<br />

liniare între acestea, corelaţia putând fi pusă pe seama întâmplării, sau, mai exact, pe seama<br />

măsurării (sau exprimării unei măsuri) a două sau mai multe mărimi parţial corelate.<br />

Dacă variabilele ce <strong>de</strong>scriu structura nu sunt corelate liniar cu proprietatea măsurată se preferă<br />

linearizarea acestora şi exprimarea unei ecuaţii <strong>de</strong> regresie liniare cu aceste variabile ce <strong>de</strong>scriu<br />

structura transformate (linearizate) corespunzător.<br />

O ecuaţie <strong>de</strong> regresie multiplă <strong>de</strong>scriind o relaţie qSPAR este semnificativă statistic dacă toţi<br />

parametrii (coeficienţii) acesteia sunt semnificativ statistic diferiţi <strong>de</strong> zero (în caz contrar expresia<br />

ecuaţiei se reduce corespunzător prin eliminarea variabilelor ale căror coeficienţi nu sunt<br />

semnificativ diferiţi <strong>de</strong> zero) şi coeficientul <strong>de</strong> corelaţie este <strong>de</strong> asemenea semnificativ diferit <strong>de</strong><br />

zero (în caz contrar respingându-se întreaga ecuaţie <strong>de</strong> regresie). Aprecierea semnificaţiei<br />

parametrilor ecuaţiei <strong>de</strong> regresie se face prin raportarea valorii parametrului la varianţa acestuia,<br />

folosind pentru interpretare testul Stu<strong>de</strong>nt t.<br />

O ecuaţie <strong>de</strong> regresie liniară multiplă qSPAR implicând o familie <strong>de</strong> <strong>de</strong>scriptori <strong>de</strong> structură este o<br />

ecuaţie <strong>de</strong> forma:<br />

b0 + b1X1 + ... +bnXn = Ŷ ~ Y (1)<br />

un<strong>de</strong> Y reprezintă şirul măsurătorilor proprietăţii/activităţii la `m` molecule (|Y|=m) iar {X1, ..., Xn}<br />

reprezintă o submulţime a familiei <strong>de</strong> <strong>de</strong>scriptori {Xi}1≤i≤N.<br />

Pentru ca ecuaţia (1) să admită soluţie unică este necesar (nu însă şi suficient) ca n ≤ m-1. Pentru ca<br />

parametrii ecuaţiei <strong>de</strong> regresie (bi)0≤i≤n să aibă şi semnificaţie statistică este necesar (nu însă şi<br />

suficient) ca n ≤ m-6.<br />

În absenţa semnificaţiei statistice pentru coeficientul b0, ecuaţia (1) se poate restrânge la:<br />

b1X1 + ... +bnXn = Ŷ ~ Y (2)<br />

Se asumă ipoteza <strong>de</strong> distribuţie normală a valorilor Y şi X1, ..., Xn şi ipoteza că şirul Y este rezultat<br />

dintr-o măsurătoare experimentală a cărei eroare <strong>de</strong> măsură este întâmplătoare şi distribuită normal<br />

în timp ce şirurile X sunt X1, ..., Xn sunt valori cunoscute care sunt <strong>de</strong> asemenea normal distribuite<br />

dar nu sunt afectate <strong>de</strong> erori. În aceste ipoteze problema <strong>de</strong>terminării coeficienţilor (bi) ale ecuaţiei<br />

(1) sau (2) se rezolvă prin minimizarea sumei erorilor observat vs. cunoscut:<br />

264


Σ1≤i≤m(Ŷi-Yi) 2 → min. (3)<br />

Rezolvarea ecuaţiei (3) presupune rezolvarea unui sistem <strong>de</strong> ecuaţii liniar şi omogen ale cărei<br />

necunoscute sunt coeficienţii (bi).<br />

În ipoteza că sistemul (3) admite o soluţie unică pentru ecuaţia (1) sau (2), ipotezele asumate permit<br />

şi obţinerea semnificaţiilor statistice ale parametrilor (bi) folosind distribuţia Stu<strong>de</strong>nt t:<br />

ti=t(bi), 0 ≤ i ≤ n pentru (1) şi 1 ≤ i ≤ n pentru (2) (4)<br />

Coeficientul <strong>de</strong> corelaţie oferă o măsură a legăturii liniare între două variabile (Y şi Ŷ) şi se<br />

calculează pe baza formulei (un<strong>de</strong> E este estimatorul valoare medie <strong>de</strong>finit în Tabelul 6):<br />

r(Y,Ŷ) =<br />

Y) ˆ<br />

Y) s(<br />

Y)<br />

s(<br />

ˆ cov( Y,<br />

=<br />

⋅<br />

E(<br />

Y<br />

Yˆ E(<br />

Y<br />

2<br />

) − E<br />

) − E(<br />

Y)<br />

⋅ E<br />

2<br />

( Y)<br />

Yˆ E(<br />

Yˆ (<br />

2<br />

)<br />

Y) ˆ 2<br />

) − E (<br />

Testul χ 2 (Pearson) este folosit în testarea agrementului între observaţie şi ipoteză, testarea<br />

in<strong>de</strong>pen<strong>de</strong>nţei şi a omogenităţii.<br />

Testarea agrementului între observaţie şi ipoteză se realizează prin divizarea observaţiilor într-un<br />

număr <strong>de</strong>finit <strong>de</strong> intervale (`n`), pentru care se calculează expresia X 2 (un<strong>de</strong> `s` este numărul <strong>de</strong><br />

parametrii ai distribuţiei teoretice):<br />

n<br />

2<br />

2 ( Oi<br />

− Ei<br />

) 2<br />

X = ∑ ≈ χ ( n − s −1)<br />

(6)<br />

i= 1 Ei<br />

din care pe baza distribuţiei teoretice χ 2 (Tabelul 18) se calculează probabilitatea <strong>de</strong> respingere a<br />

ipotezei <strong>de</strong> agrement. Uzual ipoteza <strong>de</strong> agrement este acceptată dacă probabilitatea <strong>de</strong> respingere a<br />

ipotezei <strong>de</strong> agrement este mai mică <strong>de</strong> 5%.<br />

Testarea in<strong>de</strong>pen<strong>de</strong>nţei / omogenităţii între valorile unui tabel cu `r` linii şi `c` coloane se face<br />

calculând expresia:<br />

E<br />

i,<br />

j<br />

r<br />

∑<br />

O<br />

∑∑<br />

i=<br />

1 j=<br />

1<br />

c<br />

∑<br />

i,<br />

k<br />

= k=<br />

1<br />

r<br />

k=<br />

1<br />

c<br />

O<br />

O<br />

i,<br />

j<br />

k,<br />

j<br />

(5)<br />

r c<br />

2<br />

( Oi,<br />

j − E )<br />

2<br />

i,<br />

j 2<br />

; X = ∑∑<br />

≈ χ (( r −1)(<br />

c −1))<br />

(7)<br />

E<br />

i=<br />

1 j= 1 i,<br />

j<br />

Testarea individuală a omogenităţii valorilor dintr-o clasă (linie sau coloană în tabel) şi în acelaşi<br />

timp crearea unei ierarhii a iregularităţilor se obţine <strong>de</strong>scompunând expresia lui X 2 în:<br />

r<br />

2<br />

c<br />

2<br />

2 ( Oi,<br />

c − Ei,<br />

c)<br />

( O<br />

2<br />

r,<br />

j − E )<br />

2<br />

r,<br />

j 2<br />

X c = ∑ ≈ χ ( r −1)<br />

; X r<br />

≈ χ ( c −1)<br />

(8)<br />

E<br />

E<br />

i= 1 i,<br />

c<br />

= ∑<br />

j= 1 r,<br />

j<br />

Descompunerea varianţelor în ipoteza omogenităţii permite estimarea erorii experimentale [ ].<br />

Pentru tabelul cu `r` linii şi `c` coloane ecuaţia <strong>de</strong> <strong>de</strong>scompunere a varianţelor porneşte <strong>de</strong> la ipoteza<br />

că efectul încrucişat al parametrilor <strong>de</strong>signului experimental se exprimă sub formă <strong>de</strong> produs în<br />

mărimea observată (altfel spus: dacă pentru creşterea unei plante e nevoie atât <strong>de</strong> apă cât şi <strong>de</strong> soare,<br />

atunci efectul în creştere este exprimat proporţional <strong>de</strong> ambii factori):<br />

r c<br />

2<br />

⎛ ∂S<br />

⎞ ⎛ S ⎞<br />

min.<br />

0 ; ⎜<br />

∂<br />

S = ∑∑ ( O<br />

= 0⎟<br />

⎜<br />

a ⎟<br />

i , j − a ib<br />

j)<br />

= ⇒ =<br />

(9)<br />

⎜ b ⎟<br />

i=<br />

1 j=<br />

1<br />

⎝ ∂ i ⎠ ≤ ≤ ⎝ ∂<br />

1 i r<br />

j ⎠1≤<br />

j≤c<br />

Ecuaţia (12) admite acele soluţii care verifică ecuaţiile:<br />

c<br />

∑<br />

j=<br />

1<br />

a i = c<br />

∑<br />

j=<br />

1<br />

b x<br />

j<br />

b<br />

i,<br />

j<br />

2<br />

j<br />

, i<br />

= 1..<br />

r ;<br />

r<br />

∑<br />

a ix<br />

i,<br />

j<br />

i=<br />

1 b j = r<br />

2<br />

a<br />

, j = 1..<br />

c<br />

(10)<br />

∑<br />

i=<br />

1<br />

i<br />

Matematic se poate <strong>de</strong>monstra că ecuaţiile (10) admit o infinitate <strong>de</strong> soluţii. Astfel, pentru r=2 şi<br />

c=3 coeficienţii (ai)1≤i≤2 sunt parametrizaţi <strong>de</strong> relaţia:<br />

[ 68 ] Ronald A FISHER. 1923. Studies in Crop Variation. II. The Manurial Response of Different Potato Varieties.<br />

Journal of Agricultural Science 13:311-320.<br />

265<br />

68


2<br />

2<br />

2<br />

2<br />

2<br />

⎛ a ⎞ 2 ⎜<br />

⎟<br />

a ⎟<br />

⎝ 1 ⎠<br />

( x1,<br />

1<br />

+<br />

+ x1,<br />

2 + x1,<br />

3 ) − ( x 2,<br />

1 + x 2,<br />

2 + x 2,<br />

3 ) ⎛ a ⎞ 2 ⎜ ⎟ −1<br />

= 0<br />

( x1,<br />

1x<br />

2,<br />

1 + x1,<br />

2x<br />

2,<br />

2 + x1,<br />

3x<br />

2,<br />

3)<br />

⎜ a ⎟<br />

⎝ 1 ⎠<br />

(11)<br />

Întrucât rezolvarea sistemului (10) pentru cazul general este dificilă, o soluţie mai simplă este<br />

obţinerea soluţiei prin aproximaţii succesive. Din nou, se poate <strong>de</strong>monstra matematic că soluţia<br />

optimă a sistemului (10) se află în vecinătatea valorilor date <strong>de</strong> ecuaţia:<br />

r<br />

c ⎛ ⎞⎛<br />

⎞<br />

ai⋅bj=<br />

⎜∑<br />

Oi,<br />

k ⎟⎜∑<br />

O k,<br />

j ⎟<br />

⎝ k=<br />

1 ⎠⎝<br />

k=<br />

1 ⎠<br />

Într-un mod similar, se poate arăta că:<br />

r c<br />

∑∑Oi,<br />

j<br />

i=<br />

1 j=<br />

1<br />

(12)<br />

c<br />

2<br />

x<br />

r<br />

2<br />

i,<br />

j<br />

xi,<br />

j<br />

r c 2 ∑ ( Oi,<br />

j − a ib<br />

j)<br />

2 j= 1 b ∑<br />

j 2 i= 1 a i<br />

X = ∑∑ = min.<br />

→ a i = ; b = c<br />

j r<br />

i= 1 j= 1 a ib<br />

j<br />

b<br />

a<br />

(13)<br />

a cărei soluţie optimă exactă se află din nou în vecinătatea valorilor date <strong>de</strong> ecuaţiile (12).<br />

Astfel, folosind datele din [68] redate în Tabelul 21, valorile sugerate <strong>de</strong> ecuaţiile (12) pentru<br />

produsele (aibj)1≤i≤6;1≤j≤12 sunt redate în Tabelul 22 iar valorile ce rezultă după rezolvarea exactă a<br />

sistemului (10) sunt redate în Tabelul 23.<br />

Tabelul 21. Valori experimentale în tratamentul roşiilor<br />

TV UD KK KP TP ID GS AJ BQ ND EP AC DY Suma<br />

DS 25.3 28 23.3 20 22.9 20.8 22.3 21.9 18.3 14.7 13.8 10 241.3<br />

DC 26 27 24.4 19 20.6 24.4 16.8 20.9 20.3 15.6 11 11.8 237.8<br />

DB 26.5 23.8 14.2 20 20.1 21.8 21.7 20.6 16 14.3 11.1 13.3 223.4<br />

US 23 20.4 18.2 20.2 15.8 15.8 12.7 12.8 11.8 12.5 12.5 8.2 183.9<br />

UC 18.5 17 20.8 18.1 17.5 14.4 19.6 13.7 13 12 12.7 8.3 185.6<br />

UB 9.5 6.5 4.9 7.7 4.4 2.3 4.2 6.6 1.6 2.2 2.2 1.6 53.7<br />

Suma 128.8 122.7 105.8 105 101.3 99.5 97.3 96.5 81 71.3 63.3 53.2 1125.7<br />

Legendă:<br />

÷ T_V: Tratament vs. Varietate<br />

÷ UD, KK, KP, TP, ID, GS, AJ, BQ, ND, EP, AC, DY: varietăţi <strong>de</strong> roşii (UD: Up to Date; KK: K<br />

of K; KP: Kerr's Pink; TP: Tinwald Perfection; ID: Iron Duke; GS: Great Scott; AJ: Ajax; BQ:<br />

British Queen; ND: Nithsdale; EP: Epicure; AC: Arran Comra<strong>de</strong>; DY: Duke of York)<br />

÷ DS, DC, DB, US, UC, UB: tratamente (D* - cu fertilizant natural; U* - fără; S - sol fertilizat cu<br />

sulfat; C - sol fertilizat cu cloruri; B - sol fertilizat cu baze)<br />

Tabelul 22. Valorile produselor (aibj)1≤i≤6;1≤j≤12 calculate cu relaţia (12)<br />

TV UD KK KP TP ID GS AJ BQ ND EP AC DY<br />

DS 27.61 26.30 22.68 22.51 21.71 21.33 20.86 20.69 17.36 15.28 13.57 11.40<br />

DC 27.21 25.92 22.35 22.18 21.40 21.02 20.55 20.39 17.11 15.06 13.37 11.24<br />

DB 25.56 24.35 21.00 20.84 20.10 19.75 19.31 19.15 16.07 14.15 12.56 10.56<br />

US 21.04 20.04 17.28 17.15 16.55 16.25 15.90 15.76 13.23 11.65 10.34 8.69<br />

UC 21.24 20.23 17.44 17.31 16.70 16.41 16.04 15.91 13.35 11.76 10.44 8.77<br />

UB 6.14 5.85 5.05 5.01 4.83 4.75 4.64 4.60 3.86 3.40 3.02 2.54<br />

Tabelul 23. Valorile optimizate ale produselor (aibj)1≤i≤6;1≤j≤12 folosind relaţiile (10)<br />

TV UD KK KP TP ID GS AJ BQ ND EP AC DY<br />

DS 27.07 26.42 22.64 21.85 21.85 21.94 20.94 20.63 17.93 15.48 13.54 11.61<br />

DC 26.66 26.02 22.29 21.52 21.52 21.60 20.62 20.32 17.66 15.24 13.33 11.43<br />

DB 24.91 24.32 20.83 20.11 20.11 20.19 19.27 18.99 16.50 14.25 12.46 10.69<br />

US 20.64 20.15 17.26 16.66 16.66 16.73 15.96 15.73 13.67 11.80 10.32 8.85<br />

UC 20.58 20.09 17.21 16.61 16.61 16.68 15.92 15.69 13.63 11.77 10.29 8.83<br />

UB 6.29 6.14 5.26 5.08 5.08 5.10 4.86 4.79 4.17 3.60 3.14 2.70<br />

266<br />

2<br />

∑<br />

j=1<br />

j<br />

2<br />

∑ =1<br />

i<br />

i


Tabelul 24. Valorile optimizate ale produselor (aibj)1≤i≤6;1≤j≤12 folosind relaţiile (13)<br />

TV UD KK KP TP ID GS AJ BQ ND EP AC DY<br />

DS 27.64 26.19 22.85 22.60 21.59 21.44 20.98 20.71 17.49 15.24 13.67 11.47<br />

DC 27.35 25.91 22.61 22.36 21.36 21.22 20.76 20.50 17.30 15.08 13.52 11.35<br />

DB 25.74 24.40 21.28 21.05 20.11 19.97 19.55 19.29 16.29 14.20 12.73 10.68<br />

US 21.17 20.06 17.50 17.31 16.53 16.42 16.07 15.87 13.39 11.68 10.47 8.78<br />

UC 21.40 20.28 17.69 17.50 16.71 16.60 16.25 16.04 13.54 11.80 10.58 8.88<br />

UB 6.57 6.23 5.43 5.37 5.13 5.10 4.99 4.93 4.16 3.63 3.25 2.73<br />

Tabelul 25 centralizează rezultatele obţinute pe cele 3 căi:<br />

Tabelul 25. Valori comparative: observat vs. eq. (12), vs. eq. (10), şi vs. eq. (13)<br />

Categorie<br />

Σ(Oi,j-aibj) 2 Σ(Oi,j-aibj) 2 /(aibj)<br />

vs. eq.(12) vs. eq.(10) vs. eq.(13) vs. eq.(12) vs. eq.(10) vs. eq.(13)<br />

DS 23.376 18.784 24.098 1.098 0.939 1.127<br />

DC 59.778 48.411 59.877 3.078 2.494 3.053<br />

DB 69.796 66.811 71.482 3.784 3.599 3.795<br />

US 41.532 49.046 41.710 2.721 3.191 2.713<br />

UC 57.536 59.000 56.510 3.460 3.660 3.339<br />

UB 37.417 40.067 37.094 7.882 8.291 7.651<br />

UD 30.256 26.301 28.172 2.649 2.354 2.140<br />

KK 15.333 13.446 15.744 0.761 0.641 0.733<br />

KP 62.906 62.767 64.029 3.104 3.155 3.135<br />

TP 34.252 31.394 33.265 2.792 2.693 2.366<br />

ID 3.430 3.925 3.998 0.205 0.271 0.282<br />

GS 26.141 25.591 26.956 2.289 2.447 2.517<br />

AJ 44.954 46.997 45.320 2.555 2.712 2.601<br />

BQ 21.503 20.359 20.938 1.925 1.712 1.666<br />

ND 18.358 17.860 19.105 2.136 2.284 2.348<br />

EP 2.881 3.225 3.323 0.535 0.635 0.660<br />

AC 18.273 18.773 18.762 1.759 1.867 1.839<br />

DY 11.149 11.478 11.158 1.313 1.401 1.390<br />

TOTAL 289.435 282.117 290.771 22.022 22.172 21.676<br />

După cum se observă din Tabelul 25, fiecare dintre meto<strong>de</strong>le <strong>de</strong>finite <strong>de</strong> ecuaţiile (10) şi respectiv<br />

(13) îmbunătăţeşte valoarea sumei obiectiv în raport cu expresia <strong>de</strong>finită <strong>de</strong> formula clasică (12) şi<br />

reprezintă corecţii ale acesteia. Astfel, relaţiile (10) îmbunătăţesc relaţiile (12) în ipoteza erorii<br />

experimentale uniform distribuite între clase, în timp ce relaţiile (10) îmbunătăţesc relaţiile (12) în<br />

ipoteza erorii experimentale proporţionale cu magnitudinea fenomenului observat; mai exact<br />

relaţiile (10) minimizează eroarea experimentală absolută în timp ce relaţiile (13) minimizează<br />

eroarea experimentală relativă.<br />

Soluţiile <strong>de</strong> optimizare propuse <strong>de</strong> ecuaţiile (10) şi (13) sunt relativ dificile necesitând cel puţin<br />

iteraţii succesive folosind metoda indirectă pornind <strong>de</strong> la soluţia propusă <strong>de</strong> ecuaţiile (12). Mai<br />

mult, calculul exact din ecuaţiile (10) pentru o tabelă <strong>de</strong> contingenţă 2X2 a dus la o ecuaţie <strong>de</strong><br />

gradul II în exprimarea raportului dintre constantele mo<strong>de</strong>lului (relaţiile 11), în timp ce calcul exact<br />

din ecuaţiile (13) pentru o aceeaşi tabelă <strong>de</strong> contingenţă 2X2 duce la o ecuaţie <strong>de</strong> gradul V, care<br />

necesită ulterior şi i<strong>de</strong>ntificarea optimului global:<br />

x<br />

2<br />

1,<br />

1<br />

x<br />

+ 2x<br />

1,<br />

2<br />

2<br />

1,<br />

1<br />

2<br />

2<br />

x<br />

( x<br />

1,<br />

2<br />

2<br />

1,<br />

1<br />

2<br />

4<br />

( x<br />

− x<br />

2,<br />

2<br />

2<br />

1,<br />

2<br />

2<br />

2<br />

− x<br />

( a 2<br />

5 4 2 4 2<br />

a1)<br />

+ ( x1,<br />

1 x 2,<br />

2 − x1,<br />

2 x 2,<br />

1 ) ( a 2<br />

4<br />

a1)<br />

+<br />

2<br />

2,<br />

1 ) ( a 2<br />

3 2 2 2 2<br />

a1)<br />

+ 2x<br />

2,<br />

1 x 2,<br />

2 ( x1,<br />

2 − x1,<br />

1 ) ( a 2 a1)<br />

4<br />

) ( a a ) + x<br />

2<br />

x<br />

2<br />

( x<br />

2<br />

− x<br />

2<br />

) = 0<br />

)<br />

+ ( x1,<br />

2 x 2,<br />

1 − x1,<br />

1 x 2,<br />

2 2 1 2,<br />

2 2,<br />

1 2,<br />

1 2,<br />

2<br />

Testul t este aplicat pentru eşantioane mici, în care abaterile <strong>de</strong> la ipoteza <strong>de</strong> normalitate a<br />

267<br />

2<br />

(14)


69<br />

distribuţiei valorilor în eşantion sunt majore. Testul t a fost introdus în 1908 [ ] pentru a compara<br />

două eşantioane provenite din populaţii distribuite normal cu varianţă egală, extins pentru calculul<br />

intervalului <strong>de</strong> încre<strong>de</strong>re al coeficienţilor unei ecuaţii <strong>de</strong> regresie în 1922 [ 70 ] şi a fost generalizat<br />

pentru compararea a două eşantioane provenite din populaţii distribuite normal cu varianţă diferită<br />

în 1947 [ 71 ].<br />

Probabilitatea asociată valorii medii obţinută dintr-un eşantion cu valoarea medie cunoscută a<br />

populaţiei din care provine se face din distribuţia Stu<strong>de</strong>nt t cu formula:<br />

⎛<br />

⎞<br />

⎜<br />

⎟<br />

⎜ m1<br />

− μ1<br />

t , n −1⎟<br />

(15)<br />

⎜ m ⎟<br />

2<br />

⎜<br />

⎟<br />

⎝ n −1 ⎠<br />

Probabilitatea asociată diferenţei a două valori medii obţinute din două eşantioane (Y1 şi Y2) se face<br />

similar cu formula:<br />

⎛<br />

⎞<br />

⎜<br />

⎟<br />

2<br />

2<br />

2<br />

⎜ m<br />

( ) ⎟<br />

1(<br />

Y1<br />

) − m1(<br />

Y2<br />

) m2<br />

( Y1<br />

) n(<br />

Y1<br />

) + m2<br />

( Y2<br />

) n(<br />

Y2<br />

)<br />

t ⎜<br />

,<br />

4<br />

4 ⎟<br />

(16)<br />

2<br />

2<br />

⎜ m2<br />

( Y1<br />

) m2<br />

( Y2<br />

) m2<br />

( Y1)<br />

m2<br />

( Y2<br />

)<br />

+<br />

+<br />

⎟<br />

3<br />

3<br />

⎜<br />

Y − ( n(<br />

Y −<br />

− ⎟<br />

2)<br />

1<br />

1)<br />

1)<br />

( n(<br />

Y2<br />

) 1)<br />

⎝ n(<br />

Y1<br />

) −1<br />

n(<br />

⎠<br />

⎛<br />

3 2<br />

2 2<br />

( ) ⎞<br />

⎜ m1<br />

( Y1<br />

) − m1(<br />

Y2<br />

) ( n −1)<br />

m2<br />

( Y1)<br />

+ m2<br />

( Y2<br />

)<br />

t n −1<br />

,<br />

⎟ , n = n(Y1) = n(Y2)<br />

⎜<br />

2<br />

2<br />

2 4<br />

4<br />

+ ⎟<br />

⎝ m ( Y ) + m ( Y ) n m2<br />

( Y1)<br />

m2<br />

( Y2<br />

)<br />

2 1 2 1<br />

⎠<br />

Probabilităţile asociate valorilor parametrilor ecuaţiei <strong>de</strong> regresie se obţin din:<br />

⎜<br />

⎟<br />

⎝<br />

Y) ⎠<br />

ˆ<br />

⎛<br />

⎞<br />

⎜<br />

bi<br />

m−<br />

| B |<br />

⎟<br />

⎧ n + 1,<br />

( eq1)<br />

m<br />

2<br />

t<br />

, m−<br />

| B | B | = ⎨<br />

= ∑ i − Yi )<br />

s( bi<br />

) SE(<br />

Y,<br />

⎩n,<br />

( eq2)<br />

i=<br />

1<br />

ˆ<br />

Y) ( Y ˆ<br />

; | ; SE ( Y,<br />

(17)<br />

un<strong>de</strong> valorile varianţei parametrilor B = (bi)i≥ se obţin odată cu parametrii estimaţi folosind formula,<br />

în care X este matricea <strong>de</strong>scriptorilor (în formulare matriceală Ŷ=X·B):<br />

T −1<br />

s(<br />

bi<br />

) = ( X ⋅X)<br />

i,<br />

i<br />

(18)<br />

Analiza <strong>de</strong> varianţă este o tehnică care constă în separarea varianţei totale a datelor în componente<br />

logic asociate cu surse specifice <strong>de</strong> variaţie. Ipoteza <strong>de</strong> analiză este că erorile sunt in<strong>de</strong>pen<strong>de</strong>nte,<br />

i<strong>de</strong>ntice şi distribuite normal: ε ~ N(0,σ 2 ).<br />

Pentru un set <strong>de</strong> observaţii grupate pe categorii (Oi,j)1≤i≤m;1≤j≤n un<strong>de</strong> m este numărul <strong>de</strong> categorii şi n<br />

numărul <strong>de</strong> observaţii din fiecare categorie, următorul tabel (Tabelul 26) cumulează analiza <strong>de</strong><br />

varianţă:<br />

Tabelul 26. Analiza <strong>de</strong> varianţă în observaţii grupate pe categorii<br />

Parametru Gra<strong>de</strong> <strong>de</strong> Suma pătratelor Varianţă Valoarea F<br />

libertate<br />

total m·n-1<br />

2<br />

m ⎛ n<br />

m n 1 1 ⎞<br />

SST MSA<br />

SST = ∑⎜∑∑ ∑ ⎟<br />

⎜<br />

Oi,<br />

j − O<br />

MST =<br />

≈<br />

i,<br />

j ⎟<br />

i=<br />

1 ⎝ j=<br />

1 m i=<br />

1 n<br />

m ⋅n<br />

−1<br />

MSE<br />

j=<br />

1 ⎠<br />

F(<br />

m −1,<br />

n)<br />

mo<strong>de</strong>l m-1<br />

2<br />

2<br />

m ⎛ n ⎞<br />

m n 1 ⎛ ⎞<br />

SSA<br />

(m×n)<br />

SSA = ⎜ O ⎟ i,<br />

j − ⎜ O ⎟ MSA =<br />

∑∑ ⎜ ⎟<br />

i,<br />

j<br />

i 1 j 1 m ⎜∑∑<br />

⎟<br />

n(<br />

m −1)<br />

= ⎝ = ⎠ ⎝ i=<br />

1 j=<br />

1 ⎠<br />

[ 69 ] Stu<strong>de</strong>nt (William S. GOSSET). 1908. The Probable Error of a Mean. Biometrika 6(1):1-25.<br />

[ 70 ] Ronald A. FISHER. 1922. The Goodness of Fit of Regression Formulae and the Distribution of Regression<br />

Coefficients. Journal of the Royal Statistical Society 85:597-612.<br />

[ 71 ] Bernard L. WELCH 1947. The generalization of "stu<strong>de</strong>nt's" problem when several different population variances<br />

are involved. Biometrika 34(1):28-35.<br />

268


eroare m(n-1)<br />

2<br />

m ⎛ n ⎛<br />

n ⎞<br />

∑∑ ⎜<br />

1 ⎞<br />

SSE = ⎜ ∑ ⎟⎟<br />

⎜ ⎜<br />

Oi,<br />

j − Oi,<br />

j ⎟⎟<br />

i=<br />

1 ⎝ j=<br />

1 ⎝ n j=<br />

1 ⎠⎠<br />

SSE<br />

MSE =<br />

m(<br />

n −1)<br />

Testul Fisher F poate fi folosit pentru obţinerea semnificaţiei coeficientului <strong>de</strong> <strong>de</strong>terminare, caz în<br />

care valoarea F se obţine cu formula:<br />

2<br />

var( reg)<br />

r n<br />

⎧ n + 1,<br />

( eq1)<br />

F ( r)<br />

= =<br />

; | B | =<br />

2<br />

⎨<br />

var( rez)<br />

( 1−<br />

r ) ( m−<br />

| B | −1)<br />

⎩ n , ( eq2)<br />

(19)<br />

2010A2. Construirea librăriilor <strong>de</strong> compuşi chimici virtuali (chimie combinatorială)<br />

Librăriile <strong>de</strong> compuşi chimici virtuali au fost create (baza <strong>de</strong> date MDFV <strong>de</strong>pozitează şi structura<br />

3D a compuşilor chimici) şi conţin peste 1000 <strong>de</strong> compuşi.<br />

În figura următoare se dau reprezentările 3D ale mo<strong>de</strong>lelor <strong>de</strong> geometrie moleculară ale <strong>de</strong>rivaţilor<br />

<strong>de</strong> carbochinolină (37 <strong>de</strong> compuşi).<br />

Aceştia pot fi vizualizaţi folosind Intervet Explorer şi având aplicaţia CHIME instalată, pe calea<br />

(când aplicaţia CHIME permite răsucirea moleculelor):<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDFV/?set=cqd&pdb=<br />

aşa cum rezultă în continuare:<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd01<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd02<br />

269<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd03<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd04


http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd05<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd06<br />

270<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd07<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd08


http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd12<br />

V/?set=cqd&pdb=cqd09<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd10<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd11<br />

271<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd13<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd14


http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd15<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd16<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd17<br />

272<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd18<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd19


http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd20<br />

V/?set=cqd&pdb=cqd23<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd21<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd22<br />

273<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd24


http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd25<br />

V/?set=cqd&pdb=cqd27<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd26 http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd28<br />

274


http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd29<br />

V/?set=cqd&pdb=cqd32<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd30 http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd33<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd31<br />

275<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd34


http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd35<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

276<br />

V/?set=cqd&pdb=cqd36<br />

http://l.aca<strong>de</strong>micdirect.ro/Chemistry/SARs/MDF<br />

V/?set=cqd&pdb=cqd37<br />

2010A3. Interogarea bazelor <strong>de</strong> date internaţionale (Cambridge SDb, Protein Db, Visual Mol.<br />

Dyn., MMDB - Mol. Mod. Db, PubChem Comp., PubChem Subst.), colectare informaţii,<br />

elaborarea mo<strong>de</strong>lelor moleculare compuşi virtuali (chimie computaţională)<br />

Structurile celor peste 1000 <strong>de</strong> compuşi au fost obţinute din bazele <strong>de</strong> date, PubChem şi<br />

ChemSpi<strong>de</strong>r, au urmat procedurile <strong>de</strong> optimizare a structurii moleculare cu HyperChem, şi<br />

rezultatele au fost <strong>de</strong>pozitate în baza <strong>de</strong> date MDFV.<br />

Mo<strong>de</strong>larea structurii moleculare este condiţia obligatorie pentru o analiză structură-activitate. Realizarea<br />

unui mo<strong>de</strong>l tridimensional (3D) se impune pentru cazurile când <strong>de</strong>scriptorii calculaţi uzează <strong>de</strong> geometria<br />

moleculară, ceea ce este cazul aici.<br />

Obţinerea mo<strong>de</strong>lului 3D se poate realiza folosind un program <strong>de</strong> mo<strong>de</strong>lare moleculară cum ar fi:<br />

HyperChem, Spartan, Gaussian, Molecular Mo<strong>de</strong>lling Pro, Mopac. În mo<strong>de</strong>larea structurii PCBs s-a<br />

folosit programul <strong>de</strong> mo<strong>de</strong>lare moleculară HyperChem (licenţă v. 8.0/2007).<br />

Obţinerea informaţiei <strong>de</strong> structură 3D presupune parcurgerea unei serii <strong>de</strong> paşi, care cuprin<strong>de</strong> <strong>de</strong>finirea<br />

unui mo<strong>de</strong>l <strong>de</strong> mecanică moleculară (a fost <strong>de</strong>finit AMBER [ 72 ]), optimizarea geometriei moleculare până<br />

[ 72 ] AMBER (acronim pentru Assisted Mo<strong>de</strong>l Building with Energy Refinement - este o familie <strong>de</strong> câmpuri <strong>de</strong> forţă<br />

pentru dinamica moleculară a biomoleculelor <strong>de</strong>zvoltat <strong>de</strong> succesorii grupului lui Peter Kollman la University of<br />

California, San Francisco. http://ambermd.org/


73<br />

la convergenţă folosind un algoritm <strong>de</strong> optimizare (a fost folosit POLAK-RIBIERE [ ]), <strong>de</strong>finirea unei<br />

meto<strong>de</strong> semiempirice <strong>de</strong> calcul energetic (a fost <strong>de</strong>finită AM1 [ 74 ]) şi obţinerea unei serii <strong>de</strong> parametrii<br />

energetici ce caracterizează optimul împreună cu sarcinile electrice parţiale.<br />

Rezultatul optimizării şi calcului energetic este salvat în fişierul ce <strong>de</strong>fineşte structura chimică a moleculei<br />

al cărui mo<strong>de</strong>l a fost construit. În cazul HyperChem, fişierele sunt cu extensia *.hin, având o structură cu<br />

mai multe linii, câte o linie pentru fiecare atom al moleculei cuprinzând numărul, numele, sarcina parţială,<br />

coordonatele spaţiale, numărul <strong>de</strong> legături pe care le formează şi lista legăturilor împreună cu tipul<br />

acestora.<br />

Aceste fişiere (pentru fiecare moleculă în parte) reprezintă datele <strong>de</strong> intrare în analiza <strong>de</strong> structură realizată.<br />

Uzual metodologia <strong>de</strong> analiză structură-activitate foloseşte structurile moleculare în care atomii <strong>de</strong><br />

hidrogen sunt neglijaţi (şterşi). O sumă <strong>de</strong> motive stau la baza acestei alegeri:<br />

÷ activităţile biologice în mod uzual <strong>de</strong>terminate in vivo au ca mediu <strong>de</strong> analiză mediul apos, în care au<br />

loc procese <strong>de</strong> disociere (parţială) în care atomii <strong>de</strong> hidrogen trec sub formă <strong>de</strong> protoni în soluţie,<br />

părăsind locul pe care îl ocupă în structura moleculară, <strong>de</strong>ci o formă <strong>de</strong>pletizată <strong>de</strong> hidrogen îşi găseşte<br />

corespon<strong>de</strong>ntul în starea <strong>de</strong> fapt a experimentului;<br />

÷ atomii <strong>de</strong> hidrogen pot forma o singură legătură; aceştia sunt singurii şterşi, <strong>de</strong>ci exceptând poziţia<br />

geometrică a acestora informaţia poate fi oricând reconstruită; mai mult, fiindcă formează o singură<br />

legătură, ei nu contribuie la complexitatea moleculară (nu creează lanţuri şi ramificaţii, sunt doar<br />

terminatori <strong>de</strong> structură) şi din acest punct <strong>de</strong> ve<strong>de</strong>re nu aduc informaţie care să caracterizeze<br />

suplimentar o structură în raport cu informaţia care a fost <strong>de</strong>ja produsă <strong>de</strong> ceilalţi atomi;<br />

÷ nu în ultimul rând se reduce consi<strong>de</strong>rabil volumul <strong>de</strong> calcule pe o structură fără atomi <strong>de</strong> hidrogen;<br />

consi<strong>de</strong>rând doar un alcan cu formula generală CnH2n+2 se observă că volumul <strong>de</strong> calcule se reduce la<br />

aproape o treime (în ipoteza i<strong>de</strong>ală că volumul <strong>de</strong> calcule e proporţional cu dimensiunea moleculei,<br />

ceea ce <strong>de</strong> cele mai multe ori este nerealist, reducerea fiind şi mai drastică, existând <strong>de</strong>pen<strong>de</strong>nţe<br />

pătratice sau chiar exponenţiale în timp <strong>de</strong> execuţie cu volumul molecular) dacă atomii <strong>de</strong> hidrogen<br />

sunt eliminaţi.<br />

Seria <strong>de</strong> fişiere (cu extensia `hin`) conţinând mo<strong>de</strong>lele structurilor 3D ale moleculelor reprezintă date <strong>de</strong><br />

intrare în analiza structură-activitate realizată.<br />

Figura următoare ilustrează 4 baze <strong>de</strong> date în care informaţiile colectate au fost <strong>de</strong>pozitate.<br />

[ 73 ] Polak-Ribiere este o metodă <strong>de</strong> optimizare ce foloseşte gradienţi conjugaţi (Polak B, Ribiere G, 1969. Note surla<br />

convergence <strong>de</strong>s métho<strong>de</strong>s <strong>de</strong> directions conjuguées. Rev. Fr. Imform. Rech. Oper 16:35-43).<br />

[ 74 ] AM1: Austin Mo<strong>de</strong>l 1 (<strong>de</strong>zvoltată <strong>de</strong> Dewar & alţii) în mod similar cu metoda tradiţională MNDO <strong>de</strong> aproximare a<br />

integralelor <strong>de</strong> doi electroni dar foloseşte o expresie modificată pentru repulsia nucleu-nucleu (Dewar MJS, Zoebisch<br />

EG, Healy EF, Stewart JJP, 1985. AM1: A New General Purpose Quantum Mechanical Molecular Mo<strong>de</strong>l. J Am Chem<br />

Soc 107:3902-3909).<br />

277


În fiecare dintre aceste baze <strong>de</strong> date sunt <strong>de</strong>pozitate mai multe seturi <strong>de</strong> molecule. În tabelul următor<br />

se redă conţinutul bazei <strong>de</strong> date MDFV (având peste 1000 <strong>de</strong> molecule stocate):<br />

Tabela Număr <strong>de</strong> molecule Spaţiul <strong>de</strong> stocare al populaţiei <strong>de</strong> <strong>de</strong>scriptori (_mdfv)<br />

bbb_data 535 9.6Gb<br />

cqd_data 37 727Mb<br />

cycl_data 19 399Mb<br />

dipep_data 58 1.1Gb<br />

drugs166_data 166 3.0Gb<br />

estro_data 144 2.6Gb<br />

nitro_data 39 767Mb<br />

ordnance_data 8 199Mb<br />

sulfon18_data 18 381Mb<br />

sulfon45_data 45 873Mb<br />

taxoids_data 34 673Mb<br />

triph_data 25 509Mb<br />

2010A4. Obţinerea (Q)SRR, (Q)SPR, (Q)PAR, şi (Q)AAR (chimie farmaceutică)<br />

Eficienţa obţinerii <strong>de</strong> (Q)SRR, (Q)SPR, (Q)PAR, şi (Q)AAR s-a studiat sistematic folosind o<br />

familie <strong>de</strong> <strong>de</strong>scriptori, un set <strong>de</strong> compuşi şi o activitate măsurată date şi diferite valori ale<br />

parametrilor <strong>de</strong> evoluţie. O serie <strong>de</strong> rezultate, toate noi, au fost obţinute din parcursul acestei<br />

activităţi (Jäntschi, 2009-GASI; Jäntschi & others, 2009-DF4; Jäntschi & Bălan, 2009-DF7;<br />

Jäntschi & others, 2010-MHqR; Jäntschi & others, 2010-REGA; Jäntschi & others, 2010-RESG;<br />

Jäntschi & others, 2010-SGAE; Jäntschi & others, 2010-ATGA; Jäntschi & others, 2010-ATGP;<br />

Jäntschi & others, 2010-ATGG; Jäntschi & others, 2010-TESG; Jäntschi, 2010-GAEG).<br />

Familia <strong>de</strong> <strong>de</strong>scriptori aleasă pentru evaluarea performanţelor algoritmului genetic realizat este<br />

MDF (Molecular Descriptors Family) pornind <strong>de</strong> la următoarele raţionamente:<br />

75<br />

÷ Este în totalitate <strong>de</strong>zvoltată şi documentată <strong>de</strong> autor, propusă în 2004 [ ];<br />

÷ Sistemul <strong>de</strong> generare, stocare şi interogare este un sistem mo<strong>de</strong>rn, bazat pe aplicaţii <strong>de</strong> tip<br />

client-server, la care procesarea paralelă (execuţie simultană pe aceleaşi date) este posibilă şi<br />

constituie un avantaj major în accelerarea execuţiei [ 76 ];<br />

÷ Metoda este stabilă, fiind revizuită şi complect documentată în 2005 [ ];<br />

÷ Prezintă avantajul disponibilităţii online atât în ceea ce priveşte modalitatea <strong>de</strong> obţinere a<br />

membrilor familiei cât şi a rezultatelor obţinute pe diferite seturi <strong>de</strong> compuşi [ 78 ];<br />

÷ Metoda a dovedit eficienţă în predicţia proprietăţilor fizico-chimice şi biologice la peste 50 <strong>de</strong><br />

seturi <strong>de</strong> compuşi chimici investigaţi [ 79 ].<br />

Setul <strong>de</strong> molecule ales pentru investigare este seria bifenililor policloruraţi (PCBs) o serie formată<br />

din 209 compuşi al cărui studiu este <strong>de</strong> o <strong>de</strong>osebită importanţă pentru impactul acestora asupra<br />

ecosistemului.<br />

[ 75 ] <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>. 2004. MDF - A New QSAR/QSPR Molecular Descriptors Family. Leonardo Journal of<br />

Sciences 3(4):68-85.<br />

[ 76 ] <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>. 2004. Delphi Client - Server Implementation of Multiple Linear Regression Findings: a<br />

QSAR/QSPR Application. Applied Medical Informatics 15(3-4):48-55.<br />

[ 77 ] <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>. 2005. Molecular Descriptors Family on Structure Activity Relationships 1. Review of the<br />

Methodology. Leonardo Electronic Journal of Practices and Technologies 4(6):76-98.<br />

[ 78 ] <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>. 2007. ©February. http://l.aca<strong>de</strong>micdirect.org/Chemistry/SARs/MDF_SARs/<br />

[ 79 ] <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ. 2007. Results from the Use of Molecular Descriptors Family on<br />

Structure Property/Activity Relationships, International Journal of Molecular Sciences 8(3):189-203.<br />

278<br />

77


Cl(n)<br />

Cl (n)<br />

PCBs: Seria bifenililor policloruraţi<br />

Astfel, o scurtă incursiune în istoria acestor compuşi ne arată că aceştia şi-au găsit utilizări sub<br />

formă <strong>de</strong> lichi<strong>de</strong> dielectrice în transformatoare şi con<strong>de</strong>nsatoare, ca agenţi <strong>de</strong> răcire şi ungere,<br />

aditivi stabilizatori la lipiturile <strong>de</strong> ţevi PVC pentru reţelele electrice, în componente electronice, ca<br />

agenţi <strong>de</strong> diluare ale pestici<strong>de</strong>lor, uleiuri <strong>de</strong> răcire pentru scule <strong>de</strong> tăiere, flui<strong>de</strong> hidraulice, agenţi <strong>de</strong><br />

protecţie şi lustruire, a<strong>de</strong>zivi, lacuri (<strong>de</strong> parchet), vopsele, agenţi <strong>de</strong> curăţare şi chiar ca alternativă la<br />

hârtia <strong>de</strong> celuloză [ 80 ].<br />

Chiar dacă producţia <strong>de</strong> PCB a fost stopată în 1970 datorită toxicităţii ridicate a celor mai mulţi<br />

congeneri ai familiei PCB, efectele acestora sunt încă prezente în mediu, datorită faptului că PCBs<br />

sunt poluanţi organici persistenţi (clasificaţi ca atare [ 81 ]) care se acumulează (bioacumulare) în<br />

animale.<br />

Coeficientul <strong>de</strong> partiţie octanol/apă (Kow) este raportul concentraţiilor unui compus chimic între<br />

octanol şi apă aflate în contact la o anumită temperatură. Este un parametru adimensional (fiind un<br />

raport <strong>de</strong> concentraţii) care frecvent se exprimă pe scară logaritmică (logKow sau mai simplu lkow).<br />

Această proprietate fizico-chimică este utilizată în multe studii <strong>de</strong> mediu în <strong>de</strong>terminarea efectului<br />

compuşilor chimici în mediu, un exemplu fiind utilizarea acestuia pentru prezicerea magnitudinii <strong>de</strong><br />

bioacumulare în peşti [ 82 ].<br />

Valorile activităţii măsurate se bazează pe un studiu datat în 1996 [ ] şi care sintetizează rezultatele<br />

obţinute şi raportate în literatura <strong>de</strong> specialitate în studiul PCBs <strong>de</strong> mai mulţi autori.<br />

84<br />

Studiul anterior al lkow cu familia <strong>de</strong> <strong>de</strong>scriptori moleculari [ ] a arătat că se poate obţine o ecuaţie<br />

<strong>de</strong> regresie liniară multiplă în 4 variabile care să explice activitatea măsurată în procent <strong>de</strong> 91%,<br />

ecuaţie care însă nu respectă toate condiţiile impuse <strong>de</strong> viabilitate fenotipică menţionate mai sus<br />

(variabilitate, abatere <strong>de</strong> la normalitate, şi <strong>de</strong>terminare rezonabile), în fapt 2 dintre genotipurile<br />

acestei ecuaţii eşuând la acest test <strong>de</strong> viabilitate: HMmjQt şi SMMjQg. Oricum, ecuaţia obţinută în<br />

[84] poate constitui un element <strong>de</strong> referinţă în ceea ce priveşte performanţa algoritmului genetic,<br />

fiind redată în continuare:<br />

Ŷ = 3.04 - 0.42·IIDDKGg + 0.04·IHDRKEg + 0.07·aHMmjQt - 37.5·aSMMjQg<br />

r 2 (Y,Ŷ) ≈ 0.91, F=554 (24)<br />

Măsurătorile experimentale ale coeficientului <strong>de</strong> partiţie octanol/apă ale unei serii <strong>de</strong> 206 PCBs (din<br />

totalul <strong>de</strong> 209), exprimate în scară logaritmică (lkow=ln(KOW)) aşa cum au fost ele raportate în [83]<br />

sunt redate în tabelul următor.<br />

[ 80 ] UNEP Chemicals. 1999. Gui<strong>de</strong>lines for the I<strong>de</strong>ntification of PCBs and Materials Containing PCBs. United Nations<br />

Environment Programme. http://www.chem.unep.ch/pops/pdf/PCBi<strong>de</strong>nt/pcbid1.pdf.<br />

[ 81 ] Office of International Affairs. 2002. Persistent Organic Pollutants: A Global Issue, A Global Response.<br />

Environmental Protection Agency. http://www.epa.gov/oia/toxics/pop.pdf.<br />

[ 82 ] U.S. Geological Survey. 2008. Octanol-Water Partition Coefficient (KOW). U.S. Department of the Interior.<br />

http://toxics.usgs.gov/<strong>de</strong>finitions/kow.html (Page Last Modified: Thursday, 13-Mar-2008 13:25:59 EDT).<br />

[ 83 ] Ronald EISLER, André A. BELISLE. 1996. Planar PCB Hazards to Fish, Wildlife, and Invertebrates: A Synoptic<br />

Review. Contaminant Hazard Reviews. Biological Report 31.<br />

[ 84 ] <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ. 2006. Molecular Descriptors Family on Structure Activity<br />

Relationships 6. Octanol-Water Partition Coefficient of Polychlorinated Biphenyls, Leonardo Electronic Journal of<br />

Practices and Technologies 5(8):71-86.<br />

279<br />

83


Coeficienţi <strong>de</strong> partiţie octanol/apă pentru PCBs<br />

Moleculă Structură lkow<br />

PCB015 Cl<br />

PCB001<br />

PCB002<br />

Cl<br />

PCB003 Cl<br />

PCB004<br />

PCB006<br />

PCB007<br />

PCB008<br />

PCB009<br />

PCB010<br />

PCB011<br />

Cl<br />

Cl<br />

Cl<br />

PCB012 Cl<br />

PCB014<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

4.601<br />

4.421<br />

4.401<br />

5.023<br />

5.021<br />

5.15<br />

5.301<br />

5.18<br />

5.311<br />

5.343<br />

5.295<br />

5.404<br />

280<br />

Cl<br />

Cl Cl<br />

Cl<br />

5.335<br />

PCB016 5.311<br />

Cl Cl<br />

PCB017 5.761<br />

Cl<br />

PCB018<br />

PCB019<br />

Cl<br />

Cl<br />

Cl Cl<br />

Cl Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.551<br />

5.481<br />

PCB020 5.577<br />

Cl<br />

Cl<br />

Cl<br />

PCB021 5.517<br />

Cl<br />

Cl<br />

PCB022 5.421<br />

PCB023<br />

PCB024<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.577<br />

5.671<br />

PCB025 5.677<br />

Cl<br />

PCB026<br />

Cl<br />

Cl<br />

Cl<br />

5.667


PCB027<br />

Cl<br />

Cl<br />

Cl<br />

5.447<br />

PCB028<br />

Cl<br />

Cl<br />

Cl<br />

5.691<br />

PCB029<br />

Cl<br />

Cl<br />

Cl<br />

5.743<br />

PCB030<br />

Cl<br />

Cl<br />

Cl<br />

5.504<br />

PCB031<br />

Cl<br />

Cl<br />

Cl<br />

5.677<br />

PCB032<br />

Cl<br />

Cl<br />

Cl<br />

5.751<br />

PCB033<br />

Cl<br />

Cl<br />

Cl<br />

5.572<br />

PCB034<br />

Cl<br />

Cl<br />

Cl<br />

5.667<br />

PCB035<br />

Cl<br />

Cl<br />

Cl<br />

5.827<br />

PCB036<br />

Cl<br />

Cl<br />

Cl<br />

4.151<br />

PCB037<br />

Cl<br />

Cl<br />

Cl<br />

4.941<br />

PCB038<br />

Cl<br />

Cl<br />

Cl<br />

5.767<br />

PCB039<br />

Cl<br />

Cl<br />

Cl<br />

5.897<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

PCB040 5.561<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

PCB041 6.111<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

PCB042 5.767<br />

PCB043<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.757<br />

PCB044<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.811<br />

PCB045<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.537<br />

PCB046<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.537<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

PCB047 6.291<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

PCB048 5.787<br />

281


PCB049<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.221<br />

PCB050<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.637<br />

PCB051<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.637<br />

PCB052<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.091<br />

PCB053<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.627<br />

PCB054<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.904<br />

PCB055<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.117<br />

PCB056<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.117<br />

PCB057<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.177<br />

PCB058<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.177<br />

PCB059<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.957<br />

PCB060<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.452<br />

PCB061<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.943<br />

PCB062<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.897<br />

PCB063<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.177<br />

PCB064<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.957<br />

PCB065<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.867<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

PCB066 5.452<br />

PCB067<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.207<br />

PCB068<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.267<br />

PCB069<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.047<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.231<br />

PCB070<br />

282


PCB071<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.987<br />

PCB072<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.267<br />

PCB073<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.047<br />

PCB074<br />

Cl<br />

Cl<br />

Cl<br />

Cl 6.671<br />

PCB075<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.057<br />

PCB076<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.137<br />

PCB077<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.523<br />

PCB078<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.357<br />

PCB079<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.427<br />

PCB080<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.583<br />

PCB081<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.367<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

PCB082 6.142<br />

PCB083<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.267<br />

PCB084<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.041<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

PCB085 6.611<br />

PCB086<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.204<br />

PCB087<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.371<br />

PCB088<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.516<br />

PCB089<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.077<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

PCB090 6.367<br />

283


PCB091<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.137<br />

PCB092<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.357<br />

PCB093<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.047<br />

PCB094<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.137<br />

PCB095<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.137<br />

PCB096<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.717<br />

PCB097<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.671<br />

PCB098<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.137<br />

PCB099<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.211<br />

PCB100<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.237<br />

PCB101<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.071<br />

PCB102<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.167<br />

PCB103<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.227<br />

PCB104<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

5.817<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

PCB105 6.657<br />

PCB106<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.647<br />

PCB107<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.717<br />

PCB108<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.717<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.487<br />

PCB109<br />

284


PCB110<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.532<br />

PCB111<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.767<br />

PCB112<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.457<br />

PCB113<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.547<br />

PCB114<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.657<br />

PCB115<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.497<br />

PCB116<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.304<br />

PCB117<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.467<br />

PCB118<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.121<br />

PCB119<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.587<br />

PCB120<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.797<br />

PCB121<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.647<br />

PCB122<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.647<br />

PCB123<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.747<br />

PCB124<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.737<br />

PCB125<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.517<br />

PCB126<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.897<br />

PCB127<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.957<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

PCB128 6.961<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

PCB129 7.321<br />

285


PCB130<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.391<br />

PCB131<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.587<br />

PCB132<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.587<br />

PCB133<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.867<br />

PCB134<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.304<br />

PCB135<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.151<br />

PCB136<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.511<br />

PCB138<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.441<br />

PCB139<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.677<br />

PCB140<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.677<br />

PCB141<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.592<br />

PCB142<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.517<br />

PCB143<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.607<br />

PCB144<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.677<br />

PCB145<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.257<br />

PCB146<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.897<br />

PCB147<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.647<br />

PCB148<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.737<br />

PCB149<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.281<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.327<br />

PCB150<br />

286


PCB151<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.647<br />

PCB152<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.227<br />

PCB153<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.751<br />

PCB154<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.767<br />

PCB155<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.123<br />

PCB156<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.187<br />

PCB157<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.187<br />

PCB158<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.027<br />

PCB159<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.247<br />

PCB160<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.937<br />

PCB161<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.087<br />

PCB162<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.247<br />

PCB163<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.997<br />

PCB164<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.027<br />

PCB165<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.057<br />

PCB166<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.937<br />

PCB167<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.277<br />

PCB168<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.117<br />

PCB169<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.427<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.277<br />

PCB170<br />

287


PCB171<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.704<br />

PCB172<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.337<br />

PCB173<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.027<br />

PCB174<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.117<br />

PCB175<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.177<br />

PCB176<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.767<br />

PCB177<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.087<br />

PCB178<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.147<br />

PCB179<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.737<br />

PCB180<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.367<br />

PCB181<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.117<br />

PCB182<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.207<br />

PCB183<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.207<br />

PCB184<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.857<br />

PCB185<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.933<br />

PCB186<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.697<br />

PCB187<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.177<br />

PCB188<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

6.827<br />

PCB189<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.717<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

PCB190 7.467<br />

288


PCB191<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.557<br />

PCB192<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.527<br />

PCB193<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.527<br />

PCB194<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

8.683<br />

PCB195<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.567<br />

PCB196<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.657<br />

PCB197<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.307<br />

PCB198<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.627<br />

PCB199<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.207<br />

PCB200<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.277<br />

PCB201<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.627<br />

PCB202<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

8.423<br />

PCB203<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.657<br />

PCB204<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.307<br />

PCB205<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

8.007<br />

PCB206<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

9.143<br />

PCB207<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

7.747<br />

PCB208<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

8.164<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

Cl<br />

9.603<br />

PCB209<br />

289


Pe lângă alegerea familiei <strong>de</strong> <strong>de</strong>scriptori (MDF), a setului <strong>de</strong> molecule (206 PCBs), şi a proprietăţii<br />

măsurate (coeficientul <strong>de</strong> partiţie octanol/apă în unităţi logaritmice lkow) execuţia programului<br />

evolutiv a impus alegerea unei serii <strong>de</strong> parametrii intrinseci <strong>de</strong> funcţionare a algoritmului genetic,<br />

aşa cum a fost expus până în acest moment.<br />

Fişierul <strong>de</strong> configurare a execuţiei algoritmului genetic excluzând opţiunile <strong>de</strong> afişare numără nu<br />

mai puţin <strong>de</strong> 30 <strong>de</strong> parametrii dintre care parametrii ordinali un număr <strong>de</strong> 19 şi dintre care<br />

parametrii cu valori dintr-o listă <strong>de</strong> valori impuse (finită şi <strong>de</strong>finită) un număr <strong>de</strong> 12.<br />

Un simplu calcul matematic efectuat asupra parametrilor din urmă, cu valori dintr-o listă finită şi<br />

<strong>de</strong>finită, dă numărul total posibil <strong>de</strong> combinaţii <strong>de</strong> investigat <strong>de</strong> 134784, fără a socoti că pentru<br />

fiecare dintre aceste combinaţii, există practic o infinitate <strong>de</strong> posibilităţi <strong>de</strong> configurare pentru<br />

parametrii rămaşi, în număr <strong>de</strong> 18.<br />

Argumentele <strong>de</strong> mai sus pot părea <strong>de</strong>scurajatoare în ceea ce priveşte posibilităţile <strong>de</strong> investigare<br />

sistematică a rezultatelor obţinute prin execuţia algoritmului genetic. Trebuie însă văzută partea<br />

favorabilă a situaţiei, şi anume că se oferă practic o diversitate foarte mare <strong>de</strong> stări algoritmului<br />

genetic prin care se asigură variabilitatea acestuia, care este benefică atâta timp cât algoritmul<br />

genetic este menit să investigheze activităţi biologice şi proprietăţi fizico-chimice şi ele cu o<br />

variabilitate foarte mare, atât sub aspectul provenienţei măsurătorilor (din observaţii umane,<br />

instrumentale), scări absolute şi relative <strong>de</strong> măsură, variabile discrete şi continue observate.<br />

Opţiuni <strong>de</strong> configurare pentru algoritmul genetic realizat<br />

Parametru Tip (şi valori pentru listă)<br />

a_v_ADAPT_Variance Real<br />

ajb_ADAPT_JarqueBera Real<br />

a_c_ADAPT_Correlation Real<br />

sn0_SAMPLE_Size Întreg (natural)<br />

rn0_REGRESSION_Multiple Întreg (natural)<br />

e1n_GENERATIONS_max Întreg (natural)<br />

g_r_GENERATIONS_first_rich Listă: {Yes, No}<br />

cn0_CROSSOVER_Pairs Întreg (natural)<br />

m_m_MUTATION_Genes Întreg (natural)<br />

mpp_MUTATION_Parent_probability Real<br />

mcp_MUTATION_Child_probability Real<br />

b_p_SELECTION_parameter Listă: {r2, se, Mt, Hr}<br />

b_o_SELECTION_objective Listă: {min, max}<br />

sfs_FITNESS_strategy Listă: {proportional, <strong>de</strong>terministic, tournament}<br />

sfn_FITNESS_normalized Listă: {Yes, No}<br />

sfr_FITNESS_ranks Listă: {Yes, No}<br />

sfa_FITNESS_accuracy Întreg (natural)<br />

sff_FITTEST_function Listă: {nalive, r2_min, se_min, Mt_min, Hr_min, r2_max,<br />

se_max, Mt_max, Hr_max, r2_avg, se_avg, Mt_avg, Hr_avg}<br />

sfo_FITTEST_objective {min, max}<br />

fr2_FITTEST_r2_p Real<br />

fse_FITTEST_se_p Real<br />

fMt_FITTEST_Mt_p Real<br />

fHr_FITTEST_Hr_p Real<br />

v_p_SURVIVAL_phenotyping_p Real<br />

v_g_SURVIVAL__genotyping_p Real<br />

vfs_SURVIVAL_strategy Listă: {proportional, <strong>de</strong>terministic, tournament}<br />

vfr_SURVIVAL_ranks Listă: {Yes, No}<br />

e0n_RUNS_number Întreg (natural)<br />

b_k_RUNS_kepp_best_in_sample Listă: {Yes, No}<br />

b_f_RUNS_get_best_from_file Listă: {Yes, No} + listă genotipuri în fişier c_galg.txt<br />

290


O altă remarcă se poate face cu privire la valorile parametrilor <strong>de</strong> configurare. Astfel, nu toţi<br />

parametrii pot lua orice valori (cum e cazul pentru sn0_SAMPLE_Size care în mod obligatoriu<br />

trebuie să fie cel puţin cât rn0_REGRESSION_Multiple în timp ce cn0_CROSSOVER_Pairs nu<br />

poate <strong>de</strong>păşi jumătate din sn0_SAMPLE_Size) în timp ce <strong>de</strong>finirea valorilor altor parametrii este<br />

restricţionată la un domeniu <strong>de</strong> valori pentru simplul fapt că efectul <strong>de</strong>finirii unei valori din afara<br />

domeniului este fie lipsită <strong>de</strong> sens (<strong>de</strong> exemplu <strong>de</strong>finirea unei valori întregi negative pentru<br />

e0n_RUNS_number sau pentru e1n_GENERATIONS_max face ca algoritmul genetic să nu mai fie<br />

executat), fie nu produce nici un fel <strong>de</strong> efecte diferite <strong>de</strong> o anumită valoare din domeniu (atribuirea<br />

unei valori negative pentru a_c_ADAPT_Correlation este similară cu atribuirea valorii 0 şi<br />

semnificând că nu există valoare minimă impusă pentru coeficientul <strong>de</strong> <strong>de</strong>terminare între<br />

fenotipurile ce compun o ecuaţie <strong>de</strong> regresie şi proprietatea măsurată), fie nu poate duce la atingerea<br />

obiectivului (atribuirea unei valori mai mari ca unitatea pentru a_c_ADAPT_Correlation este<br />

similară cu atribuirea valorii 1 şi are ca efect impunerea <strong>de</strong>terminării <strong>de</strong> 100%, ceea ce pe cale <strong>de</strong><br />

consecinţă face lipsită <strong>de</strong> sens căutarea <strong>de</strong> regresii multiple atâta timp cât ar exista un <strong>de</strong>scriptor<br />

molecular capabil să explice singur în proporţie <strong>de</strong> 100% proprietatea măsurată), în timp valorile <strong>de</strong><br />

configurare a unor parametrii impune valorile altora (<strong>de</strong> exemplu b_p_SELECTION_parameter=r2<br />

impune b_o_SELECTION_objective=max, pentru simplul fapt că obţinerea unei ecuaţii <strong>de</strong> regresie<br />

cu cel mai mic coeficient <strong>de</strong> <strong>de</strong>terminare nu poate constitui un obiectiv <strong>de</strong> interes, tot aşa cum<br />

b_p_SELECTION_parameter=se impune b_o_SELECTION_objective=min), în timp ce limitele<br />

valorilor unor parametrii sunt impuse doar <strong>de</strong> soluţia <strong>de</strong> memorare aleasă la implementare (<strong>de</strong><br />

exemplu e1n_GENERATIONS_max admite ca valoare maximă 2147483647 impusă <strong>de</strong> tipul <strong>de</strong> dată<br />

LongInt în care este stocată valoarea, dar care poate fi însă modificat fără dificultate la tip <strong>de</strong> dată<br />

Int64 cu limita superioară <strong>de</strong> 9223372036854775807.<br />

În evaluarea algoritmului genetic s-a consi<strong>de</strong>rat <strong>de</strong> importanţă teoretică şi practică compararea<br />

performanţelor obţinute pentru doi parametrii <strong>de</strong>finitorii ai procesului <strong>de</strong> evoluţie şi anume<br />

modalitatea <strong>de</strong> selecţie a indivizilor pentru încrucişare şi selecţie şi modalitatea <strong>de</strong> selecţie a<br />

indivizilor pentru înlocuire <strong>de</strong> către <strong>de</strong>scen<strong>de</strong>nţi (supravieţuire).<br />

Aceşti doi parametrii, metoda <strong>de</strong> selecţie (parametrul sfs_FITNESS_strategy) şi metoda <strong>de</strong><br />

supravieţuire (parametrul vfs_SURVIVAL_strategy) au constituit obiectul investigaţiei. Tabelul <strong>de</strong><br />

mai jos redă schema <strong>de</strong> execuţie (<strong>de</strong>signul experimentului realizat):<br />

Modalităţi <strong>de</strong> selecţie şi supravieţuire: <strong>de</strong>sign experimental<br />

Supravieţuire Proporţional (P) Deterministic (D) Turnir (T)<br />

Selecţie<br />

Proporţional (P) P:P (1) P:D (2) P:T (3)<br />

Deterministic (D) D:P (4) D:D (5) D:T (6)<br />

Turnir (T) T:P (7) T:D (8) T:T (9)<br />

Ceilalţi parametrii ce configurează execuţia algoritmului genetic au primit valori care au fost<br />

păstrate pe toată durata experimentului aceleaşi. Valorile acestora (care au fost date ţinând seama <strong>de</strong><br />

consi<strong>de</strong>rentele menţionate mai sus) sunt redate mai jos.<br />

Valori <strong>de</strong>finite şi păstrate pe toată durata experimentului pentru parametrii rămaşi<br />

Parametru Valoare<br />

a_v_ADAPT_Variance 0.1<br />

ajb_ADAPT_JarqueBera 0.1<br />

a_c_ADAPT_Correlation 0.1<br />

sn0_SAMPLE_Size 12<br />

rn0_REGRESSION_Multiple 4<br />

e1n_GENERATIONS_max 20000<br />

g_r_GENERATIONS_first_rich Yes<br />

cn0_CROSSOVER_Pairs 2<br />

m_m_MUTATION_Genes 2<br />

mpp_MUTATION_Parent_probability 5%<br />

mcp_MUTATION_Child_probability 5%<br />

291


_p_SELECTION_parameter r2<br />

b_o_SELECTION_objective max<br />

sfn_FITNESS_normalized No<br />

sfr_FITNESS_ranks No<br />

sfa_FITNESS_accuracy 10000<br />

sff_FITTEST_function r2_min<br />

sfo_FITTEST_objective max<br />

fr2_FITTEST_r2_p 1.0<br />

fse_FITTEST_se_p 1.0<br />

fMt_FITTEST_Mt_p 1.0<br />

fHr_FITTEST_Hr_p 1.0<br />

v_p_SURVIVAL_phenotyping_p 1.0<br />

v_g_SURVIVAL__genotyping_p 1.0<br />

vfr_SURVIVAL_ranks No<br />

e0n_RUNS_number 46<br />

b_k_RUNS_kepp_best_in_sample Yes<br />

b_f_RUNS_get_best_from_file No<br />

Performanţa algoritmului genetic a fost evaluată prin prisma rezultatelor colectate în fişierele <strong>de</strong><br />

ieşire. Configuraţia parametrilor <strong>de</strong> ieşire este redată mai jos.<br />

Configuraţii <strong>de</strong> afişare în experiment<br />

Parametru Valoare<br />

d_d_SHOW_<strong>de</strong>scriptive_XX Yes<br />

(XX = m0, m1, m2, m3, m4, mx, my, v0, g1, g2, jb, r1, r2)<br />

d_f_SHOW_fitness_YY Yes<br />

(YY = nalive, r2_min, se_min, Mt_min, Hr_min, r2_max, se_max,<br />

Mt_max, Hr_max, r2_avg, se_avg, Mt_avg, Hr_avg)<br />

d_c_SHOW_configuration Yes<br />

d_m_SHOW_mols No<br />

d_r_SHOW_regressions No<br />

d_p_SHOW_phenotypes No<br />

d_s_SHOW_genotypes No<br />

d_t_SHOW_fittests No<br />

d_g_SHOW_generations No<br />

d_e_SHOW_evolutions Yes<br />

Execuţia programului evolutiv s-a făcut pe calculatoare din generaţia P6 (Dual P5) în perioada<br />

Ianuarie - Februarie 2009 şi rezultatele au fost salvate <strong>de</strong> program în fişierele <strong>de</strong> date şi sunt<br />

disponibile pentru <strong>de</strong>scărcare <strong>de</strong> la adresa:<br />

http://l.aca<strong>de</strong>micdirec.org/Horticulture/GAs/MLR_MDF_selection_vs_survival/<br />

Fişiere rezultat (configurare şi evoluţie) după <strong>de</strong>signul <strong>de</strong> mai sus<br />

Selecţie Supravieţuire Configurare Evoluţie<br />

Proporţional Proporţional PCB_4044_cfg.txt PCB_4044_evo.txt<br />

Proporţional Deterministic PCB_2441_cfg.txt PCB_2441_evo.txt<br />

Proporţional Turnir PCB_9878_cfg.txt PCB_9878_cfg.txt<br />

Deterministic Proporţional PCB_5108_cfg.txt PCB_5108_evo.txt<br />

Deterministic Deterministic PCB_6369_cfg.txt PCB_6369_evo.txt<br />

Deterministic Turnir PCB_6690_cfg.txt PCB_6690_evo.txt<br />

Turnir Proporţional PCB_5828_cfg.txt PCB_5828_evo.txt<br />

Turnir Deterministic PCB_4872_cfg.txt PCB_4872_evo.txt<br />

Turnir Turnir PCB_1758_cfg.txt PCB_1758_evo.txt<br />

Frecvenţa <strong>de</strong> apariţie a genotipurilor în eşantion <strong>de</strong>-a lungul evoluţiilor permite aprecieri cu privire<br />

la capacitatea <strong>de</strong> adaptare a acestora, şi în acelaşi timp o măsură a variabilităţii materialului genetic<br />

292


al eşantionului pe care o induc metoda <strong>de</strong> selecţie şi metoda <strong>de</strong> supravieţuire. Următorul tabel<br />

prezintă această informaţie.<br />

Cele mai frecvente genotipuri prezente în generaţii care au produs evoluţii în 46 <strong>de</strong> execuţii<br />

in<strong>de</strong>pen<strong>de</strong>nte ale programului evolutiv<br />

Selecţie Supravieţuire Genotipuri Număr Apariţii Participanţi în regresii<br />

Proporţional Proporţional Top 23 apariţii 13 406 389<br />

mMdlHg 1 46 43<br />

MDMKHt 1 40 39<br />

nDRLHt 1 40 39<br />

iPDKCg 1 39 39<br />

ADDJCg 1 35 35<br />

mDdjGg 1 31 30<br />

bDDDGg 1 28 19<br />

bDDJCg 1 27 27<br />

sDdLHg 1 25 25<br />

BDDDGg 1 24 22<br />

bDMLEg 1 24 24<br />

bDMLGg<br />

MMDPMt<br />

1<br />

1<br />

24<br />

23<br />

24<br />

23<br />

Total 6760 16788 15902<br />

Deterministic Top 23 apariţii 13 378 371<br />

iPMDHg 1 39 37<br />

bPRjCg 1 38 38<br />

IPMDEg 1 37 36<br />

mMdoHt 1 30 29<br />

IPRKCg 1 29 29<br />

MDRLHt 1 29 29<br />

MMdlHg 1 29 29<br />

MDmWHg 1 26 26<br />

BPRjCg 1 26 25<br />

NDRlHt 1 25 25<br />

iPMDCg 1 24 23<br />

bmrVCt<br />

IPMDCg<br />

1<br />

1<br />

23<br />

23<br />

23<br />

22<br />

Total 8070 18240 17797<br />

Turnir Top 23 apariţii 6 214 207<br />

MMdlHg 1 47 47<br />

mMdlHg 1 46 43<br />

sPDLEg 1 38 38<br />

AMdwGg 1 29 29<br />

IPMDHg 1 29 27<br />

mMdqGt 1 25 23<br />

Total 7466 16599 15739<br />

Deterministic Proporţional Top 23 apariţii 3 89 72<br />

MDRLHt 1 31 31<br />

ImrWCg 1 30 19<br />

ImrWHg 1 28 22<br />

Total 3922 10764 9742<br />

Deterministic Deterministic Top 23 apariţii 32 893 893<br />

gmdKHg 1 48 48<br />

iPDDGg 1 43 43<br />

bmRkHg 1 37 37<br />

gMdEQg 1 34 34<br />

sDRDGg 1 34 34<br />

HDmLQt 1 33 33<br />

MDMKHt 1 33 33<br />

mMdLMt 1 30 30<br />

MMmwCg 1 29 29<br />

bmdFEt 1 29 29<br />

hDDJCg 1 27 27<br />

293


hDDpCg 1 27 27<br />

hPmEMg 1 27 27<br />

sPmJMt 1 27 27<br />

NmdlQg 1 26 26<br />

SMMFEg 1 26 26<br />

bMddEg 1 26 26<br />

sPRDHt 1 26 26<br />

BDrsGt 1 25 25<br />

hDMKEg 1 25 25<br />

smdoQg 1 25 25<br />

AMMpHt 1 24 24<br />

GPmVCg 1 24 24<br />

SMMjEt 1 24 24<br />

BPMkHg 1 23 23<br />

GmmlQt 1 23 23<br />

bPmjMg 1 23 23<br />

hDDDHg 1 23 23<br />

hMdWGt 1 23 23<br />

hPmSEg 1 23 23<br />

hmddCt 1 23 23<br />

imMtGg 1 23 23<br />

Total 4385 13560 13316<br />

Deterministic Turnir Top 23 apariţii 5 152 152<br />

NDRkHt 1 37 37<br />

sDDEMg 1 30 30<br />

hMrkGg 1 29 29<br />

MDDKHt 1 28 28<br />

sMrLCg 1 28 28<br />

Total 4965 12504 11572<br />

Turnir Proporţional Top 23 apariţii 13 419 405<br />

sPDJEg 1 64 64<br />

mMdlHg 1 44 42<br />

MMdlHg 1 40 40<br />

MDdjEg 1 32 30<br />

sDMDMg 1 29 28<br />

mMdqGt 1 29 23<br />

sDDKCg 1 28 28<br />

sPDLEg 1 28 28<br />

aDDKEg 1 27 27<br />

sDRKCg 1 26 26<br />

sPRKGg 1 25 22<br />

sDMLGg 1 24 24<br />

MDRLHt 1 23 23<br />

Total 6537 16368 15317<br />

Deterministic Top 23 apariţii 21 714 687<br />

MDRLHt 1 88 87<br />

IPMJCg 1 46 45<br />

IPMDEg 1 42 38<br />

sDRJEg 1 41 39<br />

iPMKCg 1 36 36<br />

iPDJCg 1 35 33<br />

sPDLEg 1 34 34<br />

mDRlHt 1 33 33<br />

nDRLHt 1 32 31<br />

sDMLCg 1 31 29<br />

iPDDGg 1 31 28<br />

iPDDEg 1 29 27<br />

mDRkHt 1 28 28<br />

IPRKCg 1 27 26<br />

IPDJCg 1 27 25<br />

iPDKCg 1 27 25<br />

294


PmkEt 1 26 26<br />

sDDJEg 1 26 26<br />

MDDKHt 1 26 22<br />

IPDKCg 1 25 25<br />

sDDLHg 1 24 24<br />

Total 7964 17700 17331<br />

Turnir Top 23 apariţii 8 217 213<br />

IDRwHt 1 34 34<br />

mMdlHg 1 28 28<br />

nMRSEt 1 28 27<br />

mPRDHt 1 27 26<br />

MDRLHt 1 26 26<br />

smmLCt 1 26 24<br />

AMDEQt 1 24 24<br />

IDRwGt 1 24 24<br />

Total 7529 17100 16151<br />

Pentru a verifica ipoteza in<strong>de</strong>pen<strong>de</strong>nţei între meto<strong>de</strong>le <strong>de</strong> selecţie şi supravieţuire în ceea ce priveşte<br />

numărul <strong>de</strong> genotipuri se foloseşte testul χ 2 aplicat la o tabelă <strong>de</strong> contingenţă <strong>de</strong> 3X3 pentru fiecare<br />

serie <strong>de</strong> valori numerice din tabelul <strong>de</strong> mai sus. Rezultatele sunt redate în continuare.<br />

Sunt in<strong>de</strong>pen<strong>de</strong>nte metoda <strong>de</strong> selecţie faţă <strong>de</strong> metoda <strong>de</strong> supravieţuire în ceea ce priveşte numărul<br />

<strong>de</strong> genotipuri distincte din cultivar în generaţiile ce produc evoluţie? - NU<br />

X<br />

2<br />

(<br />

4)<br />

χ 2<br />

P T D Σ<br />

P 6760 (6665) 7466 (7726) 8070 (7904) 22296<br />

T 6537 (6586) 7529 (7634) 7964 (7810) 22030<br />

D 3922 (3968) 4965 (4599) 4385 (4705) 13272<br />

Σ 17219 19960 20419 57598<br />

2<br />

2 2 2<br />

2 2 2<br />

2 2<br />

95 260 166 49 105 154 46 366 320<br />

= + + + + + + + + ≅ 70 ;<br />

6665 7726 7904 6586 7634 7810 3968 4599 4705<br />

p ≅ 2⋅10<br />

Sunt in<strong>de</strong>pen<strong>de</strong>nte metoda <strong>de</strong> selecţie faţă <strong>de</strong> metoda <strong>de</strong> supravieţuire în ceea ce priveşte numărul<br />

total <strong>de</strong> genotipuri din cultivar în generaţiile ce produc evoluţie? - NU<br />

χ 2<br />

P T D Σ<br />

P 16788 (16240) 16599 (17084) 18240 (18303) 51627<br />

T 16368 (16095) 17100 (16932) 17700 (18140) 51168<br />

D 10764 (11585) 12504 (12187) 13560 (13056) 36828<br />

Σ 43920 46203 49500 139623<br />

X ( 4)<br />

135<br />

2<br />

−28<br />

≅ ; p ≅ 3⋅10<br />

Sunt in<strong>de</strong>pen<strong>de</strong>nte metoda <strong>de</strong> selecţie faţă <strong>de</strong> metoda <strong>de</strong> supravieţuire în ceea ce priveşte<br />

genotipurile participante la regresiile ce produc evoluţie? - NU<br />

χ 2<br />

P T D Σ<br />

P 15902 (15241) 15739 (16172) 17797 (18025) 49438<br />

T 15317 (15044) 16151 (15963) 17331 (17792) 48799<br />

D 9742 (10676) 11572 (11328) 13316 (12626) 34630<br />

Σ 40961 43462 48444 132867<br />

X ( 4)<br />

187<br />

2<br />

−39<br />

≅ ; p ≅ 2⋅10<br />

Sunt in<strong>de</strong>pen<strong>de</strong>nte metoda <strong>de</strong> selecţie faţă <strong>de</strong> metoda <strong>de</strong> supravieţuire în ceea ce priveşte numărul<br />

<strong>de</strong> genotipuri distincte din Top 23 în generaţiile ce produc evoluţie? - NU<br />

χ 2<br />

P T D Σ<br />

P 13 (8) 6 (5) 13 (19) 32<br />

T 13 (11) 8 (7) 21 (24) 42<br />

D 3 (10) 5 (7) 32 (23) 40<br />

Σ 29 19 66 114<br />

X ( 4)<br />

14.<br />

6<br />

2<br />

−3<br />

≅ ; p ≅ 6⋅10<br />

295<br />

−14


Sunt in<strong>de</strong>pen<strong>de</strong>nte metoda <strong>de</strong> selecţie faţă <strong>de</strong> metoda <strong>de</strong> supravieţuire în ceea ce priveşte numărul<br />

total <strong>de</strong> genotipuri din Top 23 în generaţiile ce produc evoluţie? - NU<br />

χ 2<br />

P T D Σ<br />

P 406 (262) 214 (167) 378 (569) 998<br />

T 419 (354) 217 (226) 714 (770) 1350<br />

D 89 (298) 152 (190) 893 (646) 1134<br />

Σ 914 583 1985 3482<br />

X ( 4)<br />

420<br />

2<br />

−89<br />

≅ ; p ≅ 1⋅10<br />

Sunt in<strong>de</strong>pen<strong>de</strong>nte metoda <strong>de</strong> selecţie faţă <strong>de</strong> metoda <strong>de</strong> supravieţuire în ceea ce priveşte<br />

genotipurile din Top 23 participante la regresiile ce produc evoluţie? - NU<br />

χ 2<br />

P T D Σ<br />

P 389 (247) 207 (163) 371 (557) 967<br />

T 405 (333) 213 (220) 687 (751) 1305<br />

D 72 (285) 152 (189) 893 (643) 1117<br />

Σ 866 572 1951 3389<br />

X ( 4)<br />

440<br />

2<br />

−94<br />

≅ ; p ≅ 6⋅10<br />

Se remarcă că confi<strong>de</strong>nţa în <strong>de</strong>pen<strong>de</strong>nţa dintre metoda <strong>de</strong> selecţie şi metoda <strong>de</strong> supravieţuire creşte<br />

în ordinea Număr <strong>de</strong> genotipuri distincte; Număr total <strong>de</strong> genotipuri; Număr <strong>de</strong> genotipuri<br />

participante la regresii în acelaşi timp cu faptul că numărul <strong>de</strong> observaţii nu creşte în aceeaşi ordine.<br />

În baza <strong>de</strong>pen<strong>de</strong>nţei remarcate între metoda <strong>de</strong> selecţie şi cea <strong>de</strong> supravieţuire pentru toţi parametrii<br />

ce caracterizează numărul <strong>de</strong> genotipuri pe parcursul evoluţiei, se impune o caracterizare a acestei<br />

<strong>de</strong>pen<strong>de</strong>nţe.<br />

La întrebarea "Există legătură între cele 3 serii <strong>de</strong> numere <strong>de</strong> genotipuri?" se răspun<strong>de</strong> calculând<br />

coeficientul <strong>de</strong> corelaţie (tabelul <strong>de</strong> mai jos).<br />

Există legătură între numărul <strong>de</strong> genotipuri distincte (NGD), numărul total <strong>de</strong> genotipuri (NTG)<br />

şi numărul <strong>de</strong> genotipuri participante la regresii (NGR)? - DA<br />

Serii Coeficient <strong>de</strong> <strong>de</strong>terminare Valoare F; probabilitate <strong>de</strong> a greşi<br />

924; 10 -15<br />

NGD vs. NTG 0.982 (y=ax)<br />

951; 10 -15<br />

NGD vs. NGR 0.982 (y=ax)<br />

16110; 10 -25<br />

NTG vs. NGR 0.999 (y=ax)<br />

Urmează obţinerea <strong>de</strong> evi<strong>de</strong>nţe că anumite asocieri între metoda <strong>de</strong> selecţie şi metoda <strong>de</strong><br />

supravieţuire sunt semnificativ diferite <strong>de</strong>cât celelalte aşa cum rezultă şi <strong>de</strong> mai jos:<br />

P T D<br />

Ceea ce se observă în figura <strong>de</strong> mai sus, poate fi pus în evi<strong>de</strong>nţă statistic. Astfel, tabelele <strong>de</strong> mai jos<br />

redau această analiză. Analiza se bazează pe calculul intervalului <strong>de</strong> încre<strong>de</strong>re pentru medie şi<br />

<strong>de</strong>viaţie standard în ipoteza că distribuţia <strong>de</strong> eşantionare induce o distribuţie normală a acestor<br />

statistici (ale eşantionului) în jurul parametrului statistic (al populaţiei) asociat. Aşa cum s-a arătat<br />

Teorema Limită Centrală [67] ne asigură că se pot folosi în această analiză statisticile valoare medie<br />

(m) şi abatere standard (s), pe baza cărora se poate exprima intervalul <strong>de</strong> încre<strong>de</strong>re al acestora din<br />

distribuţia Stu<strong>de</strong>nt t folosind relaţiile [ 85 P 13 6 13<br />

T 13 8 21<br />

D 3 5 32<br />

]:<br />

CI( 1−<br />

α,<br />

m)<br />

= m ± t(<br />

α / 2,<br />

N −1)<br />

s N<br />

(24)<br />

⎛<br />

( 1−<br />

α,<br />

s)<br />

= ⎜<br />

s<br />

⎝<br />

n −1<br />

, s<br />

χ ( α / 2,<br />

n −1)<br />

n −1<br />

⎞<br />

⎟<br />

χ (( 1−<br />

α)<br />

/ 2,<br />

n −1)<br />

⎟<br />

⎠<br />

CI (25)<br />

2 2<br />

[ 85 ] Ronald A. FISHER. 1956. Statistical Methods and Scientific Inference. Edinburgh: Oliver & Boyd. p. 178, pp. 32.<br />

296


86<br />

Abateri semnificative statistic (α=5%) în numărul <strong>de</strong> genotipuri [ ]<br />

Genotipuri Observabilă Medie CI(95%,Medie) În afara intervalului*<br />

Top 23 Num 12.7 6 20<br />

Top 23 Apar 387 182 592 (T,D), (D,D) > CIU; (D,P), (D,T) < CIL<br />

Top 23 Part 377 173 580<br />

Total Num 6400 5183 7617 (D,·) < CIL; (P,D), (T,D) > CIU<br />

Total Apar 15514 13522 17505 (D,P), (D,T) < CIL; (P,D), (T,D) > CIU<br />

Total Part 14763 12697 16829 (D,P), (D,T) < CIL; (P,D), (T,D) > CIU<br />

* (Sel,Srv) - Observaţia făcută folosind metoda <strong>de</strong> selecţie Sel şi <strong>de</strong> supravieţuire Srv<br />

(Sel,·) - Observaţiile făcute folosind metoda <strong>de</strong> selecţie Sel şi orice metodă <strong>de</strong> supravieţuire<br />

(·,Srv) - Observaţiile făcute folosind metoda <strong>de</strong> supravieţuire Srv şi orice metodă <strong>de</strong> selecţie<br />

CIL - Limita inferioară a intervalului <strong>de</strong> încre<strong>de</strong>re <strong>de</strong> 95%<br />

CIU - Limita superioară a intervalului <strong>de</strong> încre<strong>de</strong>re <strong>de</strong> 95%<br />

Rezultatele din tabel arată că:<br />

÷ Selecţia <strong>de</strong>terministă (D) face ca:<br />

o Indiferent <strong>de</strong> metoda <strong>de</strong> supravieţuire numărul total <strong>de</strong> genotipuri distincte să scadă<br />

semnificativ statistic;<br />

o Folosind supravieţuirea turnir (T) sau proporţională (P) se remarcă scă<strong>de</strong>re semnificativă<br />

statistic la toţi parametrii observaţi (Top 23 şi Total; Distincţi, Apariţii şi Participări în<br />

regresii) în timp ce folosind supravieţuirea <strong>de</strong>terministă (D) se remarcă creştere semnificativ<br />

statistică numai în ceea ce priveşte cele mai frecvente genotipuri pentru toţi parametrii<br />

(Distincţi, Apariţii şi Participări în regresii);<br />

÷ Supravieţuirea <strong>de</strong>terministă (D) face ca:<br />

o Folosind supravieţuirea turnir (T) sau proporţională (P) să mărească semnificativ numărul<br />

total <strong>de</strong> genotipuri pentru toţi parametrii (Distincţi, Apariţii şi Participări în regresii).<br />

Diferenţe semnificative statistic (α=5%) în numărul <strong>de</strong> genotipuri (medii, abateri)<br />

Geno Obs Grup: Medie; Deviaţie CI(95%,Medie) Dev CI(95%,Dev) În afara intervalului<br />

Top23 Num (P,·): 10.7; 4.0 6 20 9.10 6 17 Dev(P,·)<br />

Top23 Apar (P,·): 333; 104 182 592 266 180 510 Dev(P,·)<br />

Top23 Part (P,·): 322; 100 173 580 265 179 508 Dev(P,·)<br />

Total Num (P,·): 7432; 656 5183 7617 1583 1069 3033 Dev(P,·)<br />

Total Apar (P,·): 17209; 898 13522 17505 2591 1750 4963 Dev(P,·)<br />

Total Part (P,·): 16479; 1144 12697 16829 2687 1815 5148 Dev(P,·)<br />

Top23 Num (T,·): 14.0; 6.6 6 20 9.10 6 17 -<br />

Top23 Apar (T,·): 450; 250 182 592 266 180 510 -<br />

Top23 Part (T,·): 435; 238 173 580 265 179 508 -<br />

Total Num (T,·): 7343; 731 5183 7617 1583 1069 3033 Dev(T,·)<br />

Total Apar (T,·): 17056; 667 13522 17505 2591 1750 4963 Dev(T,·)<br />

Total Part (T,·): 16266; 1012 12697 16829 2687 1815 5148 Dev(T,·)<br />

Top23 Num (D,·): 13.3; 16.2 6 20 9.10 6 17 -<br />

Top23 Apar (D,·): 378; 447 182 592 266 180 510 -<br />

Top23 Part (D,·): 372; 453 173 580 265 179 508 -<br />

Total Num (D,·): 4424; 523 5183 7617 1583 1069 3033 Med(D,·); Dev(D,·)<br />

Total Apar (D,·): 12276; 1412 13522 17505 2591 1750 4963 Med(D,·); Dev(D,·)<br />

Total Part (D,·): 11543; 1787 12697 16829 2687 1815 5148 Med(D,·); Dev(D,·)<br />

Top23 Num (·,P): 9.7; 5.8 6 20 9.10 6 17 Dev(·,P)<br />

Top23 Apar (·,P): 305; 187 182 592 266 180 510 -<br />

Top23 Part (·,P): 289; 188 173 580 265 179 508 -<br />

Total Num (·,P): 5740; 1578 5183 7617 1583 1069 3033 -<br />

[ 86 ] Valori calculate cu STATISTICA v.8.0 (©1984-2008), StatSoft Inc. în baza formulelor (24) şi (25).<br />

297


Total Apar (·,P): 14640; 3363 13522 17505 2591 1750 4963 -<br />

Total Part (·,P): 13654; 3400 12697 16829 2687 1815 5148 -<br />

Top23 Num (·,T): 6.3; 1.5 6 20 9.10 6 17 Dev(·,T)<br />

Top23 Apar (·,T): 194; 37 182 592 266 180 510 Dev(·,T)<br />

Top23 Part (·,T): 191; 34 173 580 265 179 508 Dev(·,T)<br />

Total Num (·,T): 6653; 1462 5183 7617 1583 1069 3033 -<br />

Total Apar (·,T): 15401; 2521 13522 17505 2591 1750 4963 -<br />

Total Part (·,T): 14487; 2533 12697 16829 2687 1815 5148 -<br />

Top23 Num (·,D): 22.0; 9.5 6 20 9.10 6 17 Med(·,D)<br />

Top23 Apar (·,D): 662; 261 182 592 266 180 510 Med(·,D)<br />

Top23 Part (·,D): 650; 263 173 580 265 179 508 Med(·,D)<br />

Total Num (·,D): 6806; 2098 5183 7617 1583 1069 3033 -<br />

Total Apar (·,D): 16500; 2560 13522 17505 2591 1750 4963 -<br />

Total Part (·,D): 16148; 2464 12697 16829 2687 1815 5148 -<br />

Rezultatele din tabel arată că:<br />

÷ Supravieţuirea <strong>de</strong>terministă (D) îmbogăţeşte semnificativ statistic grupul celor mai frecvente<br />

genotipuri (Top23) din generaţiile ce produc evoluţie în timp ce selecţia <strong>de</strong>terministă (D)<br />

sărăceşte semnificativ statistic numărul total al genotipurilor din generaţiile care produc<br />

evoluţie;<br />

÷ Practic fiecare metodă <strong>de</strong> selecţie <strong>de</strong>fineşte câte o populaţie genotipică în generaţiile care<br />

produc evoluţie; argumentul este că oricare ar fi parametrul urmărit pentru numărul total <strong>de</strong><br />

genotipuri (Distincţi, Apariţii şi Participări în regresii), şi luând pentru exemplificare numărul <strong>de</strong><br />

genotipuri distincte (Num), avem:<br />

o Varianţa totală: 1583 2 cu intervalul <strong>de</strong> încre<strong>de</strong>re <strong>de</strong> 95%: [1069 2 , 3033 2 ];<br />

o Varianţa populaţiei produse <strong>de</strong> selecţia proporţională (P): 656 2 < 1069 2 ;<br />

o Varianţa populaţiei produse <strong>de</strong> selecţia turnir (T): 731 2 < 1069 2 ;<br />

o Varianţa populaţiei produse <strong>de</strong> selecţia proporţională (P): 523 2 < 1069 2 ;<br />

÷ Nu aceeaşi concluzie se poate trage cu privire la metoda <strong>de</strong> supravieţuire, pentru care se produce<br />

segregare populaţională doar pentru supravieţuirea <strong>de</strong>terministă (D), care creează o populaţie cu<br />

un număr mediu <strong>de</strong> genotipuri semnificativ statistic mai mare <strong>de</strong>cât supravieţuirea proporţională<br />

(P) şi respectiv turnir (T).<br />

Pe baza rezultatelor experimentale un alt parametru important al evoluţiei poate fi interpretat:<br />

numărul <strong>de</strong> generaţii care produc evoluţie în cursul execuţiei cu număr impus <strong>de</strong> generaţii (20000)<br />

ca măsură a capacităţii <strong>de</strong> adaptare <strong>de</strong>finită <strong>de</strong> combinaţia celor două meto<strong>de</strong> (<strong>de</strong> selecţie şi<br />

supravieţuire) precum şi valoarea medie a numerelor generaţiilor care produc evoluţie ca măsură a<br />

vitezei <strong>de</strong> adaptare.<br />

Rezultatele au fost prelucrate astfel: pentru fiecare execuţie in<strong>de</strong>pen<strong>de</strong>ntă a algoritmului genetic sau<br />

consemnat numerele consecutive ale generaţiilor care au produs îmbunătăţirea valorii funcţiei<br />

obiectiv, şi anume s-a obţinut o ecuaţie <strong>de</strong> regresie validă (toţi coeficienţii sunt semnificativi<br />

statistic) cu un coeficient <strong>de</strong> <strong>de</strong>terminare mai mare <strong>de</strong>cât cel obţinut în generaţiile anterioare. S-a<br />

calculat apoi valoarea medie a acestui număr (care tot<strong>de</strong>auna este mai mic <strong>de</strong>cât numărul maxim <strong>de</strong><br />

generaţii al unei execuţii) şi numărul <strong>de</strong> evoluţii distincte (numărul <strong>de</strong> valori), informaţii care sunt<br />

prezentate în tabel. Întrucât ambele valori (media şi numărul <strong>de</strong> valori) au fost obţinute printr-o<br />

repetare (<strong>de</strong> 46 <strong>de</strong> ori) a experimentului pentru fiecare pereche <strong>de</strong> meto<strong>de</strong> (selecţie, supravieţuire)<br />

valorile obţinute aproximează distribuţia <strong>de</strong> eşantionare, astfel încât s-a putut presupune<br />

aproximaţia la normalitate a acestora (atât ele ca valori ale eşantionului <strong>de</strong> 46 <strong>de</strong> observaţii) cât şi<br />

populaţia din care provin, care aşa cum s-a dovedit mai sus este caracteristică (distinctă) cel puţin<br />

după metoda <strong>de</strong> selecţie. Pentru a se realiza compararea perechilor <strong>de</strong> meto<strong>de</strong> (selecţie,<br />

supravieţuire) informaţiile din tabelul <strong>de</strong> mai jos au fost supuse unei analize statistice <strong>de</strong>scriptive,<br />

care a inclus calcularea valorilor medii şi a <strong>de</strong>viaţiilor standard, împreună cu intervalele <strong>de</strong><br />

încre<strong>de</strong>re la un nivel <strong>de</strong> semnificaţie <strong>de</strong> 95%, rezultate care sunt redate în continuare.<br />

298


Generaţii ce produc evoluţii (număr şi medie) pentru 46 <strong>de</strong> execuţii in<strong>de</strong>pen<strong>de</strong>nte<br />

run (T,T) (T,D) (T,P) (D,T) (D,D) (D,P) (P,T) (P,D) (P,P)<br />

1 17 3744 26 2884 12 412 12 2662 17 1424 7 2632 52 2840 22 1734 37 3423<br />

2 27 2096 27 4704 40 5115 13 3854 19 2295 25 2780 20 1565 36 4446 19 4916<br />

3 26 1134 32 3531 28 1545 30 2714 24 2099 13 1653 29 1808 30 4095 38 2499<br />

4 27 2746 18 241 16 413 17 2981 36 1084 26 3317 16 3952 27 5396 36 2856<br />

5 28 3299 42 1655 13 2314 32 3079 27 3133 22 4913 20 977 36 5462 23 817<br />

6 20 1717 49 2398 17 1704 25 1500 8 4697 25 3235 27 488 24 653 28 4255<br />

7 19 1059 38 2103 36 4749 34 6709 25 3382 20 4528 28 1764 39 2646 28 1710<br />

8 23 3173 38 1781 20 852 23 5272 23 8355 17 3865 35 2491 23 2060 20 2335<br />

9 37 1034 34 3449 44 3596 12 822.1 33 5814 21 3523 30 1485 28 3264 40 7250<br />

10 18 5046 39 5952 22 1762 14 3647 36 4260 19 5019 17 3345 38 7288 61 5790<br />

11 36 2516 19 3191 15 599 27 3174 11 2849 24 2135 31 564 33 2193 33 4844<br />

12 25 3190 35 4744 24 4942 27 2511 26 6400 24 4675 33 1795 38 4015 33 8315<br />

13 35 907 26 1479 38 2803 21 9086 6 32 14 6338 39 4880 49 5570 33 3103<br />

14 48 4672 20 3958 25 4738 15 8139 32 8734 5 718 22 5116 18 1607 43 3602<br />

15 36 1657 44 4893 39 2839 19 3227 32 5209 4 232 40 6560 20 2896 27 736<br />

16 21 991 24 246 36 1749 12 2503 20 1317 10 2984 34 11086 50 3292 28 3195<br />

17 56 6242 41 1806 27 1707 33 4121 29 6367 31 5316 26 1555 28 964 46 4860<br />

18 24 1773 33 4545 23 5670 18 4119 27 4520 28 3645 45 2394 49 7685 19 1589<br />

19 29 1059 19 6112 23 1141 23 5796 11 992 16 1458 36 4459 14 1378 21 5115<br />

20 23 3851 30 3557 28 710 23 1558 22 3669 6 3335 42 4816 45 3543 35 3731<br />

21 31 1928 25 1302 38 2767 17 5730 20 3094 18 8798 36 2526 18 2795 45 1216<br />

22 37 699 25 2320 31 4964 18 4596 29 5753 15 576 41 1993 17 790 33 3505<br />

23 37 2148 20 4900 14 2292 32 3934 42 5110 14 5037 47 8925 47 2020 34 3427<br />

24 31 5706 20 8773 26 555 10 2962 46 4439 19 3209 13 1954 24 1985 28 1930<br />

25 21 2297 35 2497 47 1827 17 2966 25 2590 14 3056 20 1558 40 2493 26 1915<br />

26 17 4759 29 2069 28 6925 21 5171 20 7232 24 6650 25 1430 46 3584 17 985<br />

27 37 5362 28 2554 29 6977 19 5248 32 4013 13 2644 31 4939 32 3002 36 5643<br />

28 18 2531 38 1395 34 1976 4 877 18 3256 24 10910 33 1617 32 1810 18 798<br />

29 50 3231 38 975 18 3132 22 2462 25 7589 34 6637 26 937 56 5874 32 3690<br />

30 37 3887 51 6828 43 6310 20 5512 18 4664 10 3450 44 1598 28 4147 26 3217<br />

31 23 3474 29 1921 20 1908 21 1825 26 4596 11 1884 34 2606 22 2664 14 1854<br />

32 18 1130 34 3467 20 353 35 7361 32 2518 6 15 32 2099 40 5477 12 931<br />

33 36 3597 20 1300 23 2535 15 1754 33 4615 25 5651 26 4976 19 12799 21 2169<br />

34 32 516 22 5830 30 3108 43 8655 6 4893 30 4578 27 4334 42 2904 13 4336<br />

35 27 3186 42 5272 64 3288 15 3252 31 5858 13 1222 32 3064 29 1348 30 2081<br />

36 36 4600 39 4125 22 4620 14 3278 14 3301 14 5456 57 4468 28 3003 32 3050<br />

37 30 5061 16 3154 31 1345 23 4881 28 5105 27 887 33 8163 35 8225 23 4708<br />

38 25 2055 40 4141 32 7258 24 4122 13 2382 22 2577 44 4311 20 819 38 4541<br />

39 27 1018 23 3269 17 2075 43 4545 18 5421 29 2232 35 6333 33 4784 40 853<br />

40 26 1039 46 1892 50 4306 24 5563 22 631 10 177 23 887 26 1155 8 792<br />

41 31 8549 20 1763 18 1954 15 3522 34 3061 21 6100 26 2593 29 360 25 4508<br />

42 19 2272 22 772 56 7329 21 2441 22 3782 14 5815 26 1904 35 3286 24 1084<br />

43 47 5746 23 3095 21 1484 13 2313 19 2516 23 6353 25 3230 44 1418 40 3994<br />

44 38 2142 39 6810 26 1454 36 4964 8 3765 10 2492 34 495 29 2954 34 3491<br />

45 34 1432 32 4117 30 2757 27 2673 24 6675 34 2471 38 6027 26 2764 31 4802<br />

46 39 4481 39 4332 24 1277 17 1635 15 6036 20 5650 33 944 30 758 25 2566<br />

299


Statistici ale evoluţiei algoritmului genetic în funcţie <strong>de</strong> selecţie şi supravieţuire<br />

Parametru Medie CI(95%,Medie) Deviaţie CI(95%,Deviaţie)<br />

m(D,D) 4120 3518 4722 2027 1681 2553<br />

m(D,T) 3907 3326 4488 1957 1623 2465<br />

m(D,P) 3714 3032 4396 2296 1904 2892<br />

m(P,D) 3335 2631 4039 2369 1965 2984<br />

m(T,D) 3307 2748 3866 1882 1561 2371<br />

m(P,T) 3214 2520 3908 2338 1939 2945<br />

m(P,P) 3196 2671 3722 1770 1468 2229<br />

m(T,T) 2929 2400 3458 1781 1478 2244<br />

m(T,P) 2916 2322 3510 2001 1660 2520<br />

n(P,D) 32.0 29.0 35.1 10.1 8.4 12.8<br />

n(P,T) 31.8 29.0 34.6 9.3 7.7 11.7<br />

n(T,D) 31.1 28.3 33.8 9.2 7.7 11.6<br />

n(T,T) 30.0 27.2 32.7 9.3 7.7 11.7<br />

n(P,P) 29.4 26.4 32.4 10.2 8.4 12.8<br />

n(T,P) 28.7 25.2 32.1 11.5 9.5 14.5<br />

n(D,D) 23.6 20.8 26.3 9.2 7.6 11.6<br />

n(D,T) 21.7 19.1 24.2 8.5 7.1 10.8<br />

n(D,P) 18.5 16.2 20.8 7.9 6.5 9.9<br />

Analizând valorile prezentate în tabelul <strong>de</strong> mai sus în ceea ce priveşte valorile medii şi intervalele<br />

<strong>de</strong> încre<strong>de</strong>re ale acestora pentru media generaţiilor care produc evoluţii, se remarcă că selecţia<br />

<strong>de</strong>terministă (şi cu atât mai mult însoţită <strong>de</strong> supravieţuirea <strong>de</strong>terministă) produce cele mai târzii<br />

evoluţii, în timp ce selecţia turnir (şi cu atât mai mult însoţită <strong>de</strong> supravieţuirea proporţională sau<br />

turnir) produce cele mai timpurii evoluţii (Figura 1).<br />

Analizând valorile în ceea ce priveşte numărul <strong>de</strong> evoluţii intervalele <strong>de</strong> încre<strong>de</strong>re ale acestora<br />

pentru generaţiile care produc evoluţii, se remarcă că selecţia proporţională (şi cu atât mai mult<br />

însoţită <strong>de</strong> supravieţuirea <strong>de</strong>terministă sau turnir) produce cele mai multe evoluţii, în timp ce<br />

selecţia <strong>de</strong>terministă (şi cu atât mai mult însoţită <strong>de</strong> supravieţuirea proporţională sau turnir) produce<br />

cele mai puţine evoluţii (Figura 2).<br />

De remarcat <strong>de</strong> asemenea că în ceea ce priveşte frecvenţa evoluţiilor (Figura 2) o selecţie<br />

proporţională aproape că nu face diferenţa între supravieţuirea <strong>de</strong>terministă şi supravieţuirea în<br />

turnir (medii 32 şi 31.8, cu intervale <strong>de</strong> încre<strong>de</strong>re rotunjite la întreg egale) în timp ce viteza<br />

evoluţiilor (Figura 1) aceeaşi selecţie proporţională nu face diferenţa între valoarea medie pentru<br />

supravieţuirea proporţională şi turnir (diferenţa <strong>de</strong> 150 între valorile medii reprezentând cel mult<br />

30% din lărgimea intervalului <strong>de</strong> încre<strong>de</strong>re la oricare dintre ele.<br />

(Deterministic, Deterministic)<br />

(Proporţional, Deterministic)<br />

(Turnir, Deterministic)<br />

(Proporţional, Turnir)<br />

(Proporţional, Proporţional)<br />

(Turnir, Turnir)<br />

(Turnir, Proporţional)<br />

(Deterministic, Turnir)<br />

(Deterministic, Proporţional)<br />

Timpuriu Târziu<br />

Figura 1. Cât <strong>de</strong> timpuriu se produc evoluţiile<br />

300


Rar<br />

(D, P)<br />

(D, T)<br />

Figura 2. Cât <strong>de</strong> frecvent se produc evoluţiile<br />

(P, D)<br />

(T, T)<br />

(P, P)<br />

Compact Dispers<br />

Figura 3. Cât <strong>de</strong> dispers se produc evoluţiile<br />

(T, P)<br />

(D, P)<br />

(D, T)<br />

(D, D)<br />

(P, T)<br />

(T, T)<br />

(T, D)<br />

(D, D)<br />

(D, D)<br />

(T, P)<br />

(D, T)<br />

(T, D)<br />

(P, P)<br />

(P, D)<br />

(P, T)<br />

(D, P)<br />

(P, P)<br />

(T, P)<br />

(T, T)<br />

(T, D)<br />

(P, D)<br />

(P, T)<br />

Predictibil<br />

Impredictibil<br />

Figura 4. Cât <strong>de</strong> predictibil se produc evoluţiile<br />

În ceea ce priveşte variabilitatea vitezei <strong>de</strong> evoluţie (Figura 3) se remarcă că meto<strong>de</strong>le produc<br />

rezultate relativ mai grupate (relativ la rezultatele pentru valori medii), cea mai bună constanţă a<br />

vitezei <strong>de</strong> evoluţie având perechile (selecţie proporţională, supravieţuire proporţională) şi (selecţie<br />

în turnir, supravieţuire în turnir) în timp ce cea mai mare inconstanţă se observă la selecţia<br />

proporţională şi supravieţuirea <strong>de</strong>terministă urmată în<strong>de</strong>aproape <strong>de</strong> selecţia <strong>de</strong>terministă şi<br />

supravieţuirea proporţională.<br />

În ceea ce priveşte variabilitatea frecvenţei evoluţiei (Figura 4) se remarcă că o serie <strong>de</strong> patru<br />

asocieri <strong>de</strong> meto<strong>de</strong> <strong>de</strong> selecţie şi supravieţuire produc rezultate similare sub aspectul variabilităţii<br />

frecvenţei <strong>de</strong> evoluţie: (D,D), (T,D), (T,T) şi (P,T); valori extreme ale variabilităţii frecvenţei<br />

301<br />

Des


evoluţiei obţin asocierea (selecţie <strong>de</strong>terministă, supravieţuire proporţională) - cu cea mai mică<br />

variabilitate a frecvenţei <strong>de</strong> evoluţie şi (selecţia în turnir, supravieţuirea proporţională) - cu cea mai<br />

mare variabilitate a frecvenţei <strong>de</strong> evoluţie.<br />

Diversitate<br />

Genotipuri [%]<br />

Consangvinizare<br />

36<br />

32<br />

28<br />

24<br />

20<br />

16<br />

12<br />

8<br />

4<br />

0<br />

N(Top23) A(Top23) P(Top23) N(Total) A(Total) P(Total)<br />

(D,D) (D,T) (D,P) (T,D) (T,T) (T,P) (P,D) (P,T) (P,P)<br />

(Selectie,Supravietuire)<br />

Legendă: Top23: lista genotipurilor cu cel puţin 23 <strong>de</strong> apariţii (50% din max. 46)<br />

Total: lista tuturor genotipurilor<br />

N(·): număr <strong>de</strong> genotipuri<br />

A(·): număr <strong>de</strong> apariţii<br />

P(·): număr <strong>de</strong> reprezentări în regresiile ce creează asocieri vali<strong>de</strong> între fenotipuri<br />

Figura 5. Diversitate în evoluţie<br />

Informaţiile cu privire la variabilitatea genotipică în cultivar în generaţiile ce produc<br />

evoluţie se poate obţine prelucrând informaţiile. Astfel, pentru fiecare din cei şase parametrii<br />

urmăriţi (număr <strong>de</strong> genotipuri cu 23 şi peste apariţii în 46 <strong>de</strong> execuţii in<strong>de</strong>pen<strong>de</strong>nte - N(Top23),<br />

număr <strong>de</strong> apariţii ale acestor genotipuri - A(Top23), număr <strong>de</strong> participări efective în ecuaţii <strong>de</strong><br />

regresie - P(Top23), număr total <strong>de</strong> genotipuri distincte prezente în generaţiile ce produc evoluţie -<br />

N(Total), număr <strong>de</strong> apariţii ale acestora în materialul genetic din cultivar - A(Total), şi număr <strong>de</strong><br />

participări efective ale acestora în ecuaţii <strong>de</strong> regresie - P(Total) - vezi Figura 5) transformând<br />

frecvenţele <strong>de</strong> apariţie observate în proporţii relative la cele nouă perechi <strong>de</strong> meto<strong>de</strong> (selecţie,<br />

supravieţuire) se observă că:<br />

÷ Cele mai mari discrepanţe între proporţiile numerelor <strong>de</strong> genotipuri sunt prezente pentru selecţia<br />

<strong>de</strong>terministă însoţită <strong>de</strong> o supravieţuire <strong>de</strong>terministă - perechea (D,D) - un<strong>de</strong> proporţia apariţiei<br />

genotipurilor în materialul genetic se cel puţin înjumătăţeşte <strong>de</strong> la Top23 către întregul conţinut<br />

al materialului genetic ceea ce sugerează că o evoluţie bazată pe selecţia <strong>de</strong>terministă însoţită <strong>de</strong><br />

o supravieţuire <strong>de</strong>terministă induce o înmulţire preferenţială a celor mai adaptate genotipuri; în<br />

acelaşi timp, situaţia este inversată dacă supravieţuirea se face proporţional sau în turnir -<br />

perechile (D,T) şi (D,P) - un<strong>de</strong> proporţia apariţiei genotipurilor în materialul genetic se cel puţin<br />

dublează <strong>de</strong> la Top23 către întregul conţinut al materialului genetic ceea ce sugerează că o<br />

evoluţie bazată pe selecţia <strong>de</strong>terministă însoţită <strong>de</strong> o supravieţuire proporţională sau în turnir<br />

induce o înmulţire preferenţială pentru un număr cât mai mare <strong>de</strong> genotipuri diferite;<br />

÷ În extrema opusă a situaţiei generate <strong>de</strong> selecţia <strong>de</strong>terministă se află selecţia proporţională; aşa<br />

cum se poate observa selecţia proporţională însoţită <strong>de</strong> supravieţuirea proporţională face ca<br />

proporţiile <strong>de</strong> apariţie ale celor mai frecvente genotipuri (Top23) să nu difere semnificativ <strong>de</strong><br />

proporţiile <strong>de</strong> apariţie pentru numărul total <strong>de</strong> genotipuri, ceea ce sugerează că genotipurile sunt<br />

prezente în mod uniform (distribuţie uniformă) în materialul genetic - fiecare având o aceeaşi<br />

şansă <strong>de</strong> apariţie.<br />

302


2010A5. Construirea bazei <strong>de</strong> date cu cunoştinţe Compus chimic - Mo<strong>de</strong>l cuantic 3D -<br />

Descriptori moleculari - Proprietăţi fizico-bio-chimice - Activităţi terapeutice<br />

S-a creat baza <strong>de</strong> cunoştinţe, strusctura şi proprietăţile aceastei fiind valorificate pe parcursul<br />

<strong>de</strong>rulării proiectului sub formă <strong>de</strong> postere (Bolboacă & Jäntschi, 2008-SASA) şi prezentări orale<br />

(Jäntschi & Bolboacă, 2008-MQMC) la conferinţe internaţionale şi respectiv publicaţii (Bolboacă &<br />

others, 2009-MDFV)<br />

Următoarea imagine redă structura bazei <strong>de</strong> cunoştinţe împreună cu acţiunile <strong>de</strong> maganement al<br />

cunoştinţelor care au fost <strong>de</strong>zvoltate.<br />

Baza <strong>de</strong> date cu cunoştinţe Compus chimic - Mo<strong>de</strong>l cuantic 3D - Descriptori moleculari -<br />

Proprietăţi fizico-bio-chimice - Activităţi terapeutice - din (Bolboacă & Jäntschi, 2008-SASA)<br />

Analiza cunoştinţelor stocate în sistem se realizează cu o serie <strong>de</strong> aplicaţii statistice <strong>de</strong>zvoltate în<br />

acest sens, figurile următoare ilustrând acest proces - adaptate după (Bolboacă & Jäntschi, 2008-<br />

SASA):<br />

(1) Simple correlation analysis; Inter-correlation (2) Qualitative vs. quantitative analysis<br />

analysis; Multiple correlation analysis<br />

303


(3) Leave-one-out cross-validation analysis (4) Training vs. test experiment<br />

(5) Correlated correlations analysis (6) MDF Predictor<br />

2010A6. Proiectarea portalului web, Implementarea algoritmilor <strong>de</strong> interogare, Publicarea<br />

portalului web<br />

Portalul web a fost publicat. Următoarele imagini sunt <strong>de</strong>monstrative în acest sens:<br />

Portalul "MDFV"<br />

304


Portalul "MDF"<br />

Portalul "Statistics"<br />

305


Livrabile<br />

Următoarea listă conţine referinţele raportului <strong>de</strong> <strong>cercetare</strong> între care se află şi livrabilele (marcate<br />

pe fond ver<strong>de</strong>) şi alte lucrări ştiinţifice care au rezultat pe perioada <strong>de</strong> <strong>de</strong>rulare a grantrului, sunt în<br />

inci<strong>de</strong>nţă cu activităţile <strong>de</strong>sfăşurate în acesta dar nu sunt datorate în mod neapărat <strong>de</strong>rulării<br />

activităţilor din proiect, astfel nefiind raportate ca livrabile.<br />

(Bălan & others, 2008-SRDI): Mugur C. BĂLAN, Mihai DAMIAN, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>,<br />

Preliminary Results on Design and Implementation of a Solar Radiation Monitoring System,<br />

Sensors, Molecular Diversity Preservation International, ISSN 1424-8220, Basel, Switzerland,<br />

8(2), p. 963-978, 2008.<br />

(Bălan & others, 2008-SRMS): Mugur BĂLAN, Mihai DAMIAN, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Solar<br />

Radiation Monitoring System, Proceedings of the 36-th international symposium on agricultural<br />

engineering: Actual Tasks on Agricultural Engineering, Agricultural Engineering Department,<br />

Faculty of Agriculture, University of Zagreb, ISSN 1333-2651, February 11-15, Opatija, Croatia,<br />

p. 507-517, 2008.<br />

(Bălan & others, 2010): Mugur C. BĂLAN, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Mihai<br />

DAMIAN, Assessment of Thermal Solar Collectors Behaviour in Transitory Regime, Polish<br />

Journal of Environmental Studies, Hard Publishing Company, ISSN 1230-1485, Olsztyn, Poland,<br />

19(1), p. 231-241, 2010.<br />

(Bolboacă & Jäntschi, 2005): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Molecular<br />

Descriptors Family on Structure Activity Relationships 2. Insecticidal Activity of Neonicotinoid<br />

Compounds, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233, www, Internet,<br />

4(6), p. 78-85, 2005.<br />

(Bolboacă & Jäntschi, 2005): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Molecular<br />

Descriptors Family on Structure Activity Relationships 3. Antituberculotic Activity of some<br />

Polyhydroxyxanthones, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233, www,<br />

Internet, 4(7), p. 58-64, 2005.<br />

(Bolboacă & Jäntschi, 2005-CILR): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Binomial<br />

Distribution Sample Confi<strong>de</strong>nce Intervals Estimation for Positive and Negative Likelihood Ratio<br />

Medical Key Parameters, Annual Symposium on Biomedical and Health Informatics [Special<br />

Issue: from Foundations to Applications to Policy (Proc. CD, October 22-26, Washington D.C.,<br />

USA)], American Medical Informatics Association, Bethesda, Maryland, USA, ISSN 1559-4076,<br />

Washington D.C., USA, #CD, p. 66-70, PMID: 16779003, 2005.<br />

(Bolboacă & Jäntschi, 2006): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Molecular Descriptors<br />

Family on Structure-Activity Relationships: Mo<strong>de</strong>ling Herbicidal Activity of Substituted<br />

Triazines Class, Bulletin of University of Agricultural Sciences and Veterinary Medicine -<br />

Agriculture, Aca<strong>de</strong>micPres, ISSN 1454-2382, Cluj-Napoca, Romania, 62, p. 35-40, 2006.<br />

(Bolboacă & Jäntschi, 2006-SPMA): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Activity<br />

Characterization of Triazines Analogues: Statistical Parameters for Mo<strong>de</strong>ls Assessment,<br />

International Symposium on Organic Chemistry, December 9-12, 2006, Avangard Prisma, ISBN<br />

954-323-243-1 & 978-954-323-243-7, Sofia, Bulgaria, p. 48-49 [Plenary oral presentation],<br />

December 9-12, 2006.<br />

(Bolboacă & Jäntschi, 2007): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Structure versus<br />

Biological Role of Substituted Thiadiazole- and Thiadiazoline- Disulfonami<strong>de</strong>s, Studii si<br />

Cercetari Stiintifice Universitatea Bacau Seria Biologie, Universitatea Bacau, ISSN 1224-919X,<br />

Bacau, Romania, 12(1), p. 50-56, 2007.<br />

(Bolboacă & Jäntschi, 2007): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mo<strong>de</strong>ling Analysis of<br />

Amino Acids Hydrophobicity, ChemMod 2007 - Chemical Graph Theory and Molecular<br />

Mo<strong>de</strong>ling Workshop, Faculty of Chemistry and Chemical Engineering of Babes-Bolyai<br />

University and European Society of Mathematical Chemistry, Oral Presentation #6, Cluj-Napoca,<br />

Romania, October 23-26, p. 6, 2007.<br />

306


(Bolboacă & Jäntschi, 2007-AAHS): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Is Amino<br />

Acids Hydrophobicity a Matter of Scale?, Recent Advances in Synthesys & Chemical Biology<br />

VI, Centre for Synthesis & Chemical Biology, University of Dublin, Symposium, 14th December<br />

2007, Dublin, Ireland, P2, 2007.<br />

(Bolboacă & Jäntschi, 2007-BCIO): Sorana-Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Are<br />

confi<strong>de</strong>nce intervals for binomial distributed samples an optimization meters?, Fourth<br />

International Conference of Applied Mathematics and Computing, August 12-18, 2007,<br />

University of Chemical Technology and Metallurgy Sofia & Technical University of Plovdiv,<br />

Invited lecture, presented on August 13, from 18.00 to 18.30, Plovdiv, Bulgaria, p. 47, 2007.<br />

(Bolboacă & Jäntschi, 2007-CRRF): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Communication<br />

of Results on Risk Factors Studies: Confi<strong>de</strong>nce Intervals, Leonardo Journal of Sciences,<br />

Aca<strong>de</strong>micDirect, ISSN 1583-0233, www, Internet, 6(10), p. 179-187, 2007.<br />

(Bolboacă & Jäntschi, 2007-DMRM): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Data Mining<br />

on Structure-Activity/Property Relationships Mo<strong>de</strong>ls, ECCC11- The 11th Electronic<br />

Computational Chemistry Conference, online, Monmouth University, New Jersey, USA, N/A,<br />

www, Internet, paper #29, Presentation located here, April 2-30, 2007.<br />

(Bolboacă & Jäntschi, 2007-DMRM): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Data Mining<br />

on Structure-Activity/Property Relationships Mo<strong>de</strong>ls, World Applied Sciences Journal, IDOSI<br />

Publications, ISSN 1818-4952, www, Internet & Faisalabad, Pakistan, 2(4), p. 323-332, 2007.<br />

(Bolboacă & Jäntschi, 2007-DoE): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Design of<br />

Experiments: Useful Orthogonal Arrays for Number of Experiments from 4 to 16, Entropy,<br />

Molecular Diversity Preservation International, ISSN 1099-4300, Basel & www, Switzerland &<br />

Internet, 9(4), p. 198-232, Zbl 1135.62359, 2007.<br />

(Bolboacă & Jäntschi, 2007-HGCP): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, How Good the<br />

Characteristic Polynomial Can Be for Correlations?, International Journal of Molecular Sciences,<br />

Molecular Diversity Preservation International, ISSN 1422-0067, www & Basel, Internet &<br />

Switzerland, 8(4), p. 335-345, CAN 147:276982, 2007.<br />

(Bolboacă & Jäntschi, 2007-MCSC): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mapping<br />

Cigarettes Similarities using Cluster Analysis Methods, International Journal of Environmental<br />

Research and Public Health, Molecular Diversity Preservation International, ISSN 1660-4601,<br />

www & Basel, Internet & Switzerland, 4(3), p. 233-242, PMID 17911663, CAN 148:303722,<br />

2007.<br />

(Bolboacă & Jäntschi, 2007-SAHZ): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Similarities<br />

Analysis on Hydroxyapatite-Zirconia Composites, Leonardo Journal of Sciences,<br />

Aca<strong>de</strong>micDirect, ISSN 1583-0233, www, Internet, 11(6), p. 153-164, CAN 148:61815, 2007.<br />

(Bolboacă & Jäntschi, 2007-SMMV): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>,<br />

Mo<strong>de</strong>ling the Property of Compounds from Structure: Statistical Methods for Mo<strong>de</strong>ls Validation,<br />

Institute of General and Inorganic Chemistry, Bulgarian Aca<strong>de</strong>my of Sciences<br />

[http://sizemat.igic.bas.bg], FP6: EC-INCO-CT-2005-016414 Specific Support Action, Plovdiv,<br />

Bulgaria, p. 71, April 19-21, 2007.<br />

(Bolboacă & Jäntschi, 2007-SPBP): Sorana-Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Structure-<br />

Property Based Mo<strong>de</strong>l Estimation of Alkanes Boiling Points, Fourth International Conference of<br />

Applied Mathematics and Computing, August 12-18, 2007, University of Chemical Technology<br />

and Metallurgy Sofia & Technical University of Plovdiv, Invited lecture, presented on August 13,<br />

from 18.30 to 19.00, Plovdiv, Bulgaria, p. 48, 2007.<br />

(Bolboacă & Jäntschi, 2008): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Structure Activity<br />

Relationships of Taxoids therein Molecular Descriptors Family Approach, Archives of Medical<br />

Science, Termedia sp. z o.o., ISSN 1734-1922; eISSN 1896-9151, Poznan, Poland, 4(1), p. 7-15,<br />

2008.<br />

(Bolboacă & Jäntschi, 2008): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Structure-Property<br />

Based Mo<strong>de</strong>l for Alkanes Boiling Points, International Journal of Pure and Applied Mathematics,<br />

Aca<strong>de</strong>mic Publications, ISSN 1311-8080, Sofia, Bulgaria, 47(1), p. 23-30, Zbl pre05492618,<br />

307


2008.<br />

(Bolboacă & Jäntschi, 2008-ABCI): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Assessment of<br />

Confi<strong>de</strong>nce Intervals used in Medical Studies, Aca<strong>de</strong>micPres & Aca<strong>de</strong>micDirect, ISBN 978-973-<br />

744-107-2 & ISBN 978-973-86211-2-1, Cluj-Napoca & www, Romania & Internet, p. 234 (+p.<br />

10 intro), 2008.<br />

(Bolboacă & Jäntschi, 2008-ICPT): Sorana D. BOLBOACA, <strong>Lorentz</strong> JANTSCHI, Homo Sapiens<br />

Type I Collagen: Patterns Analysis, Applied Medical Informatics, 22(1-2), 39-46, 2008.<br />

(Bolboacă & Jäntschi, 2008-OCIB): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Optimized<br />

Confi<strong>de</strong>nce Intervals for Binomial Distributed Samples, International Journal of Pure and<br />

Applied Mathematics, Aca<strong>de</strong>mic Publications, ISSN 1311-8080, Sofia, Bulgaria, 47(1), p. 1-8,<br />

Zbl pre05492615, 2008.<br />

(Bolboacă & Jäntschi, 2008-SASA): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Statistical<br />

Approach of Structure-Activity Relationships: A Case Study, Strasbourg Summer School on<br />

Chemoinformatics, Louis Pasteur University, June 22-25, Obernai, France, #3, 2008.<br />

(Bolboacă & Jäntschi, 2008-SMMV): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mo<strong>de</strong>lling the<br />

property of compounds from structure: statistical methods for mo<strong>de</strong>ls validation, Environmental<br />

Chemistry Letters, Springer, ISSN 1610-3653, eISSN 1610-3661, Berlin, Germany, 6(3), p. 175-<br />

181, DOI: 10.1007/s10311-007-0119-9, 2008.<br />

(Bolboacă & Jäntschi, 2009-CCqD): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Comparison of<br />

QSAR Performances on Carboquinone Derivatives, TheScientificWorldJOURNAL,<br />

TheScientificWorld, ISSN 1537-744X, Kirkkonummi, Finland, 9(10), p. 1148-1166, DOI:<br />

10.1100/tsw.2009.131, PMID: 19838601, 2009.<br />

(Bolboacă & Jäntschi, 2009-DF3): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Distribution<br />

Fitting 3. Analysis un<strong>de</strong>r normality assumption, Bulletin of University of Agricultural Sciences<br />

and Veterinary Medicine Cluj-Napoca. Horticulture, Aca<strong>de</strong>micPres, ISSN 1843-5254, eISSN<br />

1843-5394, Cluj-Napoca, Romania, 66(2), p. 698-705, 2009.<br />

(Bolboacă & Jäntschi, 2010-DqPM): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Diagnostic of a<br />

qSPR mo<strong>de</strong>l: aqueous solubility of drug-like compounds, Studia Universitatis Babeş-Bolyai.<br />

Series Chemia, in press (2010, pp. 1-8).<br />

(Bolboacă & others, 2003-PCAT): Sorana BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Andrei ACHIMAŞ<br />

CADARIU, Creating Etiology/Prognostic Critical Appraised Topics CATRom Original Software<br />

for Romanian Physicians, Applied Medical Informatics, SRIMA, ISSN 1224-5593, Cluj,<br />

Romania, 13(3-4), p. 11-16, 2003.<br />

(Bolboacă & others, 2003-SQL2): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Andrei<br />

ACHIMAŞ CADARIU, SQL by Example. 2. PHP and MySQL Web Application based on<br />

Tanner-Whitehouse Standard, Leonardo Electronic Journal of Practices and Technologies,<br />

Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 2(2), p. 37-52, 2003.<br />

(Bolboacă & others, 2003-TW2): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Andrei<br />

ACHIMAŞ CADARIU, PHP and MySQL Medical Application Based on Tanner Whitehouse<br />

Standard, UNITECH'03 International Scientific Conference, Technical University of Gabrovo,<br />

ISBN 954-683-167-0, Gabrovo, Bulgaria, 2003, p. 304-308, November 21-22, 2003.<br />

(Bolboacă & others, 2004-CATC): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Tudor<br />

DRUGAN, Andrei ACHIMAŞ CADARIU, Creating Therapy Studies Critical Appraised Topics.<br />

CATRom Original Software for Romanian Physicians, Applied Medical Informatics, SRIMA,<br />

ISSN 1224-5593, Cluj-Napoca, Romania, 15(3-4), p. 26-33, 2004.<br />

(Bolboacă & others, 2004-DCAT): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Andrei<br />

ACHIMAŞ CADARIU, Creating Diagnostic Critical Appraised Topics. CATRom Original<br />

Software for Romanian Physicians, Applied Medical Informatics, SRIMA, ISSN 1224-5593,<br />

Cluj-Napoca, Romania, 14(1-2), p. 27-34, 2004.<br />

(Bolboacă & others, 2005-EBGC): Sorana Daniela BOLBOACĂ, Andrei ACHIMAŞ CADARIU,<br />

<strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Evi<strong>de</strong>nce-Based Gui<strong>de</strong>lines Assisted Creation through Interactive Online<br />

308


Environment, Applied Medical Informatics, SRIMA, ISSN 1224-5593, Cluj-Napoca, Romania,<br />

17(3-4), p. 3-11, 2005.<br />

(Bolboacă & others, 2005-RIMC): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Andrei<br />

ACHIMAŞ CADARIU, Relational Information in Medicine: A Challenge, Roentgenologia &<br />

Radiologia, Bulgarian Association of Radiology, ISSN 0486-400X, Sofia, Bulgaria, XLIV(1), p.<br />

22-25, 2005.<br />

(Bolboacă & others, 2006): Sorana BOLBOACĂ, Claudia FILIP, Ştefan ŢIGAN, <strong>Lorentz</strong><br />

<strong>JÄNTSCHI</strong>, Antioxidant Efficacy of 3-Indolyl Derivates by Complex Information Integration,<br />

Clujul Medical, Editura Iuliu Hatieganu, ISSN 1222-2119, Cluj-Napoca, Romania, LXXIX(2), p.<br />

204-209, 2006.<br />

(Bolboacă & others, 2006): Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mo<strong>de</strong>ling of<br />

Structure-Toxicity Relationship of Alkyl Metal Compounds by Integration of Complex Structural<br />

Information, Therapeutics: Pharmacology and Clinical Toxicology, RP Press, ISSN 1583-0012,<br />

Bucuresti, Romania, X(1), p. 110-114, 2006.<br />

(Bolboacă & others, 2006): Sorana Daniela BOLBOACĂ, Ştefan ŢIGAN, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>,<br />

Molecular Descriptors Family on Structure-Activity Relationships on anti-HIV-1 Potencies of<br />

HEPTA and TIBO Derivatives, Integrating Biomedical Information: From eCell to ePatient,<br />

European Fe<strong>de</strong>ration for Medical Informatics, ISBN 3-89838-0722-6 (Aka, Germany), ISBN 1-<br />

58603-614-9 (IOS Press, Holland), ISBN 973-625-303-1 (Politehnica Timişoara, Romania),<br />

Timisoara, Romania, p. 110-114, April 6-8, 2006.<br />

(Bolboacă & others, 2007): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mo<strong>de</strong>lling the Inhibitory<br />

Activity on Carbonic Anhydrase I of Some Substituted Thiadiazole- and Thiadiazoline-<br />

Disulfonami<strong>de</strong>s: Integration of Structure Information, ESCAPE17 - 17th European Symposium<br />

on Computer Ai<strong>de</strong>d Process Engineering, CAPE Working Party of the European Fe<strong>de</strong>ration of<br />

Chemical Engineering then Elsevier Netherlands & UK, ISBN 978-0-444-53157-5 & eISBN 0-<br />

444-53158-2, Bucharest, Romania then Amsterdam, Netherlands, T4-212 (oral presentation),<br />

May 27-30 then p. 965-970, 2007.<br />

(Bolboacă & others, 2007): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mo<strong>de</strong>lling the Inhibitory<br />

Activity on Carbonic Anhydrase I of Some Substituted Thiadiazole and Thiadiazoline-<br />

Disulfonami<strong>de</strong>s: Integration of Structure Information, Computer-Ai<strong>de</strong>d Chemical Engineering,<br />

Elsevier Netherlands & UK, eISSN 1570-7946, Amsterdam, Netherlands, 24(2007), p. 965-970,<br />

CAS-AN 2008:400595, 2007.<br />

(Bolboacă & others, 2008-RRAS): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>; Radu E.<br />

SESTRAŞ, Reporting Results and Associated Statistics in Quantitative Genetic Studies, Bulletin<br />

of University of Agricultural Sciences and Veterinary Medicine Cluj-Napoca. Horticulture,<br />

Aca<strong>de</strong>micPres, p-ISSN 1843-5254, e-ISSN 1843-5394, Cluj-Napoca, Romania, 65(1), p. 71-79,<br />

2008.<br />

(Bolboacă & others, 2008-SASM): Sorana D. BOLBOACĂ, Elena M. PICĂ, Claudia V.<br />

CIMPOIU, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Statistical Assessment of Solvent Mixtures Mo<strong>de</strong>ls Used for<br />

Separation of Biological Active Compounds, Molecules, Molecular Diversity Preservation<br />

International, ISSN 1420-3049, Basel, Switzerland, 13(8), p. 1617-1639, 2008.<br />

(Bolboacă & others, 2008-SqsV): Sorana D. BOLBOACĂ, Carmen E. STOENOIU, <strong>Lorentz</strong><br />

<strong>JÄNTSCHI</strong>, Statistics for QSAR Validation, Fifth International Conference of Applied<br />

Mathematics and Computing, University of Chemical Technology and Metallurgy Sofia &<br />

Technical University of Plovdiv, Invited lecture, presented on August 14, from 12.00 to 12.30,<br />

Plovdiv, Bulgaria, Proc Int Conf Appl Math Comput 2008 5(1), p. 83, 2008.<br />

(Bolboacă & others, 2009-AoV): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Radu E.<br />

SESTRAŞ, Statistical Approaches in Analysis of Variance: From Random Arrangements to Latin<br />

Square Experimental Design, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233,<br />

Cluj-Napoca, Romania, 8(15), p. 71-82, 2009.<br />

(Bolboacă & others, 2009-MDFV): Sorana D. BOLBOACĂ, Monica M. MARTA, Carmen E.<br />

STOENOIU, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Molecular Descriptors Family on Vertex Cutting:<br />

309


Relationships between Acelazolami<strong>de</strong> Structures and their Inhibitory Activity, Applied Medical<br />

Informatics, SRIMA, ISSN 1224-5593, Cluj-Napoca, Romania, 25(3-4), p. 65-74, 2009.<br />

(Bolboacă & others, 2010): Sorana D. BOLBOACĂ, Monica M. MARTA, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>,<br />

Binding Affinity of Triphenyl Acrylonitriles to Estrogen Receptors: Quantitative Structure-<br />

Activity Relationships, Folia medica, Christo G. Danov, ISSN 0204-8043, Plovdiv, Bulgaria,<br />

52(3), p. 37-45, 2010.<br />

(Bolboacă & others, 2010-GAAS): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mugur C.<br />

BĂLAN, Mircea V. DIUDEA, Radu E. SESTRAŞ. State of Art in Genetic Algorithms for<br />

Agricultural Systems, Notulae Botanicae Horti Agrobotanici Cluj-Napoca, 38(3):51-63, 2010.<br />

(Bolboacă & others, 2011-DDNR): Sorana D. BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Radu E.<br />

SESTRAŞ, Depen<strong>de</strong>nce between <strong>de</strong>termination coefficient and number of regressors: a case<br />

study on retention times of mycotoxins, Studia Universitatis Babeş-Bolyai. Series Chemia, in<br />

press (2011, pp. 1-10).<br />

(Cosma & others, 2008-IMCC): Constantin COSMA, Ioan SUCIU, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D.<br />

BOLBOACĂ, Ion-Molecule Reactions and Chemical Composition of Emanated Gases from<br />

Herculane Spa Geothermal Sources, International Journal of Molecular Sciences, Molecular<br />

Diversity Preservation International, ISSN 1422-0067, Basel, Switzerland, 9(6), p. 1024-1033,<br />

DOI: 10.3390/ijms9061024, 2008.<br />

(Diu<strong>de</strong>a & others, 2001-MT): Mircea V. DIUDEA, Ivan GUTMAN, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>,<br />

Molecular Topology, Nova Science, ISBN 1-56072-957-0, Huntington, New York, USA, 332 p.,<br />

89$, 2001 - 1st ed., 2002 - 2nd ed., 2001.<br />

(Drugan & others, 2003-BCI1): Tudor DRUGAN, Sorana Daniela BOLBOACĂ, <strong>Lorentz</strong><br />

<strong>JÄNTSCHI</strong>, Andrei ACHIMAŞ CADARIU, Binomial Distribution Sample Confi<strong>de</strong>nce Intervals<br />

Estimation 1. Sampling and Medical Key Parameters Calculation, Leonardo Electronic Journal of<br />

Practices and Technologies, Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 2(3), p. 45-74,<br />

2003.<br />

(Gligor & Jäntschi, 2005-PSEA): Delia Maria GLIGOR, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Periodic System of<br />

Elements Database and Its Applications, Ora<strong>de</strong>a University Annals, Chemistry Fascicle, Ora<strong>de</strong>a<br />

Univeristy Press, ISSN 1224-7626, Ora<strong>de</strong>a, Romania, 12, p. 180-194, CAN 147:211259, 2005.<br />

(Jäntschi & Avram, 2002-IBLD): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Dana AVRAM (c. LUPŞA), Internet,<br />

Browsers and Local Databases, International Conference on Quality Control, Automation and<br />

Robotics, Mediamira, ISBN 973-9357-11-1, Cluj-Napoca, Romania, 2, p. 516-521, May 23-25,<br />

2002.<br />

(Jäntschi & Bălan, 2009-DF7): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mugur C. BĂLAN, (Distribution Fitting 7.)<br />

Analysis of the genotypes number in different selection and survival strategies, Bulletin of<br />

University of Agricultural Sciences and Veterinary Medicine Cluj-Napoca. Horticulture,<br />

Aca<strong>de</strong>micPres, ISSN 1843-5254, eISSN 1843-5394, Cluj-Napoca, Romania, 66(1), p. 58-65,<br />

2009.<br />

(Jäntschi & Bolboacă, 2003-ACIA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana Daniela BOLBOACĂ, Applied<br />

Chemical and Instrumental Analysis (in Romanian), Aca<strong>de</strong>micDirect, ISBN 973-86211-6-X,<br />

www, Internet, 60 p., 2003.<br />

(Jäntschi & Bolboacă, 2005): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana Daniela BOLBOACĂ, Molecular<br />

Descriptors Family on Structure Activity Relationships 4. Molar Refraction of Cyclic<br />

Organophosphorus Compounds, Leonardo Electronic Journal of Practices and Technologies,<br />

Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 4(7), p. 55-102, 2005.<br />

(Jäntschi & Bolboacă, 2005): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana Daniela BOLBOACĂ, Molecular<br />

Descriptors Family on QSAR Mo<strong>de</strong>ling of Quinoline-based Compounds Biological Activities,<br />

The 10th Electronic Computational Chemistry Conference, Monmouth University, New Jersey,<br />

USA, Paper #4, www, Internet, April 1-30, 2005.<br />

(Jäntschi & Bolboacă, 2006): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana BOLBOACĂ, Molecular Descriptors<br />

Family on Structure Activity Relationships 6. Octanol-Water Partition Coefficient of<br />

Polychlorinated Biphenyls, Leonardo Electronic Journal of Practices and Technologies,<br />

310


Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 5(8), p. 71-86, 2006.<br />

(Jäntschi & Bolboacă, 2006): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana BOLBOACĂ, Molecular Descriptors<br />

Family on Structure Activity Relationships 5. Antimalarial Activity of 2,4-Diamino-6-<br />

Quinazoline Sulfonami<strong>de</strong> Derivates, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-<br />

0233, www, Internet, 5(8), p. 77-88, 2006.<br />

(Jäntschi & Bolboacă, 2006): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana BOLBOACĂ, Mo<strong>de</strong>lling the Inhibitory<br />

Activity on Carbonic Anhydrase IV of Substituted Thiadiazole- and Thiadiazoline-<br />

Disulfonami<strong>de</strong>s: Integration of Structure Information, Electronic Journal of Biomedicine, Red<br />

UniNet Spain, ISSN 1697-090X, www, Internet, 2006(2), p. 22-33, 2006.<br />

(Jäntschi & Bolboacă, 2006): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana-Daniela BOLBOACĂ, Mo<strong>de</strong>ling the<br />

Octanol-Water Partition Coefficient of Substituted Phenols: the Use of Structure Information,<br />

Third Humboldt Conference on Computational Chemistry, InnosLab Ltd. , ISBN 954-323-199-0<br />

& 978-954-323-199-7, Varna, Bulgaria, p. 65, June 24-28, 2006.<br />

(Jäntschi & Bolboacă, 2006-DDI): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana BOLBOACĂ, Auto-calibrated<br />

Online Evaluation: Database Design and Implementation, Leonardo Electronic Journal of<br />

Practices and Technologies, Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 5(9), p. 179-192,<br />

2006.<br />

(Jäntschi & Bolboacă, 2006-MDFR): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana Daniela BOLBOACĂ,<br />

Molecular Descriptors Family on Structure-Activity and Structure-Property Relationships:<br />

Results, SizeMat: Workshop on Size-Depen<strong>de</strong>nt Effects in Materials for Environmental<br />

Protection and Energy Application, Institute of General and Inorganic Chemistry, Bulgarian<br />

Aca<strong>de</strong>my of Sciences [http://sizemat.igic.bas.bg], FP6: EC-INCO-CT-2005-016414 Specific<br />

Support Action, Varna, Bulgaria, p. 14-15 [Plenary oral presentation], May 25-27, 2006.<br />

(Jäntschi & Bolboacă, 2006-OCPG): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana BOLBOACĂ, Organizing<br />

Gui<strong>de</strong>lines Mo<strong>de</strong>ls and Clinical Practice Gui<strong>de</strong>lines, 11th International Symposium for Health<br />

Information Management Research, Dalhousie University, ISBN 0-7703-9016-1, Halifax, Nova<br />

Scotia, Canada, p. 328-338, July 14-16, 2006.<br />

(Jäntschi & Bolboacă, 2006-OMDF): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana-Daniela BOLBOACĂ, Online<br />

System for Molecular Descriptors Family on Structure-Activity Relationships: Assessment and<br />

Characterization of Biologic Active Compounds, 6th European Conference on Computational<br />

Chemistry, European Association for Chemical and Molecular Sciences, Poster 47, Tale,<br />

Slovakia, September 3-7, 2006.<br />

(Jäntschi & Bolboacă, 2006-PSKC): Sorana BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Pearson Versus<br />

Spearman, Kendall's Tau Correlation Analysis on Structure-Activity Relationships of Biologic<br />

Active Compounds, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233, www,<br />

Internet, 5(9), p. 179-200, CAS-AN 2007:1026159, 2006.<br />

(Jäntschi & Bolboacă, 2007): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Antiallergic Activity<br />

of Substituted Benzami<strong>de</strong>s: Characterization, Estimation and Prediction, Clujul Medical, Editura<br />

Iuliu Hatieganu, ISSN 1222-2119, Cluj-Napoca, Romania, LXXX(1), p. 125-132, 2007.<br />

(Jäntschi & Bolboacă, 2007): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Triazines Herbicidal<br />

Assessed Activity, Studii si Cercetari Stiintifice Universitatea Bacau Seria Biologie,<br />

Universitatea Bacau, ISSN 1224-919X, Bacau, Romania, 12(1), p. 57-62, 2007.<br />

(Jäntschi & Bolboacă, 2007): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana-Daniela BOLBOACĂ, Mo<strong>de</strong>ling the<br />

Octanol-Water Partition Coefficient of Substituted Phenols by the Use of Structure Information,<br />

International Journal of Quantum Chemistry, Wiley InterScience, ISSN 0020-7608, eISSN 1097-<br />

461X, New York, NY, USA, Volume 107, Issue 8 (Special Issue: Proceedings from the 3rd<br />

Humboldt Conference on Computational Chemistry. Issue Edited by Georgi N. Vayssilov,<br />

Tzonka Mineva), p. 1736-1744, CAN 147:103053, 2007.<br />

(Jäntschi & Bolboacă, 2007-HADR): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, How to Asses<br />

Dose-Response Study Outcome: a Statistical Approach, Recent Advances in Synthesys &<br />

Chemical Biology VI, Centre for Synthesis & Chemical Biology, University of Dublin,<br />

Symposium, 14th December 2007, Dublin, Ireland, P36, 2007.<br />

311


(Jäntschi & Bolboacă, 2007-JLRR): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, The Jungle of<br />

Linear Regression Revisited, Leonardo Electronic Journal of Practices and Technologies,<br />

Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 6(10), p. 169-187, 2007.<br />

(Jäntschi & Bolboacă, 2007-MDFA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Molecular<br />

Descriptors Family Project and Their Application on Structure-Property/Activity Relationships,<br />

ChemMod 2007 - Chemical Graph Theory and Molecular Mo<strong>de</strong>ling Workshop, Faculty of<br />

Chemistry and Chemical Engineering of Babes-Bolyai University and European Society of<br />

Mathematical Chemistry, Poster #22, Cluj-Napoca, Romania, October 23-26, p. 22, 2007.<br />

(Jäntschi & Bolboacă, 2007-MDFC): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Molecular<br />

Descriptors Family on Chromatography, BBCAC-4 4th Black Sea Basin Conference on<br />

Analytical Chemistry, "St. Kliment Ohridski" University of Sofia, Poster P128, Sunny Beach,<br />

Bulgaria, September 19-23, 2007.<br />

(Jäntschi & Bolboacă, 2007-MDFE): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Structure-<br />

Activity Relationships on the Molecular Descriptors Family Project at the End, Leonardo<br />

Electronic Journal of Practices and Technologies, Aca<strong>de</strong>micDirect, ISSN 1583-1078, www,<br />

Internet, 6(11), p. 163-180, CAS-AN 2008:532878, 2007.<br />

(Jäntschi & Bolboacă, 2007-RMDF): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana BOLBOACĂ, Results from the<br />

Use of Molecular Descriptors Family on Structure Property/Activity Relationships, International<br />

Journal of Molecular Sciences, Molecular Diversity Preservation International, ISSN 1422-0067,<br />

www & Basel, Internet & Switzerland, 8(3), p. 189-203, CAN 147:317671, 2007.<br />

(Jäntschi & Bolboacă, 2008): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, A Structural Mo<strong>de</strong>lling<br />

Study on Marine Sediments Toxicity, Marine Drugs, Molecular Diversity Preservation<br />

International, ISSN 1660-3397, Basel, Switzerland, 6(2), p. 372-388, DOI:<br />

10.3390/md20080017, 2008.<br />

(Jäntschi & Bolboacă, 2008-EEVC): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Entropy and<br />

Energy of Substructures Obtained by Vertex Cutting in Regular Trees, Fifth International<br />

Conference of Applied Mathematics and Computing, University of Chemical Technology and<br />

Metallurgy Sofia & Technical University of Plovdiv, Invited lecture, presented on August 12,<br />

from 16.30 to 17.00, Plovdiv, Bulgaria, Proc Int Conf Appl Math Comput 2008 5(2), p. 216,<br />

2008.<br />

(Jäntschi & Bolboacă, 2008-EMGT): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Embed<strong>de</strong>d<br />

Molecular Geometry and Molecular Topology Approach for Structure - Activity Relationships,<br />

Strasbourg Summer School on Chemoinformatics, Louis Pasteur University, June 22-25,<br />

Obernai, France, #8, 2008.<br />

(Jäntschi & Bolboacă, 2008-MQMC): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, From<br />

Mathematical Chemistry to Quantum and Medicinal Chemistry, 17th European Symposium on<br />

Quantitative Structure-Activity Relationships & Omics Technologies and Systems Biology,<br />

Cheminformatics and QSAR Society, September 21-26, Uppsala, Swe<strong>de</strong>n, Oral presentation<br />

(Session 9: Emerging Technologies), Friday September 26th, 1010-1030, 2008.<br />

(Jäntschi & Bolboacă, 2009-CPRI): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Counting<br />

Polynomials on Regular Iterative Structures, Applied Medical Informatics, SRIMA, Applied<br />

Medical Informatics, Cluj-Napoca, Romania, 24(1-2), p. 67-95, 2009.<br />

(Jäntschi & Bolboacă, 2009-DF2): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Distribution<br />

Fitting 2. Pearson-Fisher, Kolmogorov-Smirnov, An<strong>de</strong>rson-Darling, Wilks-Shapiro, Kramer-von-<br />

Misses and Jarque-Bera statistics, Bulletin of University of Agricultural Sciences and Veterinary<br />

Medicine Cluj-Napoca. Horticulture, Aca<strong>de</strong>micPres, ISSN 1843-5254, eISSN 1843-5394, Cluj-<br />

Napoca, Romania, 66(2), p. 691-697, 2009.<br />

(Jäntschi & Bolboacă, 2009-EDFD): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Entropy due to<br />

Fragmentation of Dendrimers, Surveys in Mathematics and its Applications, University<br />

Constantin Brâncuşi of Târgu-Jiu, ISSN 1843-7265, eISSN 1842-6298, Targu Jiu, Romania, 4, p.<br />

168-176, 2009.<br />

(Jäntschi & Bolboacă, 2009-OvO): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Observation vs.<br />

312


Observable: Maximum Likelihood Estimations according to the Assumption of Generalized<br />

Gauss and Laplace Distributions, Leonardo Electronic Journal of Practices and Technologies,<br />

Aca<strong>de</strong>micDirect, eISSN 1583-1078, Cluj-Napoca, Romania, 8(15), p. 81-104, 2009.<br />

(Jäntschi & Bolboacă, 2010-EPCI): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Exact<br />

Probabilities on Confi<strong>de</strong>nce Limits for Binomial Samples: Applied to the Difference between<br />

Two Proportions, TheScientificWorldJOURNAL, TheScientificWorld, ISSN 1537-744X,<br />

Kirkkonummi, Finland, 10(5), p. 865-878, 2010.<br />

(Jäntschi & Bolboacă, 2010-REBP): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, The relationship<br />

between energy calculations and boiling points of n-alkanes, Studia Universitatis Babeş-Bolyai.<br />

Series Chemia, in press (2010, pp. 1-7).<br />

(Jäntschi & Diu<strong>de</strong>a, 2003-DM1): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mircea V. DIUDEA, Data Mining. 1.<br />

Glycine Content Estimation from Activity Coefficients Measurement, Leonardo Journal of<br />

Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233, www, Internet, 2(2), p. 53-63, 2003.<br />

(Jäntschi & Diu<strong>de</strong>a, 2006-SPV): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mircea V. DIUDEA, Subgraphs by Pairs of<br />

Vertices, TOPMOL2006 - 20 Years Anniversary of Molecular Topology at Cluj, Babes-Bolyai<br />

University, CEEx M3 PR-D11-PT00-41, Cluj-Napoca, Romania, p. 16 [Plenary oral<br />

presentation], September 25-30, 2006.<br />

(Jäntschi & Diu<strong>de</strong>a, 2009-sGPV): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mircea V. DIUDEA, Subgraphs of Pair<br />

Vertices, Journal of Mathematical Chemistry, Springer Verlag, ISSN 0259-9791, eISSN 1572-<br />

8897, Berlin, Germany, 45(2), p. 364-371, DOI: 10.1007/s10910-008-9411-6, 2009.<br />

(Jäntschi & Diu<strong>de</strong>a, 2011-C16V): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mircea V. DIUDEA, Centrality of some<br />

cubic graphs on 16 vertices, Journal of Indian Chemical Society, 87(12):1531-1537, 2011.<br />

(Jäntschi & Naşcu, 2002-FSD3): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Horea Iustin NAŞCU, Free Software<br />

Development. 3. Numerical Description of Soft Acid with Soft Base Titration, Leonardo Journal<br />

of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233, www, Internet, 1(1), p. 53-68, 2002.<br />

(Jäntschi & Naşcu, 2002-NDT): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Horea Iustin NAŞCU, Numerical Description<br />

of Titration, International Conference on Quality Control, Automation and Robotics, Mediamira,<br />

ISBN 973-9357-10-3, Cluj-Napoca, Romania, 1, p. 259-262, May 23-25, 2002.<br />

(Jäntschi & others, 2003-SQLA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mariana MARCU, Sorana Daniela<br />

BOLBOACĂ, SQL Application for Secondary School Leaving Examination, UNITECH'03<br />

International Scientific Conference, Technical University of Gabrovo, ISBN 954-683-167-0,<br />

Gabrovo, Bulgaria, 2003, p. 258-262, November 21-22, 2003.<br />

(Jäntschi & others, 2005-CSII): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mihaela Ligia UNGUREŞAN, Sorana Daniela<br />

BOLBOACĂ, Complex Structural Information Integration: Inhibitor Activity on Carbonic<br />

Anhydrase II of Substituted Disulfonami<strong>de</strong>s, Applied Medical Informatics, SRIMA, ISSN 1224-<br />

5593, Cluj-Napoca, Romania, 17(3-4), p. 12-21, 2005.<br />

(Jäntschi & others, 2006-GPAP): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Carmen Elena STOENOIU, Sorana Daniela<br />

BOLBOACĂ, Use of Graph Polynomials for Characterization of Alkanes Properties,<br />

International Symposium on Organic Chemistry, December 9-12, 2006, Avangard Prisma, ISBN<br />

954-323-243-1 & 978-954-323-243-7, Sofia, Bulgaria, p. 87-88, December 9-12, 2006.<br />

(Jäntschi & others, 2006-RPRD): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mădălina Ana VĂLEANU, Sorana Daniela<br />

BOLBOACĂ, Rapid Programming of Relational Databases Applications (in Romanian),<br />

Aca<strong>de</strong>micDirect & Aca<strong>de</strong>micPres, ISBN: 973-86211-5-1 & 978-973-86211-5-2<br />

(Aca<strong>de</strong>micDirect) && ISBN 973-744-044-7 & 978-973-744-044-0 (Aca<strong>de</strong>micPres), www &<br />

Cluj-Napoca, Internet & Romania, 233 p., 2006.<br />

(Jäntschi & others, 2007): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Mircea V. DIUDEA,<br />

Chromatographic Retention Times of Polychlorinated Biphenyls: from Structural Information to<br />

Property Characterization, International Journal of Molecular Sciences, Molecular Diversity<br />

Preservation International, ISSN 1422-0067, Basel & www, Switzerland & Internet, 8(11), p.<br />

1125-1157, CAS-AN 2008:423655, 2007.<br />

(Jäntschi & others, 2007-CCPN): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana-Daniela BOLBOACĂ, Cristina<br />

Maria FURDUI, Characteristic and Counting Polynomials on Mo<strong>de</strong>ling Nonane Isomers<br />

313


Properties, Fourth International Conference of Applied Mathematics and Computing, August 12-<br />

18, 2007, University of Chemical Technology and Metallurgy Sofia & Technical University of<br />

Plovdiv, Invited lecture, presented on August 15, from 12.20 to 13.00, Plovdiv, Bulgaria, p. 234,<br />

2007.<br />

(Jäntschi & others, 2007-FVCT): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Carmen Elena STOENOIU, Sorana-Daniela<br />

BOLBOACĂ, A Formula for Vertex Cuts in b-Trees, Fourth International Conference of Applied<br />

Mathematics and Computing, August 12-18, 2007, University of Chemical Technology and<br />

Metallurgy Sofia & Technical University of Plovdiv, Short communication, presented on August<br />

15, from 12.10 to 12.20, Plovdiv, Bulgaria, p. 233, 2007.<br />

(Jäntschi & others, 2007-NTCP): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Carmen E.<br />

STOENOIU, National Trends on Agricultural Crops Production: Cluster Analysis, Bulletin of<br />

University of Agricultural Sciences and Veterinary Medicine - Agriculture, 63-64:194-202, 2007.<br />

(Jäntschi & others, 2008): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Violeta POPESCU, Sorana D. BOLBOACĂ,<br />

Toxicity Caused by Para-Substituents of Phenole on Tetrahymena Pyriformis and Structure-<br />

Activity Relationships, Electronic Journal of Biotechnology, Pontificia Universidad Catolica <strong>de</strong><br />

Valparaiso, ISSN 0717-3458, Valparaiso, Chile, 11(3), fulltext 9, DOI: 10.2225/vol11-issue3fulltext-9,<br />

2008.<br />

(Jäntschi & others, 2008-FVCT): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Carmen E. STOENOIU, Sorana D.<br />

BOLBOACĂ, A Formula for Vertex Cuts in b-Trees, International Journal of Pure and Applied<br />

Mathematics, Aca<strong>de</strong>mic Publications, ISSN 1311-8080, Sofia, Bulgaria, 47(1), p. 17-22, Zbl<br />

pre05492617, 2008.<br />

(Jäntschi & others, 2008-IEbT): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Informational<br />

Entropy of b-ary Trees After a Vertex Cut, Entropy, Molecular Diversity Preservation<br />

International, ISSN 1099-4300, Basel, Switzerland, 10(4), p. 576-588, 2008.<br />

(Jäntschi & others, 2008-PTGS): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Radu E.<br />

SESTRAŞ, On about what Can Be Done and what Cannot Be Done with Genetic Algorithms in<br />

Phylogenetic Tree and Gene Sequence Analyses, Bulletin of University of Agricultural Sciences<br />

and Veterinary Medicine Cluj-Napoca. Horticulture, Aca<strong>de</strong>micPres, p-ISSN 1843-5254, e-ISSN<br />

1843-5394, Cluj-Napoca, Romania, 65(1), p. 63-70, 2008.<br />

(Jäntschi & others, 2009-CCPI): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Cristina M.<br />

FURDUI, Characteristic and Counting Polynomials: Mo<strong>de</strong>lling Nonane Isomers Properties,<br />

Molecular Simulation, Taylor & Francis Group, ISSN 0892-7022, eISSN 1029-0435, London,<br />

UK, 35(3), p. 220-227, DOI: 10.1080/08927020802398892, 2009.<br />

(Jäntschi & others, 2009-DF4): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Carmen E.<br />

STOENOIU, Mihaela IANCU, Monica M. MARTA, Elena M. PICĂ, Monica ŞTEFU, Adriana<br />

F. SESTRAŞ, Marcel M. DUDA, Radu E. SESTRAŞ, Ştefan ŢIGAN, Ioan ABRUDAN, Mugur<br />

C. BĂLAN, Distribution Fitting 4. Benford test on a sample of observed genotypes number from<br />

running of a genetic algorithm, Bulletin of University of Agricultural Sciences and Veterinary<br />

Medicine Cluj-Napoca. Agriculture, Aca<strong>de</strong>micPres, ISSN 1843-5246, eISSN 1843-5386, Cluj-<br />

Napoca, Romania, 66(1), p. 82-88, 2009.<br />

(Jäntschi & others, 2009-HPGS): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Radu E.<br />

SESTRAŞ, Hard Problems in Gene Sequence Analysis: Classical Approaches and Suitability of<br />

Genetic Algorithms, Biotechnology & Biotechnological Equipment, Diagnosis Press, ISSN 1310-<br />

2818, Sofia, Bulgaria, 23(2), p. 1275-1280, 2009.<br />

(Jäntschi & others, 2010-ATGA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Mircea V.<br />

DIUDEA, Radu E. SESTRAŞ, Average Trends over Millennia of Evolution Supervised by<br />

Genetic Algorithms. 3. Analysis of Phenotypes Associations, Bulletin of University of<br />

Agricultural Sciences and Veterinary Medicine Cluj-Napoca. Agriculture, Aca<strong>de</strong>micPres, ISSN<br />

1843-5246, eISSN 1843-5386, Cluj-Napoca, Romania, 67(1), p. 169-174, 2010.<br />

(Jäntschi & others, 2010-ATGG): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Mircea V.<br />

DIUDEA, Radu E. SESTRAŞ, Average Trends over Millennia of Evolution Supervised by<br />

Genetic Algorithms. 1. Analysis of Genotypes, Bulletin of University of Agricultural Sciences<br />

314


and Veterinary Medicine Cluj-Napoca. Horticulture, Aca<strong>de</strong>micPres, ISSN 1843-5254, eISSN<br />

1843-5394, Cluj-Napoca, Romania, 67(1), p. 72-79, 2010.<br />

(Jäntschi & others, 2010-ATGP): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Mircea V.<br />

DIUDEA, Radu E. SESTRAŞ, Average Trends over Millennia of Evolution Supervised by<br />

Genetic Algorithms. 2. Analysis of Phenotypes, Bulletin of University of Agricultural Sciences<br />

and Veterinary Medicine Cluj-Napoca. Agriculture, Aca<strong>de</strong>micPres, ISSN 1843-5246, eISSN<br />

1843-5386, Cluj-Napoca, Romania, 67(1), p. 161-168, 2010.<br />

(Jäntschi & others, 2010-CAGA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Radu E.<br />

SESTRAŞ, Classical Approaches of Genetic Algorithms and their Suitability, Asian Journal of<br />

Chemistry, Chemic Publishing Co., ISSN 0970-7077, Ghaziabad, India, 22(3), p. 2275-2284,<br />

2010.<br />

(Jäntschi & others, 2010-DqCC): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Mircea V.<br />

DIUDEA, Radu E. SESTRAŞ, Distribution of QSARs correlation coefficients, Visualization and<br />

Mo<strong>de</strong>ling in Chemistry, University of Split, October 29-31, Split, Croatia, p. 13-14, 2010.<br />

(Jäntschi & others, 2010-MHqR): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Radu E.<br />

SESTRAŞ, Meta-heuristics on quantitative structure-activity relationships: study on<br />

polychlorinated biphenyls, Journal of Molecular Mo<strong>de</strong>ling, Springer Verlag, ISSN 1610-2940 ,<br />

eISSN 0948-5023, Berlin, Germany, 6(2), p. 377-386, DOI: 10.1007/s00894-009-0540-z, PMID:<br />

19609578, 2010.<br />

(Jäntschi & others, 2010-REGA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Radu E.<br />

SESTRAŞ, Recording Evolution Supervised by a Genetic Algorithm for Quantitative Structure-<br />

Activity Relationship Optimization, Applied Medical Informatics, SRIMA, ISSN 1224-5593,<br />

Cluj-Napoca, Romania, 26(2), p. 89-100, 2010.<br />

(Jäntschi & others, 2010-RESG): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Mugur BĂLAN,<br />

Radu E. SESTRAŞ, Mircea V. DIUDEA, Results of Evolution Supervised by Genetic<br />

Algorithms, Notulae Scientia Biologicae, Aca<strong>de</strong>micPres, ISSN 2067-3205, eISSN 2067-3264,<br />

Cluj-Napoca, Romania, 2(3), p. 12-15, 2010.<br />

(Jäntschi & others, 2010-SGAE): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Radu E.<br />

SESTRAŞ, A Study of Genetic Algorithm Evolution on the Lipophilicity of Polychlorinated<br />

Biphenyls, Chemistry & Biodiversity, KGaA & Wiley-VCH Verlag, ISSN 1612-1872, eISSN<br />

1612-1880, Weinheim, Switzerland, 7(8), p. 1978-1989, DOI: 10.1002/cbdv.200900356, 2010.<br />

(Jäntschi & others, 2010-TESG): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana D. BOLBOACĂ, Mugur C. BĂLAN,<br />

Radu E. SESTRAŞ, Ten<strong>de</strong>ncy of Evolution Supervised by Genetic Algorithms, Bulletin of<br />

University of Agricultural Sciences and Veterinary Medicine Cluj-Napoca. Horticulture,<br />

Aca<strong>de</strong>micPres, ISSN 1843-5254, eISSN 1843-5394, Cluj-Napoca, Romania, 67(1), p. 80-85,<br />

2010.<br />

(Jäntschi & Pică, 2002-NKC): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Elena Maria PICĂ, Numerical Kinetic<br />

Chemistry, International Conference on Quality Control, Automation and Robotics, Mediamira,<br />

ISBN 973-9357-10-3, Cluj-Napoca, Romania, 1, p. 263-268, May 23-25, 2002.<br />

(Jäntschi & Pică, 2003-CASS): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Elena Maria PICĂ, Coals Analysis by Sample<br />

Study, UNITECH'03 International Scientific Conference, Technical University of Gabrovo,<br />

ISBN 954-683-167-0, Gabrovo, Bulgaria, 2003, p. 263-266, November 21-22, 2003.<br />

(Jäntschi & Pică, 2003-NCDR): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Elena Maria PICĂ, Numerical Simulation of<br />

Concurent Diffusion and Reaction, Annals of West University of Timişoara, Series Chemistry,<br />

West University of Timişoara, ISSN 1224-9513, Timisoara, Romania, 12(3), p. 1107-1112, CAN<br />

142:266989, 2003.<br />

(Jäntschi & Pică, 2003-ORM): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Elena Maria PICĂ, New Approach of Well<br />

Known Oscilating Reaction Mo<strong>de</strong>ls, Annals of West University of Timişoara, Series Chemistry,<br />

West University of Timişoara, ISSN 1224-9513, Timisoara, Romania, 12(3), p. 1169-1176, 2003.<br />

(Jäntschi & Ungureşan, 2001-MKD): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mihaela Ligia UNGUREŞAN, Physical<br />

Chemistry. Molecular Kinetic and Dynamic (in Romanian), Mediamira, ISBN 973-9358-71-3,<br />

Cluj-Napoca, Romania, 159 p., 2001.<br />

315


(Jäntschi & Ungureşan, 2001-SCA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mihaela Ligia UNGUREŞAN, Special<br />

Chapters of Chemistry for Automatics (in Romanian), UTPres, ISBN 973-8335-15-9, Cluj-<br />

Napoca, Romania, 202 p., 2001.<br />

(Jäntschi & Ungureşan, 2002-PCEI): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mihaela Ligia UNGUREŞAN, Physical<br />

Chemistry. Experiments of Chemical and Instrumental Analysis (in Romanian), Amici, ISBN<br />

973-85727-0-3, Cluj-Napoca, Romania, 120 p., 2002.<br />

(Jäntschi & Zaharieva-Stoyanova, 2003-MLPM): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Elena ZAHARIEVA-<br />

STOYANOVA, MATHLab as tool for Process Mo<strong>de</strong>ling, International Conference on Materials<br />

Science and Engineering BRAMAT 2003, Transilvania University Press, ISBN 973-635-122-X<br />

& 973-635-125-4, Brasov, Romania, 3, p. 137-142, March 10-12, 2003.<br />

(Jäntschi & Zaharieva-Stoyanova, 2003-UFS): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Elena ZAHARIEVA-<br />

STOYANOVA, Upload a File to a Server. Case Study, UNITECH'03 International Scientific<br />

Conference, Technical University of Gabrovo, ISBN 954-683-167-0, Gabrovo, Bulgaria, 2003, p.<br />

274-276, November 21-22, 2003.<br />

(Jäntschi, 2002-ACRA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Property Investigations with an Automat Correlation<br />

Routine and Applications for a Set of Alloys, Acta Tehnica Napocensis, series Machines<br />

Building. Materials, UTPres, ISSN 1221-5872, Cluj-Napoca, Romania, 45(1), p. 296-301, 2002.<br />

(Jäntschi, 2002-ASSP): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Automat Server Si<strong>de</strong> Processing of Statistical Data,<br />

UNITECH'02 International Scientific Conference, Technical University of Gabrovo, ISBN 954-<br />

683-167-0, Gabrovo, Bulgaria, 2002, p. 185-189, November 21-22, 2002.<br />

(Jäntschi, 2002-CIA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Chemical and Instrumental Analysis (in Romanian),<br />

UTPres, ISBN 973-8335-19-1, Cluj-Napoca, Romania, 138 p., 2002.<br />

(Jäntschi, 2002-FSD1): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Free Software Development. 1. Fitting Statistical<br />

Regressions, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233, www, Internet,<br />

1(1), p. 31-52, 2002.<br />

(Jäntschi, 2002-TRPI): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Real Time Property Investigation in Sets of Alloys,<br />

International Conference on Advanced Materials and Structures, Editura Orizonturi Universitare,<br />

ISBN 973-8391-50-4, Timisoara, Romania, p. 189-194, September 19-21, 2002.<br />

(Jäntschi, 2003-CIA): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Physical Chemistry. Chemical and Instrumental<br />

Analysis (in Romanian), Aca<strong>de</strong>micDirect, , ISBN 973-86211-7-8, www, Internet, 64 p., 2003.<br />

(Jäntschi, 2003-FBSD): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Installing and Testing a Server Operating System,<br />

Leonardo Electronic Journal of Practices and Technologies, Aca<strong>de</strong>micDirect, ISSN 1583-1078,<br />

www, Internet, 2(3), p. 1-30, 2003.<br />

(Jäntschi, 2003-I386): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, I386-Based Computer Architecture and Elementary<br />

Data Operations, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233, www,<br />

Internet, 2(3), p. 9-23, 2003.<br />

(Jäntschi, 2003-KB): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Kinetic Biochemistry, Leonardo Journal of Sciences,<br />

Aca<strong>de</strong>micDirect, ISSN 1583-0233, www, Internet, 2(2), p. 1-40, 2003.<br />

(Jäntschi, 2003-MME): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Metrology and Monitoring of Environment (in<br />

Romanian), Amici, ISBN 973-85727-2-X, Cluj-Napoca, Romania, 148 p., 2003.<br />

(Jäntschi, 2003-MTPS): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Microbiology and Toxicology. Phytochemistry<br />

Studies (in Romanian), Amici, ISBN 973-85727-3-8, Cluj-Napoca, Romania, 183 p., 2003.<br />

(Jäntschi, 2003-SQL1): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, SQL by Example. 1. Application for High School<br />

Bachelor Examination, Leonardo Electronic Journal of Practices and Technologies,<br />

Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 2(2), p. 20-36, 2003.<br />

(Jäntschi, 2004-DCS): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Delphi Client - Server Implementation of Multiple<br />

Linear Regression Findings: a QSAR/QSPR Application, Applied Medical Informatics, SRIMA,<br />

ISSN 1224-5593, Cluj-Napoca, Romania, 15(3-4), p. 48-55, 2004.<br />

(Jäntschi, 2004-MDF) <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, MDF - A New QSAR/QSPR Molecular Descriptors<br />

Family, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233, www, Internet, 3(4), p.<br />

68-85, 2004.<br />

(Jäntschi, 2004-PCB): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, QSPR on Estimating of Polychlorinated Biphenyls<br />

316


Relative Response Factor using Molecular Descriptors Family, Leonardo Electronic Journal of<br />

Practices and Technologies, Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 3(5), p. 67-84,<br />

2004.<br />

(Jäntschi, 2004-WAC): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Water Activated Carbon Organics Adsorption<br />

Structure - Property Relationships, Leonardo Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-<br />

0233, www, Internet, 3(5), p. 63-73, 2004.<br />

(Jäntschi, 2005-MDF1): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Molecular Descriptors Family on Structure Activity<br />

Relationships 1. Review of the Methodology, Leonardo Electronic Journal of Practices and<br />

Technologies, Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 4(6), p. 76-98, 2005.<br />

(Jäntschi, 2005-MTPS): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Microbiology and Toxicology and Phytochemistry<br />

Studies (in Romanian), Aca<strong>de</strong>micDirect, ISBN 973-86211-8-6, www, Internet, 75 p., 2005.<br />

(Jäntschi, 2007-CCPN): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Characteristic and Counting Polynomials of Nonane<br />

Isomers, Aca<strong>de</strong>micDirect, ISBN 973-86211-3-5 & ISBN 980-973-86211-3-8, www, Internet, p.<br />

101, 2007.<br />

(Jäntschi, 2009-DF1): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Distribution Fitting 1. Parameters Estimation un<strong>de</strong>r<br />

Assumption of Agreement between Observation and Mo<strong>de</strong>l, Bulletin of University of<br />

Agricultural Sciences and Veterinary Medicine Cluj-Napoca. Horticulture, Aca<strong>de</strong>micPres, ISSN<br />

1843-5254, eISSN 1843-5394, Cluj-Napoca, Romania, 66(2), p. 684-690, 2009.<br />

(Jäntschi, 2009-GASI): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, A genetic algorithm for structure-activity<br />

relationships: software implementation, ArXiv manuscript, http://arxiv.org/abs/0906.4846, 2009.<br />

(Jäntschi, 2010-GAEG): <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Genetic algorithms: evolution in genetics and<br />

informatics, BioArta - Society and Perception of Biotechnology. Exploratory Workshop,<br />

UASVM Cluj-Napoca, Cluj-Napoca, Romania, 2010.<br />

(Naşcu & Jäntschi, 2004-MCE1): Horea Iustin NAŞCU, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Multiple Choice<br />

Examination System 1. Database Design and Implementation for General Chemistry, Leonardo<br />

Journal of Sciences, Aca<strong>de</strong>micDirect, ISSN 1583-0233, www, Internet, 3(5), p. 18-33, 2004.<br />

(Naşcu & Jäntschi, 2004-MCE2): Horea Iustin NAŞCU, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Multiple Choice<br />

Examination System 2. Online Quizzes for General Chemistry, Leonardo Electronic Journal of<br />

Practices and Technologies, Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 3(5), p. 26-36,<br />

2004.<br />

(Naşcu & others, 1999): Horea NASCU, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Teodor HODIŞAN, Claudia<br />

CIMPOIU, Gabriela CÂMPAN, Some Applications of Statistics in Analytical Chemistry,<br />

Reviews in Analytical Chemistry, Freud Publishing House, ISSN 0793-0135, Tel Aviv &<br />

London, Israel & England, XVIII(6), p. 409-456, CAN 132:287941, 1999.<br />

(Pică & Jäntschi, 2003-CSC1): Elena Maria PICĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Case Study of Coals<br />

Farcasesti Area. 1. Depen<strong>de</strong>ncies Excluding Fixed Carbon Determinations, Annals of West<br />

University of Timişoara, Series Chemistry, West University of Timişoara, ISSN 1224-9513,<br />

Timisoara, Romania, 12(3), p. 1127-1136, CAN 142:41100, 2003.<br />

(Pică & Jäntschi, 2003-CSC2): Elena Maria PICĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Case Study of Coals<br />

Farcasesti Area. 2. Depen<strong>de</strong>ncies Including Fixed Carbon Determinations, Annals of West<br />

University of Timişoara, Series Chemistry, West University of Timişoara, ISSN 1224-9513,<br />

Timisoara, Romania, 12(3), p. 1137-1144, CAN 142:41119, 2003.<br />

(Pică & others, 2004-ASOC): Elena Maria PICĂ, Mihaela Ligia UNGUREŞAN, <strong>Lorentz</strong><br />

<strong>JÄNTSCHI</strong>, Amperometric Sensors for the Analysis of the Oxygen Content, Acta Tehnica<br />

Napocensis, series Machines Building. Materials, UTPres, ISSN 1224-9106, Cluj-Napoca,<br />

Romania, 47, p. 91-98, 2004.<br />

(Pică & others, 2004-OCAS): Elena Maria PICĂ, Mihaela Ligia UNGUREŞAN, <strong>Lorentz</strong><br />

<strong>JÄNTSCHI</strong>, Oxygen Content Analysis with Current Sensors, A&QT-R 2004 (THETA 14) 2004<br />

IEEE-TTTC - International Conference on Automation, Quality and Testing, Robotics,<br />

Mediamira, ISBN 973-713-046-4, Cluj-Napoca, Romania, 1, p. 471-472, May 13-15, 2004.<br />

(Sârbu & Jäntschi, 1998): Costel SÂRBU, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Statistic Validation and Evaluation<br />

of Analytical Methods by Comparative Studies. I. Validation of Analytical Methods using<br />

317


Regression Analysis (in Romanian), Revista <strong>de</strong> Chimie, SC Biblioteca Chimiei SA, ISSN 0034-<br />

7752, Bucuresti, Romania, 49(1), p. 19-24, CAN 128:225190, 1998.<br />

(Ştefu & others, 2002-FSD2): Monica ŞTEFU, Mihaela Ligia UNGUREŞAN, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>,<br />

Free Software Development. 2. Chemical Database Management, Leonardo Electronic Journal of<br />

Practices and Technologies, Aca<strong>de</strong>micDirect, ISSN 1583-1078, www, Internet, 1(1), p. 69-76,<br />

2002.<br />

(Ştefu & others, 2008-MHHS): Monica ŞTEFU, Sorana D. BOLBOACĂ, Mugur C. BĂLAN,<br />

<strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Molecular Hyperstructures with High Symmetry, Bulletin of University of<br />

Agricultural Sciences and Veterinary Medicine Cluj-Napoca. Horticulture, Aca<strong>de</strong>micPres, p-<br />

ISSN 1843-5254; e-ISSN 1843-5394, Cluj-Napoca, Romania, 65(2), p. 681-686, 2008.<br />

(Stoenoiu & others, 2007-CMST): Carmen Elena STOENOIU, Sorana Daniela BOLBOACĂ,<br />

<strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Characterization of Marine Sediments Toxicity based on Structural<br />

Information, Institute of General and Inorganic Chemistry, Bulgarian Aca<strong>de</strong>my of Sciences<br />

[http://sizemat.igic.bas.bg], FP6: EC-INCO-CT-2005-016414 Specific Support Action, Plovdiv,<br />

Bulgaria, p. 54, April 19-21, 2007.<br />

(Stoenoiu & others, 2007-MFI): Carmen Elena STOENOIU, Sorana-Daniela BOLBOACĂ, <strong>Lorentz</strong><br />

<strong>JÄNTSCHI</strong>, Mo<strong>de</strong>l Formulation and Interpretation for Chemical Reactions Mechanisms - From<br />

Experiment to Theory, Fourth International Conference of Applied Mathematics and Computing,<br />

August 12-18, 2007, University of Chemical Technology and Metallurgy Sofia & Technical<br />

University of Plovdiv, Invited lecture, presented on August 15, from 11.30 to 12.10, Plovdiv,<br />

Bulgaria, p. 511, 2007.<br />

(Stoenoiu & others, 2008-MFET): Carmen E. STOENOIU, Sorana D. BOLBOACĂ, <strong>Lorentz</strong><br />

<strong>JÄNTSCHI</strong>, Mo<strong>de</strong>l Formulation & Interpretation - From Experiment to Theory, International<br />

Journal of Pure and Applied Mathematics, Aca<strong>de</strong>mic Publications, ISSN 1311-8080, Sofia,<br />

Bulgaria, 47(1), p. 9-16, Zbl pre05492616, 2008.<br />

(Suciu & others, 2008-HMPP): Ioan SUCIU, Constantin COSMA, Mihai TODICĂ, Sorana D.<br />

BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Analysis of Soil Heavy Metal Pollution and Pattern in<br />

Central Transylvania, International Journal of Molecular Sciences, Molecular Diversity<br />

Preservation International, ISSN 1422-0067, Basel, Switzerland, 9(4), p. 434-453, 2008.<br />

(Tăut & others, 2007-MMCP): Ioan TĂUT, George ARGHIR, Viorel CÂNDEA, Sorana-Daniela<br />

BOLBOACĂ, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Mechanical Milling: Evolution of Crystal Parameter of Iron<br />

Pow<strong>de</strong>r, 9th Annual Conference of the Yugoslav Materials Research Society, Serbian Aca<strong>de</strong>my<br />

of Sciences and Arts, ISBN 978-86-80321-11-0, Herceg Novi, Montenegro, OSA11, p. 14,<br />

September 10-14, 2007.<br />

(Ţigan & others, 2006): Ştefan ŢIGAN, <strong>Lorentz</strong> <strong>JÄNTSCHI</strong>, Sorana-Daniela BOLBOACĂ,<br />

Mo<strong>de</strong>ling Herbicidal Activity of a Substituted Triazines Class by Integration of Compounds<br />

Complex Structural Information, XXIII International Biometric Conference, International<br />

Biometric Society, TP1.219 (509.pdf on CD), Montreal, Quebec, Canada, July 16-21, 2006.<br />

Concluzii<br />

Derularea proiectului "De la Chimia Matematică la Chimia Cuantică şi la Chimia Medicală" a<br />

permis aprofundarea unor concepte cu ajutorul cărora se face trasnferul cunoştinţelor între domenii<br />

<strong>de</strong> vârf ale cercetării şi în acelaşi timp a <strong>de</strong>schis oportunitatea obţinerii unei serii <strong>de</strong> rezultate noi şi<br />

originale valorificate prin publicaţii ştiinţifice în reviste <strong>de</strong> prestigiu.<br />

318

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!