Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ
Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ
Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Capítulo I. Introdução<br />
O Simulated Annealing (SA), algoritmo <strong>de</strong> seleção <strong>de</strong> variáveis, foi<br />
originalmente proposto em 1953 por Metropolis et al. [51]<br />
e popularizado após o<br />
trabalho <strong>de</strong> Kirkpatrick et al. [52] em 1983. Trata-se <strong>de</strong> um método estocástico <strong>de</strong><br />
busca global, cujo princípio está associado à Termodinâmica em simulações <strong>de</strong><br />
“cozimento” <strong>de</strong> sólidos. No contexto da Química Analítica, a literatura é escassa <strong>de</strong><br />
trabalhos envolvendo o SA em problemas <strong>de</strong> classificação. Destaca-se o trabalho<br />
apresentado por Llobet et al. [53] . Nesse estudo, os autores avaliaram a<br />
espectrometria <strong>de</strong> massa com nariz eletrônico quanto ao seu potencial para<br />
classificação <strong>de</strong> presuntos espanhóis. O SA foi aplicado em re<strong>de</strong>s neurais artificiais<br />
e 97,24% <strong>das</strong> amostras foram corretamente classifica<strong>das</strong>. O número <strong>de</strong> variáveis foi<br />
reduzido <strong>de</strong> 209 para 14.<br />
O método <strong>de</strong> eliminação <strong>de</strong> variáveis não informativas (UVE: Uninformative<br />
Variable Elimination), proposto inicialmente por Centner et al. [54]<br />
para calibração<br />
multivariada, foi adaptado para o contexto dos métodos <strong>de</strong> classificação por<br />
Wu et al. [46] . <strong>Para</strong> esse propósito, mo<strong>de</strong>los <strong>de</strong> análise discriminante pelos mínimos<br />
quadrados parciais (PLS-DA: Partial Least Squares-Discriminant Analyisis) foram<br />
empregados e a taxa <strong>de</strong> classificação correta (TCC) foi adotada como parâmetro <strong>de</strong><br />
<strong>de</strong>sempenho do método.<br />
O algoritmo genético (GA: Genetic Algorithm), muito utilizado em calibração<br />
multivariada, é um método <strong>de</strong> seleção <strong>de</strong> variáveis <strong>de</strong> natureza estocástica, assim<br />
como o SA. Contudo, o procedimento é realizado através <strong>de</strong> uma simulação <strong>de</strong><br />
processos naturais da evolução com aplicação da teoria da evolução <strong>das</strong> espécies<br />
proposta por Darwin: “Quanto melhor um indivíduo se adaptar ao seu meio<br />
ambiente, maior será sua chance <strong>de</strong> sobreviver e gerar <strong>de</strong>scen<strong>de</strong>ntes” [55-57] . No<br />
contexto dos métodos <strong>de</strong> classificação, alguns trabalhos po<strong>de</strong>m ser<br />
encontrados [58-60] .<br />
O GA foi incorporado ao método <strong>de</strong> análise <strong>de</strong> variável canônica discreta<br />
(DCVA: Discret Canonical Variate Analysis) e comparado, em seis conjuntos <strong>de</strong><br />
dados, com as técnicas LDA e re<strong>de</strong>s neurais artificiais [58] . Na maioria dos casos, o<br />
<strong>de</strong>sempenho do GA-DCVA foi superior às <strong>de</strong>mais estratégias.<br />
Dharmaraj et al. [59] utilizaram a espectroscopia FTIR para a classificação <strong>de</strong><br />
diferentes origens geográficas da Phyllanthus niruri Linn., espécie <strong>de</strong> planta<br />
largamente difundida na Amazônia e eficiente para o tratamento <strong>de</strong> cálculo renal. O<br />
GA foi utilizado para seleção <strong>de</strong> variáveis em mo<strong>de</strong>los LDA. O PCA-LDA e SIMCA<br />
12