Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ
Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ
Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Capítulo I. Introdução<br />
seja, as amostras são examina<strong>das</strong> utilizando apenas medi<strong>das</strong> <strong>de</strong> algumas<br />
proprieda<strong>de</strong>s com intuito <strong>de</strong> se observar agrupamentos naturais [5] .<br />
As principais técnicas <strong>de</strong> RP não-supervisiona<strong>das</strong> são: análise <strong>de</strong><br />
agrupamentos hierárquicos (Hierarchical Cluster Analysis – HCA) e análise <strong>de</strong><br />
componentes principais (Principal Component Analysis – PCA) [3,4,7] . Esses métodos<br />
são complementares, com muita aceitação por parte dos pesquisadores na análise<br />
<strong>de</strong> dados químicos.<br />
A PCA é uma <strong>das</strong> técnicas <strong>de</strong> RP não-supervisiona<strong>das</strong> mais utiliza<strong>das</strong>. Nela,<br />
uma visão estatisticamente privilegiada e simples do conjunto <strong>de</strong> dados é fornecida<br />
através da criação <strong>de</strong> um novo conjunto <strong>de</strong> variáveis (novos eixos no espaço<br />
multidimensional), <strong>de</strong>nominados Componentes Principais (PCs), que são ortogonais<br />
entre si e construídos da or<strong>de</strong>m da maior para a menor variância explicada dos<br />
dados. Teoricamente, o número <strong>de</strong> PCs é sempre igual ao número <strong>de</strong> variáveis.<br />
Entretanto, poucas componentes são responsáveis pela gran<strong>de</strong> parte da<br />
variabilida<strong>de</strong> total dos dados. Em outras palavras, a PCA agrupa variáveis que estão<br />
altamente correlaciona<strong>das</strong> em novas variáveis, criando um conjunto que contém<br />
apenas as informações importantes e <strong>de</strong>scartando as redundantes. Com isso,<br />
diminui-se o número <strong>de</strong> dimensões do sistema e cada amostra acaba sendo<br />
representada por um ponto em um espaço multidimensional menor, no qual é mais<br />
fácil a extração <strong>de</strong> informações e a observação <strong>de</strong> agrupamentos <strong>de</strong> amostras que<br />
apresentam características semelhantes [4-5,7] .<br />
Aplicações envolvendo a PCA junto aos métodos espectrométricos têm sido<br />
freqüentemente apresenta<strong>das</strong> na literatura [8-15] . Uma breve revisão <strong>de</strong> alguns<br />
trabalhos será mostrada abaixo.<br />
As espectroscopias <strong>de</strong> emissão ótica e <strong>de</strong> massa com plasma indutivamente<br />
acoplado (ICP OES/ICP-MS) foram utiliza<strong>das</strong> para <strong>de</strong>terminar traços <strong>de</strong> metais em<br />
chás <strong>de</strong> vários países africanos e asiáticos. A origem geográfica foi caracterizada<br />
pelas técnicas PCA e HCA (utilizando distância euclidiana e o método <strong>de</strong> Ward) [8] .<br />
Além disso, um estudo supervisionado foi também realizado para procedimentos <strong>de</strong><br />
classificação. Em ambas as técnicas não - supervisiona<strong>das</strong>, foi possível observar<br />
agrupamentos naturais referentes às amostras <strong>das</strong> diferentes origens.<br />
A PCA foi utilizada com intuito <strong>de</strong> elucidar o potencial do uso da<br />
espectroscopia Raman (excitação em 785 nm) para medi<strong>das</strong> quantitativas <strong>de</strong><br />
carotenói<strong>de</strong>, colágeno e gordura em músculo <strong>de</strong> peixe [9] . <strong>Para</strong> o registro dos<br />
5