Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ
Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ
Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Capítulo III. Classificação <strong>de</strong> óleos vegetais<br />
SPA, alguns dos comprimentos <strong>de</strong> onda selecionados pelo GA estão localizados em<br />
regiões on<strong>de</strong> nenhuma informação é evi<strong>de</strong>nciada, incluindo uma parte do visível,<br />
on<strong>de</strong> a baixa relação sinal/ruído é pronunciada. A inclusão <strong>de</strong>stas variáveis<br />
apresenta efeitos adversos, sobretudo no que diz respeito à sensibilida<strong>de</strong> do mo<strong>de</strong>lo<br />
LDA ao ruído instrumental. Este estudo será abordado na próxima seção.<br />
A Tabela 3.5 apresenta o resumo dos erros <strong>de</strong> classificação para o conjunto<br />
<strong>de</strong> teste <strong>de</strong> óleos vegetais.<br />
Tabela 3.5. Resumo dos resultados (erros <strong>de</strong> classificação no conjunto <strong>de</strong> teste) para o SPA-LDA,<br />
GA-LDA e SIMCA (4 níveis <strong>de</strong> significância do teste-F) para o conjunto <strong>de</strong> dados <strong>de</strong> óleos vegetais.<br />
SPA-LDA GA-LDA<br />
SIMCA SIMCA SIMCA SIMCA<br />
1% 5% 10% 25%<br />
Tipo I 1 - - - 1 9<br />
Tipo II 1 - 19 7 4 -<br />
Total 2 - 19 7 5 9<br />
Fica claro a superiorida<strong>de</strong> dos mo<strong>de</strong>los LDA com seleção <strong>de</strong> variáveis (SPA<br />
e GA) frente aos mo<strong>de</strong>los SIMCA (nos quatro níveis <strong>de</strong> significância do teste-F).<br />
Entre os resultados apresentados pelo SIMCA, a classificação realizada com 10%<br />
<strong>de</strong> nível <strong>de</strong> significância apresentou o melhor <strong>de</strong>sempenho, em termos do número<br />
total <strong>de</strong> erros. É importante lembrar que quando uma classificação é realizada na<br />
LDA, a amostra que não for corretamente classificada na sua classe verda<strong>de</strong>ira,<br />
obrigatoriamente será incluída em uma errada. Portanto, o SPA-LDA apresentou um<br />
erro do Tipo I (amostra <strong>de</strong> soja não classificada como pertencente ao mo<strong>de</strong>lo Soja),<br />
que, conseqüentemente, também se qualifica como erro do tipo II (amostra <strong>de</strong> soja<br />
classificada como canola).<br />
3.4.6. Análise <strong>de</strong> sensibilida<strong>de</strong> ao ruído<br />
Nesta seção, um estudo <strong>de</strong> sensibilida<strong>de</strong> dos mo<strong>de</strong>los LDA e SIMCA com<br />
respeito ao ruído instrumental foi realizado. <strong>Para</strong> isso, os espectros do conjunto <strong>de</strong><br />
teste foram artificialmente contaminados com ruído gaussiano branco <strong>de</strong> média zero.<br />
O <strong>de</strong>svio padrão do ruído adicional foi da or<strong>de</strong>m <strong>de</strong> 10 -3 . Então, os mo<strong>de</strong>los<br />
previamente obtidos (sem o ruído adicional) foram aplicados para a classificação do<br />
novo conjunto externo <strong>de</strong> amostras.<br />
A Tabela 3.6 apresenta uma comparação entre os resultados <strong>de</strong><br />
classificação dos mo<strong>de</strong>los SPA-LDA, GA-LDA e SIMCA para o novo cenário. Os<br />
números entre parênteses indicam os resultados obtidos anteriormente (sem a<br />
adição do ruído). O nível <strong>de</strong> significância do teste-F empregado para o SIMCA foi<br />
48