Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ
Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ
Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Capítulo II. Fundamentação Teórica<br />
(Equação 2.21) originalmente empregado no SPA não é uma métrica aplicável. Por<br />
esse motivo, uma nova função <strong>de</strong> custo foi concebida para guiar a seleção <strong>de</strong><br />
variáveis.<br />
A função <strong>de</strong> custo proposta refere-se ao risco médio G <strong>de</strong> uma classificação<br />
incorreta pela LDA. Assim como o RMSEV, esta função é calculada com base em<br />
um conjunto <strong>de</strong> validação, conforme <strong>de</strong>scrito na Equação 2.22:<br />
K<br />
1 v<br />
G = ∑gk<br />
(2.22)<br />
K<br />
v k=<br />
1<br />
on<strong>de</strong> g k (risco <strong>de</strong> uma classificação incorreta do objeto x k da k-ésima<br />
amostra <strong>de</strong> validação) é <strong>de</strong>finido como:<br />
g<br />
k<br />
r<br />
min<br />
2<br />
(xk,μIk<br />
)<br />
2<br />
r (x ,μ )<br />
= (2.23)<br />
Ij≠Ik<br />
k<br />
Ij<br />
Na equação anterior, o numerador r 2 (x k ,μ Ik ) é o quadrado da distância <strong>de</strong><br />
Mahalanobis entre o objeto x k (com índice <strong>de</strong> classe Ik) e a média <strong>de</strong> sua classe<br />
(μ Ik ). O <strong>de</strong>nominador da Equação 2.23 correspon<strong>de</strong> ao quadrado da distância <strong>de</strong><br />
Mahalanobis entre o objeto x k e o centro da classe errada mais próxima. I<strong>de</strong>almente,<br />
g k <strong>de</strong>verá ser tão pequeno quanto possível, ou seja, o objeto x k <strong>de</strong>verá estar perto<br />
do centro da sua verda<strong>de</strong>ira classe e distante dos centros <strong>das</strong> <strong>de</strong>mais classes.<br />
<strong>Para</strong> iniciar o procedimento <strong>de</strong> seleção <strong>de</strong> variáveis no SPA-LDA, <strong>de</strong>ve-se<br />
fornecer como entrada:<br />
(i) Matrizes correspon<strong>de</strong>ntes às respostas instrumentais:<br />
• Conjunto <strong>de</strong> treinamento: Train (Kc × J);<br />
• Conjunto <strong>de</strong> validação: Val (Kv × J);<br />
• Conjunto externo para Teste: Test (Kt × J);<br />
on<strong>de</strong> K c , K v e K t representam o número <strong>de</strong> amostras para os conjuntos <strong>de</strong><br />
treinamento, validaçao e teste, respectivamente. Esses conjuntos <strong>de</strong>verão ter o<br />
mesmo número <strong>de</strong> variáveis J.<br />
(ii) Índices <strong>das</strong> classes:<br />
• Conjunto <strong>de</strong> treinamento: Group_Train (Kc × 1);<br />
• Conjunto <strong>de</strong> validação: Group_Val (Kv × 1);<br />
29