04.03.2015 Views

Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ

Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ

Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Capítulo II. Fundamentação Teórica<br />

(Equação 2.21) originalmente empregado no SPA não é uma métrica aplicável. Por<br />

esse motivo, uma nova função <strong>de</strong> custo foi concebida para guiar a seleção <strong>de</strong><br />

variáveis.<br />

A função <strong>de</strong> custo proposta refere-se ao risco médio G <strong>de</strong> uma classificação<br />

incorreta pela LDA. Assim como o RMSEV, esta função é calculada com base em<br />

um conjunto <strong>de</strong> validação, conforme <strong>de</strong>scrito na Equação 2.22:<br />

K<br />

1 v<br />

G = ∑gk<br />

(2.22)<br />

K<br />

v k=<br />

1<br />

on<strong>de</strong> g k (risco <strong>de</strong> uma classificação incorreta do objeto x k da k-ésima<br />

amostra <strong>de</strong> validação) é <strong>de</strong>finido como:<br />

g<br />

k<br />

r<br />

min<br />

2<br />

(xk,μIk<br />

)<br />

2<br />

r (x ,μ )<br />

= (2.23)<br />

Ij≠Ik<br />

k<br />

Ij<br />

Na equação anterior, o numerador r 2 (x k ,μ Ik ) é o quadrado da distância <strong>de</strong><br />

Mahalanobis entre o objeto x k (com índice <strong>de</strong> classe Ik) e a média <strong>de</strong> sua classe<br />

(μ Ik ). O <strong>de</strong>nominador da Equação 2.23 correspon<strong>de</strong> ao quadrado da distância <strong>de</strong><br />

Mahalanobis entre o objeto x k e o centro da classe errada mais próxima. I<strong>de</strong>almente,<br />

g k <strong>de</strong>verá ser tão pequeno quanto possível, ou seja, o objeto x k <strong>de</strong>verá estar perto<br />

do centro da sua verda<strong>de</strong>ira classe e distante dos centros <strong>das</strong> <strong>de</strong>mais classes.<br />

<strong>Para</strong> iniciar o procedimento <strong>de</strong> seleção <strong>de</strong> variáveis no SPA-LDA, <strong>de</strong>ve-se<br />

fornecer como entrada:<br />

(i) Matrizes correspon<strong>de</strong>ntes às respostas instrumentais:<br />

• Conjunto <strong>de</strong> treinamento: Train (Kc × J);<br />

• Conjunto <strong>de</strong> validação: Val (Kv × J);<br />

• Conjunto externo para Teste: Test (Kt × J);<br />

on<strong>de</strong> K c , K v e K t representam o número <strong>de</strong> amostras para os conjuntos <strong>de</strong><br />

treinamento, validaçao e teste, respectivamente. Esses conjuntos <strong>de</strong>verão ter o<br />

mesmo número <strong>de</strong> variáveis J.<br />

(ii) Índices <strong>das</strong> classes:<br />

• Conjunto <strong>de</strong> treinamento: Group_Train (Kc × 1);<br />

• Conjunto <strong>de</strong> validação: Group_Val (Kv × 1);<br />

29

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!