Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ
Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ
Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Capítulo II. Fundamentação Teórica<br />
k 2<br />
s<br />
ij<br />
= ∑[xi<br />
− mij]<br />
(2.17)<br />
sendo<br />
isto é:<br />
k<br />
x<br />
i<br />
o valor <strong>de</strong> x i na k-ésima amostra e m ij é o valor médio <strong>de</strong> x i na classe j,<br />
1 k<br />
m<br />
ij<br />
= ∑ xi<br />
(2.18)<br />
n<br />
j k∈I j<br />
Já a dispersão entre as classes, SB i , é <strong>de</strong>finida a partir da Equação 2.19:<br />
∑<br />
SB (2.19)<br />
= C 2<br />
i<br />
n<br />
j[mij<br />
− mi]<br />
j=<br />
1<br />
on<strong>de</strong> m i é a média <strong>de</strong> x i para todos os objetos do conjunto <strong>de</strong> treinamento.<br />
Em cada passo, a variável x i com o valor <strong>de</strong> D i mais elevado é selecionada e<br />
o número <strong>de</strong> erros obtidos por validação cruzada leave-one-out é registrado. Antes<br />
do próximo passo, as variáveis que apresentarem uma alta correlação com a<br />
variável recém-selecionada são <strong>de</strong>scarta<strong>das</strong> com intuito <strong>de</strong> evitar problemas <strong>de</strong><br />
colinearida<strong>de</strong>. O algoritmo encerra o cálculo quando to<strong>das</strong> as variáveis forem<br />
avalia<strong>das</strong>. O conjunto <strong>de</strong> variáveis que resultar em um menor número <strong>de</strong> erros <strong>de</strong><br />
validação cruzada é então apresentado para o analista [27] . <strong>Para</strong> uma melhor<br />
compreensão, os passos para esta estratégia <strong>de</strong> seleção <strong>de</strong> variável são mostrados<br />
abaixo:<br />
Sejam v sel e P os conjuntos contendo as variáveis já seleciona<strong>das</strong> e aquelas<br />
ainda disponíveis, respectivamente. Além disso, sejam γ um limiar <strong>de</strong> correlação (0 <<br />
γ