Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ

More documents

Recommendations

Info

Capítulo II. Fundamentação Teórica (Equação 2.21) originalmente empregado no SPA não é uma métrica aplicável. Por esse motivo, uma nova função de custo foi concebida para guiar a seleção de variáveis. A função de custo proposta refere-se ao risco médio G de uma classificação incorreta pela LDA. Assim como o RMSEV, esta função é calculada com base em um conjunto de validação, conforme descrito na Equação 2.22: K 1 v G = ∑gk (2.22) K v k= 1 onde g k (risco de uma classificação incorreta do objeto x k da k-ésima amostra de validação) é definido como: g k r min 2 (xk,μIk ) 2 r (x ,μ ) = (2.23) Ij≠Ik k Ij Na equação anterior, o numerador r 2 (x k ,μ Ik ) é o quadrado da distância de Mahalanobis entre o objeto x k (com índice de classe Ik) e a média de sua classe (μ Ik ). O denominador da Equação 2.23 corresponde ao quadrado da distância de Mahalanobis entre o objeto x k e o centro da classe errada mais próxima. Idealmente, g k deverá ser tão pequeno quanto possível, ou seja, o objeto x k deverá estar perto do centro da sua verdadeira classe e distante dos centros das demais classes. Para iniciar o procedimento de seleção de variáveis no SPA-LDA, deve-se fornecer como entrada: (i) Matrizes correspondentes às respostas instrumentais: • Conjunto de treinamento: Train (Kc × J); • Conjunto de validação: Val (Kv × J); • Conjunto externo para Teste: Test (Kt × J); onde K c , K v e K t representam o número de amostras para os conjuntos de treinamento, validaçao e teste, respectivamente. Esses conjuntos deverão ter o mesmo número de variáveis J. (ii) Índices das classes: • Conjunto de treinamento: Group_Train (Kc × 1); • Conjunto de validação: Group_Val (Kv × 1); 29
Capítulo II. Fundamentação Teórica • Conjunto externo para Teste: Group_Test (Kt × 1); (iii) Número mínimo e máximo de variáveis a serem selecionadas • Número mínimo de variáveis: N1; • Número máximo de variáveis: N2; É importante ressaltar que a construção de subconjuntos de variáveis com base no critério de minimização de colinearidade realizada pelo SPA-LDA resulta de uma seqüência de operações de projeções de vetores aplicadas às colunas da Matriz de treinamento (Kc, J). Contudo, antes mesmo de realizar tal procedimento, os objetos pertencentes a este conjunto são centralizados na média da sua própria classe. Então, torna-se necessário o uso dos índices de classes. Considera-se que as respostas instrumentais (x) referentes ao conjunto de treinamento estejam em uma matriz X de dimensões (Kc × J), de forma que a j - ésima variável x j esteja associada ao j-ésimo vetor coluna x j ∈ R Kc . Sejam M = min (Kc – C, J) o número máximo de variáveis que podem ser incluídas no modelo LDA e C é o número de classes envolvidas no problema. Partindo de cada variável x j , j = 1,....,J, uma cadeia contendo M variáveis é construída de acordo com as seguintes operações [85] : • Passo 1: Início z 1 = x j (vetor que define as operações de projeção inicial) 1 x k = x k , k = 1,...,J L (1, j) = j • Passo 2: Cálculo da matriz P i de projeção no subespaço ortogonal a z i : P i i i T z (z ) I − i T i (z ) z onde I é uma matriz identidade de dimensões apropriadas. = (2.24) • Passo 3: Cálculo dos vetores projetados x a partir de: i +1 k para k = 1, …, J. i+1 k i x = P x i k (2.25) • Passo 4: Determinar o índice k* do vetor de maior projeção e armazená-lo na matriz L. k * = arg max || x || (2.26) k= 1,..., J i+ 1 k 30
Page 1 and 2: Universidade Federal da Paraíba Ce
Page 3: P814a Pontes, Márcio José Coelho
Page 6 and 7: Agradecimentos • A Deus; • A to
Page 8 and 9: Sumário Lista de Figuras..........
Page 10 and 11: 6.4. Objetivos ....................
Page 12 and 13: Figura 3.10. Espectro médio para c
Page 14 and 15: Figura 6.10. Espectro médio da cla
Page 16 and 17: Tabela 5.2. Número de amostras de
Page 18 and 19: Resumo Neste trabalho, o Algoritmo
Page 20 and 21: Publicações decorrentes do trabal
Page 22 and 23: Capítulo I. Introdução 1. INTROD
Page 24 and 25: Capítulo I. Introdução Tabela 1.
Page 26 and 27: Capítulo I. Introdução seja, as
Page 28 and 29: Capítulo I. Introdução Técnicas
Page 30 and 31: Capítulo I. Introdução Candolfi
Page 32 and 33: Capítulo I. Introdução técnicas
Page 34 and 35: Capítulo I. Introdução foram uti
Page 36 and 37: Capítulo I. Introdução 1.4. Obje
Page 38 and 39: Capítulo II. Fundamentação Teór
Page 54 and 55: CAPÍTULO III CLASSIFICAÇÃO DE Ó
Page 56 and 57: Capítulo III. Classificação de
Page 72 and 73: Capítulo IV. Classificação de ó
Page 86 and 87: Capítulo V. Classificação de caf
Page 100 and 101:
Capítulo VI. Classificação de so
Page 102 and 103:
Page 104 and 105:
Page 106 and 107:
Page 108 and 109:
Page 110 and 111:
Page 112 and 113:
Page 114 and 115:
Page 116 and 117:
Page 118 and 119:
CAPÍTULO VII CONCLUSÕES
Page 120 and 121:
Capítulo VII. Conclusões 7.1. Pro
Page 122 and 123:
Referências Bibliográficas direta
Page 124 and 125:
Referências Bibliográficas Assess
Page 126 and 127:
Referências Bibliográficas [44] B
Page 128 and 129:
Referências Bibliográficas [61] S
Page 130 and 131:
Page 132 and 133:
Page 134 and 135:
Referências Bibliográficas [112]
Page 136 and 137:
Referências Bibliográficas [129]
Page 138 and 139:
Anexos O código-fonte do programa
Page 140 and 141:
Anexos end save(filename,'L') else
Page 142 and 143:
Anexos Programas Auxiliares do SPA-
Page 144:
Anexos Programas Auxiliares do SPA-
show all

Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ

Create successful ePaper yourself

Delete template?

Save as template?