Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ

More documents

Recommendations

Info

Capítulo II. Fundamentação Teórica número de variáveis, i e j representam os índices das amostras e variáveis, respectivamente. Um teste F é, então, utilizado para verificar a localização da amostra em relação ao(s) modelo(s). Compara-se o valor obtido pela Equação 2.12 (F cal ) com um valor crítico (F crit ) que pode ser obtido empiricamente ou tabelado para um determinado nível de confiança e graus de liberdade. Se a amostra sob investigação apresentar um valor de F cal menor do que o obtido pelo F crit , a mesma pertencerá à classe em consideração. c 2 ( Si ) Nc F cal = . (2.12) c 2 ( S ) N − A −1 o c c É importante ressaltar que dois tipos de erros podem ser apresentados em uma classificação SIMCA: • Tipo I: a amostra não é classificada em sua classe verdadeira; • Tipo II: a amostra é classificada em uma classe errada. Portanto, uma mesma amostra poderá não ser classificada na sua classe verdadeira e ser ou não classificada em outra(s) classe(s). 2.4. LDA Na LDA, a variável latente (Função Discriminante) é obtida através de uma combinação linear das variáveis originais. Quando um estudo de classificação apresentar c classes de amostras, c – 1 funções discriminantes poderão ser determinadas se o número de variáveis for maior do que c [7] . O processo de classificação da LDA está associado ao conceito da distância de Mahalanobis [5,45] , que pode ser definida da seguinte forma: Seja x = [x 1 x 2 ... x p ] T um objeto que deve pertencer a uma das c classes possíveis. Em caso de dados espectrométricos, as variáveis de classificação x 1 , x 2 , ... x p podem corresponder, por exemplo, às medidas de absorbância realizadas em p comprimentos de ondas. O quadrado da distância de Mahalanobis r 2 (x,μ j ) entre x e o centro da j-ésima classe (j = 1, 2, ..., c) é definido conforme a Equação 2.13. r 2 ( x, μ j ) = ( x − μ j t ) . ∑ −1 j .( x − μ j ) (2.13) 21
Capítulo II. Fundamentação Teórica onde μ j (p × 1) e ∑ j (p × p) são, respectivamente, o vetor-média e a matriz de covariância para a classe j [45] . Se os valores da média e covariância são desconhecidos (o que usualmente acontece), estimativas m j e S j podem ser empregadas no lugar de μ j e ∑ j , respectivamente. Tais estimativas podem ser obtidas a partir de um conjunto de treinamento com objetos de classificação conhecida [5] . É importante salientar que a LDA estima uma única matriz de covariância conjunta S, em vez de utilizar uma estimativa separada para cada classe. Este procedimento simplifica o modelo de classificação e resulta em superfícies de decisão lineares no p R [5, 27, 45, 82] . Com esta modificação, o quadrado da distância de Mahalanobis entre o objeto x e o centro da j-ésima classe é calculado a partir da Equação 2.14. 2 t −1 r x, m ) = ( x − m ) . S .( x − m ) (2.14) ( j j j O objeto x é, então, atribuído à classe j para a qual r 2 (x,m j ) tiver o menor valor. Com intuito de se ter um problema bem condicionado, o número de amostras deverá ser maior do que o número p de variáveis a serem incluídas no modelo LDA. Caso contrário, a matriz de covariância estimada S será singular, o que inviabiliza o cálculo da matriz inversa na Equação 2.14. Portanto, o uso da LDA em dados espectrométricos depende, quase que totalmente, de procedimentos de seleção de variáveis. 2.5. Seleção de variáveis Vários autores têm procurado definir seleção de variáveis baseado em diferentes critérios [83] . Três definições são apresentadas abaixo: 1. Clássica: Seleciona um subconjunto de M variáveis provenientes de um conjunto de N variáveis (M < N). Neste caso, uma função de custo é empregada para otimização. 2. Desempenho preditivo: seleciona subconjuntos de variáveis para melhorar ou não diminuir significativamente a habilidade preditiva dos modelos. 3. Aproximação da distribuição das classes originais: seleciona um subconjunto pequeno de variáveis de modo que a distribuição da classe resultante seja a mais próxima possível da distribuição da classe original que emprega todas as variáveis. 22
Page 1 and 2: Universidade Federal da Paraíba Ce
Page 3: P814a Pontes, Márcio José Coelho
Page 6 and 7: Agradecimentos • A Deus; • A to
Page 8 and 9: Sumário Lista de Figuras..........
Page 10 and 11: 6.4. Objetivos ....................
Page 12 and 13: Figura 3.10. Espectro médio para c
Page 14 and 15: Figura 6.10. Espectro médio da cla
Page 16 and 17: Tabela 5.2. Número de amostras de
Page 18 and 19: Resumo Neste trabalho, o Algoritmo
Page 20 and 21: Publicações decorrentes do trabal
Page 22 and 23: Capítulo I. Introdução 1. INTROD
Page 24 and 25: Capítulo I. Introdução Tabela 1.
Page 26 and 27: Capítulo I. Introdução seja, as
Page 28 and 29: Capítulo I. Introdução Técnicas
Page 30 and 31: Capítulo I. Introdução Candolfi
Page 32 and 33: Capítulo I. Introdução técnicas
Page 34 and 35: Capítulo I. Introdução foram uti
Page 36 and 37: Capítulo I. Introdução 1.4. Obje
Page 38 and 39: Capítulo II. Fundamentação Teór
Page 54 and 55: CAPÍTULO III CLASSIFICAÇÃO DE Ó
Page 56 and 57: Capítulo III. Classificação de
Page 72 and 73: Capítulo IV. Classificação de ó
Page 86 and 87: Capítulo V. Classificação de caf
Page 92 and 93:
Capítulo V. Classificação de caf
Page 94 and 95:
Page 96 and 97:
Page 98 and 99:
Page 100 and 101:
Capítulo VI. Classificação de so
Page 102 and 103:
Page 104 and 105:
Page 106 and 107:
Page 108 and 109:
Page 110 and 111:
Page 112 and 113:
Page 114 and 115:
Page 116 and 117:
Page 118 and 119:
CAPÍTULO VII CONCLUSÕES
Page 120 and 121:
Capítulo VII. Conclusões 7.1. Pro
Page 122 and 123:
Referências Bibliográficas direta
Page 124 and 125:
Referências Bibliográficas Assess
Page 126 and 127:
Referências Bibliográficas [44] B
Page 128 and 129:
Referências Bibliográficas [61] S
Page 130 and 131:
Page 132 and 133:
Page 134 and 135:
Referências Bibliográficas [112]
Page 136 and 137:
Referências Bibliográficas [129]
Page 138 and 139:
Anexos O código-fonte do programa
Page 140 and 141:
Anexos end save(filename,'L') else
Page 142 and 143:
Anexos Programas Auxiliares do SPA-
Page 144:
Anexos Programas Auxiliares do SPA-
show all

Algoritmo das Projeções Sucessivas Para Seleção de ... - PPGQ

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?