783.5 REDUÇÃO DO NÚMERO DE VARIÁVEIS AOS COM-PONENTES PRINCIPAISA análise de componentes principais – ACP é amplamente utilizada em pesquisas emais recentemente, vem sen<strong>do</strong> aplicada a conjuntos de variáveis com da<strong>do</strong>s autocorrelaciona<strong>do</strong>sem modelos geoestatísticos.Este tipo de análise estatística de da<strong>do</strong>s tem a finalidade de transformar linearmentevariáveis correlacionadas em seus componentes principais não correlaciona<strong>do</strong>s e organizar essescomponentes em ordem decrescente de suas variâncias. A idéia é reduzir a quantidade de da<strong>do</strong>saos componentes que retêm a maior parte da variância total <strong>do</strong> conjunto de variáveis. Deve-seaqui atentar para o fato de que, na presença de valores discrepantes (outliers) a variabilidade<strong>do</strong>s da<strong>do</strong>s poderá ser comprometida, alteran<strong>do</strong> o papel da variável porta<strong>do</strong>ra desses valores noprocesso de análise <strong>do</strong>s componentes <strong>do</strong> conjunto. Para processos gaussianos, os componentesescolhi<strong>do</strong>s podem ser ti<strong>do</strong>s como fatores.Seja Y = (Y 1 ,Y 2 ,...,Y p ) um processo estocástico p-dimensional onde cada variável Y k(k = 1,2,..., p) segue o modelo defini<strong>do</strong> pela Equação 2.3. É importante explicar a estruturade covariância desse processo para a redução de seu número de variáveis devi<strong>do</strong> a redundânciasou de uma interpretação correlacional (JOHNSON; WICHERN, 1992). Esse tipo de análise deda<strong>do</strong>s é ti<strong>do</strong> como um processo intermediário para investigações mais amplas como regressãomúltipla ou análise de agrupamentos.Considera-se o vetor Y e a partir dele, constrói-se a matriz de covariânciasΣ = E ( (Y − µ)(Y − µ) ′)sen<strong>do</strong> µ = (µ 1 , µ 2 ,..., µ p ) ′ o vetor das médias relativas a cada variável <strong>do</strong> vetor Y. Já os elementosda matriz de covariâncias amostrais são:s kk ′ = 1n − 1ou, em forma matricial, S = (n − 1) −1 (Y −Ȳ)(Y −Ȳ) ′ .n∑(y ik − ȳ k )(y ik ′ − ȳ k ′) k,k ′ = 1,2,..., p. (3.13)i=iDecompon<strong>do</strong>-se a matriz de covariâncias obtém-se os p pares de autovalores e autovetoresassocia<strong>do</strong>s (λ k ;e k ), tais que λ 1 ≥ λ 2 ≥ ... ≥ λ p .Para Kolman (1997) sen<strong>do</strong> Y um conjunto de vetores em um mesmo espaço vetorial,
79então um outro vetor Cp, nesse mesmo espaço vetorial será uma combinação linear <strong>do</strong>s vetoresde Y se existirem números reais a 1 ,...,a p tais que Cp = a 1 Y 1 ,a 2 Y 2 ,...a p Y p . Assim, segun<strong>do</strong>Reis (1997), pode-se escrever o vetor Y como uma combinação de seus elementos como:Cp 1 = a 11 Y 1 + a 12 Y 2 +...+a 1p Y pCp 2 = a 21 Y 1 + a 22 Y 2 +...+a 2p Y p.Cp p = a p1 Y 1 + a p2 Y 2 +...+a pp Y psen<strong>do</strong> Cp k a k-ésima componente principal (não correlacionada) cuja variância seja a maiorpossível, ou seja:• Var(Cp k ) = e ′ k Σe k = λ k ;• Cov(Cp j ;Cp k ) = e ′ j Σe k = 0 j ≠ k;p∑• Var(Y i ) =k=1p∑Var(Cp i ) = λ 1 + λ 2 +...+λ p .k=1A porcentagem de contribuição de cada componente é determinada como:⎛%CCp k = λ k⎝p∑j=1⎞−1λ j⎠ . (3.<strong>14</strong>)Desta forma, aquelas primeiras m variáveis Y k que acumularem maior porcentagem,poderão ser substituídas pelas m componentes principais, reduzin<strong>do</strong> assim, o número devariáveis sem grande perda na variabilidade <strong>do</strong> processo.Segun<strong>do</strong> Johnson e Wichern (1992) o coeficiente de correlação entre as componentese as variáveis primárias Y k é da<strong>do</strong> por:√λi√λiρ(Cp i ;Y k ) = e ik√ = e ikonde i;k = 1,2,..., p.VarYk σ iiApesar da correlação entre as p variáveis e seus componentes principais ajudar a interpretaro papel <strong>do</strong>s componentes, esta mede somente a contribuição univariada de um particularY k para formar a componente Cp k e não a sua importância na presença das demais. Quan<strong>do</strong>as variáveis Y k forem processos medi<strong>do</strong>s em escalas diferentes, recomenda-se utilizar a suapadronização para que possam ser comparáveis. O processo de seleção de componentes principaisa partir de variáveis padronizadas Z k se dá a partir da matriz de correlações R obtida
- Page 4:
A meus filhos, Denise e André e a
- Page 8 and 9:
4 CONCLUSÕES E SUGESTÕES DE TRABA
- Page 10 and 11:
direita ilustra também o comportam
- Page 12 and 13:
Figura 2.21 Distribuição a poster
- Page 14 and 15:
Lista de TabelasTabela 2.1Estatíst
- Page 16 and 17:
Lista de SiglasAPGPSSIGMVMVRACPCEPB
- Page 18 and 19:
A análise revelou a capacidade do
- Page 20 and 21:
deals with samples of small size.Ke
- Page 22 and 23:
2se dá na região Nordeste do Esta
- Page 24 and 25:
4reais, os fenômenos frequentement
- Page 26 and 27:
2 MODELO GEOESTATÍSTICO GAUSSIANOU
- Page 28 and 29:
8mente como Dβ é efeito espacial
- Page 30 and 31:
102.2.2 Componente determinísticoS
- Page 32 and 33:
12(a ′ ,b ′ ) = (a,b)(cos(ψA )
- Page 34 and 35:
14Para Tragmar, Yost e Uehara (1985
- Page 36 and 37:
162.4 TIPOS DE MODELO DE CORRELAÇ
- Page 38 and 39:
182.4.1 Função de correlação de
- Page 40 and 41:
20ρ(h) − Esferica0.0 0.2 0.4 0.6
- Page 42 and 43:
22Como solução dessas equações
- Page 44 and 45:
24Ribeiro Jr (2007) dizem que esse
- Page 46 and 47:
26de amostras coletadas com espaça
- Page 48 and 49: 28Agora substituindo σ 2 R+τ 2 I
- Page 50 and 51: 30[(l(φ,ν 2 ) = − 1 (Y − Dβ)
- Page 52 and 53: 32Segundo Perry e Iemma (1999) os e
- Page 54 and 55: 34variância do erro. Em uma coorde
- Page 56 and 57: 36origem, todavia o conhecido Teore
- Page 58 and 59: 38O modelo geoestatístico dado pel
- Page 60 and 61: 40Se forem conhecidos os parâmetro
- Page 62 and 63: 42então:[β;|Y(x);φ]∼ tnσ +n(
- Page 64 and 65: 44σ 2 r ′ (φ)R −1 (φ) r(φ)
- Page 66 and 67: 46d) Predição com incerteza nos p
- Page 68 and 69: 48região do patamar oriental da Ba
- Page 70 and 71: 50Figura 2.11: Localização das am
- Page 72 and 73: 52do valor de referência de 2,75 t
- Page 74 and 75: 54amostrais têm dimensão 5 × 5 m
- Page 76 and 77: 56os resultados obtidos por MV mas
- Page 78 and 79: 58256 amostras128 amostras64 amostr
- Page 80 and 81: 60Figura 2.19: Localização das am
- Page 82 and 83: 62Estatísticas descritivas da pred
- Page 84 and 85: 642.8.5 Conclusões sobre o método
- Page 86 and 87: 66suporte da ACP para a redução d
- Page 88 and 89: 68três ecossistemas. Efetuaram uma
- Page 90 and 91: 70 (y 2,1 )• x 4• x 1(y 1,1 )(
- Page 92 and 93: 72Figura 3.2: Grid regular com loca
- Page 94 and 95: 74observações y 1 (x i ) e y 2 (x
- Page 96 and 97: 76O método de cokrigagem poderá s
- Page 100 and 101: 80como:R =( )V − 21 −1 (Σ V 2)
- Page 102 and 103: 82ou a componente representante de
- Page 104 and 105: 84secundária apresentada no caso a
- Page 106 and 107: 86t ha −1 obtida de fato na área
- Page 108 and 109: 883.6.5 Conclusões sobre o método
- Page 110 and 111: 90• Comparar diferentes formulaç
- Page 112 and 113: 92CRESSIE, N. Fitting variogram mod
- Page 114 and 115: 94PEBESMA, E. J.; WESSELING, C. G.
- Page 116 and 117: ANEXO A -- Figuras: Validação Cru
- Page 118 and 119: 98data1.5 3.01.5 3.0predicted0.0 0.
- Page 120 and 121: ANEXO B -- Código fonte R das aná
- Page 122 and 123: 102}45 }}## −−−−−−−
- Page 124 and 125: 104## Dados256 $SB ,## Dados256 $ i
- Page 126 and 127: 106## summary ( Soja256 . geo )## r
- Page 128 and 129: 108285 #### −−−−−−−
- Page 130 and 131: 110375 ##par ( mfcol =c ( 5 , 2 ) ,
- Page 132 and 133: 112##summary ( Soja64S .KC$ p r e d
- Page 134 and 135: 114t i t l e ( main="256 amostras"
- Page 136 and 137: 116par ( mfrow=c ( 1 , 2 ) , mar=c
- Page 138 and 139: 118Listagem B.2: Análise univariad
- Page 140 and 141: 12080 sd ( IMA18$ARG1)sd ( IMA18$AR
- Page 142 and 143: 122##165 ## D e f i n i n d o o mod
- Page 144 and 145: 124## −−−−−−−−−
- Page 146 and 147: 126## −−−−−−−−−
- Page 148 and 149:
128130 ###### iConeiCone150S . geo
- Page 150 and 151:
130round ( prop . t a b l e ( t a b
- Page 152 and 153:
132## F I M## −−−−−−−
- Page 154 and 155:
13445 ####IMA18