10.07.2015 Views

14 - PPGMNE - Universidade Federal do Paraná

14 - PPGMNE - Universidade Federal do Paraná

14 - PPGMNE - Universidade Federal do Paraná

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

A meus filhos, Denise e André e a minha querida esposaMaria Elizabeth.ii


SumárioLista de Figuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .viiLista de Tabelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .xiiLista de Siglas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .xivResumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .xvAbstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xvii1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 MODELO GEOESTATÍSTICO GAUSSIANO UNIVARIADO. . . . . . . . . . . . . . . . . . . 62.1 GEOMETRIA DO ESPAÇO GEOESTATÍSTICO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.2 COMPONENTES DO MODELO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82.2.1 Componente mensurável . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82.2.2 Componente determinístico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102.2.3 Componente <strong>do</strong> processo gaussiano correlaciona<strong>do</strong> . . . . . . . . . . . . . . . . . . . . . . . . . . 112.3 COVARIÂNCIA E VARIOGRAMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122.4 TIPOS DE MODELO DE CORRELAÇÃO ESPACIAL . . . . . . . . . . . . . . . . . . . . . . . . 162.4.1 Função de correlação de Matèrn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182.4.2 Função de correlação da Família Esférica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182.4.3 Função de correlação da Família “Potência” de ordem κ . . . . . . . . . . . . . . . . . . . . . . 192.5 ESTIMAÇÃO DE PARÂMETROS DO MODELO . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202.5.1 Modelagem e estimação de parâmetros de tendência não-estacionária . . . . . . . . . . . 20iv


4 CONCLUSÕES E SUGESTÕES DE TRABALHOS FUTUROS . . . . . . . . . . . . . . . . . 89Referências Bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91Anexo A -- Figuras: Validação Cruzada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96Anexo B -- Código fonte R das análises estatísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100vi


Lista de FigurasFigura 2.1Comportamento padrão da função semivariância. Os elementos principais quea compõem são: o alcance prático proporcional a φ, a variância de pequenaescala ou efeito pepita τ 2 e a contribuição σ 2 que corresponde à diferençaentre o patamar e τ 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13Figura 2.2Etapas da transformação da função de correlação (linha contínua) para a funçãosemivariograma (linha tracejada). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15Figura 2.3O gráfico da esquerda corresponde ao comportamento da função de correlaçãopoder de ordem 1 (exp(−u)) onde a função no ponto u = 0 não é diferenciável.O da direita corresponde a mesma função de correlação exponencial “poder”de ordem 2 (exp(−u 2 )), diferenciável em u = 0. . . . . . . . . . . . . . . . . . . . . . . . . . 16Figura 2.4 O gráfico da esquerda representa um processo de variações abruptas ao longode uma transecção unidimensional, associada a uma função de correlação nãodiferenciável.O da direita mostra um processo com variações mais suaves aolongo da mesma transecção, mas associada a uma função de correlação duasvezes diferenciável. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17Figura 2.5 Comportamento da função de correlação de Matèrn com o parâmetro φ = 0,25fixo e diferentes valores para o parâmetro de diferenciabilidade κ (esquerda).Na mesma figura, para um mesmo valor de κ = 0.5, variou-se o parâmetro φque controla a taxa de decaimento da função (direita). . . . . . . . . . . . . . . . . . . . 19Figura 2.6O gráfico da esquerda mostra uma função de correlação esférica com oparâmetro φ = 0,6. O gráfico <strong>do</strong> centro ilustra o comportamento de umafunção de correlação exponencial de ordem κ = 1 e φ = 0,2. O gráfico davii


direita ilustra também o comportamento de uma função de correlação exponencialde ordem κ = 2 e φ = 0,35, equivalente à função Gaussiana. . . . . . . 20Figura 2.7Variograma empírico de concentração de cálcio em uma área com 178 pontosamostrais, em da<strong>do</strong>s de pesquisa de Oliveira (2003). . . . . . . . . . . . . . . . . . . . . . 23Figura 2.8Ilustração geométrica da obtenção de um par de pontos <strong>do</strong> variograma empirico.d α representa a distância de um ponto separa<strong>do</strong> de outro por uma distância uaté a reta bissetriz de um diagrama de dispersão u-scaterplot. . . . . . . . . . . . . . 25Figura 2.9Variograma empírico agrupa<strong>do</strong> em classes (“bina<strong>do</strong>”) de concentração de cálcioem área com 178 pontos amostrais, em da<strong>do</strong>s de pesquisa de Oliveira (2003). 25Figura 2.10 Esquema de mostragem com locação das parcelas e pontos amostrais em sistemadesalinha<strong>do</strong>, sistemático estratifica<strong>do</strong> porposto por Wollenhaupt e Wolkowski(1994) e adapta<strong>do</strong>s por Souza et al. (1999). . . . . . . . . . . . . . . . . . . . . . . 47Figura 2.11 Localização das amostras na área de cultivo. Os delineamentos amostrais comportam,da esquerda para a direita, 256 pontos origalmente estrutura<strong>do</strong>s pelosistema sistemático desalinha<strong>do</strong> estratifica<strong>do</strong>, 128 e 64 pontos sortea<strong>do</strong>s <strong>do</strong>s256 pontos originais. O eixo horizontal corresponde a distância total de <strong>14</strong>1,2m e o eixo vertical 115,2 m. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50Figura 2.12 Perfil <strong>do</strong> log-verossimilhança para o parâmetro λ de transformação de Box-Cox. Intervalo de 95% de confiança que contenha o valor unitário implica emnormalidade da distribuição <strong>do</strong>s da<strong>do</strong>s. Da esquerda para a direita as figurasrepresentam o log da função de verossimilhança para o parâmetro λ comrelação aos delineamentos amostrais de soja em 256 pontos estrutura<strong>do</strong>s, 128e 64 pontos sortea<strong>do</strong>s. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50Figura 2.13 Gráfico de padrões de intensidade por parcela colhida classifica<strong>do</strong> pelos quantisde produtividade 20, 40, 60 e 80%. A largura da figura corresponde a umadistância de <strong>14</strong>1,2 m e a altura 115,2 m. Cada retângulo corresponde a umaviii


área de 25 m 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53Figura 2.<strong>14</strong> Mapas de produtividade de soja estima<strong>do</strong>s por krigagem convencional a partirde modelo ajusta<strong>do</strong> por MV, em uma malha regular de 690 pontos a partirde 256 (esquerda), 128 (centro) e 64 (direita) pontos amostrais. Os pontosbrancos correspondem às produtividades abaixo de 2,34 t ha −1 e os pontospretos às produtividades acima de 3,16 t ha −1 . Os pontos em escalas cinzacorrespondem às produtividades intermediárias. . . . . . . . . . . . . . . . . . . . . . . . . . 54Figura 2.15 Distribuição a posteriori para os parâmetros β e σ 2 com 50 níveis de φ e 1.000aproximações numéricas a partir de um grupo de 256 amostras. . . . . . . . . . . . 56Figura 2.16 Distribuição a posteriori para os parâmetros β e σ 2 com 50 níveis de φ e 1.000aproximações numéricas a partir de um grupo de 128 amostras. . . . . . . . . . . . 57Figura 2.17 Distribuição a posteriori para os parâmetros β e σ 2 com 50 níveis de φ e 1.000aproximações numéricas a partir de um grupo de 64 amostras. . . . . . . . . . . . . 57Figura 2.18 Mapas de produtividade de soja estima<strong>do</strong>s por inferência bayesiana em umamalha regular de 690 pontos com base em 256 (esquerda) 128 (centro) e 64(direita) pontos amostrais. Em cada mapa a largura corresponde a <strong>14</strong>1,2 m ea altura 115,2 m. Os pontos brancos correspondem às produtividades abaixode 2,4075 t ha −1 , os cinza às produtividades entre 2,4075 e 3,045 t ha −1 e ospretos ‘as produtividades acima de 3,045 t ha −1 . . . . . . . . . . . . . . . . . . . . . . . . . 58Figura 2.19 Localização das amostras na área de reflorestamento da fazenda MOBASA emRio Pedrinho-SC. Os 18 pontos amostrais na figura à esquerda representam ascoordenadas de da<strong>do</strong>s de análises físicas e químicas e os 555 pontos na figuraà direita representam as análises físicas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60Figura 2.20 Perfil <strong>do</strong> log-verossimilhança para o parâmetro λ de transformação de Box-Coxda variável IMA. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61ix


Figura 2.21 Distribuição a posteriori para os parâmetros β, σ 2 e φ a partir de 1.000aproximações numéricas da variável IMA tomada em 18 pontos amostrais . 61Figura 2.22 Mapa de predição de IMA com 18 amostras, classificada pelos quartis. A figurada esquerda foi obtida por krigagem convencional e a da direita por prediçãobayesiana. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63Figura 3.1 Representação de uma área típica com processos geoestatísticos bivaria<strong>do</strong>s conten<strong>do</strong>quatro localizações amostrais, onde as variáveis não são co-localizadase nem oferecem o mesmo número de observações. . . . . . . . . . . . . . . . . . . . . . . . 70Figura 3.2Grid regular com locação amostral de duas variáveis com círculos representan<strong>do</strong>a primeira e estrelas a segunda. As setas estabelecem a direção dascorrelações e os h, através de seus índices indicam o grupo de correlações entrevariáveis separadas por uma mesma distância. . . . . . . . . . . . . . . . . . . . . . . . . 72Figura 3.3 Mapas de produtividade de soja em modelos bivaria<strong>do</strong>s em uma malha regular de 690pontos. No modelo <strong>do</strong> mapa da esquerda utilizou-se 128 amostras de soja e no dadireita, 64. A variável secundária foi 150 amostras de iCone . . . . . . . . . . . . . . . . . . 85Figura 3.4 Mapas de produtividade de soja estima<strong>do</strong>s por MV em modelos bivaria<strong>do</strong>s em uma malharegular de 690 pontos. No modelo <strong>do</strong> mapa da esquerda utilizou-se 128 amostrasde soja e no da direita, 64. A variável secundária foi 150 amostras da CP1 . . . . . . . 86Figura 3.5Mapa de predição de IMA classificada pelos quartis, usan<strong>do</strong> krigagem convencionale Teor de Argila como variável secundária no modelo bivaria<strong>do</strong>. . . . . 87Figura A.1 Erros de predição por Validação cruzada. Predição nas mesmas coordenadas damalha de da<strong>do</strong>s de estimação <strong>do</strong> modelo com a estratégia de retirar um pontopor vez e estimá-lo com o modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97x


Figura A.2 Erros de predição por Validação cruzada. Predição em 128 coordenadas externasà malha de da<strong>do</strong>s de estimação <strong>do</strong> modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . 98Figura A.3 Erros de predição por Validação cruzada. Predição em 192 coordenadas externasà malha de da<strong>do</strong>s de estimação <strong>do</strong> modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . 99xi


Lista de TabelasTabela 2.1Estatística descritiva da variável soja medida em 256 pontos estrutura<strong>do</strong>s(Soja256), 128 e 64 pontos sortea<strong>do</strong>s (Soja128 e Soja64, respectivamente)dentre os 256 pontos originais disponíveis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51Tabela 2.2Estatísticas descritivas das variáveis secundárias P, pH, K, MO, SB e iCone,todas tomadas nos mesmos 150 pontos aleatórios, seleciona<strong>do</strong>s <strong>do</strong>s 256 disponíveis.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51Tabela 2.3 Estimação <strong>do</strong>s parâmetros <strong>do</strong> modelo geoestatístico por MV. . . . . . . . . . . . . . . 52Tabela 2.4 Estimação <strong>do</strong>s parâmetros <strong>do</strong> modelo geoestatístico pelo méto<strong>do</strong> MVR. . . . . 52Tabela 2.5 Estatística descritiva das predições por krigagem convencional da produtividadede soja medida em uma malha de 690 pontos, com base em amostras de 256,128 e 64 pontos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55Tabela 2.6 Porcentagem <strong>do</strong>s pontos estima<strong>do</strong>s por méto<strong>do</strong> de krigagem com modelo univaria<strong>do</strong>,incidentes em cada intervalo de classificação, segun<strong>do</strong> três tipos deamostragem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55Tabela 2.7 Média da posteriori <strong>do</strong>s parâmetros <strong>do</strong> modelo geoestatístico obti<strong>do</strong> por inferênciabayesiana. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56Tabela 2.8 Estatísticas descritivas das predições bayesianas da produtividade de soja medidaem uma malha de 1.131 pontos, com base em amostras de 256 pontosestrutura<strong>do</strong>s (Soja256), 128 e 64 pontos aleatórios (Soja128 e Soja64, respecxii


tivamente) toma<strong>do</strong>s <strong>do</strong>s 256 disponíveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58Tabela 2.9 Porcentagem <strong>do</strong>s pontos estima<strong>do</strong>s por méto<strong>do</strong> bayesiano com modelo univaria<strong>do</strong>,incidentes em cada intervalo de classificação, segun<strong>do</strong> três tipos deamostragem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59Tabela 2.10 Estatísticas descritivas das amostras de IMA em 18 localizações e de Teor deArgila em 18 e 555 localizações. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60Tabela 2.11 Parâmetros <strong>do</strong> modelo geoestatístico estima<strong>do</strong> por MV e inferência bayesiana.O modelo de função de correlação usa<strong>do</strong> foi o de Matèrn com parâmetro dediferenciabilidade κ = 0,5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61Tabela 2.12 Estatísticas descritivas das predições <strong>do</strong> IMA através da krigagem convencionale por estimativa bayesiana. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62Tabela 2.13 Porcentagem <strong>do</strong>s pontos estima<strong>do</strong>s de IMA por méto<strong>do</strong> bayesiano com modelounivaria<strong>do</strong>, incidentes em cada intervalo de classificação. . . . . . . . . . . . . . . . . 62Tabela 3.1 Parâmetros estima<strong>do</strong>s para os modelos geoestatísticos bivaria<strong>do</strong>s por MV. . . 83Tabela 3.2 Estatísticas descritivas das predições da produtividade de soja medida em 128e 64 pontos aleatórios condicionadas às observações de iCone e da CP1 epredições de IMA condicionadas a 555 observações de Teor de Argila. . . . 84Tabela 3.3Porcentagem <strong>do</strong>s pontos estima<strong>do</strong>s com modelo bivaria<strong>do</strong>, incidentes nos respectivosintervalo de classificação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84xiii


Lista de SiglasAPGPSSIGMVMVRACPCEPBLUENITUnioesteAgricultura de PrecisãoGlobal Positioning SystemSistema de Informações GeográficasMáximo <strong>do</strong> logarítmo da função de verossimilhançaMáxima verossimilhança restritaAnálise de Componentes PrincipaisCoeficiente de efeito pepitaBest Linear Unbiased EstimatorNúcleo de Inovações Tecnológicas<strong>Universidade</strong> Estadual <strong>do</strong> Oeste <strong>do</strong> ParanáCOODETEC Cooperativa Central Agropecuária de Desenvolvimento Tecnológico eEconômico LtdaUFPrMOBASAUTMGPLGNUIBGECONABCV<strong>Universidade</strong> <strong>Federal</strong> <strong>do</strong> ParanáMo<strong>do</strong> Battistella Reflorestamento S/AUniversal Transverse MercatorGeneral Public LicenceGNU Operating SystemInstituto Brasileiro de Geografia e EstatísticaCompanhia Nacional de AbastecimentoCoeficiente de Variaçãoxiv


ResumoOs grãos são comodities de grande importância internacional, amplamente negociadasentre importa<strong>do</strong>res e exporta<strong>do</strong>res. A madeira é fundamental nas atividades industriais<strong>do</strong> Brasil, seja como insumo, seja como gera<strong>do</strong>ra de energia. Neste início de milênio, soja,cana-de-açúcar, milho e madeira têm ocupa<strong>do</strong> espaço na substituição da produção de energia deorigem petroquímica e consequentemente tem aumenta<strong>do</strong> sua demanda pela competição com aprodução de alimentos.Além da expansão de fronteiras agrícolas, novas tecnologias têm surgi<strong>do</strong> para dar suporteao aumento da produtividade, viabilidade econômica e preservação <strong>do</strong> habitat.Novos conceitos vão sen<strong>do</strong> estabeleci<strong>do</strong>s e a agricultura de precisão é um <strong>do</strong>s que maisse desenvolve. Ela propõe a identificação e o manejo de zonas agrícolas de característica uniforme,onde se pode dar um tratamento mais específico, evitan<strong>do</strong>-se, por exemplo, sub<strong>do</strong>sagensou super<strong>do</strong>sagens de insumos. Na identificação dessas zonas de manejo, os mapas temáticostêm função de destaque. Sua elaboração requer meto<strong>do</strong>logias próprias onde a geoestatísticatem cumpri<strong>do</strong> seu papel. Muitos estu<strong>do</strong>s são realiza<strong>do</strong>s e importantes resulta<strong>do</strong>s têm leva<strong>do</strong> amapas que expressam, com qualidade, a distribuição espacial <strong>do</strong>s valores das variáveis georreferenciadas.Nas pesquisas em que são aplica<strong>do</strong>s méto<strong>do</strong>s geoestatísticos é comum a coleta deum conjunto de variáveis que descrevem propriedades físicas, químicas e de produção e composição de coleta de da<strong>do</strong>s referenciadas espacialmente. Muitos trabalhos envolvem o estu<strong>do</strong>e elaboração de mapas de uma única variável por vez. Neste trabalho foram produzi<strong>do</strong>s mapasem um contexto multivaria<strong>do</strong>. Apesar das baixas correlações dessas variáveis reportadasna literatura, foi feita uma análise de componentes principais para a redução <strong>do</strong> conjunto devariáveis suporte à sua primeira componente, incorporan<strong>do</strong> sua informação de variabilidade espaciala outra variável de interesse principal, em uma estrutura bivariada de modelo, para qualse dispunha de recursos computacionais para resolver numericamente aplicações.A<strong>do</strong>tou-se uma formulação com base em modelos mistos. Seus parâmetros foramestima<strong>do</strong>s pela otimização de funções de verossimilhança e por simulação bayesiana para aobtenção de distribuições a posteriori. Com esses modelos foram deriva<strong>do</strong>s preditores marginaise condicionais, permitin<strong>do</strong>-se estimar valores em pontos de uma estrutura compatível coma apresentação em forma de mapa.Foram analisa<strong>do</strong>s da<strong>do</strong>s de <strong>do</strong>is problemas distintos em sua natureza. Em um <strong>do</strong>scasos os da<strong>do</strong>s reportavam variáveis de produtividade de soja associa<strong>do</strong>s a da<strong>do</strong>s físicos equímicos, distribuí<strong>do</strong>s em uma área de 1,74 ha cultivada em sistema de plantio direto. Nooutro, as variáveis representavam o incremento médio anual – IMA de Pinus taeda L. em áreade 2.252,11 ha de reflorestamento e dissociadamente da<strong>do</strong>s de teor de argila.xv


A análise revelou a capacidade <strong>do</strong> modelo bivaria<strong>do</strong> em explorar a informação espacialcontida nos da<strong>do</strong>s quan<strong>do</strong> as localizações das variáveis não eram as mesmas e a capacidade deidentificar zonas de regionalização onde o modelo univaria<strong>do</strong> não o fez, principalmente em setratan<strong>do</strong> de amostras pequenas da variável de interesse principal. A análise mostrou ainda queo méto<strong>do</strong> bayesiano, no caso univaria<strong>do</strong>, define melhor as zonas diferentes quan<strong>do</strong> se trata dedelineamentos com poucas amostras.Palavras-chave: Geoestatística multivariada, geoestatística bayesiana, verossimilhança, agriculturade precisão, inventário florestal.xvi


AbstractThe grains are great international importance comodities, widely negotiated betweenimporters and exporters. Already the wood is basic in the industrial activities of Brazil, eitheras manufactures material, either as generating of energy. In this beginning of milênio, soy bean,sugar cane, maize and wood have ocupaited space in the production of petrochemical energyand then it has increased its demand for the competition with the food production.Beyond the expansion of agricultural borders, new technologies arrived to increaseproductivity, to guarantee economic viability and preserve the habitat.New concepts go appearing and the Precision Farming is of that more it is developed.It propose the identification and the handling of uniform agricultural zones where it can give amore specific treatment, preventing for example, over<strong>do</strong>ses or sub<strong>do</strong>ses of chemical material.In the identification of these handling zones, the thematic maps have prominence function.Its elaboration requires proper metho<strong>do</strong>logies where the geostatistics fulfilled its paper. Manystudies are carried through and important resulted they have taken the maps that they express,with quality, the spatial behavior of the geographically marked variables.In the geostatistics research of agricultural problems with a set of variable that describephysical, chemical and production properties is common. Many works involve the study andelaboration of maps of one variable for each time. In this work it was produced maps in amultivariate context. Although the low correlations between agricultural variable was reportedin literature, was made analysis of main components for reduction of the set of variables toits first component, having incorporated its space variability information to another variable ofmain interest, in a bi variated structure of model, because computational resources availabilityfor numerical applications.A mixed model-based formularization was a<strong>do</strong>pted where its parameters had been estimatedby the optimization of likelihood functions and by Bayesian simulation. With thesemodels it was derived conditional and marginal predictors, allowing itself estimate values inlocalization where the structure was compatible with a map.In this work had been analyzed data from two distinct problems in its own nature.In one of the cases the data reported variable of soy productivity associates the physical andchemical data, distributed in a 1,74 ha area cultivated in system of direct plantation. In the other,the variable represented the Annual Average Increment of Pinus taeda L. in area of 2.252,11 haof reforestation and separately it Clay Concentration data.The analysis showed the capacity of the bivariate model, where the localizations ofthe variable were complementary, to identify zones where the univariate model didn’t make it,mainly in if treating to small samples of the variable of primary interest. The analysis showedthat the Bayesian method, in the univariate case, defines the different zones better when if itxvii


deals with samples of small size.Key-words: Multivariate Geostatistics, Bayesian Geostatistics, Likelihood, precision agriculture,forest inventory.xviii


1 INTRODUÇÃOA grande explosão demográfica que acompanha o desenvolvimento da espécie humanatem exigi<strong>do</strong> cada vez mais um significativo aumento na produção e distribuição de alimentos,pois saciar a fome é uma das necessidades mais primárias <strong>do</strong> ser humano. A atividade agrícolaatual, em geral, não tem consegui<strong>do</strong> oferecer alimentos em quantidade suficiente e simultaneamentepreservar o meio ambiente, além de ter que produzir combustíveis renováveis, devi<strong>do</strong>à escassez e ao dano provoca<strong>do</strong> por combustível de origem fóssil. Os resulta<strong>do</strong>s das pesquisascientíficas não atingem, em grande escala, a consciência <strong>do</strong> produtor rural, que em muitos casosé ávi<strong>do</strong> pelo lucro rápi<strong>do</strong> e sem riscos econômicos.É incorreto pensar que as fronteiras agrícolas se estabelecem nos limites de cada propriedaderural. O ecossistema é um ambiente altamente correlaciona<strong>do</strong> onde os recursos disponíveisem um local específico decorrem das transformações ao longo de milhares de anos deevolução e de desenvolvimento <strong>do</strong> globo terrestre. Uma propriedade rural não representa umsistema fecha<strong>do</strong>. Os insumos aplica<strong>do</strong>s tendem a se distribuir além de seus limites geográficos.Os recursos naturais demanda<strong>do</strong>s em um da<strong>do</strong> momento, sem controle ou critério, podem levarposteriormente à sua falta ou mesmo o esgotamento definitivo, não só naquela propriedade,como também em toda uma região. Se considerarmos os recursos naturais compartilha<strong>do</strong>s,como os recursos hídricos por exemplo, então um manejo isola<strong>do</strong> em uma propriedade poderáproduzir consequências danosas às outras propriedades ou mesmo ao meio-ambiente local.Tome-se como exemplo o Esta<strong>do</strong> <strong>do</strong> Paraná, que tem si<strong>do</strong> historicamente um grandeprodutor de grãos <strong>do</strong> Brasil, com grande potencial econômico e agrícola e uma localizaçãoprivilegiada em relação ao Merca<strong>do</strong> Comum <strong>do</strong> Sul - MERCOSUL. Sua região Oeste é responsávelpor aproximadamente um terço da produção de grãos <strong>do</strong> Esta<strong>do</strong>, ten<strong>do</strong> sua economiabaseada principalmente na produção de soja e trigo, com muitas propriedades disputan<strong>do</strong> simultaneamenteos recursos naturais da respectiva região. Outro exemplo na linha de agronegócios


2se dá na região Nordeste <strong>do</strong> Esta<strong>do</strong> de Santa Catarina, particularmente nos municípios de RioNegrinho e Doutor Pedrinho onde juntos dispõem de 232 indústrias ligadas ao setor madeireiro,abastecidas por grandes áreas de reflorestamento de pinus e eucalipto desenvolvidas na região,interferin<strong>do</strong> na economia e no meio-ambiente dessas duas cidades.Por outro la<strong>do</strong>, a globalização da economia e a grande demanda por mais alimentosexigem que a agricultura brasileira desenvolva tecnologias que possibilitem a competição denossos produtos no merca<strong>do</strong> mundial e um aumento de produtividade para atender o crescimentopopulacional. Esse aumento é normalmente controla<strong>do</strong> pelo aumento <strong>do</strong> uso <strong>do</strong>s insumosagrícolas. Estes insumos compreendem principalmente os insumos biológicos, insumosmecânicos, água e insumos químicos. O uso de insumos químicos tem si<strong>do</strong> identifica<strong>do</strong> como oprincipal fator de contaminação da água e <strong>do</strong> solo (BAKHSH et al., 1997). Deduz-se, portanto,que eles, ao mesmo tempo em que auxiliam no aumento da produtividade agrícola, apresentamgrande perigo para o solo e mananciais de água.Após o advento <strong>do</strong> plantio direto, revolucionan<strong>do</strong> o manejo agrícola com o desenvolvimentode novos equipamentos, oferecen<strong>do</strong> resulta<strong>do</strong>s importantes para o desempenho <strong>do</strong>cultivar e para o meio-ambiente, surge o conceito de Agricultura de Precisão (AP). Inicialmenteo objetivo era uniformizar manchas ou zonas de produção diferenciadas nivelan<strong>do</strong> áreaspelas altas produtividades. Acreditava-se que as operações de manejo ou semeadura em taxasvariáveis seria suficiente para uniformizar a produtividade no nível <strong>do</strong> rendimento máximopossível. A aplicação da AP nas propriedades agrícolas requeria o uso de tecnologias emergentesque fosse capaz de discriminar, a uma resolução refinada, a variabilidade espacial <strong>do</strong>sdiversos fatores associa<strong>do</strong>s à produção e orientar, com o auxílio de aparelhos <strong>do</strong>ta<strong>do</strong>s de um Sistemade Posicionamento Global, popularmente conheci<strong>do</strong> por GPS (acrônimo <strong>do</strong> inglês GlobalPositioning System), um sistema mecaniza<strong>do</strong> para aplicar insumos otimizadamente. A tecnologiaSIG – Sistema de Informações Geográficas, associada com os da<strong>do</strong>s agrícolas geram umagrande quantidade de informações, expressas na forma de mapas temáticos e relatórios de apoioa decisão no manejo agrícola. Mesmo assim, visan<strong>do</strong> aumentos progressivos de produtividade,os agricultores utilizavam o máximo de fertilizantes e corretivos (MOLIN, 1997).O mapa de produtividade é, ainda nessa primeira década <strong>do</strong> terceiro milênio, essencialpara quem pretenda entender ou praticar as prerrogativas da AP, pois é ele quem mostra asvariações de produtividade em uma área. A idéia básica continua sen<strong>do</strong> identificar zonas outalhões de alta ou de baixa produtividade e administrar essas diferenças. O conceito atual paraAP, no entanto, é o de um sistema de gestão agrícola composto de tecnologias e procedimentosque levem a uma produção otimizada (MOLIN, 2002b). Para esse autor, a melhor informação <strong>do</strong>


3resulta<strong>do</strong> de uma lavoura é a colheita. Esse resulta<strong>do</strong> pode ser expresso pela média, usualmenteexpressa em toneladas por hectare, ou um mapa de produtividade que mostra, entre outrasinformações, a produtividade obtida em cada parte da lavoura e, no seu conjunto, a variabilidadeespacial da produção.Um <strong>do</strong>s desafios mais recentes da AP é oferecer subsídios para a definição de unidadesde manejo para posterior intervenção. Essa identificação pode ser feita com informações desolo, da produtividade ou indica<strong>do</strong>res compostos. Definir unidades de manejo em talhões quemereçam tratamento diferencia<strong>do</strong> é uma tarefa pouco objetiva pois depende de fatores multivaria<strong>do</strong>s,como a resposta da cultura, características <strong>do</strong> solo, fatores ambientais, dentre outros(MOLIN, 2002a). De qualquer maneira, a geoestatística pode contribuir muito para se obterresulta<strong>do</strong>s cientificamente aceitos. A AP está fundamentada basicamente na existência da variabilidadeespacial <strong>do</strong>s fatores produtivos e, portanto, da própria quantidade produzida pelacultura, constituin<strong>do</strong> a sua representação gráfica uma das mais importantes ferramentas destinadasa sua análise (BALASTREIRE; ELIAS; AMARAL, 1997).O acompanhamento <strong>do</strong> desenvolvimento de uma cultura em tempo real e a correção<strong>do</strong>s fatores deficientes no instante que é diagnostica<strong>do</strong> foi uma das metas mais importantese ousadas da AP (CAPELLI, 1999). O que aconteceu no final da década de 90 e no iníciodeste segun<strong>do</strong> milênio foi que, devi<strong>do</strong> aos altos preços de implementos pratica<strong>do</strong>s decorrentesda baixa escala de produção e pequena nacionalização industrial, a a<strong>do</strong>ção <strong>do</strong> manejo a taxavariável se tornou inexpressiva. O merca<strong>do</strong> também não respondeu e atualmente não existemnovidades tecnológicas em equipamentos de custo economicamente viável que levem a umasolução esperada para a variabilidade espacial <strong>do</strong>s talhões (MOLIN, 2002b).A geoestatística se apresenta como um méto<strong>do</strong> que utiliza procedimentos estatísticosaplica<strong>do</strong>s a problemas cujos da<strong>do</strong>s provêm de fenômenos naturais e que são espacialmentedistribuí<strong>do</strong>s e auto correlaciona<strong>do</strong>s, ou seja, consideram não só o valor obti<strong>do</strong> para uma determinadavariável, mas também sua posição, expressa por um sistema de coordenadas. Assim,o comportamento <strong>do</strong> evento estatístico pode ser descrito pelas diferenças entre as informaçõesobtidas em função da distância que as separa. O valor de uma variável em uma determinadaposição poderá ser estima<strong>do</strong> a partir <strong>do</strong>s valores em posições vizinhas. Atualmente a noção deméto<strong>do</strong>s geoestatísticos é popular em muitas áreas das ciências e da indústria para se avaliarda<strong>do</strong>s correlaciona<strong>do</strong>s no espaço e/ou no tempo.Tanto experimentos basea<strong>do</strong>s nos conceitos de AP quanto experimentos de outras áreasque envolvem a estatística espacial, particularmente a geoestatística, usam procedimentos univaria<strong>do</strong>spara a representação <strong>do</strong> comportamento de suas variáveis. Entretanto, em problemas


4reais, os fenômenos frequentemente ocorrem sob circunstâncias multivariadas e espacialmentecorrelaciona<strong>do</strong>s.Existe disponível na literatura, muitos trabalhos envolven<strong>do</strong> méto<strong>do</strong>s geoestatísticosmultivaria<strong>do</strong>s tais como os apresenta<strong>do</strong>s por Einax e Soldt (1998) e Caeiro et al. (2003), masainda cabe investigações para se determinar as condições em que uma análise multivariada paraos problemas representam um ganho efetivo na qualidade <strong>do</strong>s resulta<strong>do</strong>s, na confiabilidade <strong>do</strong>processo, na eficiência, sobretu<strong>do</strong> na predição. Cabe espaço também para se avaliar as características<strong>do</strong>s diferentes modelos propostos, ou seja, tanto aqueles basea<strong>do</strong>s em variogramas ena estrutura da matriz de correlação como aqueles basea<strong>do</strong>s em modelos de regressão. Em decorrênciadessas avaliações, poderão surgir novas proposições ou recomendações de estratégiasde modelagem que levem a uma viabilidade computacional, grande limitação nos méto<strong>do</strong>s atuais,ou ainda, ampliar a interpretabilidade <strong>do</strong>s resulta<strong>do</strong>s.O objetivo geral deste trabalho foi empregar méto<strong>do</strong>s geoestatísticos univaria<strong>do</strong>s emultivaria<strong>do</strong>s em experimentos agrícolas desenvolvi<strong>do</strong>s na região Oeste <strong>do</strong> Paraná e em da<strong>do</strong>sde área de reflorestamento no município de Rio Negrinho-SC, incorporan<strong>do</strong> técnicas que permitirama elaboração de mapas temáticos melhores com uma redução no número de amostrasde variáveis de interesse principal pela sua correlação com outras variáveis agrícolas que sejammais facilmente disponíveis.O capítulo 2 trata de eventos geoestatísticos univaria<strong>do</strong>s basea<strong>do</strong>s em modelos nosquais se apresenta a geometria <strong>do</strong> espaço a<strong>do</strong>ta<strong>do</strong>, analisa-se os componentes <strong>do</strong> modelo,associa-se cada componente <strong>do</strong> modelo a conceitos basea<strong>do</strong>s em covariograma e variograma,apresenta-se as principais funções de correlação utilizadas, deriva-se os méto<strong>do</strong>s deestimação <strong>do</strong>s parâmetros <strong>do</strong> modelo basea<strong>do</strong>s em maximização <strong>do</strong> logarítmo da função deverossimilhança (MV), máxima verossimilhança restrita (MVR) e da determinação empíricade distribuição a posteriori <strong>do</strong>s parâmetros basea<strong>do</strong>s em inferência bayesiana. Finalmente,nesse capítulo, analisam-se <strong>do</strong>is problemas de confeção de mapas temáticos e de estimaçãode produção.O capítulo 3 aborda o problema geoestatístico multivaria<strong>do</strong> e particularmente o caso bivaria<strong>do</strong>,possível de ser implementa<strong>do</strong> computacionalmente. Inicialmente foi obti<strong>do</strong> um méto<strong>do</strong>bivaria<strong>do</strong> sob o enfoque da geoestatística baseada em modelos, propon<strong>do</strong>-se um modelo quecontemplasse a demanda surgida no problema univaria<strong>do</strong>. Derivou-se também uma meto<strong>do</strong>logiade predição linear multivariada, particularmente a distribuição preditiva de uma variável deinteresse principal, condicionada às demais. Dois casos foram estuda<strong>do</strong>s, um associan<strong>do</strong> umavariável de interesse principal com outra de interesse secundário, em uma mesma área de cul-


5tivo e outro caso associan<strong>do</strong> a variável de interesse principal com a primeira componente obtidade uma análise de componentes principais (ACP) sobre um conjunto de variáveis secundárias.Foram então analisa<strong>do</strong>s os da<strong>do</strong>s geoestatísticos <strong>do</strong> problema aborda<strong>do</strong> no capítulo 2, uma vezque cada um <strong>do</strong>s <strong>do</strong>is conjuntos de da<strong>do</strong>s foram toma<strong>do</strong>s em uma mesma região de manejoagrícola.No capítulo 4 apresentam-se as conclusões gerais <strong>do</strong> trabalho e sugestões para trabalhosfuturos com base nos méto<strong>do</strong>s desenvolvi<strong>do</strong>s. Na última parte desse trabalho encontram-seem anexo os roteiros de análise para os interessa<strong>do</strong>s em aplicar os mesmos procedimentos emoutros estu<strong>do</strong>s similares.Os arquivos fonte da análise estatística estão disponíveis na URL (Uniform ResourceLocation) http://www.leg.ufpr.br/ como complementos para artigos e materiais <strong>do</strong> LEG (Laboratóriode Estatística e Geoinformação) da UFPR (<strong>Universidade</strong> <strong>Federal</strong> <strong>do</strong> Paraná) na seçãopaper companions em Atividades e Eventos. Os da<strong>do</strong>s podem ser obti<strong>do</strong>s diretamente <strong>do</strong> pacotegeoR (RIBEIRO JR; DIGGLE, 2001).


2 MODELO GEOESTATÍSTICO GAUSSIANOUNIVARIADOO modelo que se idealizou neste estu<strong>do</strong> assumiu uma variável Y observada em diferentescoordenadas de um plano cartesiano bidimensional, representan<strong>do</strong> uma versão de ruí<strong>do</strong>de um sinal S de um processo espacial contínuo, sen<strong>do</strong> Y condicionalmente independente de S.Estruturou-se esse modelo como um modelo linear misto, especifica<strong>do</strong> com notação de modeloshierárquicos, quan<strong>do</strong> necessário à sua clareza. O componente associa<strong>do</strong> ao valor espera<strong>do</strong> de Ycomportou uma estrutura induzida por covariáveis presentes nas coordenadas de mensuração.Como essas covariáveis atuam no componente determinístico <strong>do</strong> modelo e são obti<strong>do</strong>s nas mesmascoordenadas de mensuração de Y , o processo como um to<strong>do</strong> foi aqui considera<strong>do</strong> como umprocesso gaussiano univaria<strong>do</strong>.2.1 GEOMETRIA DO ESPAÇO GEOESTATÍSTICONeste trabalho foram considera<strong>do</strong>s como da<strong>do</strong>s espaciais as informações observadasde um fenômeno aleatório ocorri<strong>do</strong> em um sistema agrícola, distribuí<strong>do</strong> em uma região de umespaço bidimensional. Não foram estuda<strong>do</strong>s da<strong>do</strong>s que representassem polígonos de uma região(sub-área) e nem da<strong>do</strong>s que representassem processos pontuais, como a ocorrência positivaou negativa de um atributo. Abor<strong>do</strong>u-se somente da<strong>do</strong>s vincula<strong>do</strong>s a um processo aleatóriogaussiano de variação espacial contínua e mensurável.O formato básico <strong>do</strong>s da<strong>do</strong>s geoestatísticos univaria<strong>do</strong>s que se a<strong>do</strong>tou foi:{(xi ;y i ) : x i ∈ R 2 ,y i ∈ R,i : 1,2,...,n }onde:x i : indica a localização espacial da i-ésima coordenada em uma região <strong>do</strong> espaçobi-dimensional (R 2 );


7y i : indica uma medida escalar da variável aleatória contínua Y = (y 1 ,y 2 ,...y n ) T ,tomada na x i -ésima localização.Um particular resulta<strong>do</strong> y da variável Y pode ocorrer em qualquer localização x de umaregião contínua. Essas localizações x i : i = 1,2,...,n formam uma malha fixa ou estocasticamenteindependente de Y , onde serão obtidas as medidas de y i .O processo gaussiano é defini<strong>do</strong> como um conjunto de n variáveis aleatórias onde adistribuição finito-dimensional de qualquer subconjunto de variáveis tomadas desse conjunto,tem distribuição gaussiana multivariada com dimensão igual ao número de variáveis <strong>do</strong> subconjunto.Assim, o conjunto { S(x i ) : x i ∈ R 2 ;i : 1,2,...,n } , foi o processo estocástico gaussianoque descreveu, de maneira teórica, o comportamento <strong>do</strong> fenômeno em uma área. Esse processodeve ter uma distribuição espacialmente contínua e o evento Y deverá ocorrer segun<strong>do</strong> a sua leide probabilidades. O modelo geoestatístico apropria<strong>do</strong> que se a<strong>do</strong>tou foi basea<strong>do</strong> em um processoestocástico espacial S(x), gaussiano, contínuo, que representa o fenômeno de interesse emuma área de um espaço bidimensional ou, eventualmente, em uma reta de um espaço unidimensional.Entende-se aqui o processo estocástico gaussiano univaria<strong>do</strong> como sen<strong>do</strong> um modeloprobabilístico defini<strong>do</strong> por um conjunto de variáveis aleatórias gaussianas { S(x) : x ∈ R 2} emque os S(x i ) são medidas de mesma natureza, que ocorrem em diferentes locais <strong>do</strong> espaço(WALLER; GOTWAY, 1965). Assim, Y = (y 1 ,y 2 ,...,y n ) T é um vetor aleatório de dimensão nconten<strong>do</strong> as medidas da realização <strong>do</strong> evento. Cada y i é representa<strong>do</strong> por uma função densidadede probabilidade gaussiana e o vetor Y tem função densidade de probabilidade conjunta dadapor:f Y (y) = (2π) − n 2 |Σ| − 1 2{exp − 1 }2 (y − µ)′ Σ −1 (y − µ)em que Σ é uma matriz não singular e de posto completo e µ um vetor de médias.(2.1)Uma realização <strong>do</strong> evento Y corresponde a um conjunto de observações em nlocalizações distintas e fixas, onde cada resulta<strong>do</strong> é, em si, o resulta<strong>do</strong> de uma variável aleatóriaY k = Y(x k ) = y k , k = 1,2,...,n.Uma realização de Y é então a ocorrência de n variáveisaleatórias gaussianas, cada uma com uma única observação e que pode ser modelada como:em que:Y(x i ) = µ(x i )+S(x i )+ε i ; i = 1,...,n (2.2)• Y(x i ) é uma variável aleatória contínua com distribuição normal de médiaE [Y(x i )|S(x i )] = µ(x i )+S(x i ) e variância condicional Var(Y(x i )|S(x i )) = Var(ε i ) = τ 2 ;• µ(x i ) = β 0 + β 1 d 1 (x i ) + β 2 d 2 (x i ) + ... + β p d p (x i ) que pode ser representa<strong>do</strong> matricial-


8mente como Dβ é efeito espacial externo associa<strong>do</strong> a p covariáveis d(x i ), diferentes deY(x i ) mas que irão depender da localização x i . Os coeficientes β são constantes a seremdeterminadas. Esse componente, também é chama<strong>do</strong> de efeito sistemático e pode tornaro modelo não estacionário;• S(x i ) é o valor, na posição x i , <strong>do</strong> processo gaussiano multivaria<strong>do</strong> { S(x) : x ∈ R 2} , commédia zero, variância σ 2 e função de correlação ρ(u i j ) = Corr{S(x i ),S(x j )} onde u i j =‖x i − x j ‖ é a distância euclidiana que separa duas coordenadas quaisquer x i e x j ;• ε i são erros independentes e identicamente distribuí<strong>do</strong>s com distribuiccão normal demédia zero e variância τ 2 , ou seja, ε i ∼ N(0;τ 2 ).A distribuição de probabilidade da variável aleatória n-dimensional Y é então:Y ∼ N ( Dβ,σ 2 R+τ 2 I ) (2.3)em que:• σ 2 é a variância;• R é uma matriz de tamanho n × n cujos elementos representam as correlações entreobservações feitas em diferentes localizações;• τ 2 representa a variância <strong>do</strong> erro ε i e• I a matriz identidade de tamanho n × n.2.2 COMPONENTES DO MODELO2.2.1 Componente mensurávelA variável mensurável Y(x) no modelo da equação 2.2 foi suposta com distribuiçãogaussiana de probabilidades. Essa suposição permitiu obter a solução analítica na estimação <strong>do</strong>sparâmetros <strong>do</strong> modelo. Entretanto, para o méto<strong>do</strong> geoestatístico basea<strong>do</strong> em modelos, isso nãoé necessário, desde que se consiga escrever uma função de verossimilhança que tenha solução.Já o méto<strong>do</strong> bayesiano pode facilmente resolver problemas de estimação de parâmetros paramodelos lineares generaliza<strong>do</strong>s, sem a restrição da suposição <strong>do</strong> tipo <strong>do</strong> processo estocásticoenvolvi<strong>do</strong>. A maioria <strong>do</strong>s trabalhos com geoestatística se valem <strong>do</strong> recurso de transformar avariável resposta para se obter a gaussianiedade.


9Existem muitas razões importantes, amplamente discutidas na literatura, para se transformarda<strong>do</strong>s estatísticos buscan<strong>do</strong> obter uma forma de distribuição próxima da distribuiçãonormal de probabilidades. Eventos que têm evolução não linear, representa<strong>do</strong>s por forte assimetriana distribuição de freqüências de seus da<strong>do</strong>s, requerem tranformações logarítmicasconverten<strong>do</strong> o problema em uma escala mais aditiva, levan<strong>do</strong> a distribuição em direção a umcomportamento mais simétrico, próximo da distribuição gaussiana.Box e Cox (1964) apresentam um méto<strong>do</strong> de transformação da família potência quebasicamente consiste na adequação a uma família paramétrica numa generalização empírica <strong>do</strong>modelo gaussiano, na qual a escolha da transformação mais adequada corresponde a estimarum parâmetro de transformação λ, empregan<strong>do</strong>-se para isso o méto<strong>do</strong> MV. Uma vez escolhi<strong>do</strong>λ, procede-se com a seguinte operação nos da<strong>do</strong>s observa<strong>do</strong>s:⎧ ( )⎪⎨ Y λ − 1Y ∗ , se λ ≠ 0= λ⎪⎩ logY , se λ = 0(2.4)Na área econômica, Aguirre e Faria (1996) utilizaram a transformação de Box e Cox(1964) em uma aplicação <strong>do</strong> méto<strong>do</strong> <strong>do</strong>s preços hedônicos na avaliação de imóveis em estu<strong>do</strong>de viabilidade econômica <strong>do</strong> programa de canalização de córregos na implantação de vias ena recuperação ambiental e social de fun<strong>do</strong>s de vales, elabora<strong>do</strong> pela prefeitura da cidade deSão Paulo no perío<strong>do</strong> de 1993 a 1994. O méto<strong>do</strong> <strong>do</strong>s preços hedônicos consiste em estimarpreços implícitos através de atributos ambientais característicos de bens ambientais comercializa<strong>do</strong>sem merca<strong>do</strong>s através da observação <strong>do</strong> próprio merca<strong>do</strong> no qual os bens estão inseri<strong>do</strong>s.A aplicação da transformação foi necessária pois as variáveis preços e aluguel apresentaramassimetria e altos valores de curtose, sugerin<strong>do</strong> uma distribuição log-normal para os da<strong>do</strong>s.Destacam no trabalho a necessidade de, no final, transformar novamente as variáveis modificadaspara a sua escala original (uma anamorfose), para que os coeficientes de regressão possamter interpretação direta.Frasson e Molin (2006) utilizaram a mesma transformação para confirmar a gaussianiedadena elaboração de mapa geoestatístico da produtividade de soja, com da<strong>do</strong>s <strong>do</strong> ano de 2005provenientes da Fazenda Velha Lagoa da Empresa Agropecuária Dois Irmãos no município deCampos Novos Paulista-SP, em talhões de 22,8 ha. A produtividade foi medida com monitor decolheita com detecção de massa por placa de impacto e receptor GPS com correção diferencialpor algoritmo interno, instala<strong>do</strong> em colhetadeira própria.


102.2.2 Componente determinísticoSegun<strong>do</strong> Waller e Gotway (1965), <strong>do</strong>is conceitos devem ser estabeleci<strong>do</strong>s antes de semodelar um processo espacial: estacionariedade e isotropia. Matematicamente um processoserá estacionário quan<strong>do</strong> suas propriedades forem invariantes às translações em um espaçomultidimensional, ou seja, a relação entre <strong>do</strong>is eventos em um processo estacionário dependerásomente de suas posições relativas. Será isotrópico quan<strong>do</strong> for invariante às rotações emtorno da origem de um sistema de referência, ou seja, não deverá depender da orientação <strong>do</strong>eixo que liga suas posições no espaço.A ausência de estacionariedade na média ocorre quan<strong>do</strong> existe uma variação naturalprópria da área, que interfere no comportamento <strong>do</strong> processo, como por exemplo: a declividadesistemática de um solo que interfere nas características de fertilidade, umidade e compactação,importantes para se avaliar a variação da produtividade de uma área. Para estudar esse efeito,pesquisa<strong>do</strong>res costumam modelar a média µ como uma função das localizações x, destacan<strong>do</strong>os efeitos de tendência por modelos de regressão polinomial e utilizan<strong>do</strong> o resíduo, para entãoprosseguir com a análise. Modelos assim não são cientificamente explica<strong>do</strong>s pois as correlaçõescom direções definidas não dão informações sobre o processo causa<strong>do</strong>r <strong>do</strong> efeito.Esse efeito que afeta a média de um processo geoestatístico pode ser modela<strong>do</strong> relativamenteàs suas covariáveis. É o equivalente aos fatores em uma análise estatística tradicional.Muitas pesquisas são feitas em áreas onde existem sub-áreas de características próprias que afetamo processo em estu<strong>do</strong>. Souza, Marques JR e Pereira (2004), por exemplo, desenvolveramum trabalho em Guariba-SP com o objetivo de avaliar a variabilidade espacial <strong>do</strong> pH, cálcio(Ca), magnésio (Mg) e saturação de bases (V%) em Latossolo Vermelho entroférrico sob cultivode cana-de-açúcar. Eles classificaram a curvatura e o perfil das formas <strong>do</strong> terreno no terçoinferior da encosta em <strong>do</strong>is compartimentos, um com menor variação das formas e curvaturas,pre<strong>do</strong>minan<strong>do</strong> a forma linear e outro com maior variação, com a presença de formas linear,côncava e convexa. Concluíram que o tipo de relevo, dentre outros resulta<strong>do</strong>s, condiciona umavariabilidade espacial diferenciada para os atributos químicos. Outro trabalho com o uso decovariáveis é apresenta<strong>do</strong> por Carvalho e Queiroz (2002). Eles concluem que o uso da altitudecomo covariável para a precipitação de chuvas no Esta<strong>do</strong> <strong>do</strong> Paraná define bolsões, além deevitar instabilidade numérica no sistema de equações <strong>do</strong> modelo causada pela redundância deobservações da variável auxiliar. O conceito é semelhante ao delineamento de experimentos emblocos, que retira <strong>do</strong> resíduo uma fonte de variação conhecida. As informações adicionais sãonormalmente tomadas nas mesmas coordenadas <strong>do</strong> processo principal e não são tratadas comoum segun<strong>do</strong> processo, manten<strong>do</strong> assim o aspecto univaria<strong>do</strong> da análise.


11De maneira um pouco mais formal, diz-se que o processo é estacionário de primeira ordem(na média) se µ(x i ) = µ, ∀ x i , i = 1,2,...n e estacionário de segunda ordem (na variância)se as covariâncias para cada par de coordenadas forem função somente da distância euclidianau i j e para u i j = 0, ρ(u i j ) = σ 2 .2.2.3 Componente <strong>do</strong> processo gaussiano correlaciona<strong>do</strong>Assumiu-se neste estu<strong>do</strong> que o processo S(x) é desconheci<strong>do</strong>, de variação contínua,com incerteza em seus parâmetros e correlaciona<strong>do</strong> na região em que ocorre e poderá ser compostopor processos latentes S k (x), k = 1,2,... p, p ∈ N, escalona<strong>do</strong>s por σk 2 (RIBEIRO JR;DIGGLE, 1999). Supôs-se ainda que o <strong>do</strong>mínio D em que ocorre o processo é fixo em umespaço R 2 . O fato de D ser fixo significa que os pontos amostrais não serão aleatórios. Schabenbergere Gotway (2005) dizem ser importante associar a continuidade <strong>do</strong> processo ao <strong>do</strong>mínioD e não ao atributo que está sen<strong>do</strong> medi<strong>do</strong>. O fato de os da<strong>do</strong>s mensuráveis serem contínuos oudiscretos não determinam se são <strong>do</strong> tipo geoestatístico ou não.Um outro aspecto importante sobre o processo gaussiano é a existência de estacionariedadena sua estrutura de correlação. Um pressuposto razoável é supor que seu valor decaia medida que a distância entre as localizações aumenta, independentemente <strong>do</strong> ângulo <strong>do</strong> eixoforma<strong>do</strong> entre essas localizações. Neste caso se diz que o processo é isotrópico, caso contrário oprocesso é anisotrópico. Essa forma de se avaliar o comportamento das correlações é chama<strong>do</strong>de efeito direcional que na sua forma mais simples, — e talvez mais comum, é chama<strong>do</strong> anisotropiageométrica. Este tipo de anisotropia ocorre quan<strong>do</strong> a estrutura de covariância apresentaalongamentos e rotações em relação aos eixos das coordenadas. Desta forma pode-se caracterizaresse efeito através de <strong>do</strong>is parâmetros: o ângulo de anisotropia ψ A que dá a direção <strong>do</strong> efeitoe a razão de anisotropia ψ R > 1 que dá a relação entre o eixo maior e o eixo menor da elipseformada (JOURNEL; HUIJBREGTS, 1978).Na prática, ψ A e ψ R são informações desconhecidas que podem ser convenientementeincorporadas ao modelo geoestatístico para serem estimadas a partir <strong>do</strong>s da<strong>do</strong>s. Uma vez conhecidaa tendência devi<strong>do</strong> à anisotropia, pode-se, para efeito de análise, transformar as coordenadas.Se (a,b) for a coordenada de um ponto no plano cartesiano R 2 , poder-se-á contrair/extendere/ou rotacionar esse vetor com a transformação linear (KOLMAN, 1997):


12(a ′ ,b ′ ) = (a,b)(cos(ψA ) −sen(ψ A )sen(ψ A ) cos(ψ A ))(1 00 ψ −1R)Os efeitos de tendência direcional e regional têm papel fundamental na análise <strong>do</strong>processo S(x), pois permitem melhorar o conhecimento subjetivo <strong>do</strong> fenômeno em estu<strong>do</strong>.Segun<strong>do</strong> Matheron (1973), um tipo de modelo não-estacionário é o modelo intrínseco.Ele considera um caminho aleatório S(x) = S(x − 1) + Z(x) com Z ∼ N(0,1), ou seja, umafunção aleatória intrínseca é um processo estocástico S(x) com incrementos estacionários. Assim,o processo S x ′(x) = S(x) − S(x − x ′ ) será dito estacionário para to<strong>do</strong> x ′ ∈ R 2 .A principal diferença entre uma predição obtida com modelo intrínseco e modelo estacionário,é que se for usa<strong>do</strong> o primeiro, a predição em uma localização x será influenciada peloambiente local <strong>do</strong>s da<strong>do</strong>s, ou seja, por observações medidas em locais próximos. Consideraruma hipótese intrínseca para os da<strong>do</strong>s significa supor que as diferenças entre os valores apresentamfraco incremento, ou seja, as diferenças serão localmente estacionárias. Com o empregode modelos estacionários, as predições serão afetadas pelo ambiente global <strong>do</strong>s da<strong>do</strong>s.Diggle, Tawn e Moyeed (1998) mostram duas aplicações em que a meto<strong>do</strong>logia geoestatísticaconvencional para resolver problemas de valores de uma função linear de um processoestocástico espacial gaussiano basea<strong>do</strong> nas observações <strong>do</strong> modelo (Equação 2.2) é inapropriada.A estrutura teórica para o méto<strong>do</strong> geoestatístico basea<strong>do</strong> em modelos é condicional aoprocesso não observa<strong>do</strong> e as observações em locações amostrais formam um modelo linear generaliza<strong>do</strong>com os valores correspondentes de S(x) que ficam de fora em uma ação de predição.2.3 COVARIÂNCIA E VARIOGRAMADiggle e Lophaven (2006) definiram a semivariância como a função:V(u) = 1 2 E [(Y(x) −Y(x − u)) 2]de um processo estocástico espacial estacionário.


13Estimar os parâmetros de V(u) pelo méto<strong>do</strong> <strong>do</strong>s momentos consiste em obter os valoresv i j = 1 2 (y i − y j ) 2 (2.5)provenientes de da<strong>do</strong>s experimentais, agrupá-los dentro de intervalos de distâncias (e ângulosquan<strong>do</strong> for o caso) e ajustar um modelo de semivariância teórica ao gráfico forma<strong>do</strong> pela média<strong>do</strong>s pontos de cada intervalo loca<strong>do</strong>s em seu centro. O comportamento padrão de um semivariogramaé da<strong>do</strong> pela Figura 2.1. Nesse gráfico, a função semivariância é uma função monótonanão decrescente e depende somente <strong>do</strong> comportamento da função de correlação ρ(u). O efeitopepita (nugget) representa a variância de pequena escala τ 2 . O patamar (sill total) da<strong>do</strong> porτ 2 + σ 2 representa a variância total <strong>do</strong> processo e o alcance prático de dependência espacial(range) é determina<strong>do</strong> por um parâmetro φ que controla a taxa de decaimento da função decorrelação. Nessa figura nota-se que o efeito pepita (τ 2 ) corresponde ao valor da semivariânciaa distâncias nulas. Entretanto, amostras medidas exatamente na mesma posição deveriam tero mesmo valor. Quan<strong>do</strong> isso não ocorre, a diferença é ser atribuída, dentre outras razões desconhecidas,ao erro de medida amostral. A semivariância pode ainda indicar descontinuidadena origem, ou seja, a ausência de valores. Isto ocorre tanto por um planejamento amostral quenão considera medidas à distância nulas (repetidas) quanto pela diferenciabilidade na origemda função semivariância na origem.Para Journel e Huijbregts (1978) o semivariograma é um gráfico muito utiliza<strong>do</strong> pararepresentar o mecanismo de dependência espacial.semivariância0.0 0.2 0.4 0.6 0.8 1.0 1.2patamar(σ 2 + τ 2 )efeito pepita(τ 2 )alcance prático(φ)0.0 0.2 0.4 0.6 0.8 1.0distânciaFigura 2.1: Comportamento padrão da função semivariância. Os elementos principais que acompõem são: o alcance prático proporcional a φ, a variância de pequena escala ou efeitopepita τ 2 e a contribuição σ 2 que corresponde à diferença entre o patamar e τ 2 .


<strong>14</strong>Para Tragmar, Yost e Uehara (1985) o efeito pepita mostra<strong>do</strong> na Figura 2.1 tem umpapel importante na análise geoestatística, pois pode sugerir a presença de dependência espacial<strong>do</strong> processo, quan<strong>do</strong> compara<strong>do</strong> ao patamar. Se os valores se aproximam, a amostra tende anão receber influência espacial. Cambardella et al. (1994) propuseram mensurar a dependênciaespacial pela razão percentual entre o efeito pepita e patamar ou coeficiente de efeito pepita(CEP) da<strong>do</strong> por:CEP =τ2τ 2 + σ 2 × 100classifican<strong>do</strong> como forte para valores menores que 25%, moderada para valores entre 25% e75% e forte para valores acima de 75%Considerou-se o modelo da<strong>do</strong> pela Equação 2.2, supon<strong>do</strong> estacionariedade, comosen<strong>do</strong> aquele que descreve o conjunto Y das variáveis observadas de um determina<strong>do</strong> processoS(x). Desta forma, y i e y j são observações tomadas em quaisquer duas localizações separadaspor uma distância u i j . Então, Var(y i − y j ) registra a variação da diferença <strong>do</strong>s valores medi<strong>do</strong>ssepara<strong>do</strong>s por essa distância. Fixan<strong>do</strong> µ = 0 e τ 2 = 0 vem:Var(y i − y j ) = Var(y i )+Var(y j ) − 2 Cov(y i ;y j )Var(y i − y j ) = Var(S(x i )+ε i )+Var(S(x j )+ε j ) − 2 Cov ( S(x i );S(x j ) ) (2.6)Como S(x) e ε são independentes, então:Var(y i ) = Var(S(x i )+ε i ) = Var(S(x i ))+Var(ε i ) = σ 2Var(y j ) = Var(S(x j )+ε j ) = Var(S(x j ))+Var(ε j ) = σ 2 ,e assim:Var(y i ) = Var(y j ) = σ 2 (2.7)Em estatística clássica, o coeficiente de correlação de Pearson (ρ) mede o grau ea direção (positiva ou negativa) da correlação linear entre duas variáveis (MONTGOMERY;PECK, 1955). Se aplicada no contexto da geoestatística utilizan<strong>do</strong>-se o resulta<strong>do</strong> obti<strong>do</strong> pelaEquação 2.7 tem-se:ρ(u i j ) =Cov(y i ;y j )√Var(yi )Var(y j ) = Cov(y i;y j )√σ 2 σ 2 = Cov(y i;y j )σ 2 ,o que implica que:Cov(y i ;y j ) = σ 2 ρ(u i j ) (2.8)Nota-se pela Equação 2.8, caso a hipótese de estacionariedade não seja rejeitada, que


15a correlação entre <strong>do</strong>is valores medi<strong>do</strong>s de Y irá depender somente da distância que os separa.Esta função será monótona decrescente, restrita a ρ(0) = 1 e lim u→∞ρ(u) = 0 para u > 0.Assim, substituin<strong>do</strong>-se os resulta<strong>do</strong>s das Equações 2.7 e 2.8 na Equação 2.6 obtém-se:Var(y i − y j ) = (σ 2 + τ 2 )+(σ 2 + τ 2 ) − 2 σ 2 ρ(u i j )Var(y i − y j ) = 2 τ 2 + 2 σ 2 (1 − ρ(u i j ))Var(y i − y j ) = 2 ( τ 2 + σ 2 (1 − ρ(u i j )) )12 Var(y i − y j ) = τ 2 + σ 2 (1 − ρ(u i j ))Fazen<strong>do</strong> 1 2 Var(Y i −Y j ) = γ(u i j ) a semivariância teórica fica dada por:γ(u i j ) = τ 2 + σ 2 (1 − ρ(u i j )) (2.9)A Figura 2.2 mostra o comportamento gráfico da função semivariância onde pode-senotar o papel funtamental da função de correlação pois é ela que define no modelo, a forma comque as correlações decaem com o aumento da distância entre as coordenadas. Segun<strong>do</strong> Diggle eRibeiro Jr (2007), sen<strong>do</strong> o processo estacionário, a função semivariância é o equivalente teóricopara a função covariância, com a vantagem de oferecer elementos para a análise da estruturaespacial <strong>do</strong>s da<strong>do</strong>s.γ(u)−1.0 −0.5 0.0 0.5 1.0 1.5τ + στρ(u)γ(u)− ρ(u)τ + σ(1 − ρ(u))1 − ρ(u)0 1 2 3 4 5distancia (u)Figura 2.2: Etapas da transformação da função de correlação (linha contínua) para a funçãosemivariograma (linha tracejada).


162.4 TIPOS DE MODELO DE CORRELAÇÃO ESPACIALA escolha da estrutura de correlação desempenha um papel decisivo no modelo geoestatísticopois esta escolha irá afetar diretamente a suavidade da imagem gerada. É ela queestabelece o comportamento de uma característica pontual em sua vizinhança. As medidasmatemáticas aceitas para se avaliar essa suavidade são a continuidade e a diferenciabilidade.Bartlett (1955) afirma que um processo estocástico estacionário com função de correlação ρ(u)será k-vezes diferenciável se, e somente se, ρ(u) for 2 k-vezes diferenciável na origem.correlação0.2 0.4 0.6 0.8 1.0correlação0.0 0.2 0.4 0.6 0.8 1.0−2 −1 0 1 2u−2 −1 0 1 2Figura 2.3: O gráfico da esquerda corresponde ao comportamento da função de correlação poderde ordem 1 (exp(−u)) onde a função no ponto u = 0 não é diferenciável. O da direitacorresponde a mesma função de correlação exponencial “poder” de ordem 2 (exp(−u 2 )), diferenciávelem u = 0.uNa Figura 2.3 tem-se o comportamento básico da diferenciabilidade da função decorrelação. Ambas as figuras ilustram o caso de funções contínuas em to<strong>do</strong> o <strong>do</strong>mínio dasdistâncias u, o que é mais freqüentemente a<strong>do</strong>ta<strong>do</strong>, embora possam ocorrer descontinuidadesna origem. A figura da esquerda apresenta um ponto “problema” que é o ponto u = 0 onde afunção não é diferenciável, da<strong>do</strong> que da teoria <strong>do</strong> cálculo sabe-se que a derivada de uma funçãonão existe onde a tangente ao ponto é vertical. Já a figura da direita mostra uma função contínuae diferenciável em to<strong>do</strong> o seu <strong>do</strong>mínio.O processo S(x) é desconheci<strong>do</strong> e tipicamente, não observável diretamente. Assim, aexperiência <strong>do</strong> pesquisa<strong>do</strong>r com o fenômeno estuda<strong>do</strong> deve ser usada para uma boa escolha <strong>do</strong>modelo de correlação espacial. Se o evento em questão tiver variações mais abruptas, modeloscom números menores de derivadas deverão ser preferi<strong>do</strong>s e se tiver variações mais suaves,utiliza-se números maiores.


17Y(x)−1.0 −0.5 0.0 0.5 1.00.0 0.2 0.4 0.6 0.8 1.0xY(x)−1.0 −0.5 0.0 0.5 1.00.0 0.2 0.4 0.6 0.8 1.0xFigura 2.4: O gráfico da esquerda representa um processo de variações abruptas ao longo deuma transecção unidimensional, associada a uma função de correlação não-diferenciável. Oda direita mostra um processo com variações mais suaves ao longo da mesma transecção, masassociada a uma função de correlação duas vezes diferenciável.A Figura 2.4 ilustra-se um exemplo desse efeito a partir de simulações <strong>do</strong> processoS(x). Foi gera<strong>do</strong> simulan<strong>do</strong>-se 200 pontos de um processo estocástico estacionário, isotrópico,com taxas de decaimento equivalentes. Foram consideradas duas situações: função contínuanão diferenciável (esquerda) onde nota-se variações bruscas da superfície gerada pelo processoe função contínua diferenciável (direita) onde as variações são mais suaves. Vale aqui salientarque o processo é o mesmo (exponencial), diferin<strong>do</strong> apenas na diferenciabilidade da função decorrelação.Deve-se lembrar que correlações com variações muito suaves perto da origem podemproduzir efeitos de quasi-multicolinearidade na matriz de covariâncias, levan<strong>do</strong> a dificuldadescomputacionais na solução numérica da álgebra envolvida no processo. Uma vez que se supõediminuir a similaridade regional a longas distâncias, sen<strong>do</strong> no máximo nula, então é razoável escolhero conjunto de funções de correlações que sejam definidas positiva. Esta condição impõerestrições. Assim, para um conjunto de localizações x i e uma constante real a i , a condição:n∑ n∑a i a j Cov(Y i ;Y j ) ≥ 0 ∀ i; ji=1 j=1deve ser obedecida asseguran<strong>do</strong> variância não negativa de predição e implican<strong>do</strong> que somentealgumas famílias paramétrica específicas de funções de correlação, como as apresentadas aseguir, terão uso prático.


182.4.1 Função de correlação de MatèrnMatèrn (1986) apresenta uma classe de funções de correlação que é consideradauma das mais completas, por englobar outras funções de correlação, pela simples escolha <strong>do</strong>parâmetro de diferenciabilidade. Esta é dada por:ρ (u,φ,κ) =( )1 u κ ( ) u2 κ−1 K κΓ(κ) φ φ(2.10)onde K κ (δ), δ = u φ é a função modificada de Bessel de terceiro tipo (ABRAMOWITZ; STE-GUN, 1965) dada por:⎧⎪⎨K κ (δ) =⎪⎩(π)2sinπδ{I −κ (δ) − I κ (δ)} κ ≠ 0,1,2,...( ) πlim{I −κ (δ) − I κ (δ)} κ = 0,1,2,...p→κ 2sinπ psen<strong>do</strong> que:∞∑I κ (δ) =j=0(δ/2) κ+2 jj!Γ(κ + j+ 1) ,para κ = 0,1,2,... eΓ(κ) =∫ ∞0t κ−1 e −t dt, κ > 0, é a função Gamma.O parâmetro φ > 0 na Equação 2.10 define a taxa na qual a função de correlação caia zero com o aumento da distância u. O parâmetro κ > 0 é chama<strong>do</strong> de ordem <strong>do</strong> modelo deMatèrn e determina a suavidade <strong>do</strong> sinal S(x). O comportamento dessa função pode ser vista naFigura 2.5.2.4.2 Função de correlação da Família EsféricaA função de correlação dessa família é definida como:⎧ ( ) ( )⎨31 − 3 uφρ (u;φ) =2+ 1 uφ20 ≤ φ⎩0 u > φ(2.11)O nome desta função se deve ao fato de que ρ(u;φ) tem uma interpretação geométrica


19ρ(h)0.0 0.2 0.4 0.6 0.8κ = 0.5κ = 1.0κ = 2.0ρ(h)0.0 0.2 0.4 0.6 0.8φ = 0.250φ = 0.188φ = 0.<strong>14</strong>00.0 0.2 0.4 0.6 0.8 1.0distancia0.0 0.2 0.4 0.6 0.8 1.0distanciaFigura 2.5: Comportamento da função de correlação de Matèrn com o parâmetro φ = 0,25 fixoe diferentes valores para o parâmetro de diferenciabilidade κ (esquerda). Na mesma figura,para um mesmo valor de κ = 0.5, variou-se o parâmetro φ que controla a taxa de decaimentoda função (direita).como sen<strong>do</strong> o volume de interseção de duas esferas cujos centros estejam separadas de umadistância u (DIGGLE; RIBEIRO JR, 2007). Essa função de correlação tem alcance finito edepende somente <strong>do</strong> parâmetro de escala φ. O comportamento gráfico dessa função pode servista na Figura 2.6 à esquerda.2.4.3 Função de correlação da Família “Potência” de ordem κA função de correlação dessa família é definida como:ρ (u;φ;κ) = e − “ uφ” κpara φ > 0 e 0 < κ ≤ 2 (2.12)Nesta função, se κ < 2, o processo S(x) é contínuo mas não é diferenciável e se κ ≥ 2pode ser infinitamente diferenciável. Existem <strong>do</strong>is casos particulares para essa função. No casoκ = 1 a função será chamada exponencial, e para κ = 2 a função será chamada de gaussiana(Figura 2.6 à direita).Toda a meto<strong>do</strong>logia geoestatística está baseada na correlação existente entre as medidastomadas em duas coordenadas distintas. As formas das funções apresentadas atendem aopressuposto de que as observações mais próximas são, provavelmente, mais similares entre si <strong>do</strong>


20ρ(h) − Esferica0.0 0.2 0.4 0.6 0.8 1.0ρ(h) − Exponencial0.0 0.2 0.4 0.6 0.8 1.0ρ(h) − Gaussiana0.0 0.2 0.4 0.6 0.8 1.00.0 0.2 0.4 0.6 0.8 1.0distancia0.0 0.2 0.4 0.6 0.8 1.0distancia0.0 0.2 0.4 0.6 0.8 1.0distânciaFigura 2.6: O gráfico da esquerda mostra uma função de correlação esférica com o parâmetroφ = 0,6. O gráfico <strong>do</strong> centro ilustra o comportamento de uma função de correlação exponencialde ordem κ = 1 e φ = 0,2. O gráfico da direita ilustra também o comportamento de uma funçãode correlação exponencial de ordem κ = 2 e φ = 0,35, equivalente à função Gaussiana.que aquelas muito afastadas. Isso dá o caráter regionaliza<strong>do</strong> de um atributo ou uma propriedadeem áreas agrícolas.Existe na literatura outras propostas de funções de correlação, como a geométrica (WA-KERNAGEL, 2003), ou mesmo aquelas que apresentam só o patamar (efeito pepita puro). Dasfunções apresentadas, a mais empregada é a de Matèrn pois ela permite maior flexibilidadena variação <strong>do</strong>s parâmetros por descreverem a diferenciabilidade <strong>do</strong> processo e a extensão dadependência espacial. Esta foi a família de correlações a<strong>do</strong>tada no desenvolvimento deste trabalho.2.5 ESTIMAÇÃO DE PARÂMETROS DO MODELO2.5.1 Modelagem e estimação de parâmetros de tendência nãoestacionáriaNo modelo geoestatístico idealiza<strong>do</strong> para o processo mensurável Y , da<strong>do</strong> pela Equação2.2 a estrutura linear para a média µ(x i ) é usualmente chamada de “tendência” e é dada de formageral por:p∑µ(x i ) = β 0 + β 1 d 1 (x i )+...+β p d p (x i ) = β 0 + β j d j (x i ) (2.13)sen<strong>do</strong> p o número de covariáveis presentes. Na forma matricial se representa como:j=1


21⎛onde: µ =⎜⎝⎞ ⎛µ 1µ 2; D(x) =... ⎟ ⎜⎠ ⎝µ nµ = D β (2.<strong>14</strong>)⎞ ⎛ ⎞1 d 11 d 21 ... d p1β 01 d 12 d 22 ... d p2β 1; β =. . .... . ⎟ ⎜⎠ ⎝ ... ⎟⎠1 d 1n d 2n ... d pn β psen<strong>do</strong> a matriz D uma matriz de posto completo, ou seja, n ≥ p. Os coeficiente são obti<strong>do</strong>sempregan<strong>do</strong>-se o méto<strong>do</strong> <strong>do</strong>s mínimos quadra<strong>do</strong>s (MONTGOMERY; PECK, 1955). Sob ahipótese de independência entre as observações, a função de mínimos quadra<strong>do</strong>s para o problemapode ser escrita como:⎛n∑ n∑MSQ(β 0 ,β 1 ,...,β p ) = εi 2 = ⎝µ i − β 0 −i=1 i=1j=1⎞p∑β j d j (x i ) ⎠2(2.15)A solução que minimiza a Equação 2.15 em termos de β, segun<strong>do</strong> Montgomery e Peck(1955) é aquela que satisfaz:∂∂β 0MSQ(β) = −2∂∂β jMSQ(β) = −2⎛⎞n∑p∑⎝µ i − β ˆ 0 − βˆj d j (x i ) ⎠ = 0i=1i=1para j = 1,..., p e i = 1,...,n.j=1⎛⎞n∑p∑⎝µ i − β ˆ 0 − βˆj d j (x i ) ⎠d j (x i ) = 0j=1Expandin<strong>do</strong>-se o somatório externo e simplifican<strong>do</strong> obtém-se o seguinte sistema deequações normais de mínimos quadra<strong>do</strong>s:8>:n ˆ β 0ˆ β 0ˆ β 0.ˆ β 0nXd i1i=1nXd i2i=1nXd iki=1+ ˆ β 1+ ˆ β 1+ ˆ β 1.+ ˆ β 1nXd 1 (x i )i=1nXd 1 (x i ) 2i=1nXd 1 (x i )d 2 (x i )i=1nXd p (x i )d 1 (x i )i=1+ ˆ β 2+ ˆ β 2+ ˆ β 2.+ ˆ β 2nXi=1nXi=1nXi=1nXi=1d 2 (x i ) +... + ˆ β kd 1 (x i )d 2 (x i ) +... + ˆ β kd 2 (x i ) 2 +... + ˆ β kd p (x i )d 2 (x i ) +... + ˆ β knXnXd p (x i ) = µ ii=1i=1nXnXd 1 (x i )d p (x i ) = d i1 µ ii=1i=1nXnXd 2 (x i )d p (x i ) = d i2 µ ii=1i=1. . . .. .. ..nXnXd p (x i ) 2 = d ik µ ii=1i=1


22Como solução dessas equações normais tem-se os estima<strong>do</strong>res de mínimos quadra<strong>do</strong>spara β. Usan<strong>do</strong> notação matricial, a função de mínimos quadra<strong>do</strong>s para a Equação 2.<strong>14</strong> serádada por:MSQ(β) =n∑εi 2 = ε ′ ε = (µ − D β) ′ (µ − D β)i=1= µ ′ µ − β ′ D ′ µ − µ ′ Dβ + β ′ D ′ Dβ= µ ′ µ − 2β ′ D ′ µ + β ′ D ′ Dβ∂∂β MSQ(β) = ∂∂β (µ′ µ − 2β ′ D ′ µ + β ′ D ′ Dβ) == −2D ′ µ + 2D ′ D ˆβ = 0Assim, D ′ D ˆβ = D ′ µ, e portanto, ˆβ pode ser estima<strong>do</strong> como:ˆβ = ( D ′ D ) −1 D ′ µConsideran<strong>do</strong>-se que µ i representa a média de uma única observação na localização x i ,então esse valor coincide com o valor observa<strong>do</strong> y i e pode-se assim escrever o estima<strong>do</strong>r <strong>do</strong>scoeficientes <strong>do</strong> modelo de tendência como sen<strong>do</strong>:ˆβ = ( D ′ D ) −1 D ′ YSe os da<strong>do</strong>s não forem independentes e a matriz de covariância associada Σ <strong>do</strong> modelo(que é o caso) for conhecida, então o méto<strong>do</strong> será denomina<strong>do</strong> mínimos quadra<strong>do</strong>s generaliza<strong>do</strong>s.O modelo inicial será inflaciona<strong>do</strong> na quantidade de parâmetros a serem estima<strong>do</strong>s paradefinir Σ. O estima<strong>do</strong>r de β será da<strong>do</strong> por:ˆβ = ( D ′ Σ −1 D ) −1D ′ Σ −1 Y (2.16)Assumin<strong>do</strong>-se que Y tem distribuição normal multivariada, ˆβ será o estima<strong>do</strong>r demínimos quadra<strong>do</strong>s para β, com suas importantes propriedades, coincidin<strong>do</strong> com o estima<strong>do</strong>rde máxima verossimilhança.Uma vez identificada e modelada a tendência, é possível estimar componentes residuaisdas observações por:Y ∗ = Y − D ˆβ (2.17)e que refletem apenas a estrutura de covariâncias <strong>do</strong> processo.


232.5.2 Ajuste de modelo ao semivariograma por mínimos quadra<strong>do</strong>sO semivariograma teórico trata-se <strong>do</strong> gráfico da função semivariância versus adistância u que separa duas posições. Como a função de correlação associada é assintoticamentedecrescente, sua variação será muito pequena para grandes valores de u, poden<strong>do</strong> ser consideradaestável, para efeitos práticos. Segun<strong>do</strong> Diggle e Ribeiro Jr (2007) uma convenção a<strong>do</strong>tadapor este modelo é considerar atingi<strong>do</strong> o patamar quan<strong>do</strong>, para um da<strong>do</strong> u 0 , tem-se ρ(u 0 ) ≃ 0,05.Não há uma razão científica para se a<strong>do</strong>tar esse valor de corte, poden<strong>do</strong> ser considerada umaquantidade numericamente razoável para a estabilização da função de correlação e, consequentemente,da função semivariância. Esse valor u 0 é denomina<strong>do</strong> de alcance prático. Em termosda função semivariância, seu valor é obti<strong>do</strong> com o valor de u 0 tal que γ(u 0 ) = τ 2 + 0,95 σ 2 .Para a modelagem de um processo gaussiano isotrópico estacionário, o problema sereduz a definir a função de correlação mais apropriada ao fenômeno e estimar os parâmetros µ,τ 2 , σ 2 e φ, na situação mais simples.A estimativa de Matheron (MATHERON, 1963) para a semivariância teórica envolven<strong>do</strong>duas medidas <strong>do</strong> processo Y é dada pela Equação 2.5, denominada semivariância experimentalou empírica. Uma área conten<strong>do</strong> n coordenadas amostrais fornecerá ( n2)pares <strong>do</strong>tipo (u i j ,v i j ). Este será, dependen<strong>do</strong> <strong>do</strong> número de coordenadas amostrais, um conjunto muitogrande. O seu gráfico é denomina<strong>do</strong> semivariograma experimental, caracteriza<strong>do</strong> por uma nuvemde pontos. Seu aspecto é mostra<strong>do</strong> pela Figura 2.7.semivariance0 500 1000 15000 100 200 300 400 500 600distanceFigura 2.7: Variograma empírico de concentração de cálcio em uma área com 178 pontos amostrais,em da<strong>do</strong>s de pesquisa de Oliveira (2003).Devi<strong>do</strong> ao grande número de pontos no gráfico <strong>do</strong> semivariograma empírico, bemcomo a forte dispersão à grandes distâncias, ele se torna uma figura de difícil interpretação, nosenti<strong>do</strong> de se tornar difícil ajustar visualmente um bom modelo variográfico teórico. Diggle e


24Ribeiro Jr (2007) dizem que esse comportamento errático se deve ao fato de que a distribuiçãoamostral marginal de cada ordenada v i j é proporcional a uma distribuição qui-quadra<strong>do</strong> com 1grau de liberdade, sen<strong>do</strong> portanto, fortemente assimétrica e com alto coeficiente de variação.Visan<strong>do</strong> facilitar o aspecto computacional <strong>do</strong> processo e ter uma interpretação gráficaplausível, Pannatier (1996) sugeriu dividir em intervalos a variação das distâncias u e representar,no ponto médio de cada intervalo, o valor médio <strong>do</strong> grupo das semivariâncias relativasa esse intervalo. O semivariograma se reduz a uns poucos pontos, permitin<strong>do</strong> o ajuste de ummodelo variográfico teórico, usan<strong>do</strong> como critério de ajuste méto<strong>do</strong>s basea<strong>do</strong>s em minimizaro erro médio quadrático, da<strong>do</strong> pela diferença entre o valor médio de v para uma distância u 0representante <strong>do</strong> intervalo e o valor teórico nessa mesma distância, ou seja, um erro <strong>do</strong> tipo(γ(u 0 ) − v(u 0 )) 2 . O gráfico típico resultante desse procedimento é mostra<strong>do</strong> na Figura 2.9.O estima<strong>do</strong>r pelo méto<strong>do</strong> <strong>do</strong>s momentos mais utiliza<strong>do</strong> para a semivariância é aqueleproposto por Matheron (1962) e defini<strong>do</strong> como:ˆγ(u) =1|2N(u)|∑( y(xi ) − y(x j ) ) 2N(u)(2.18)onde N(u) = { (x i ,x j ) : x i − x j = u;i, j = 1,2,...,n } é o conjunto <strong>do</strong>s pares cujas distâncias éu. Para Braga (1990), se Y for uma função aleatória estacionária, então esse estima<strong>do</strong>r, soba hipótese intrínseca, é não-tendencioso e não-vicia<strong>do</strong> para a média mas muito afeta<strong>do</strong> porobservações atípicas (outliers).Atteia, Dubois e Webster (1994) disseram que a situação ideal em uma região homogêneasegun<strong>do</strong> as observações amostrais de uma variável Y(x) espacialmente distribuída,corresponderia à reta bissetriz no primeiro quadrante de um plano cartesiano, onde ficariamaloca<strong>do</strong>s os pontos <strong>do</strong> diagrama u-dispersão. Mas a realidade é diferente disso, apresentan<strong>do</strong>pontos fora dessa reta. Esses pontos representam as diferenças de duas coordenadas quaisquer.Pela Figura 2.8, deduz-se que:cos45 0 =d αY(x α + u) −Y(x α )d α = cos45 0 (Y(x α + u) −Y(x α ))sen<strong>do</strong> que α representa uma certa distância fixa.A distância média quadrática γ(u) será obtida como:


25Y α (x+u)Y α (x).. ... d α ❅❅ 45 0❅Y α (x) cos(45 0 ) =d αY α (x+u) −Y α (x)Figura 2.8: Ilustração geométrica da obtenção de um par de pontos <strong>do</strong> variograma empirico. d αrepresenta a distância de um ponto separa<strong>do</strong> de outro por uma distância u até a reta bissetriz deum diagrama de dispersão u-scaterplot.γ(u) =γ(u) =∑N(u)1d 2 α = cos2 45 0N(u) N(u)α=1∑N(u)12N(u)α=1N(u)∑α=1(Y(x α + u) −Y(x α )) 2(Y(x α + u) −Y(x α )) 2que corresponde à expressão <strong>do</strong> estima<strong>do</strong>r <strong>do</strong> semivariograma experimental apresentada porIsaaks e Srivastava (1989), Journel e Huijbregts (1978), Pannatier (1996), Matheron (1962)entre outros.semivariância0 50 100 1500 100 200 300 400 500distânciaFigura 2.9: Variograma empírico agrupa<strong>do</strong> em classes (“bina<strong>do</strong>”) de concentração de cálcio emárea com 178 pontos amostrais, em da<strong>do</strong>s de pesquisa de Oliveira (2003).Essa abordagem vem sen<strong>do</strong> a<strong>do</strong>tada por diversos autores em estu<strong>do</strong>s que envolvemaplicações agrícolas. Reichardt, Vieira e Libardi (1986) estudaram 50 da<strong>do</strong>s de pH de solo,


26de amostras coletadas com espaçamento de 1 m, em transecção de uma área de LatossoloVermelho-escuro orto localiza<strong>do</strong> em Araras-SP, cultivada com cultura de cana-de-açúcar. Atécnica de autocorrelação que empregaram nos da<strong>do</strong>s mostrou que observações de pH eramcorrelacionadas espacialmente até uma distância de 5 m. Observaram ainda que, para as amostrasserem consideradas independentes e completamente casualizadas, deveriam ser espaçadasa pelo menos, 10 m. Com seu trabalho, os autores concluíram que a variabilidade espacial <strong>do</strong>solo pode ser definida corretamente e que a geoestatística era a alternativa certa às meto<strong>do</strong>logiastradicionais.Prevedello (1987) estu<strong>do</strong>u a magnitude da variabilidade espacial de 47 parâmetros(físicos e químicos) de um solo com Terra Roxa Estruturada, em uma área de 4.810 m 2 , emPiracicaba-SP, onde foi aplica<strong>do</strong> o manejo de uma cultura de arroz de sequeiro. O autor utilizouem seu experimento uma estrutura regular formada pelo cruzamento de 4×13 linhas, totalizan<strong>do</strong>52 pontos amostrais, separa<strong>do</strong>s 10 m entre si. Avaliou e discutiu a dependência espacialpela análise <strong>do</strong> autocorrelograma e <strong>do</strong> semivariograma, usan<strong>do</strong> o estima<strong>do</strong>r clássico de Matheron.Assim, com o emprego da teoria das variáveis regionalizadas, estabeleceu subunidades deamostragem ou de manejo individualiza<strong>do</strong>, consideran<strong>do</strong>-as independentes. Concluiu ainda quea área total não se mostrou homogênea para nenhum <strong>do</strong>s 47 parâmetros estuda<strong>do</strong>s, contrarian<strong>do</strong>o que havia inicialmente suposto.Mohamed, Evans e Shiel (1996) usaram a geoestatística para examinar a variabilidadegeográfica em uma área de terra e descobrir, pela distribuição espacial a melhor densidadeamostral, no senti<strong>do</strong> de obterem as propriedades de colheita e distribuição das características<strong>do</strong> solo com poucas amostras. Com o emprego <strong>do</strong> semivariograma experimental determina<strong>do</strong>pelo estima<strong>do</strong>r clássico de Matheron, detectaram uma estrutura de variabilidade no solo. Comisso puderam utilizar seus parâmetros para efetuarem a interpolação de da<strong>do</strong>s para produção demapas de contornos.Yang et al. (1998) estudaram a influência da topografia no rendimento da colheita,pela variabilidade de cinco campos em declive, da região de Palouse, em Washington-USA. Osautores desenvolveram um sistema de informações geográficas (GIS) para o manejo e análise<strong>do</strong> rendimento de trigo, juntamente com informações georreferenciadas sobre a variabilidadeda topografia. Identificaram também o padrão de variabilidade <strong>do</strong> rendimento <strong>do</strong> trigo dentrode cada região plantada, para cada uma das cinco regiões estudadas e avaliaram a relação entrerendimento e atributos de topografia. Descreveram o padrão de variabilidade espacial pelosemivariograma, que mostrou claramente uma estrutura de dependência espacial justifican<strong>do</strong> oemprego <strong>do</strong> manejo localiza<strong>do</strong>.


2.5.3 Ajuste de modelos e estimação <strong>do</strong>s parâmetros por máximaverossimilhança27Consideran<strong>do</strong> o caso estacionário <strong>do</strong> modelo geoestatístico univaria<strong>do</strong> da<strong>do</strong> pelaEquação 2.2, onde o processo S(x i ) pode ser escrito como um conjunto de observações Y comdistribuição de probabilidades de acor<strong>do</strong> com a Equação 2.3, os parâmetros gerais <strong>do</strong> modelo aserem estima<strong>do</strong>s são: θ = (β,σ 2 ,φ,τ 2 ) onde, como já foi dito, φ é um parâmetro da função decorrelação.Os dadis y = {y 1 ,...,y n }, que representam uma realização <strong>do</strong> processo estocásticoespacial em n coordenadas, possui distribuição gaussiana n-variada, ou seja, Y∼ N n (µ;Σ)onde µ é um vetor de números reais, to<strong>do</strong>s iguais e Σ é a matriz de variâncias e covariâncias detamanho n × n, com as propriedades de ser simétrica e definida positiva. Então, a distribuiçãoconjunta de Y , segun<strong>do</strong> (DUDEWICZ; MISHRA, 1988) será:{1f Y (y) =exp − 1 }(2π) n/2 |Σ| 21 2 (Y − µ)′ Σ −1 (Y − µ)para to<strong>do</strong> vetor Y de números reais.Sen<strong>do</strong> Y um vetor gaussiano correlaciona<strong>do</strong>, sua função de verossimilhança será compostapela sua distribuição conjunta de probabilidades dada por:L(θ) = f(y|θ) = (|σ 2 R+τ 2 I|) −1/2(2π) n/2O logaritmo da função verossimilhança é da<strong>do</strong> por:{exp − 1 }2 (Y − Dβ)′ (σ 2 R+τ 2 I) −1 (Y − Dβ) . (2.19)l(θ) = − 1 2 log(2π)n − 1 2 log(|σ 2 R+τ 2 I|) − 1 2 (Y − Dβ)′ (σ 2 R+τ 2 I) −1 (Y − Dβ)l(θ) = − 1 [nlog(2π)+log(|σ 2 R+τ 2 I|)+2+ (Y − Dβ) ′ (σ 2 R+τ 2 I) −1 (Y − Dβ) ] . (2.20)Fazen<strong>do</strong>-se τ2 = ν 2 então Var(Y) = Σ = σ 2 R+τ 2 I = σ 2( )R+ τ2 I = σ 2 V .σ 2 σ 2Substituin<strong>do</strong>-se σ 2 R+τ 2 I por σ 2 V na Equação 2.20, vem:l(θ) = − 1 2[nlog(2π)+log(|σ 2 V |)+(Y − Dβ) ′ (σ 2 V) −1 (Y − Dβ) ] . (2.21)


28Agora substituin<strong>do</strong> σ 2 R+τ 2 I por Σ na mesma Equação (2.20), tem-se:l(θ) = − 1 2[nlog(2π)+log(|Σ|)+(Y − Dβ) ′ (Σ) −1 (Y − Dβ) ] (2.22)Desenvolven<strong>do</strong>-se os produtos matriciais a Equação 2.22 resulta em:l(θ) = − 1 2[nlog(2π)+log(|Σ|)+Y ′ Σ −1 Y − 2Y ′ Σ −1 Dβ + β ′ D ′ Σ −1 Dβ ] (2.23)em que Y ′ Σ −1 Dβ é um escalar pois Y 1×n , Σ n×n , D n×n e β n×1 .Segun<strong>do</strong> Kolman (1997), se A é uma matriz quadrada simétrica definida positiva eβ = [β 1 ,β 2 ,...,β n ] ′ um vetor, então:a) ∂Ax∂x = A′b) ∂x′ Ax∂x(transposta)= 2Ax (forma quadrática).Desses resulta<strong>do</strong>s obtém-se a derivada parcial <strong>do</strong> logaritmo da função deverossimilhança de θ com relação a β, dada por:∂l(θ)∂β= −1 2 (−2(Y ′ Σ −1 D) ′ + 2(D ′ Σ −1 D)β) = D ′ Σ −1 Y − D ′ Σ −1 Dβ.Se ∂l(θ)∂β= 0, então D′ Σ −1 Y − D ′ Σ −1 D ˆβ = 0, e assim obtém-se o estima<strong>do</strong>r MV parao parâmetro β que é da<strong>do</strong> por:ˆβ = (D ′ Σ −1 D) −1 D ′ Σ −1 Y. (2.24)fica:Consideran<strong>do</strong>-se também que Σ = σ 2 V e que |Σ| = (σ 2 ) n |V |, então a Equação 2.21l(θ) = − 1 2[nlog(2π)+log(|σ 2 V |)+Y ′ (σ 2 V) −1 Y − β ′ D ′ (σ 2 V) −1 Dβ ] ,logo:l(θ) = − 1 [nlog(2π)+log[(σ 2 ) n |V |]+ Y ′ V −1 Y2= − 1 2σ 2− 2 Y ′ V −1 Dβσ 2 + β ′ D ′ V −1 ]Dβσ 2[nlog(2π)+nlog(σ 2 )+log|V |+ (Y − Dβ)′ V −1 ](Y − Dβ)σ 2


29onde [(Y − Dβ) ′ V −1 (Y − Dβ)]/σ 2 é uma soma de quadra<strong>do</strong>s ponderada pela matriz de covariâncias.Calculan<strong>do</strong>-se a derivada de l(θ) com relação a σ 2 obtém-se:Se ∂l(θ)∂σ 2∂l(θ)∂σ 2 = − 1 [ n2 σ 2 − (Y − Dβ)′ V −1 ](Y − Dβ)(σ 2 ) 2 .= 0 e consideran<strong>do</strong> o vetor de parâmetros (β,σ2 ,φ,ν 2 ) ′ , tem-se:− ṋσ + (Y − Dβ)′ V −1 (Y − Dβ)2 ( ˆσ 2 ) 2 = 0,(Y − Dβ) ′ V −1 (Y − Dβ)( ˆσ 2 ) 2 = n,logo,ˆσ 2 φ,ν 2 = (Y − Dβ)′ V −1φ,ν 2 (Y − Dβ)nRetoman<strong>do</strong>-se a Equação (2.24) e substituin<strong>do</strong> Σ por σ 2 V vem:(2.25)β =( D ′ V −1 ) −1D DV −1 Yσ 2σ 2= (D ′ V −1 D) −1 σ 2 DV −1 Yσ 2= (D −1 V −1 D) −1 DV −1 Y (2.26)φ,ν 2 φ,ν 2que depende somente <strong>do</strong>s parâmetros φ e ν 2 . Neste caso, a matriz de correlação será dada por:⎛V =⎜⎝⎞1+ν 2 ρ(u 12 ) ... ρ ( u 1n )ρ(u 21 ) 1+ν 2 ... ρ(u 2n ). .... . ⎟⎠ρ(u n1 ) ρ(u n2 ) ... 1+ν 2(2.27)O logaritmo da função de verossimilhança concentrada será então dada por:


30[(l(φ,ν 2 ) = − 1 (Y − Dβ) ′ V −1 )(Y − Dβ)φ,νnlog(2π)+nlog2 + log|V |2n⎤+ (Y − Dβ)′ V −1 (Y − Dβ)( Y − Dβ) ′ V −1 ) ⎥(Y − Dβ ⎦ ,nAssim,[(l(φ,ν 2 ) = − 1 (Y − Dβ) ′ V −1 ) ](Y − Dβ)φ,νnlog(2π)+nlog2 + log|V |+n .2nlogol(φ,ν 2 ) = − 1 ()2 [nlog(2π) + nlog (Y − Dβ) ′ V −1 (Y − Dβ) − nlognφ,ν 2+ log|V |+n]. (2.28)Para um modelo estacionário, a menos das constantes, a função l(φ,ν 2 ) fica:l(φ,ν 2 ) ∝ − n 2()(Y − µ) ′ V −1 (Y − µ) − log|V | . (2.29)φ,ν 2 2Esta função recebe como argumentos, o vetor das observações <strong>do</strong> processo Y e a matrizdas distâncias de cada coordenada com as demais, que permite obter V pela escolha convenientede uma função de correlação ρ(u i j ). A maximização dessa função, segun<strong>do</strong> os parâmetrosenvolvi<strong>do</strong>s, fornecerá a estimativa <strong>do</strong>s parâmetros <strong>do</strong> modelo de correlação espacial.Funções côncavas são aquelas cujo gráfico está sempre acima ou sobre qualquer cordatraçada numa região entre seus pontos, ou, equivalentemente, seu gráfico está abaixo da retatangente ao seu ponto de máximo. Neste senti<strong>do</strong>, tanto a função de verossimilhança quanto ologaritmo da função de verossimilhança são funções côncavas, garantin<strong>do</strong> assim a existência deum ponto de máximo local.Para se obter a melhor estimativa para os parâmetros, deve-se encontrar simultaneamenteo valor <strong>do</strong>s parâmetros que irão maximizar essa função. Muitos programas computacionais,incluin<strong>do</strong> o geoR (RIBEIRO JR; DIGGLE, 2001), possuem algoritmos eficientes paraestimar esses parâmetros. A questão importante a se destacar aqui é que esse méto<strong>do</strong>, usa<strong>do</strong>para aderir um modelo teórico com a melhor estimativa de seus parâmetros, envolvem todasas observações amostrais, sem a necessidade <strong>do</strong>s agrupamentos feito nos ajustes através de


31variogramas, evitan<strong>do</strong> os erros decorrentes.Uma restrição quanto ao uso <strong>do</strong> méto<strong>do</strong> da otimização <strong>do</strong> logaritmo da função deverossimilhança está relacionada à forma suave de variação de certas funções de correlação, ouseja, aquelas funções que são diferenciáveis um número grande de vezes. Nestes casos, a matrizde correlação poderá apresentar colunas muito parecidas numericamente, impossibilitan<strong>do</strong> suainversão.Muitos pesquisa<strong>do</strong>res atualmente envolvem em seus trabalhos, a escolha de modelo decorrelação e ajuste <strong>do</strong>s parâmetros por este méto<strong>do</strong>. Oliveira (2003) o utilizou em da<strong>do</strong>s experimentaiscoleta<strong>do</strong>s em levantamento detalha<strong>do</strong> de solos da Estação Experimental de Campos,Rio de Janeiro, na Fazenda Angra, em estu<strong>do</strong> pe<strong>do</strong>lógico onde foram avaliadas as característicasmorfológicas, físicas e químicas <strong>do</strong>s solos, e apresentadas também, informações referentes àdistribuição geográfica. No estu<strong>do</strong> geoestatístico foi considerada a variável agronômica teorde Cálcio (mmolc dm −3 ), nas camadas de 0-20 e 20-40 cm. Dentre suas conclusões verificouque o estima<strong>do</strong>r de máxima verossimilhança não foi eficiente para detectar diferenças entre osmodelos com covariável.2.5.4 Ajuste de modelos e estimação <strong>do</strong>s parâmetros por máximaverossimilhança restritaModelos mistos descrevem experimentos cuja estrutura linear envolve fatores fixos efatores aleatórios, independentemente da média e <strong>do</strong> erro, exigin<strong>do</strong> uma análise separada paracada uma de suas partes. A análise da parte aleatória é feita pela estimação <strong>do</strong>s componentes davariância na presença <strong>do</strong>s efeitos fixos e a análise da parte fixa é feita pela estimativa da funçãoque a governa e por testes de hipóteses.Hartley e Rao (1967) apresentam em seu artigo procedimentos de estimação por MVpara análise de variância para modelos mistos generaliza<strong>do</strong>s envolven<strong>do</strong> qualquer combinaçãode fatores fixos e aleatórios e interações de qualquer ordem. O méto<strong>do</strong> se aplica aos casosonde as estruturas matriciais envolvidas satisfazem certas condições mostradas no seu trabalho.Os autores mostram ainda a eficiência e a consistência <strong>do</strong>s estima<strong>do</strong>res e derivam testes dehipóteses e intervalos de confiança. Já o méto<strong>do</strong> da máxima verossimilhança restrita é descritopor Patterson e Thompson (1971) como os procedimentos de MV modifica<strong>do</strong>s, extensivo adelineamentos experimentais em blocos com estruturas mais complexas para também estimarcomponentes de variância <strong>do</strong> modelo.


32Segun<strong>do</strong> Perry e Iemma (1999) os estima<strong>do</strong>res de MVR são obti<strong>do</strong>s maximizan<strong>do</strong>-se aparte da função MV que é invariante ao parâmetro de locação, ou seja, maximizan<strong>do</strong>-se a funçãoMV de um vetor de combinações lineares das observações que são invariantes a µ(x) = Dβ.Consideran<strong>do</strong>-se o modelo da Equação 2.2 vem:KY = Kµ(x)+K S(x)+K ε (2.30)onde K é o tal vetor de combinações lineares. Assim:Y ∼ N n(Kµ(x);K( σ 2 R(φ)+τ 2 I ) K ′)e o logaritmo da função MVR poderá então ser escrita como:−2logL RE= log|σ 2 R(φ)+τ 2 I|+(Y − D ˆβ) ′ (σ 2 R(φ)+τ 2 I) −1 (Y − D ˆβ)+log|D ′ (σ 2 R(φ)+τ 2 I)D|+(n − k)log2πonde k é o posto da matriz D e:ˆβ = (D ′ ( ˆσ 2 R( ˆφ)+ ˆτ 2 I))(D ′ ( ˆσ 2 R( ˆφ)+ ˆτ 2 I)) −1 Ysen<strong>do</strong> ˆβ, ˆσ 2 , ˆτ 2 e ˆφ 2 estima<strong>do</strong>res MV de β, σ 2 , τ 2 e φ, respectivamente.O méto<strong>do</strong> supõe gaussianidade <strong>do</strong>s da<strong>do</strong>s, fornecen<strong>do</strong> estimativas não negativas davariância e ainda considera a perda de graus de liberdade pela presença <strong>do</strong>s fatores fixos. Apesarde ser emprega<strong>do</strong> para estimar componentes da variância em da<strong>do</strong>s desbalancea<strong>do</strong>s (númerodiferentes de repetições) fornece também estima<strong>do</strong>res não vicia<strong>do</strong>s e de variância mínima parada<strong>do</strong>s balancea<strong>do</strong>s.2.5.5 Escolha de modelos por validação cruzadaPara Cressie (1985), escolher um modelo é obter o estima<strong>do</strong>r <strong>do</strong>s seus parâmetros comméto<strong>do</strong>s estatísticos de otimização, e uma vez escolhi<strong>do</strong>, resta saber se ele é eficiente parainterpolar valores, permitin<strong>do</strong> estimativas confiáveis para a construção de mapas temáticos.Essa escolha é feita com a aplicação de méto<strong>do</strong>s de validação que comparam o valor de umavariável sob um modelo geoestatístico teórico com o valor empíricos dessa variável obti<strong>do</strong>através de amostragem, em uma mesma coordenada espacial. Basea<strong>do</strong> na análise <strong>do</strong> erro de


33estimação poderá ser escolhi<strong>do</strong> o melhor modelo. Dentre os principais critérios para validaçãoencontram-se o Critério de Informação de Akaike, de Filliben, da validação cruzada e o máximovalor <strong>do</strong> logaritmo da função verossimilhança (FARACO et al., 2008).A validação cruzada é uma técnica frequentemente utilizada para se avaliar um modeloteórico idealiza<strong>do</strong> para explicar um fenômeno. Após o ajuste de seus parâmetros, com base emum conjunto experimental de da<strong>do</strong>s, os quais se supõe serem governa<strong>do</strong>s por tal modelo, testa-seo seu efeito sobre a estimação <strong>do</strong> mesmo conjunto de da<strong>do</strong>s ou sobre outro conjunto conheci<strong>do</strong>e que seja supostamente governa<strong>do</strong> pelo mesmo modelo. Para isso, duas principais estatégiassão a<strong>do</strong>tadas. Em uma delas, retira-se cada um <strong>do</strong>s pontos amostrais por vez e então o estimacom o modelo ajusta<strong>do</strong> ao conjunto completo de informações. Em outra estratégia, ajusta-se omodelo pretendi<strong>do</strong> a um conjunto de da<strong>do</strong>s experimentais e então aplica-se o modelo em outroconjunto de da<strong>do</strong>s conheci<strong>do</strong>s e que também seja governa<strong>do</strong> pelo mesmo modelo. A avaliação<strong>do</strong> erro de predição informará sobre a qualidade <strong>do</strong> modelo escolhi<strong>do</strong>.2.6 PREDIÇÃO LINEAR ESPACIAL UNIVARIADAUm aspecto importante da modelagem estatística é a utilização <strong>do</strong> modelo obti<strong>do</strong> paraefetuar predições. Empregar o termo predição significa fazer conjectura ou suposição sobre umresulta<strong>do</strong> de Y , desconheci<strong>do</strong>, que poderá ou não acontecer. A meta é realizar boas estimativasde quantidades que variam continuamente no espaço, em função de um conjunto discreto deobservações obtidas dispersamente em uma área. Esse procedimento, sob certas circunstâncias,é chama<strong>do</strong> krigagem, termo este cria<strong>do</strong> por G. Matheron em reconhecimento ao trabalho <strong>do</strong>engenheiro de minas D. G. Krige (KRIGE, 1951), sen<strong>do</strong> a krigagem ordinária a mais utilizada.O méto<strong>do</strong> estima um valor em um ponto arbitrário de uma região fechada onde a função decorrelação <strong>do</strong> processo é conhecida, empregan<strong>do</strong> o conjunto de pontos amostrais conheci<strong>do</strong>s,distribuí<strong>do</strong>s pela área.Isaaks e Srivastava (1989) citam vários méto<strong>do</strong>s de estimação pontual como: méto<strong>do</strong>poligonal de desagrupamento, méto<strong>do</strong> da triangulação, méto<strong>do</strong> <strong>do</strong> inverso <strong>do</strong> quadra<strong>do</strong> dasdistâncias, méto<strong>do</strong> <strong>do</strong>s vizinhos mais próximos. A krigagem ordinária é um méto<strong>do</strong> que forneceum estima<strong>do</strong>r BLUE, acrônimo <strong>do</strong> inglês Best Linear Unbiased Estimator – melhor estima<strong>do</strong>rnão vicia<strong>do</strong> e de variância mínima. O méto<strong>do</strong> é linear porque seus estima<strong>do</strong>res são feitos apartir de combinações lineares sobre as observações amostrais disponíveis, é não vicia<strong>do</strong> poiso erro médio residual é zero e “melhor” porque dentre outros estima<strong>do</strong>res é o que leva à menor


34variância <strong>do</strong> erro. Em uma coordenada arbitrária x 0 , as estimativas serão dadas por:ŷ(x 0 ) =n∑ω i y(x i )i=1onde os x 0 são as coordenadas onde se deseja efetuar uma estimativa e ω i é o peso associa<strong>do</strong> ài-ésima observação y(x i ), sujeito à restrição ∑ ni=1 ω i = 1, que garante a não tendenciosidade <strong>do</strong>preditor.Journel e Huijbregts (1978) também salientaram que, no caso de processos nãoestacionários,serão necessárias algumas condições de ausência de viés. Para eles a limitação àclasse de estima<strong>do</strong>res lineares é natural, uma vez que são necessários somente os momentos desegunda ordem da função de covariância.Schabenberger e Gotway (2005) fazem distinção entre estimação e predição, pois sãoprocedimentos muitas vezes ti<strong>do</strong>s como equivalentes. Em um modelo básico de regressão linearsimples os erros não são correlaciona<strong>do</strong>s (são independentes) e os coeficientes são estima<strong>do</strong>spor méto<strong>do</strong>s de mínimos quadra<strong>do</strong>s, conforme Equação 2.16 e então se prediz um valor deinteresse. Não fica claro se o preditor é uma “resposta” em x 0 ou é um estima<strong>do</strong>r de E[Y(X 0 )].Apesar da estimação de uma quantidade fixa ou predição de uma quantidade aleatória ser umaquestão menor, sua importância fica clara ao se considerar uma incerteza associada a essasquantidades. No caso da geoestatística, apesar <strong>do</strong> total desconhecimento <strong>do</strong> processo S(x),aplicações com predição são frequentemente mais empregadas <strong>do</strong> que aquelas que buscam aestimação de uma média.O modelo de predição linear, sinônimo de krigagem, dependen<strong>do</strong> se a média <strong>do</strong> processoé ou não conhecida, proposto por esses autores é da<strong>do</strong> por:Ŷ(x 0 ) = ˆµ + r ′ Σ −1 (Y(x) − ˆµ)onde r = Cov(Y(x),Y(x 0 )) e Σ é a matriz de variâncias e covariâncias das variáveis observadas.A variância da predição, segun<strong>do</strong> eles, será:Var(Ŷ(x 0 )) = σ 2 − r ′ Σ −1 r+ (1 − 1′ Σ −1 r) 21 ′ Σ −1 1Segun<strong>do</strong> Goovaerts (1997), o estima<strong>do</strong>r de krigagem é um estima<strong>do</strong>r de regressãolinear Ŝ(x) e é defini<strong>do</strong> como:


35Ŝ(x) = µ += µ +(= 1 −n∑λ i (Y i − µ)i=1n∑λ i Y i −i=1n∑λ i µi=1)n∑λ i µ +i=1i=1n∑λ i Y iem que µ é a média <strong>do</strong> processo, mas que, em um caso geral, pode ser aplicada em seu lugar afunção média µ(x). Y i é o vetor de observações e λ a função peso.Sen<strong>do</strong> S(x) um processo estacionário e Y um vetor de variáveis aleatórias cujos valoressão observáveis e T outra variável aleatória, cujo valor se deseja estimar, Y terá distribuiçãonormal multivariada com média constante µ e variância σ 2 R+τ 2 I e T = T(S) será a meta depredição. Se T = S(x 0 ) então a distribuição conjunta de T e Y será normal multivariada, dada[ ])σ2σpor: (T,Y) ∼ N n(µ,2 r ′,σ 2 r σ 2 R+τ 2 IPara Diggle e Ribeiro Jr (2007) o estima<strong>do</strong>r pontual ˆT = E(T |Y) será o valor que minimizao erro médio quadrático MSE( ˆT) = E( ˆT −T) 2 onde: ˆT(x 0 ) = E(T |Y) = µ +r ′ V −1 (Y −µ)e Var( ˆT(x 0 )) = Var(T |Y) = σ 2( 1 − r ′ V −1 r ) , em que V = σ 2 R+τ 2 I e r é o vetor de correlaçãoentre a posição <strong>do</strong>s valores observa<strong>do</strong>s e a posição <strong>do</strong> valor y 0 a ser predito.No caso <strong>do</strong> valor de µ ser desconheci<strong>do</strong>, então ele poderá ser estima<strong>do</strong> por:ˆµ = (1 ′ V −1 1) −1 1 ′ V −1 Y2.7 INFERÊNCIA BAYESIANA PARA MODELOS GEO-ESTATÍSTICOSAutores como Lindley (1990) e Paulino, Turkman e Murteira (2003) consideram umarevolução científica a substituição <strong>do</strong> paradigma clássico pelo bayesiano. A base para essaabordagem em problemas de inferência, dizem, foi lançada por Richard Price em 1763 quan<strong>do</strong>publicou a obra póstuma de Thomas Bayes, com o título An Essay Towards Solving a Problemin the Dictrine of Chances. Entretanto, há certo grau de discordância na literatura acerca dessa


36origem, todavia o conheci<strong>do</strong> Teorema de Bayes, se aceitas as leis de probabilidades axiomáticasde Kolmogorov, é núcleo dessa abordagem.Para Gelman et al. (2003) a análise bayesiana de da<strong>do</strong>s consiste em um méto<strong>do</strong> parainferências que aplica modelos de probabilidades tanto para as quantidades amostrais observadasquanto para as quantidades que se deseja conhecer. A característica essencial <strong>do</strong> méto<strong>do</strong>,para eles, é o emprego explícito da lei de probabilidades para quantificar incertezas.O méto<strong>do</strong> bayesiano para análise de da<strong>do</strong>s é caracteriza<strong>do</strong> pelas seguintes etapas:• Constrói-se um modelo que comporte, na sua distribuição conjunta de probabilidades, asquantidades observáveis e as não observáveis, consistentes com o problema científico emquestão;• Condicionalmente aos da<strong>do</strong>s observa<strong>do</strong>s, calcula-se e interpreta-se uma distribuição aposteriori de probabilidades para as quantidades não observáveis;• Avalia-se o ajuste <strong>do</strong> modelo e as implicações <strong>do</strong>s resulta<strong>do</strong>s da distribuição a posteriori.A lógica da inferência bayesiana é realizar inferência associan<strong>do</strong> incerteza aosparâmetros envolvi<strong>do</strong>s no modelo, tratan<strong>do</strong>-os também como variável aleatória. A propostapara sua aplicação com geoestatística é a de combinar estimação e predição a partir de um conjuntode observações associadas a um processo, em um alvo de predição. O resulta<strong>do</strong> obti<strong>do</strong>será uma realização de uma variável aleatória. Nela a incerteza sobre o parâmetro desconheci<strong>do</strong>,será descrita por uma distribuição de probabilidades e um conceito de predição, normalmente amédia de sucessivas realizações.2.7.1 Especificação <strong>do</strong> modelo geoestatístico bayesianoSegun<strong>do</strong> Diggle e Ribeiro Jr (2007) um modelo geoestatístico é especifica<strong>do</strong> conjuntamentepara um processo espacial contínuo não observa<strong>do</strong> { S(x) : x ∈ R 2} e para um conjuntode da<strong>do</strong>s observa<strong>do</strong>s Y(x) nas localizações x, condiciona<strong>do</strong> ao processo espacial com efeito nasmesmas localizações. Sen<strong>do</strong> θ = { θ 1 ;...;θ p ∈ R } o conjunto de parâmetros desconheci<strong>do</strong>s enão observáveis no modelo, então:P ( Y(x);S(x)|θ ) = P( Y(x);S(x);θ )P(θ)= P ( Y(x)|S(x);θ ) P ( S(x)|θ ) . (2.31)


37Y(x) como:A distribuição preditiva <strong>do</strong> processo S(x) é definida condicionalmente às observaçõesP(S(x)|Y(x)) = P(S(x);Y(x)) , (2.32)P(Y(x))entretanto, o cenário é constituí<strong>do</strong> pela distribuição conjunta <strong>do</strong> processo S(x), de observaçõesde Y(x) e de parâmetros desconheci<strong>do</strong>s θ. Para se obter a distribuição conjunta de (S(x);Y(x))exigida na Equação 2.32, integra-se a distribuição de (S(x);Y(x);θ) sobre o espaço deparâmetros, ou seja:∫∫P(S(x);Y(x)) = P(S(x);Y(x);θ)dθ = P(S(x)|Y(x);θ)P(θ|Y(x))P(Y(x))dθθθque, substituída em 2.32 produz:P ( S(x)|Y(x) ) ∫= P ( S(x)|Y(x);θ ) P ( θ|Y(x) ) dθ. (2.33)θEssa distribuição corresponde a uma média ponderada pela distribuição de θ condicionadaa Y(x), onde os pesos P ( θ|Y(x) ) refletem a incerteza a posteriori sobre os valores <strong>do</strong>sparâmetros <strong>do</strong> modelo.Bolstad (2004) mostra que aplican<strong>do</strong>-se o Teorema de Bayes, a distribuição a posteriori<strong>do</strong>s parâmetros pode ser escrita como:P ( θ|Y(x) ) = P( θ;Y(x) )P ( Y(x) ) = P( Y(x)|θ ) P ( θ )P ( Y(x) ) (2.34)onde o termo P ( Y(x) ) = ∫ θ P( Y(x)|θ ) P(θ)d(θ) é constante sob a distribuição de [θ|Y(x)].A notação [ · ] corresponde à distribuição de probabilidades <strong>do</strong> interior <strong>do</strong> colchetes. O termoP ( Y(x)|θ ) é a função de verossimilhança de Y(x)|θ com distribuição gaussiana multivariada eP(θ) é a distribuição a priori de θ que expressa o conhecimento prévio acerca da distribuiçãode probabilidades <strong>do</strong>s parâmetros.Segun<strong>do</strong> Gelman et al. (2003) e Kolman (2004), excluin<strong>do</strong>-se o termo constanteP ( Y(x) ) a Equação 2.34 fica:P ( θ|Y(x) ) ∝ P ( Y(x)|θ ) P(θ) (2.35)Destaque-se que a Equação 2.35 não é uma distribuição de probabilidades, mask P ( θ|Y(x) ) o será para uma escolha adequada da constante k de proporcionalidade, obtidatanto por méto<strong>do</strong>s analíticos quanto méto<strong>do</strong>s numéricos.


38O modelo geoestatístico da<strong>do</strong> pela Equação 2.3 pode ser especifica<strong>do</strong> como um modelohierárquico espacial misto como:• Y(x) = Dβ + S(x)+ε;• S(x) ∼ N n(0 ; σ 2 R(φ) ) ;• ε ind. ∼ N n (0;τ 2 );• θ = (β;σ 2 ;φ;τ 2 ) que terá distribuição de probabilidades (a priori) a ser atribuída conformeo problema.Na prática, a escolha da distribuição a priori <strong>do</strong>s parâmetros <strong>do</strong> modelo é um assuntodelica<strong>do</strong> na inferência bayesiana pois ela se dá, ora por conhecimento (objetivo ou subjetivo)da sua distribuição, ora por uma conveniência que resulte em uma distribuição a posteriori comsolução analitica. Distribuições a priori que resultem em uma posteriori da mesma família, sãochamadas de prioris conjugadas e sua escolha se dá devi<strong>do</strong> à tratabilidade analítica decorrentee a uma conveniência computacional. Se os parâmetros da distribuição a priori forem conheci<strong>do</strong>s,dir-se-á que ela é degenerada nos seus valores. Se o conhecimento sobre esses parâmetrosé vago, dir-se-á que a distribuição priori não é informativa, é plana (flat) ou é imprópria (EH-LERS, 2006).Sen<strong>do</strong> Y(x) um processo gaussiano como o defini<strong>do</strong> pela Equação 2.3, e sua função deverossimilhança dada pela Equação 2.19, então a distribuição a posteriori <strong>do</strong>s parâmetros serádada pela Equação 2.35 como:P(β;σ 2 ;φ;τ 2 |Y(x)) ∝ |σ 2 R(φ)+τ 2 I| − 2 1 ×{× exp − 1 }2 (Y(x) − Dβ)′ (σ 2 R(φ)+τ 2 I) −1 (Y(x) − Dβ) ×× P(β;σ 2 ;φ;τ 2 ) (2.36)As distribuições a posteriori desses parâmetros foram obtidas consideran<strong>do</strong>-se os seguintescasos:a) Incerteza no parâmetro de média.Supon<strong>do</strong>-se que β tenha uma distribuição a priori não informativa dada porP ( β|σ 2 ;φ ) ∝ 1 e que σ 2 e φ sejam parâmetros conheci<strong>do</strong>s, utilizan<strong>do</strong>-se a Equação 2.35


39combinada com a Equação 2.19 tem-se:P ( β|Y(x);σ 2 ;φ ) ∝∝exp{(Y(x) − Dβ) ′( σ 2 R(φ) ) }−1 (Y(x) − Dβ){exp Y ′ (x) ( σ 2 R(φ) ) −1 Y(x) −Y ′ (x) ( σ 2 R(φ) ) −1 Dβ− β ′ D ′( σ 2 R(φ) ) −1 Y(x)+β ′ D ′( σ 2 R(φ) ) }−1 DβP ( β|Y(x);σ 2 ;φ ) ∝{exp β ′ D ′( σ 2 R(φ) ) −1 D β−Y ′ (x) ( σ 2 R(φ) ) −1 D(D′ ( σ 2 R(φ) ) −1 D) −1 (D ′( σ 2 R(φ) ) −1 D)β−β ′ (D ′ ( ( σ 2 R(φ) ) −1 D) D−1 ( σ 2 R(φ) ) −1 Y(x)+Y ′ (x) ( σ 2 R(φ) ) −1 D(D( σ 2 R(φ) ) −1 D)(D ( σ 2 R(φ) ) −1 D) −1 D ′( σ 2 R(φ) ) −1 Y(x)−Y ′ (x) ( σ 2 R(φ) ) −1 D(D( σ 2 R(φ) ) −1 D)(D ( σ 2 R(φ) ) −1 D) −1 D ′( σ 2 R(φ) ) −1 Y(x)}P ( β|Y(x);σ 2 ;φ ) ∝{exp (β −(D ′( σ 2 R(φ) ) −1 D) −1 D ′( σ 2 R(φ) ) −1 Y(x))′D ′( σ 2 R(φ) ) −1 D(β −(D ′( σ 2 R(φ) ) −1 D) −1 D ′( σ 2 R(φ) ) −1 Y(x))}De acor<strong>do</strong> com a dedução dada pela Equação 2.16,ˆβ = (D ′( σ 2 R(φ) ) −1 D) −1 D ′( σ 2 R(φ) ) −1 Y(x),onde ˆβ é o estima<strong>do</strong>r MV para β. Assim:P ( β|Y(x);σ 2 ;φ ) ∝exp{(β − ˆβ) ′ D ′( σ 2 R(φ) ) }−1 D (β − ˆβ).(2.37)A Equação 2.37 corresponde ao núcleo de uma distribuição normal com média ˆβ evariância ( σ 2 R(φ) ) −1 , definin<strong>do</strong> uma distribuição a posteriori para β, condicionada àsobservações Y(x) e aos parâmetros conheci<strong>do</strong>s σ 2 e φ:[β|Y(x);σ 2 ;φ ] ( (∼ N ˆβ ; σ 2 R(φ) ) ) −1.b) Incerteza no parâmetro de escala.


40Se forem conheci<strong>do</strong>s os parâmetros de média β e de correlação φ, Gelman et al. (2003)sugerem utilizar como uma priori cojungada a distribuição χ 2 -inversa escalonada – χ 2 ScI ,ou seja, [ σ 2 |β ; φ ] ∼ χ 2 ScI (n σ ; W 2 ) cuja função densidade de probabilidade é dada por:P(σ 2 ) = (n σ/2) (n σ/2)W n ( σσ 2) {−(n σ /2+1)exp − n σ W 2 }Γ(n σ /2)2 σ 2 , σ 2 > 0. (2.38)Nessa Equação 2.38, n σ corresponde aos graus de liberdade e W a uma medida de escala.A função de verossimilhança (Equação 2.19) pode aqui ser escrita como:{L(σ 2 ;φ;β;Y(x)) ∝ (σ 2 ) −(n/2) exp − 1}2 σ 2(Y(x) − Dβ)′ (R(φ)) −1 (Y(x) − Dβ)∝ (σ 2 ) −(n/2) exp{− n ˆσ 2 }2 σ 2, (2.39)onde ˆσ 2 = 1 n (Y(x) − Dβ)′ (R(φ)) −1 (Y(x) − Dβ) é o estima<strong>do</strong>r MV para σ 2 .Toman<strong>do</strong>-se a priori conjugada sugerida tem-se:P(σ 2 |β;φ) ∝ (σ 2 ) − n σ +1 2 exp{− n σ W 2 }2 σ 2 . (2.40)Substituin<strong>do</strong>-se a Equação 2.39 e a Equação 2.40 na Equação 2.35 vem:P(σ 2 |Y(x);β;φ) ∝( σ 2) {− n+n σ2 +1exp − n ˆσ 2 + n σ W 2 }2 σ 2∝⎧⎪ ( σ 2) − n+n σ ⎨ (n+n σ ) n ˆσ 2 + n σ W 22 +1 n+n exp −σ⎪ 2 σ 2 .⎩⎫⎪⎬⎪⎭(2.41)Portanto, [ σ 2 |Y(x);β;φ ] ∼ χ 2 ScIc) Incerteza nos parâmetro de média e de escala.(n+n σ ; n ˆσ 2 + n σ W 2 ).n+n σNeste caso considera-se desconheci<strong>do</strong> os parâmetros da média β e de escala σ 2 e conheci<strong>do</strong>o parâmetro φ da função de correlação. Ehlers (2006) sugere especificar uma prioriconjugada em duas etapas. Na primeira considera-se σ 2 fixo e se utiliza o resulta<strong>do</strong> obti<strong>do</strong>na Equação 2.37 e na segunda etapa combina-se a função de verossimilhança da Equação2.19 com uma distribuição a priori para σ 2 , conforme a Equação 2.41, usan<strong>do</strong>-se o fatode que P(β;σ 2 ) = P(β|σ 2 ) P(σ 2 ). Esquematicamente o procedimento fica:• Especifica-se as priori marginais, supon<strong>do</strong> independência entre elas;• Obtém-se a priori conjunta;


41• Obtém-se a posteriori conjunta através <strong>do</strong> produto da priori conjunta pela função deverossimilhança;• Obtém-se as posteriori marginais por integração.Seja:P ( β ; σ 2 |Y(x) ) ∝ P ( β ; σ 2) P ( Y(x)|β ; σ 2) (2.42)a distribuição a posteriori conjunta para β e σ 2 desejada e seja:[Y(x)|β ; σ2 ] ∼ N n(D β ; σ 2 R(φ) )a função de verossimilhança. Então:P(β ; σ 2 |Y(x)) ∝ ( σ 2) {− n 2exp − 12 σ 2(Y(x) − D β)′( R(φ) ) }−1 (Y(x) − D β)Conforme solução da Equação 2.37 tem-se:(Y(x) − D β) ′ (R(φ)) −1 (Y(x) − D β)=( β − ˆβ) ′ (D′ ( R(φ) ) −1 D) (β − ˆβ)+ (Y(x) − D ˆβ) ′( R(φ) ) −1 (Y(x) − D ˆβ)Gelman et al. (2003) sugerem utilizar a distribuição Normal χScI 2 para a distribuição conjuntade β e σ 2 , ou seja,[β; σ 2 | φ ] ∼ N ( m β ;σ 2 ) (V β χ2ScI nσ ;Wσ)2 (2.43)Combinan<strong>do</strong>-se a função de verosimilhança com a priori dada pela Equação 2.43 obtémsea posteriori:onde:[β; σ 2 | Y(x);φ ] ∼ N ( (ˆβN ;σ 2 )V ˆβN χ2 W 2 )1ScI n σ + n;n σ + n(2.44)W 2 1= n σ Wσ 2 + n ˆσ 2 + ˆβ ′ V −1 ˆβ + m ′ β V −1− ( V −1ˆβˆβ +V −1βm ) ′V (β ˆβN V−1ˆβˆββm βˆβ +V −1βm β)Como:• P ( β; σ 2 |Y(x);φ ) = P ( β|Y(x); σ 2 ;φ ) P ( σ 2 |Y(x);φ ) ,• [ β|Y(x);σ 2 ;φ ] ∼ N ( ˆβN ;σ 2 )V ˆβN e• [ σ 2 |Y(x);φ ] ∼ χScI( 2 nσ + n;W12 )


42então:[β;|Y(x);φ]∼ tnσ +n( ˆβN ;W 2 1 V ˆβN)d) Incerteza nos parâmetro de média, de escala e de correlação.Além <strong>do</strong>s parâmetros de média e de escala serem desconheci<strong>do</strong>s, o acréscimo <strong>do</strong>parâmetro de correlação φ, também desconheci<strong>do</strong>, presente na matriz de correlações espaciais<strong>do</strong> modelo, será feito com a suposição de que modelo seja isotrópico e sem efeitopepita. O acréscimo de um efeito de anisotropia exigirá somente o acréscimo de mais<strong>do</strong>is parâmetros na mesma matriz de correlações, sen<strong>do</strong> um para controlar uma razão deanisotropia e outro para controlar um ângulo de inclinação de uma elipse associada aoefeito. Assim, estamos supon<strong>do</strong> que o parâmetro ψ R = 1 e ψ A = 0.A priori conjunta ( β;σ 2 ;φ ) terá distribuição de probabilidades dada por:P ( β;σ 2 ;φ ) = P ( β;σ 2 | φ ) P ( φ )e uma distribuição a posteriori dada por:P ( β;σ 2 ;φ| Y(x) ) = P ( β;σ 2 | Y(x);φ ) P ( φ| Y(x) )onde P ( β;σ 2 | Y(x);φ ) tem distribuição Normal-χ 2 ScIP ( φ| Y(x) ) ∝ P ( Y(x)|φ ) P ( φ ) .conforme visto na Equação 2.44 ePara Ribeiro Jr e Diggle (1999), usan<strong>do</strong> uma priori imprópria P(β;σ 2 |φ) ∝ σ −2 a posterioripara o parâmetro de correlação fica:P ( φ|Y(x) ) ∝ P ( φ ) |V ˆβ| 1 2 |Ry | − 1 2(W 2) − n−p2(2.45)o que não define uma distribuição de probabilidades conhecida. Uma solução sugeridapelos autores é a utilização de inferência por simulação, discretizan<strong>do</strong> a distribuição de(φ|Y(x))e a<strong>do</strong>tanto uma distribuição uniforme discreta para φ.2.7.2 Predição linear espacial bayesianaSegun<strong>do</strong> Ribeiro Jr e Diggle (1999), em problemas de variáveis espacialmente correlacionadas,frequentemente o interesse é a predição de uma variável Y 0 (x ′ ) em um novo conjuntode localizações x ′ para a elaboração de mapas temáticos e então o modelo deverá incluir essanova variável. Entretanto, a questão de predição refere-se a afirmações sobre Y 0 (x ′ ) depois de


43ter si<strong>do</strong> observada a amostra Y(x), significan<strong>do</strong> que o que se deseja de fato é P(Y 0 (x ′ )|Y(x)).DeGroot (1989) afirma que o preditor E(Y 0 (x ′ )|Y(x)) é um preditor ótimo pois minimiza o erroquadrático médio da predição.O cenário geoestatístico bayesiano de interesse é aquele forma<strong>do</strong> pela distribuição conjuntade Y(x) e Y 0 (x ′ ), cujo modelo é escrito como:([ ] [ ])D V(σ(Y(x);Y 0 (x ′ )|θ) ∼ N β ; τ 2 2 ;φ) v(σ 2 ;φ)I +(2.46)D 0 v(σ 2 ;φ) ′ V 0 (σ 2 ;φ)onde V(σ 2 ;φ) é a matriz de covariâncias formada pelas amostras de Y(x) nas coordenadasx, V 0 (σ 2 ;φ) é a matriz <strong>do</strong> covariâncias formada pelas estimativas de Y 0 (x ′ ) nas coordenadasx ′ e v(σ 2 ;φ) é a matriz de covariâncias cruzadas formada pelas coodenadas de Y(x) e Y 0 (x ′ ).Sob uma distribuição gaussiana, consideran<strong>do</strong>-se os parâmetros de θ conheci<strong>do</strong>s, a obtençãoda distribuição conjunta dada pela Equação 2.46 será simples, tanto quanto será a distribuiçãomarginal de [Y(x)] e a condicional [ Y 0 (x ′ )|Y(x) ] . Todavia os parâmetros não são conheci<strong>do</strong>s enecessitam então ser estima<strong>do</strong>s, sob o enfoque não bayesiano ou se deve integrar a preditiva soba posteriori <strong>do</strong>s parâmetros no estima<strong>do</strong>r bayesiano.As predições de Y 0 (x ′ ) condicionalmente às observações de Y(x) serão obtidas como:P ( Y 0 (x ′ )|Y(x) ) ∫= P ( Y 0 (x ′ );θ|Y(x) ) ∫ (P Y0 (x ′ );Y(x);θ )dθ =P ( Y(x) ) dθ∫ (P Y0 (x ′ )|Y(x);θ ) P ( Y(x);θ )=P ( Y(x) ) dθ∫ (P Y0 (x ′ )|Y(x);θ ) P ( θ|Y(x) )=P ( Y(x) ) P( Y(x) ) dθ∫= P ( Y 0 (x ′ )|Y(x);θ ) P ( θ|Y(x) ) dθ (2.47)que representa uma média ponderada de (Y 0 (x)|Y(x);θ) sobre o espaço <strong>do</strong>s parâmetrosθ = (β;σ 2 ;φ;τ 2 ) onde os pesos são determina<strong>do</strong>s pela distribuição a posteriori conjunta[θ|Y(x)]. Consideran<strong>do</strong> as propriedades da distribuição gaussiana, e um modelo sem o efeitopepita, ou seja, τ 2 = 0, a Equação 2.47 terá uma distribuição de probabilidades dada por:[Y0 (x ′ )|Y(x);β;σ 2 ;φ ] ∼ N n(D 0 β + r ′ (φ) ( R(φ) ) −1(Y(x) − Dβ);σ 2( R 0 (φ) − r ′ (φ)(R Y (φ)) −1 r(φ) )) (2.48)onde σ 2 R 0 (φ) representa a variância sem se levar em consideração a informação da amostra e


44σ 2 r ′ (φ)R −1 (φ) r(φ) é a redução na variância devi<strong>do</strong> à informação da amostra, cuja intensidadeYirá depender da configuração das localizações x (RIBEIRO JR; DIGGLE, 1999).Busca-se na maneira bayesiana, incorporar incertezas na forma de uma distribuição deprobabilidades, em todas as predições e na a distribuição a posteriori [ Y 0 (x 0 ) ] . Considerou-seaqui todas as circunstâncias abordadas na Seção 2.7.1.a) Predição com incerteza no parâmetro βA distribuição a posteriori da predição de Y 0 consideran<strong>do</strong>-se incerteza no parâmetro β ea Equação 2.47 será dada por:P ( Y 0 (x ′ )|Y(x);σ 2 ;φ ) ==∫P ( y 0 ;β|y;σ 2 ;φ ) d ββ∫P ( y 0 |y;β;σ 2 ;φ ) P ( β|y;σ 2 ,φ ) d ββO termo dentro da integral é uma expressão de uma normal bivariada, então, a integral iráresultar também uma distribuição normal na forma:onde:eµ 1 = E [ Y 0 (x ′ )|Y(x);σ 2 ;φ ]= ( D 0 − r ′ (φ)R −1Y+ [ r ′ (φ)R −1Y[Y0 (x ′ )|Y(x);σ 2 ;φ ] ∼ N ( µ 1 ;σ 2 Σ 1)(φ)D)( V −1β+ D ′ R −1Y(φ)D) −1 V−1(φ)+( D 0 − r ′ (φ)R −1 (φ)D)( V −1Σ 1 = Var ( Y 0 (x ′ )|Y(x);σ 2 ;φ )= R −10 (φ) − r′ RY−1 (φ)r+ ( D 0 − r ′ R −1Y(φ)D) ′(V−1b) Predição com incerteza no parâmetro σ 2βY+ ( D ′ R −1Yββµ β+ D ′ R −1Y(2.49)(φ)D) −1 D ′ R −1 (φ)] Y(x)(φ)D) −1 ) −1 (D D0 − r ′ R −1 (φ)D)Neste caso, a distribuição preditiva para Y 0 (x ′ ) será dada por:P ( Y 0 (x ′ )|Y(x);β;φ ) ∫= P ( y 0 ;σ 2 |y;β;φ ) d σ 2∫σ 2= P ( y 0 |y;β;σ 2 ;φ ) P ( σ 2 |y;β,φ ) d σ 2 .σ 2YY


45Substituin<strong>do</strong>-se o termo da verossimilhança (com distribuição normal) e o termo da priori(com distribuição χScI 2 ) a solução analítica resultará em uma distribuição a posteriori paraY 0 (x ′ ) com distribuição t − student dada por:onde:Assim:[Y0 (x ′ )|Y(x);β;φ ] ∼ t nσ +n(µ0 ;Q 0 Σ 1)µ 0 = D 0 β + r ′ (φ)RY−1 (φ)(y − Dβ),Q 0 = n σW σ + n ˆσ 2,n σ + nΣ 0 = RY−1 (φ) − r′ (φ)R −1 (φ)r(φ).E [ Y 0 (x ′ )|Y(x) ] = µ 0 ;Var [ Y 0 (x ′ )|Y(x) ] ( )nσ + n=Q 0 Σ 0 .n σ + n − 2c) Predição com incerteza nos parâmetros β e σ 2Neste caso, a distribuição preditiva para Y 0 (x ′ ) será dada por:P ( Y 0 (x ′ )|Y(x);φ) ) ==∫σ 2 ∫β∫ ∫σ 2YP ( y 0 ;β;σ 2 |y;φ ) dβ dσ 2P(y 0 ;β|y;σ 2 ;φ)P(σ 2 |y;φ)dβ dσ 2 .β(2.50)Integran<strong>do</strong>-se em relação a β vem:P ( Y 0 (x ′ )|Y(x);φ ) =∫σ 2 P(y 0 |y;σ 2 ;φ)P(σ 2 |y;φ)dσ 2 .O primeiro termo da integral corresponde à distribuição preditiva dada pela Equação 2.49e o segun<strong>do</strong> termo corresponde a distribuição a posteriori marginal P ( σ 2 |Y(x) ) . Para asprioris aqui a<strong>do</strong>tadas, a distribuição a posteriori ficará:[Y0 (x ′ )|Y(x);φ ] ∼ t nσ +n(µ1N ;W 2 1 Σ 1N)onde µ 1N e Σ 1N dependerão da escolha para a priori de β, e então:E [ Y 0 (x ′ )|Y(x) ] = µ 1N ;Var [ Y 0 (x ′ )|Y(x) ] ( W2)= 1 Σ 1N.n σ + n − 2(2.51)


46d) Predição com incerteza nos parâmetros β, σ 2 e φNeste caso, a distribuição preditiva para Y 0 (x ′ ) será dada por:P ( Y 0 (x ′ )|Y(x) ) ∫ ∫ ∫= P ( y 0 ;β;σ 2 ;φ|y ) dβ dσ 2 dφφ β σ 2∫ ∫=Pφ[β∫σ ( y 0 ;β;σ 2 |y;φ ) ]dβ dσ 2 P ( φ|Y(x) ) dφ∫2= P ( y 0 ;|y;φ ) P ( φ|Y(x) ) dθθonde ( Y 0 (x ′ )|Y(x) ) ∼ t nσ +n(µ1N ;W 2 1 Σ 1N)conforme Equação 2.51 e(φ|Y(x))é obti<strong>do</strong>conforme Equação 2.45.Para a inclusão de um efeito pepita (nugget), escreve-se a matriz de correlação na forma:R ( φ;ν ) = σ 2[ ]R(φ)+ν 2 I(2.52)onde ν 2 = τ2corresponde ao efeito pepipa relativo e assim, a distribuição a posterioriσ 2para esse parâmetro é obtida discretizan<strong>do</strong>-se ( φ;ν 2)2.8 APLICAÇÃO DO MODELO GEOESTATÍSTICO UNI-VARIADO2.8.1 Estu<strong>do</strong> de casoCaso 1: Produtividade de Soja em área comercialAqui foram utiliza<strong>do</strong>s os da<strong>do</strong>s de pesquisa <strong>do</strong> Núcleo de Inovações Tecnológicas –NIT, da <strong>Universidade</strong> Estadual <strong>do</strong> Oeste <strong>do</strong> Paraná – Unioeste. A área de Latossolo vermelhodistrófico, com declividade média de 0,19%, em área de 1,74 ha, está localizada localiza<strong>do</strong> noCentro de Pesquisa Eloy Gomes, da Cooperativa Central Agropecuária de DesenvolvimentoTecnológico e Econômico Ltda. – COODETEC, situada na BR 467, km 98, em Cascavel-PR.Nessa área, no final <strong>do</strong> ano de 1997, cultivou-se soja em sistema de semeadura direta. Em abril


47de 1998, a produção de cada parcela foi colhida e pesada. Simultaneamente foram tomadas, emcada parcela, amostras <strong>do</strong> solo para a análise química.Para modelar a estrutura de variabilidade espacial e correlacioná-la com uma variávelda cultura implantada na área, foram utiliza<strong>do</strong>s os atributos químicos: pH, Matéria Orgânica –MO (%), Potássio – K (Cmol c dm −3 ), Fósforo – P (mg dm −3 ) e Índice de Saturação de Bases– SB (%) e o atributo físico resistência mecânica à penetração no solo, expressa pelo índice decone – iCone (Kg cm −2 )As amostras foram obtidas com 7 cm de diâmetro e 15 cm de profundidade dentro decada uma das 256 parcelas, estruturadas em um grid de 7,20 × 7,20 m, com carrea<strong>do</strong>r de 2,4 mem uma das direções, usan<strong>do</strong>-se o sistema desalinha<strong>do</strong>, sistemático estratifica<strong>do</strong> de Wollenhaupte Wolkowski (1994) e adapta<strong>do</strong>s por Souza et al. (1999). Para a produtividade, foram colhidase identificadas as parcelas de 5,0 × 5,0 m, excluí<strong>do</strong>s bordaduras e carrea<strong>do</strong>r (Figura 2.10).Figura 2.10: Esquema de mostragem com locação das parcelas e pontos amostrais em sistemadesalinha<strong>do</strong>, sistemático estratifica<strong>do</strong> porposto por Wollenhaupt e Wolkowski (1994) e adapta<strong>do</strong>spor Souza et al. (1999).Caso 2: Rendimento de Pinus taeda L. em área de reflorestamento comercialFoi utiliza<strong>do</strong> também um segun<strong>do</strong> conjunto de da<strong>do</strong>s provenientes de banco de da<strong>do</strong>scartográficos gera<strong>do</strong> em padrões e formatos ArcGis, disponíveis no setor de informaçõesgeográficas da <strong>Universidade</strong> <strong>Federal</strong> <strong>do</strong> Paraná - UFPr e da empresa Mo<strong>do</strong> Battistella ReflorestamentoS/A – MOBASA. O estu<strong>do</strong> foi desenvolvi<strong>do</strong> em parcelas de inventários florestaiscontínuos com plantio de Pinus da espécie P. Taeda L. em fazendas situadas no município deRio Negrinho no Esta<strong>do</strong> de Santa Catarina sob <strong>do</strong>mínio das bacias e coberturas sedimentares na


48região <strong>do</strong> patamar oriental da Bacia <strong>do</strong> Paraná e na unidade <strong>do</strong> patamar de Mafra-SC. Trata-sede uma área de 2.252 ha localizada no Norte <strong>do</strong> Esta<strong>do</strong> de Santa Catarina onde o relevo é quaseplano, com cotas altimétricas diminuin<strong>do</strong> de leste para oeste, atingin<strong>do</strong> valores entre 650 a 740m. A geologia é representada pelo grupo Itararé compreenden<strong>do</strong> to<strong>do</strong> o pacote de sedimentosde origem glacial e periglacial relaciona<strong>do</strong> ao carbonífero superior e permiano inferior. O experimentofoi em delineamento completamente casualiza<strong>do</strong> e da<strong>do</strong>s não balancea<strong>do</strong>s em que asidades de coleta das informações das parcelas de inventário florestal contínuo foram consideradascomo repetições <strong>do</strong> modelo. Os três fatores qualitativos considera<strong>do</strong>s foram os municípios(três), as fazendas (sete) e as parcelas, com idades de 11, 12, 13, <strong>14</strong> e 15 anos (BOGNOLA,2007).Nessa área foram efetua<strong>do</strong>s levantamentos pe<strong>do</strong>lógicos com prospecção por tradageme em perfis em barrancos de estrada, acompanhada de coleta de amostras para análises químicasde: pH(CaCl 2 ), Fósforo disponível (P), Potássio disponível (K), Al 3+ , Carbono orgânico, H +Al 3+ , Soma de bases (SB), capacidade de troca catiônica (CTC) e Saturação por bases (V %) eanálises granulométricas de: areia, silte e argila.Foram ainda analisadas 18 árvores com idades que variavam de 11 a 15 anos, nas quaisforam medidas o diâmetro (cm) a 1,3 m de altura, a altura média (m) das árvores da parcela, onúmero de árvores por hectare, a altura <strong>do</strong>minante (m) das 10 maiores árvores, a área basal (m 3 ),o volume médio (m 3 ha −1 ) e incremento médio anual - IMA (m 3 ). Essas foram consideradas asvariáveis principais por estarem relacionadas com algum interesse econômico.O delineamento geoestatístico foi feito em pontos aleatórios da área registran<strong>do</strong>-seos pontos amostrais em coordenadas ortogonais UTM (Universal Transverse Mercator) comauxílio de aparelho de posicionamento por satélite GPS e anotan<strong>do</strong>-se, para cada localização,a análise <strong>do</strong> material geológico, as medições das árvores, a profundidade efetiva <strong>do</strong> perfil <strong>do</strong>solo (horizontes A + B), altura estimada <strong>do</strong> lençol freático, a posição na encosta, o percentualde declividade e a altitude.2.8.2 Recursos computacionaisForam a<strong>do</strong>ta<strong>do</strong>s ao longo das análises estatísticas deste estu<strong>do</strong>, recursos computacionaisbasea<strong>do</strong>s em programas livres, suporta<strong>do</strong>s pela licença internacional GPL – General PublicLicence. O sistema operacional foi o GNU/Linux e o pacote estatístico foi o R (R DevelopmentCore Team, 2008) e módulo geoestatístico geoR (RIBEIRO JR; DIGGLE, 2001) na


49versão 1.6-20. Com esse pacote geoestatístico foi possível ajustar modelos teóricos univaria<strong>do</strong>se bivaria<strong>do</strong>s váli<strong>do</strong>s, ajustar modelos lineares de corregionalização, efetuar estimação lineare simulações por krigagem e cokrigagem e produzir gráficos e mapas temáticos. O pacote estatístico,além <strong>do</strong> suporte às funções <strong>do</strong>s pacotes geoestatísticos, permitiu a análise convencional<strong>do</strong>s da<strong>do</strong>s bem como a ACP.2.8.3 Análise geoestatística <strong>do</strong>s da<strong>do</strong>s de produtividade de sojaFoi da<strong>do</strong> inicialmente um enfoque estatístico tradicional para a análise <strong>do</strong> conjunto devariáveis aleatórias medidas na área. Empregou-se uma análise descritiva, visan<strong>do</strong> identificar eavaliar a estrutura de pontos discrepantes, verificar homogeneidade e tendência direcional, bemcomo obter indica<strong>do</strong>res de atendimento aos pressupostos de um modelo geoestatístico e parareferências exploratórias no ajuste de parâmetros. Em seguida foram ajusta<strong>do</strong>s e analisa<strong>do</strong>smodelos teóricos para o processo geoestatístico gaussiano que determinou a produtividade desoja na área. Com o modelo foi possível construir mapas temáticos procuran<strong>do</strong> identificarclasses diferenciadas de produtividade em função <strong>do</strong>s resulta<strong>do</strong>s obti<strong>do</strong>s. Foi feita tambémuma análise descritiva das predições obtidas nos mapas visan<strong>do</strong> confrontar os resulta<strong>do</strong>s com ovalor da produtividade conhecida na área a partir de 256 amostras. A densidade amostral foi de157 pontos por hectare, valor esse considera<strong>do</strong> bem acima <strong>do</strong> usualmente pratica<strong>do</strong> no manejoagrícola pelo alto custo que representa.Análise descritiva das amostras de produtividade de soja e de variáveis Físicas e Químicas<strong>do</strong> soloAs amostras foram analisadas em três enfoques sen<strong>do</strong> o primeiro constituí<strong>do</strong> de to<strong>do</strong>sos 256 pontos amostrais disponibiliza<strong>do</strong>s pelo experimento original, o segun<strong>do</strong> por 128parcelas tomadas aleatóriamente das 256 coordenadas originais e um terceiro com 64 parcelastambém tomadas aleatóriamente das 256 coordenadas originais. As localizações das amostrasestá representada na Figura 2.11.A soma das áreas das parcelas totalizou 6.400 m 2 , corresponden<strong>do</strong> a 36,7% da áreatotal cultivada. A colheita resultou então em 1,758 t de soja que, projetada para a área totalcultivada resultou em 4,789 t. Essa produção corresponde a 2,75 t ha −1 que é compatível comos 2,74 t ha −1 registra<strong>do</strong>s pelo IBGE na safra de 2003 e com as 2,55 t ha −1 da safra 97/98 <strong>do</strong>


50Figura 2.11: Localização das amostras na área de cultivo. Os delineamentos amostrais comportam,da esquerda para a direita, 256 pontos origalmente estrutura<strong>do</strong>s pelo sistema sistemáticodesalinha<strong>do</strong> estratifica<strong>do</strong>, 128 e 64 pontos sortea<strong>do</strong>s <strong>do</strong>s 256 pontos originais. O eixo horizontalcorresponde a distância total de <strong>14</strong>1,2 m e o eixo vertical 115,2 m.Paraná segun<strong>do</strong> levantamento feito pela CONAB em abril de 2006. Tomou-se então como valorreferência a produtividade de 2,75 t ha −1 , projetada na área como única informação disponível.A Tabela 2.1 mostra os principais resulta<strong>do</strong>s descritivos sobre o resulta<strong>do</strong> da colheita.Nota-se que os valores da média de produtividade aumentam quan<strong>do</strong> se diminui o tamanho daamostra. Consideran<strong>do</strong> ensaios agrícolas de campo, Gomes (1963) classificou os experimentoscom base no coeficiente de variação – CV, onde valores superiores a 20% já indicam perdade precisão. Para a produtividade de soja o CV se manteve abaixo de 20%, valor este sugerin<strong>do</strong>homogeneidade das medidas. Os intervalos de confiança de 95% para o parâmetro detransformação λ de normalidade de Box-Cox (BOX; COX, 1964) incluem o valor unitário. Assim,optou-se por não transformar a variável resposta e considerou-se os da<strong>do</strong>s de produtividadecompatíveis com uma distribuição normal de probabilidades. Os perfis de verossimilhança parao parâmetro λ de transformação podem ser vistos na Figura 2.12.log−Likelihood−530.0 −529.0 −528.0 −527.095%0.2 0.4 0.6 0.8 1.0 1.2 1.4λlog−Likelihood−209 −207 −205 −20395%−1.0 −0.5 0.0 0.5 1.0 1.5 2.0λlog−Likelihood−79 −78 −77 −76 −75−2 −1 0 1 2 3Figura 2.12: Perfil <strong>do</strong> log-verossimilhança para o parâmetro λ de transformação de Box-Cox. Intervalo de 95% de confiança que contenha o valor unitário implica em normalidadeda distribuição <strong>do</strong>s da<strong>do</strong>s. Da esquerda para a direita as figuras representam o log da função deverossimilhança para o parâmetro λ com relação aos delineamentos amostrais de soja em 256pontos estrutura<strong>do</strong>s, 128 e 64 pontos sortea<strong>do</strong>s.95%λ


51Tabela 2.1: Estatística descritiva da variável soja medida em 256 pontos estrutura<strong>do</strong>s (Soja256),128 e 64 pontos sortea<strong>do</strong>s (Soja128 e Soja64, respectivamente) dentre os 256 pontos originaisdisponíveis.Delineamento Mínimo Média Máximo D.P. C.V.% LI-Bx LS-BxSoja256 1,190 2,7464 4,<strong>14</strong>0 0,4904 17,85 0,3 1,3Soja128 1,710 2,7544 4,<strong>14</strong>0 0,4328 15,71 -0,3 1,3Soja64 1,930 2,8080 3,700 0,4057 <strong>14</strong>,45 -1,1 2,0Medidas em ton ha −1 . D.P.: Desvio Padrão, C.V.: Coeficiente de Variação, LI-Bx e LS-Bx: Respectivamenteo limite inferior e limite superior <strong>do</strong> intervalo de 95% de confiança para o parâmetro λ deBox-Cox.As variáveis de natureza física e química <strong>do</strong> solo (secundárias), apresentadas na Tabela2.2, mostram resulta<strong>do</strong>s compatíveis com a literatura. Excetuan<strong>do</strong>-se MO e pH, asvariáveis apresentam coeficiente de variação acima de 20%, evidencian<strong>do</strong> a homogeneidadedas medidas. As variáveis P, pH e K não apresentam o valor unitário no intervalo de confiançade Box-Cox, sugerin<strong>do</strong> a necessidade de transformação em aplicações que exijam o pressupostode normalidade. As variáveis MO, SB e iCone contém o valor unitário no intervalo, sugerin<strong>do</strong>normalidade nas medidas, dispensan<strong>do</strong> transformações.Tabela 2.2: Estatísticas descritivas das variáveis secundárias P, pH, K, MO, SB e iCone, todastomadas nos mesmos 150 pontos aleatórios, seleciona<strong>do</strong>s <strong>do</strong>s 256 disponíveis.Delineamento Mínimo Média Máximo D.P. C.V.% LI-Bx LS-BxP 2,000 4,047 13,100 1,439 36,60 -1,2 -0,3pH 4,300 5,<strong>14</strong>5 6,600 0,505 9,80 -3,5 -0,5K 0,170 0,331 0,550 0,085 25,70 -0,6 0,6MO 36,55 52,680 68,350 6,392 12,13 0,3 2,6V% <strong>14</strong>,89 55,470 84,030 12,896 23,20 0,4 1,4iCone 10,50 20,300 31,100 4,163 20,50 0,3 1,6P em mg dm −3 , pH sem unidade de medida, K em cmolc dm −3 , MO em g dm −3 , SB em porcentageme iCone em kg cm −2 . D.P.: Desvio Padrão, C.V.: Coeficiente de Variação, LI-Bx e LS-Bx: Respectivamenteo limite inferior e limite superior <strong>do</strong> intervalo de 95% de confiança para o parâmetro λ deBox-Cox.Análise espacial das amostras de produtividade de sojaDevi<strong>do</strong> a dificuldade de se ajustar um modelo teórico confiável ao semivariograma experimentalpelo méto<strong>do</strong> <strong>do</strong>s mínimos quadra<strong>do</strong>s ou suas variações (Figura 2.7), optou-se nessetrabalho por se obter uma estimativa pontual para os parâmetros <strong>do</strong> modelo geoestatístico porMV, MVR e por méto<strong>do</strong>s bayesianos. A Tabela 2.3 mostra os resulta<strong>do</strong>s obti<strong>do</strong>s por MV. Nelanota-se que a estimativa para o parâmetro β, que corresponde à produtividade média, é próximo


52<strong>do</strong> valor de referência de 2,75 t ha −1 , ou seja, o erro relativo, da<strong>do</strong> pela diferença entre o valorobserva<strong>do</strong> nas amostras e o valor médio estima<strong>do</strong> pelo méto<strong>do</strong> não superou 8%. Destaca-setambém nessa tabela que o CEP apresentou, para amostras de 256 e 128 pontos, moderadadependência espacial e para amostras de 64 pontos, uma fraca dependência espacial, segun<strong>do</strong>classificação de Cambardella et al. (1994). Foi a<strong>do</strong>ta<strong>do</strong> no modelo, a função de correlação deMatèrn com κ = 0,5 e média constante.Tabela 2.3: Estimação <strong>do</strong>s parâmetros <strong>do</strong> modelo geoestatístico por MV.Delineamento β τ 2 σ 2 φ CEP (%) −logLSoja256 2,6583 0,1889 0,0725 63,8 72 168Soja128 2,7220 0,1359 0,0620 50,0 69 67Soja64 2,8083 0,1588 0,0033 38,6 98 33β: parâmetro <strong>do</strong> efeito sistemático <strong>do</strong> modelo, σ 2 e φ: parâmetros da função de correlação, τ 2 : parâmetro<strong>do</strong> erro, CEP: coeficiente de efeito pepita e logL: valor de MV. A função de correlação a<strong>do</strong>tada foi a deMatèrn com κ = 0,5.A Tabela 2.4 mostra os resulta<strong>do</strong>s obti<strong>do</strong>s pelo méto<strong>do</strong> MVR. Nela a estimativa parao parâmetro β, que corresponde à produtividade média, segue a tendência observada na Tabela2.3. O parâmetro φ de alcance forneceu valores muito maiores que a distância máxima daárea. Como os valores máximos <strong>do</strong> logarítimo da função de verosimilhança são equivalentestanto para o méto<strong>do</strong> MV quanto no méto<strong>do</strong> MVR, esse último não foi emprega<strong>do</strong> nas análisesseguintes e na produção de mapas.Tabela 2.4: Estimação <strong>do</strong>s parâmetros <strong>do</strong> modelo geoestatístico pelo méto<strong>do</strong> MVR.Delineamento β τ 2 σ 2 φ CEP (%) −logLSoja256 2,5454 0,1904 0,4495 ≫ 177 30 165Soja128 2,6649 0,1389 0,2440 ≫ 177 36 66Soja64 2,8160 0,1535 4,1380 ≫ 177 4 32β: parâmetros <strong>do</strong> efeito sistemático <strong>do</strong> modelo, σ 2 e φ: parâmetros da função de correlação, τ 2 :parâmetro <strong>do</strong> erro, κ: parâmetro de diferenciabilidade da função de correlação, CEP:coeficiente de efeitopepita e logL: valor MVRPara se avaliar o comportamento espacial de uma variável é usual fazer a suarepresentação através de um mapa <strong>do</strong>s resulta<strong>do</strong>s obti<strong>do</strong>s, loca<strong>do</strong>s em suas coordenadas decoleta. O mapa da produtividade de soja, ilustra<strong>do</strong> na Figura 2.13, foi classifica<strong>do</strong> segun<strong>do</strong> osquantis 20%, 40%, 60% e 80%. Os retângulos mais claros correspondem às baixas produtividadese os mais escuros às altas produtividades. As classes corresponderam a valores abaixo de2,34 t ha −1 , representa<strong>do</strong> por seu ponto médio de 1,8 t ha −1 , valores entre 2,34 e 2,61 t ha −1 ,


53representa<strong>do</strong>s por deu ponto médio de 2,5 t ha −1 , valores entre 2,61 e 2,85 t ha −1 , representa<strong>do</strong>spor seu ponto médio de 2,7 t ha −1 , valores entre 2,85 e 3,16 t ha −1 , representa<strong>do</strong>s por se pontomédio de 3,0 t ha −1 e valores acima de 3,16 t ha −1 , representa<strong>do</strong>s por seu ponto médio de 3,7t ha −1 . Essa classificação não seguiu um critério agronômico, servin<strong>do</strong> apenas para identificarzonas diferenciadas de produtividade.< 2,34 (2,34;2,61) (2,61;2,85) (2,85;3,16) > 3,16Figura 2.13: Gráfico de padrões de intensidade por parcela colhida classifica<strong>do</strong> pelos quantis deprodutividade 20, 40, 60 e 80%. A largura da figura corresponde a uma distância de <strong>14</strong>1,2 m ea altura 115,2 m. Cada retângulo corresponde a uma área de 25 m 2 .Avaliou-se os modelos geoestatísticos com parâmetros otimiza<strong>do</strong>s por MV através davalidação cruzada. No caso da amostra de 256 coordenadas utilizou-se a estatégia de retirar“uma amostra por vez” e estimá-la com o modelo ajusta<strong>do</strong>. Nas amostras de 128 e 64 coordenadassorteadas <strong>do</strong> conjunto de 256 pontos originais, utilizou-se a estratégia de estimar osvalores no conjunto complementar (onde as amostras não foram utilizadas). Os resulta<strong>do</strong>s estãoapresenta<strong>do</strong>s no anexo A. Nessas figuras, a validação resultou em erros de predição com umadistribuição gaussiana de probabilidades em torno <strong>do</strong> zero com uma variância de predição menorque a variância <strong>do</strong>s da<strong>do</strong>s. Não se identifica também um padrão de regionalização <strong>do</strong>s erros,como por exemplo uma concentrações de valores de superestimação ou subestimação.Na Figura 2.<strong>14</strong> ilustra-se a distribuição espacial da produtividade de soja estimada porkrigagem a partir de modelo ajusta<strong>do</strong> por MV, em 690 pontos de uma malha regular. Os pontos


54amostrais têm dimensão 5 × 5 m, compatível com o suporte de medida de 25 m 2 a<strong>do</strong>ta<strong>do</strong>s nacolheita das parcelas. Os resulta<strong>do</strong>s também foram classifica<strong>do</strong>s segun<strong>do</strong> os quantis 20, 40,60 e 80%, observa<strong>do</strong> nos da<strong>do</strong>s, permitin<strong>do</strong> assim a comparação com o mapa da Figura 2.13.O mapa à esquerda corresponde às predições com base nos 256 pontos amostrais originais,onde, conforme Tabela 2.6, somente 0,7% das predições ficaram abaixo de 2,34 t ha −1 e nenhumaacima de 3,16 t ha −1 , entretan<strong>do</strong> identificou-se zonas de produtividade diferenciadas.O mapa central corresponde às predições com base em 128 pontos amostrais, onde, conformea mesma tabela, apresentou uma concentração maior <strong>do</strong>s valore nas classes centrais. Nenhumresulta<strong>do</strong> ficou abaixo de 2,34 t ha −1 e nenhum acima de 3,16 t ha −1 . Esse mapa também identificouzonas diferenciadas. No mapa da direita, as predições foram efetuadas com base em 64pontos amostrais e ficaram todas na classe central, entre 2,61 t ha −1 e 2,85 t ha −1 . O mapacorrespondente não reproduziu um padrão espacial capaz de identificar zonas de produtividadediferenciadas segun<strong>do</strong> esses critérios de classificação.256 amostras128 amostras64 amostras20 40 60 80 10020 40 60 80 10020 40 60 80 10020 40 60 80 100 120 <strong>14</strong>020 40 60 80 100 120 <strong>14</strong>020 40 60 80 100 120 <strong>14</strong>0Figura 2.<strong>14</strong>: Mapas de produtividade de soja estima<strong>do</strong>s por krigagem convencional a partir demodelo ajusta<strong>do</strong> por MV, em uma malha regular de 690 pontos a partir de 256 (esquerda), 128(centro) e 64 (direita) pontos amostrais. Os pontos brancos correspondem às produtividadesabaixo de 2,34 t ha −1 e os pontos pretos às produtividades acima de 3,16 t ha −1 . Os pontos emescalas cinza correspondem às produtividades intermediárias.A Tabela 2.5 mostra os resulta<strong>do</strong>s descritivos da krigagem convencional em 690 pontosregularmente distribuí<strong>do</strong>s pela área, conforme justifica<strong>do</strong> anteriormente. Nota-se nela que amédia <strong>do</strong>s valores estima<strong>do</strong>s ficou próximo <strong>do</strong> valor de referência de 2,75 t ha −1 nos três delineamentosamostrais, manten<strong>do</strong> um erro relativo absoluto de predição abaixo de 2,1 %. Houvetambém uma uniformidade nos resulta<strong>do</strong>s, manten<strong>do</strong> o CV abaixo de 8%. Nota-se que a krigagemrecuperou a informação da produtividade média da área, diferentemente da descrição davariabilidade espacial mostrada pelo respectivos mapas.Na tabela 2.6 se apresenta a porcentagem <strong>do</strong>s pontos estima<strong>do</strong>s, incidentes em cadaintervalo de classificação, segun<strong>do</strong> três tipos de amostragem utiliza<strong>do</strong>s no modelo univaria<strong>do</strong>.Nela verifica-se, quan<strong>do</strong> comparada com a distribuição percentual <strong>do</strong>s da<strong>do</strong>s originais,


55Tabela 2.5: Estatística descritiva das predições por krigagem convencional da produtividade desoja medida em uma malha de 690 pontos, com base em amostras de 256, 128 e 64 pontos.Delineamento Mínimo Média Máximo D.P. C.V.(%) ER(%)Soja256 2,3285 2,7422 3,1365 0,1784 6,5 -0,27Soja128 2,3946 2,7562 3,0566 0,1736 6,3 0,24Soja64 2,7792 2,8078 2,8360 0,0161 0,6 2,12Medidas em t ha −1 . D.P.: Desvio Padrão, C.V.: Coeficiente de Variação, ER(%): erro em relação aovalor referência de 2,75 t ha −1 .a tendência <strong>do</strong> número de pontos preditos se concentrarem na classe central, tanto na prediçãoatravés da utilização <strong>do</strong>s 256 pontos amostra<strong>do</strong>s quanto na predição que envolveu uma reduçãono número de amostras.Tabela 2.6: Porcentagem <strong>do</strong>s pontos estima<strong>do</strong>s por méto<strong>do</strong> de krigagem com modelo univaria<strong>do</strong>,incidentes em cada intervalo de classificação, segun<strong>do</strong> três tipos de amostragem.Classe PM S256 S128 S64 S256d1,19 a 2,34 1,8 0,7 0,0 0,0 20,32,34 a 2,61 2,5 22,9 25,2 0,0 19,92,61 a 2,85 2,7 46,2 37,4 100,0 20,72,85 a 3,16 3,0 29,1 37,4 0,0 19,13,16 a 4,<strong>14</strong> 3,7 0,0 0,0 0,0 19,9PM: ponto médio da classe, S256: soja em 256 amostras, S128: soja em 128 amostras, S64: soja em64 amostras, IC: índice de cone, CP1: primeira componente principal, S256d: da<strong>do</strong>s originais de sojaclassifica<strong>do</strong>s.Análise espacial bayesiana das amostras de produtividade de sojaPara inferência bayesiana sobre os parâmetros <strong>do</strong> modelo foi considera<strong>do</strong> um modeloisotrópico, sem tendência direcional ou efeito sistemático e função de correlação de Matèrncom parâmetro de diferenciabilidade κ = 0.5. A<strong>do</strong>tou-se as distribuições a priori plana (“flat”)para o parâmetro β, recíproca para σ 2 e uniforme discreta para φ. Considerou-se ainda o valorde τ 2 relativo igual a zero, ou seja, ausência <strong>do</strong> efeito de pequena escala. A opção portais procedimentos se deu por conveniência computacional, caben<strong>do</strong> uma exploração mais detalhadasobre o assunto em trabalhos futuros. A Figura 2.15 mostra a distribuição a posterioripara os parâmetros β e σ 2 no caso em que se utilizou a amostra de produtividade de sojaem 256 pontos amostrais. As Figuras 2.16 e 2.17 correspondem às distribuições a posterioripara os parâmetros β e σ 2 no caso em que se utilizou amostra de produtividade de soja em128 e 64 pontos amostrais, respectivamente. A Tabela 2.7 apresenta as estimativas pontuais<strong>do</strong>s parâmetros, obti<strong>do</strong>s pela média de 1.000 simulações bayesianas obtidas pelas respectivasdistribuições a posteriori. As estimativas <strong>do</strong>s parâmetros β nessa tabela são compatíveis com


56os resulta<strong>do</strong>s obti<strong>do</strong>s por MV mas as estimativas <strong>do</strong>s parâmetros σ 2 foram aumentadas devi<strong>do</strong>à incorporação de incertezas no modelo, próprio <strong>do</strong> méto<strong>do</strong> bayesiano.Tabela 2.7: Média da posteriori <strong>do</strong>s parâmetros <strong>do</strong> modelo geoestatístico obti<strong>do</strong> por inferênciabayesiana.Delineamento β σ 2 φSoja256 2,7203 0,3072 7,20Soja128 2,7604 0,2108 7,06Soja64 2,8126 0,1945 6,78β é o parâmetro <strong>do</strong> efeito sistemático <strong>do</strong> modelo, σ 2 e φ são parâmetros da função de correlação, to<strong>do</strong>sobti<strong>do</strong>s pela média de 1.000 aproximações numéricas pelo méto<strong>do</strong> bayesiano. Neste processo, τ 2 é oparâmetro <strong>do</strong> erro, fixa<strong>do</strong> em zero.Density0 1 2 3 4 5Density0 2 4 6 8 10 12 <strong>14</strong>2.5 2.6 2.7 2.8 2.9 3.0β0.20 0.25 0.30 0.35 0.40σ 2Figura 2.15: Distribuição a posteriori para os parâmetros β e σ 2 com 50 níveis de φ e 1.000aproximações numéricas a partir de um grupo de 256 amostras.A Figura 2.18 ilustra a distribuição espacial da predição da produtividade de soja obtidapela média de 1.000 simulação preditivas em uma malha de 690 pontos, com amostras de256, 128 e 64 pontos, apresentadas da esquerda para a direita, respectivamente, com resulta<strong>do</strong>sclassifica<strong>do</strong>s pelos quantis 20, 40, 60 e 80% observa<strong>do</strong> nos da<strong>do</strong>s. Os pontos em tons de cinzacorrespondem a diferentes classes de produtividade. Nessa figura, no caso de 256 amostras,observa-se um padrão da distribuição espacial semelhante ao apresenta<strong>do</strong> na Figura 2.13. Esseresulta<strong>do</strong> diferiu <strong>do</strong> obti<strong>do</strong> pelo méto<strong>do</strong> de krigagem a partir de valores pontuais <strong>do</strong>s parâmetros,estima<strong>do</strong>s por MV. Perdeu-se a definição de zonas diferenciadas de produtividade, como o apresenta<strong>do</strong>na Figura 2.<strong>14</strong>, contu<strong>do</strong> apresentou um padrão de variabilidade espacial, em to<strong>do</strong>s ostamanhos de amostras.


57Density0 1 2 3 4 5 6Density0 5 10 152.6 2.7 2.8 2.9 3.0β0.15 0.20 0.25 0.30 0.35σ 2Figura 2.16: Distribuição a posteriori para os parâmetros β e σ 2 com 50 níveis de φ e 1.000aproximações numéricas a partir de um grupo de 128 amostras.Density0 1 2 3 4 5Density0 2 4 6 8 10 121.8 2.0 2.2 2.4 2.6 2.8 3.0β0.0 0.5 1.0 1.5 2.0 2.5σ 2Figura 2.17: Distribuição a posteriori para os parâmetros β e σ 2 com 50 níveis de φ e 1.000aproximações numéricas a partir de um grupo de 64 amostras.A Tabela 2.8 apresenta resulta<strong>do</strong>s descritivos da predição de soja por simulação bayesianacom base nos três diferentes delineamentos amostrais já menciona<strong>do</strong>s. Esses resulta<strong>do</strong>sindicaram a manutenção no erro relativo compara<strong>do</strong> com o resulta<strong>do</strong> obti<strong>do</strong> pela predição porkrigagem convencional, conforme visto na Tabela 2.5 e coeficiente de variação da mesma ordemde grandeza, garantin<strong>do</strong>-se a uniformidade <strong>do</strong>s resulta<strong>do</strong>s.Na Tabela 2.9 apresenta-se a porcentagem <strong>do</strong>s pontos estima<strong>do</strong>s por méto<strong>do</strong> bayesi-


58256 amostras128 amostras64 amostras20 40 60 80 10020 40 60 80 10020 40 60 80 10020 40 60 80 100 120 <strong>14</strong>020 40 60 80 100 120 <strong>14</strong>020 40 60 80 100 120 <strong>14</strong>0Figura 2.18: Mapas de produtividade de soja estima<strong>do</strong>s por inferência bayesiana em uma malharegular de 690 pontos com base em 256 (esquerda) 128 (centro) e 64 (direita) pontos amostrais.Em cada mapa a largura corresponde a <strong>14</strong>1,2 m e a altura 115,2 m. Os pontos brancos correspondemàs produtividades abaixo de 2,4075 t ha −1 , os cinza às produtividades entre 2,4075 e3,045 t ha −1 e os pretos ‘as produtividades acima de 3,045 t ha −1 .Tabela 2.8: Estatísticas descritivas das predições bayesianas da produtividade de soja medidaem uma malha de 1.131 pontos, com base em amostras de 256 pontos estrutura<strong>do</strong>s (Soja256),128 e 64 pontos aleatórios (Soja128 e Soja64, respectivamente) toma<strong>do</strong>s <strong>do</strong>s 256 disponíveisDelineamento Mínimo Média Máximo D.P. C.V.% ER(%)Soja256 1,6757 2,7460 3,7000 0,3186 11,6 -0,13Soja128 1,9606 2,7616 3,6255 0,2461 8,9 0,44Soja64 2,<strong>14</strong>71 2,8069 3,5022 0,1675 6,0 2,08Medidas em t ha −1 . D.P.: Desvio Padrão, C.V.: Coeficiente de Variação, ER(%): erro em relação aovalor referência de 2,7496 t ha −1 .ano, incidentes em cada intervalo de classificação, segun<strong>do</strong> três tipos de amostragem utiliza<strong>do</strong>sno modelo univaria<strong>do</strong>. Nela verifica-se, quan<strong>do</strong> comparada com a distribuição percentual <strong>do</strong>sda<strong>do</strong>s originais segun<strong>do</strong> os intervalos de classe, a tendência <strong>do</strong> número de pontos preditos seconcentrarem na classe central, tanto na predição através da utilização <strong>do</strong>s 256 pontos amostra<strong>do</strong>squanto na predição que envolveu uma redução no número de amostras. Todavia o efeito émenos acentua<strong>do</strong> quan<strong>do</strong> compara<strong>do</strong> aos resulta<strong>do</strong>s da Tabela 2.6.2.8.4 Análise geoestatística <strong>do</strong>s da<strong>do</strong>s rendimento de P. Taeda L.Análogo ao caso <strong>do</strong>s da<strong>do</strong>s de produção de soja, visto na Seção 2.8.3, aqui foi da<strong>do</strong> inicialmenteum enfoque estatístico tradicional pela análise descritiva básica, visan<strong>do</strong>-se tambémidentificar e avaliar a estrutura de pontos discrepantes, homogeneidade e tendência direcional,bem como obter indica<strong>do</strong>res de atendimento aos pressupostos de um modelo geoestatístico e àsreferências exploratórias na obtenção de estimativas <strong>do</strong>s parâmetros. Foram ajusta<strong>do</strong>s e analisa<strong>do</strong>smodelos teóricos para o processo geoestatístico supostamente gaussiano que determinou


59Tabela 2.9: Porcentagem <strong>do</strong>s pontos estima<strong>do</strong>s por méto<strong>do</strong> bayesiano com modelo univaria<strong>do</strong>,incidentes em cada intervalo de classificação, segun<strong>do</strong> três tipos de amostragem.Classe PM S256 S128 S64 S256d[1,19 ; 2,34) 1,8 9,1 3,8 0,7 20,3[2,34 ; 2,61) 2,5 23,5 22,9 10,1 19,9[2,61 ; 2,85) 2,7 31,0 38,0 54,1 20,7[2,85 ; 3,16) 3,0 26,2 30,3 32,3 19,1[3,16 ; 4,<strong>14</strong>) 3,7 10,1 5,1 2,8 19,9PM: ponto médio da classe, S256: soja em 256 amostras, S128: soja em 128 amostras, S64: soja em64 amostras, IC: índice de cone, CP1: primeira componente principal, S256d: da<strong>do</strong>s originais de sojaclassifica<strong>do</strong>s.o rendimento de madeira. Com o modelo escolhi<strong>do</strong> foi possível construir mapas temáticos procuran<strong>do</strong>identificar zonas diferenciadas. Também foi feita uma análise descritiva das prediçõesobtidas nos mapas. A densidade amostral foi de 0,008 pontos por ha −1 , valor esse considera<strong>do</strong>inexpressivo.Análise descritivas das amostras de argila e IMAAs amostras foram analisadas em 2 enfoques. O primeiro constituí<strong>do</strong> de 18 pontosamostrais com medidas de IMA e Teor de Argila. O segun<strong>do</strong> pelo conjunto de 555 parcelasonde foi medi<strong>do</strong> somente o Teor de Argila. O layout está ilustra<strong>do</strong> na Figura 2.19.Pela Tabela 2.10 o valor médio <strong>do</strong> IMA, avalia<strong>do</strong> em 18 árvores, foi de 26,2 m 3ha −1 ano −1 , com CV de 24%, o que, segun<strong>do</strong> Gomes (1963), compromete a precisão da medidade tal variável. Mainardi, Schneider e Finger (1996) obtiveram um valor médio de IMAde 28,24 m 3 ha −1 ano −1 em árvores aos 12 anos e 32,94 m 3 ha −1 ano −1 em árvores aos 15anos toma<strong>do</strong>s em 7 diferentes sítios na região de Cambará <strong>do</strong> Sul no Esta<strong>do</strong> <strong>do</strong> Rio Grande <strong>do</strong>Sul. Carvalho et al. (1999) apresentaram em estu<strong>do</strong> <strong>do</strong>s efeitos das características <strong>do</strong> solo nacapacidade produtiva um resulta<strong>do</strong> <strong>do</strong> IMA de 25,3 m 3 ha −1 ano −1 em 16 amostras de árvorescom 15 anos. Na mesma tabela encontra-se o valor médio obti<strong>do</strong> de 32,8% <strong>do</strong> teor de argila em18 amostras e 25,2% para 555 amostras, indican<strong>do</strong> em um solo de textura média, adequa<strong>do</strong> aocrescimento radicular (ROSOLEN et al., 1999).A Figura 2.20 ilustra o perfil da função log da verossimilhança para o parâmetro λ de


60Figura 2.19: Localização das amostras na área de reflorestamento da fazenda MOBASA emRio Pedrinho-SC. Os 18 pontos amostrais na figura à esquerda representam as coordenadas deda<strong>do</strong>s de análises físicas e químicas e os 555 pontos na figura à direita representam as análisesfísicas.Tabela 2.10: Estatísticas descritivas das amostras de IMA em 18 localizações e de Teor deArgila em 18 e 555 localizações.Delineamento Mínimo Média Máximo D.P. C.V.%IMA18 <strong>14</strong>,09 26,2 37,02 6,546 24,96Argila18 9,00 32,8 64,20 12,542 38,19Argila555 8,00 25,2 58,00 7,776 30,87IMA: m 3 ha −1 ano −1 ; Teor de Argila: porcentagem; D.P.: Desvio Padrão, C.V.: Coeficiente de Variação.transformação de Box-Cox da variável IMA em 18 amostras. Foi obti<strong>do</strong> o intervalo de 95% deconfiança ( 0,9; 2,9) para esse parâmetro, o qual incluin<strong>do</strong> a unidade, não sugere a necessidadede transformação, indican<strong>do</strong> válida a hipótese de gaussianiedade das medidas.Ajuste <strong>do</strong>s parâmetros <strong>do</strong> modelo univaria<strong>do</strong> para IMAA Tabela 2.11 mostra os resulta<strong>do</strong>s da estimação pontual e médias <strong>do</strong>s parâmetros <strong>do</strong>modelo gaussiano, obti<strong>do</strong>s por MV e inferência bayesiana. Na obtenção da verossimilhançao Teor de Argila foi considera<strong>do</strong> covariável para o efeito sistemático. No méto<strong>do</strong> bayesiano,foram a<strong>do</strong>tadas as priori plana (“flat”) para β, recíproca para σ 2 e uniforme discreta para φ e oefeito de pequena escala e/ou erro aleatório foi considera<strong>do</strong> nulo. Na tabela as distribuições a


61log−Likelihood−61.5 −60.5 −59.595%−1 0 1 2 3Figura 2.20: Perfil <strong>do</strong> log-verossimilhança para o parâmetro λ de transformação de Box-Coxda variável IMA.λposteriori <strong>do</strong>s parâmetros σ 2 e β são, respectivamente χScI 2 e Normal e seus gráficos, obti<strong>do</strong>s apartir de simulações estão apresentadas na Figura 2.21.Tabela 2.11: Parâmetros <strong>do</strong> modelo geoestatístico estima<strong>do</strong> por MV e inferência bayesiana. Omodelo de função de correlação usa<strong>do</strong> foi o de Matèrn com parâmetro de diferenciabilidadeκ = 0,5.IMA18 β 0 β 1 τ 2 σ 2 φMV 35,9 -0,29 0,0 26,7 191,5BAYES 25,5 – 0,0 242,9 5.732,3β 0 e β 1 são parâmetros <strong>do</strong> efeito sistemático <strong>do</strong> modelo, σ 2 e φ são parâmetros da função de correlação,τ 2 é o parâmetro <strong>do</strong> erro.Density0.00 0.02 0.04 0.06−40 0 20 60Density0.000 0.001 0.002 0.003 0.0040 500 1000 1500Density0.00000 0.000100 5000 15000βFigura 2.21: Distribuição a posteriori para os parâmetros β, σ 2 e φ a partir de 1.000aproximações numéricas da variável IMA tomada em 18 pontos amostraisσ 2φ


62Estatísticas descritivas da predição univariada de IMAA Tabela 2.12 mostra estatísticas descritivas da predição de IMA com base em umaamostra de 18 pontos toma<strong>do</strong>s casualmente na área de reflorestamento, empregan<strong>do</strong>-se krigagemconvencional com parâmetros <strong>do</strong> modelo estima<strong>do</strong>s por MV e predição bayesiana. Nota-senessa tabela que os resulta<strong>do</strong>s são muito próximos, exceto por uma variância um pouco maior nocaso bayesiano refletin<strong>do</strong> nessa maior variabilidade o fato da incerteza sobre os parâmetros serconsiderada nessa abordagem. Entretanto, não se pode estabelecer uma diferença de prediçãode um méto<strong>do</strong> em relação ao outro.Tabela 2.12: Estatísticas descritivas das predições <strong>do</strong> IMA através da krigagem convencional epor estimativa bayesiana.Delineamento Mínimo Média Máximo D.P. C.V.%Clássico 17,48 26,53 36,09 0,747 2,8Bayesiano <strong>14</strong>,69 26,02 36,72 5,100 19,6IMA: m 3 ha −1 ano −1 ; D.P.: Desvio Padrão, C.V.: Coeficiente de Variação.Na Tabela 2.13 se apresenta a porcentagem <strong>do</strong>s pontos de IMA estima<strong>do</strong>s por méto<strong>do</strong>bayesiano, incidentes em cada intervalo de classificação. Nela verifica-se a tendência <strong>do</strong> númerode pontos preditos se concentrarem nas classes centrais, tanto na predição através da krigagemquanto na predição que envolveu o méto<strong>do</strong> bayesiano. Todavia o efeito é menos acentua<strong>do</strong> nométo<strong>do</strong> bayesiano.Tabela 2.13: Porcentagem <strong>do</strong>s pontos estima<strong>do</strong>s de IMA por méto<strong>do</strong> bayesiano com modelounivaria<strong>do</strong>, incidentes em cada intervalo de classificação.Classe PM MV18 Bayes18[<strong>14</strong>,09 ; 20,50) 17,3 0,8 4,6[20,50 ; 23,43) 22,0 3,6 13,0[23,43 ; 28,32) 25,9 84,6 54,4[28,32 ; 32,50) 30,4 10,7 19,5[32,50 ; 37,02) 34,8 0,4 3,6PM: ponto médio da classe, MV18: IMA em 18 amostras estima<strong>do</strong> por MV, Bayes18: IMA em 18amostras estima<strong>do</strong> por méto<strong>do</strong> bayesiano.


63Mapa de predição univariada de IMAPara a produção <strong>do</strong>s mapas temáticos os resulta<strong>do</strong>s foram classifica<strong>do</strong>s segun<strong>do</strong> osquantis 20, 40, 60 e 80% de predição de IMA. A Figura 2.22 a esquerda ilustra a distribuiçãoespacial de IMA estimada por krigagem convencional. Nela, segun<strong>do</strong> a Tabela 2.13 0,8% daárea representa IMA abaixo de 20,50 m 3 ha −1 ano −1 , 3,6% representa IMA entre 20,50 e 23,42m 3 ha −1 ano −1 , 84,6% representa IMA entre 23,42 e 28,33 m 3 ha −1 ano −1 , 10,7% entre 28,33e 32,50 m 3 ha −1 ano −1 e 0,4% acima de 32,50 m 3 ha −1 ano −1 . Já a figura da direita ilustraa distribuição espacial estimada por méto<strong>do</strong>s bayesianos. Nela, 4,6% da área representa IMAabaixo de 20,50 m 3 ha −1 ano −1 , 13% representa IMA entre 20,50 e 23,42 m 3 ha −1 ano −1 ,54,4% representa IMA entre 23,42 e 28,33 m 3 ha −1 ano −1 , 19,5% entre 28,33 e 32,50 m 3ha −1 ano −1 e 3,6% acima de 32,50 m 3 ha −1 ano −1 . Isso indica, neste caso, que o méto<strong>do</strong> bayesianoconcentrou menos predições que a krigagem baseada em MV, mostran<strong>do</strong> áreas maioresde rendimento diferencia<strong>do</strong>.Figura 2.22: Mapa de predição de IMA com 18 amostras, classificada pelos quartis. A figurada esquerda foi obtida por krigagem convencional e a da direita por predição bayesiana.


642.8.5 Conclusões sobre o méto<strong>do</strong> univaria<strong>do</strong>• O méto<strong>do</strong> da máxima verossimilhança foi capaz de estimar a produtividade de soja comerro relativo abaixo de 2,1% e estimar a média de IMA com erro relativo abaixo de 1,2%,consideran<strong>do</strong>-se os valores conheci<strong>do</strong>s de 18 pontos amostrais;• O méto<strong>do</strong> bayesiano foi capaz de estimar a produtividade de soja com erro relativo abaixode 2,1%, e estimar a média de IMA com erro relativo abaixo de 1,0%;• O mapa da distribuição espacial da média de produtividade de soja, quan<strong>do</strong> feito pelométo<strong>do</strong> MV, perde identificabilidade de zonas de manejo com a diminuição <strong>do</strong> númerode amostras;• O méto<strong>do</strong> bayesiano, aplica<strong>do</strong> tanto no estu<strong>do</strong> de produtividade de soja quanto no de IMAfoi capaz de identificar zonas de manejo para amostras de tamanho onde o méto<strong>do</strong> da MVnão o foi, além de ser mais sensível na identificação das variações a pequenas distâncias.• A krigagem baseada em MV e a predição bayesiana induziram a uma concentração devalores preditos em torno da média, inversamente proporcional ao tamanho da amostratomada considerada nos méto<strong>do</strong>s.


3 MODELO GEOESTATÍSTICO GAUSSIANOMULTIVARIADO3.1 INTRODUÇÃOPara Ver Hoef e Cressie (1993), em ciências da terra é freqüente o interesse em predizerconjuntamente uma grande quantidade de variáveis. Normalmente se prediz uma variávelpor vez, usan<strong>do</strong> da<strong>do</strong>s de um mesmo tipo (krigagem) ou utilizan<strong>do</strong> informações adicionais deoutra variável tomada nas mesmas coordenadas (krigagem com covariável). O modelo bivaria<strong>do</strong>mostrou que a predição de uma variável com base em uma outra variável correlacionada,mas em locais diferentes (cokrigagem) resultou em predições precisas. Predições espaciaismultivariadas permitem construir regiões de predição multivariada. Esses autores relacioname comparam predições baseadas no variograma cruza<strong>do</strong>, predições espaciais multivariadas eestimação de parâmetros por mínimos quadra<strong>do</strong>s generaliza<strong>do</strong>s.Os modelos geoestatísticos multivaria<strong>do</strong>s dizem respeito a um conjunto de variáveisaleatórias gaussianas dadas por:{Y1 (x),Y 2 (x),...,Y p (x) : Y k (x) ∈ S k (x);x i ∈ R 2 ;i = 1,2,...,n } (3.1)Essas varíaveis são georreferenciadas em uma mesma região, todas com igual interessecientífico. É uma situação pouco realística pois esta descrição não leva a uma interpretaçãofísica no senti<strong>do</strong> prático, entretanto o será se puder ser escrita a distribuição condicional deuma das variáveis, eleita de interesse primário, condicionada a uma ou mais variáveis espacialmentelocalizadas. Neste caso, exige-se que todas as variáveis sejam tomadas nas mesmasposições geográficas e que haja uma certa correlação entre elas. Outra situação prática ocorrequan<strong>do</strong> a variável primária for de difícil aquisição, então, pode-se formar um conjunto dasvariáveis restantes, supostamente de fácil observação, como o conjunto de variáveis preditorasque, modeladas adequadamente, permitirão fazer estimativas da variável primária em locaisonde foram obtidas as demais variáveis. Neste caso, as variáveis podem ser em quantidades,tipos e localizações diferentes. Pretendeu-se aqui abordar ambos os casos e ainda utilizar o


66suporte da ACP para a redução <strong>do</strong> número de variáveis envolvidas no problema. Apresentou-seo problema geoestatístico multivaria<strong>do</strong> envolven<strong>do</strong> duas variáveis, sen<strong>do</strong> uma a principal e aoutra, secundária.3.2 MODELO GEOESTATÍSTICO MULTIVARIADOO conjunto da<strong>do</strong> pela expressão 3.1 é uma coleção p-dimensional de variáveisaleatórias. A matriz Σ de covariâncias desse conjunto é dada por:⎛⎞Cov(Y 1 ;Y 1 ) Cov(Y 1 ;Y 2 ) ... Cov(Y 1 ;Y p )Cov(Y 2 ;Y 1 ) Cov(Y 2 ;Y 2 ) ... Cov(Y 2 ;Y p )Σ =⎜⎝ ..... . ⎟⎠Cov(Y p ;Y 1 ) Cov(Y p ;Y 2 ) ... Cov(Y p ;Y p )sen<strong>do</strong> a diagonal a autocorrelação de cada variável Y k : k = 1,2,..., p <strong>do</strong> conjunto. Os elementosfora da diagonal representam a matriz correlação cruzada para cada combinação de paresde variáveis. Essa matriz é uma extensão daquela matriz para o caso univaria<strong>do</strong> da<strong>do</strong> pelaEquação 2.27. Ela deve ser uma matriz quadrada, simétrica, definida positiva e passível dedecomposição, para se obter sua inversa.Para qualquer par de variáveis, por exemplo ( Y c (a);Y d (b) ) , Cov ( Y c (a);Y d (b) ) = σ cdab .Neste caso, afirma-se que a covariância (e a correlação) se estabelece entre a variável Y c (x)tomada na coordenada a e a variável Y d (x) tomada na coordenada b. Uma propriedade imediata,é a sua natureza simétrica, ou seja, σ cdab = σ dcba .A matriz de correlação será dada por R(u), cujos elementos serão:ρab cd = σ cd√ abσa 2 σb2= σ cdabσ a σ bQuan<strong>do</strong> a = b, a função ρ aa (u) = ρ bb (u) corresponderá à função de correlação <strong>do</strong>processo univaria<strong>do</strong> Y a (x) e ρ aa (−u) = ρ aa (u). Se a ≠ b a função ρ ab (u) será chamada funçãode correlação cruzada de Y a (x) e Y b (x), mas não será necessariamente simétrica na matriz R(u),mas ainda assim satisfará a condição de que ρ ab (u) = ρ ba (−u) (DIGGLE; RIBEIRO JR, 2007).Pebesma e Wesseling (1998) apresentam um modelo de predição multivariada envolven<strong>do</strong>variáveis cruzadas correlacionadas. O modelo utiliza<strong>do</strong> para cada variável Y k ;k =1,2,..., p é aquele defini<strong>do</strong> pela Equação 2.2, portanto, um processo não estacionário. O mo-


67delo multivaria<strong>do</strong>, neste caso de envolvimento de todas as variáveis <strong>do</strong> conjunto, é da<strong>do</strong> por:Y = D β + S(x)+εonde D β corresponde à matriz de tendência externa <strong>do</strong> modelo aplicada às respectivasvariáveis. As matrizes envolvidas são:⎛⎞ ⎛D 1 0 ... 00 D 2 ... 0D =onde D⎜⎝ . .... . ⎟ k =⎜⎠ ⎝0 0 ... D ppara n k1 d (k)11d (k)21... d (k)p11 d (k)12d (k)22... d (k)p2. . .... .1 d (k)1n kd (k)2n k... d (k)pn krepresentan<strong>do</strong> o número de coordenadas relativas à k-ésima variável externa de p é o número de variáveis externas associada a um particular processo Y k . S(x) ={S1 (x),S 2 (x),...,S p (x) } .⎞,⎟⎠O melhor preditor linear não vicia<strong>do</strong> será:Ŷ(x 0 ) = d(x 0 ) ˆβ + r ′ V −1 Y(x) − D ˆβno qual⎛d(x 0 ) =⎜⎝( )d 1 x(0) 0 ... 0( )0 d 2 x(0) ... 0. .... .( )0 0 ... d p x(0)⎞⎟⎠e d k (x 0 ) corresponden<strong>do</strong> à linha da matriz D que contém o valor correspondente de Y(x 0 ), r amatriz de correlações de cada variável com o ponto x 0 a ser estima<strong>do</strong> e V a matriz de correlaçõesobtidas à partir da matriz de covariâncias multivariadas dada pela equação 3.2.A variância <strong>do</strong> erro de predição será dada por:Var ( Ŷ(x 0 ) ) = ˆβ − r ′ V −1 r+ ( d(x 0 ) − r ′ V −1 D )( D −1 V −1 D ) −1(d(x0 ) − r ′ V −1 r ) −1Para Ver Hoef e Cressie (1993) este modelo não impõe restrições ao número devariáveis e cada variável pode ter um número diferente de localizações.O pantanal matogrossense, segun<strong>do</strong> Couto e Cunha (2002), apresenta muitas unidadesde pe<strong>do</strong>paisagens com áreas periodicamente inundáveis, onde a amostragem é difícil devi<strong>do</strong> aelevada variabilidade espacial inter e intra estratos. Para sua pesquisa coletaram e analisaramcento e onze amostras sistemáticas com cinco atributos físicos e quinze atributos químicos em


68três ecossistemas. Efetuaram uma análise de componentes principais e fatorial. Das amostrasrestaram quatro componentes que explicaram 77% da variância total e <strong>do</strong>is fatores quemostraram a melhor separação entre as pe<strong>do</strong>paisagens. Utilizaram, nas estimativas <strong>do</strong>s semivariogramaspara os componentes principais os softwares GS+ produzi<strong>do</strong> e comercializa<strong>do</strong>pela empresa Gamma Design Software (www.gammadesign.com) e o software Surfer produzi<strong>do</strong>pela empresa Golden Software, Inc. (www.goldensoftware.com). Relatam os aspectos daanálise multivariada como apoio às aplicações geoestatísticas mas não explicitam o emprego dageoestatística multivariada.Filzmoser e Reimann (2002) discutem e comparam méto<strong>do</strong>s e propriedades da análisede componentes principais e da análise fatorial. Eles expõem as vantagens em se aplicarméto<strong>do</strong>s multivaria<strong>do</strong>s robustos em geoestatística. Ilustram porém, com aplicações a um conjuntode da<strong>do</strong>s geoquímicos, aplicações da geoestatística univariada.3.3 MODELO GEOESTATÍSTICO BIVARIADOConsiderou-se o seguinte processo gaussiano estacionário bivaria<strong>do</strong>:{S(x) =(S1 (x i ),S 2 (x j ) ) : S 1 (x),S 2 (x) ∈ R;x i ,x j ∈ R 2 ;i = 1,2,...,r; j = 1,2,...,s } ,com E(S 1 (x i )) = 0; E(S 2 (x i )) = 0 e Var(S 1 (x i )) = σ 2 1 e Var(S 2(x i )) = σ 2 2 .sen<strong>do</strong>,A matriz de covariância associada é dada por:Σ =(Cov(S1 ;S 1 ) Cov(S 1 ;S 2 )Cov(S 2 ;S 1 ) Cov(S 2 ;S 2 ))=((1,1) σi, jσ (1,2)i, jσ (2,1)i, jσ (2,2)i, j)• σ 1,1 i = 1,...,r e j = 1,...,r;(i, j)• σ 1,2 i = 1,...,r e j = 1,...,s;(i, j)• σ 2,1 i = 1,...,s e j = 1,...,r;(i, j)• σ 2,2 i = 1,...,s e j = 1,...,s;(i, j)


69Expandin<strong>do</strong> essa matriz vem:⎛Σ =⎜⎝σ (1,1)1,1σ (1,1)1,2... σ (1,1)1,rσ (1,2)1,1σ (1,2)1,2... σ (1,2)1,sσ (1,1)2,1σ (1,1)2,2... σ (1,1)2,rσ (1,2)2,1σ (1,2)2,2... σ (1,2)2,s... ... ... ... ... ...σ (1,1)r,1σ (1,1)r,2... σ r,r (1,1) σ (1,2)r,1σ (1,2)r,2... σ r,s(1,2)σ (2,1)1,1σ (2,1)1,2... σ (2,1)1,rσ (2,2)1,1σ (2,2)1,2... σ (2,2)1,sσ (2,1)2,1σ (2,1)2,2... σ (2,1)2,rσ (2,2)2,1σ (2,2)2,2... σ (2,2)2,s... ... ... ... ... ...σ (2,1)s,1σ (2,1)s,2... σ s,r (2,1) σ (2,2)s,1σ (2,2)s,2... σ s,s(2,2)⎞⎟⎠Nesta matriz, o bloco superior esquer<strong>do</strong> representa as autocovariâncias da variável Y 1e o bloco inferior direito as autocovariâncias das variável Y 2 . Os blocos superior direito e inferioresquer<strong>do</strong> representam as covariâncias cruzadas entre as variáveis Y 1 e Y 2 . Os índices noexpoente <strong>do</strong>s elementos da matriz representam as variáveis envolvidas e os índices abaixo correspondemàs localizações. Assim, o elemento σ (2,1)i, jrepresenta a covariância entre a variávelY 2 medida na localização x i e Y 1 medida na localização x j . De uma forma geral, essa matriz decovariâncias não estabelece que as coordenadas devam ser totalmente ou parciamente coincidentes.Considerou-se aqui a notação x i para a i-ésima coordenada da variável Y 1 e x ′ j a j-ésimacoordenada da variável Y 2 .Modelos bivaria<strong>do</strong>s podem ser escritos como uma junção de modelos univaria<strong>do</strong>scomo: {Y1,i = µ 1 (x i )+S 1 (x i )+ε i , i = 1,...,r.Y 2, j = µ 2 (x j )+S 2 (x j )+ε j ,j = 1,...,s.onde:a) µ 1 (x i ) = D 1 β (1) e µ 2 (x j ) = D 2 β (2) são componentes determinísticos <strong>do</strong> modelo associa<strong>do</strong>sa p 1 covariáveis em D 1 e a p 2 covariáveis em D 2 ;b) S 1 (x i ) e S 2 (x j ) são variáveis aleatórias espacialmente correlacionadas onde S 1 (x i ) ∼(N n 0;σ21 R(φ 1 ) ) (e S 2 (x j ) ∼ N n 0;σ22 R(φ 2 ) ) com σ1 2R(φ 1) e σ2 2R(φ 2) representan<strong>do</strong> asautocorrelações de S 1 (x i ) e S 2 (x j ), respectivamente;c) ε i ∼ N ( 0;τ1) 2 e ε j ∼ N ( 0;τ2) 2 são os erros aleatórios independentes.As variáveis Y 1 e Y 2 não precisarão ser co-localizadas e nem medidas o mesmo númerode vezes, ou seja, podem ou não serem coincidentes na área (Figura 3.1).


70 (y 2,1 )• x 4• x 1(y 1,1 )(y 2,2 )• x 3(y 1,3 )• x 2(y 1,2 ) Figura 3.1: Representação de uma área típica com processos geoestatísticos bivaria<strong>do</strong>s conten<strong>do</strong>quatro localizações amostrais, onde as variáveis não são co-localizadas e nem oferecemo mesmo número de observações.Deve-se aqui considerar quatro possibilidades distintas para modelos assim especifica<strong>do</strong>s,consideran<strong>do</strong> as características de seus elementos, assumin<strong>do</strong> que Y 1 e Y 2 ocorremsimultaneamente em uma mesma área de um espaço bidimensional:a) Sen<strong>do</strong> τ 1 = τ 2 = 0 e S 1 (x i ) ∼ N n(0;σ21 R(φ 1 ) ) independente de S 2 (x j ) ∼ N n(0;σ22 R(φ 2 ) ) ,então Y 1 será independente de Y 2 , ou seja, não serão correlaciona<strong>do</strong>s. Um problema escritodesta maneira, exigirá a estimação de quatro parâmetros: σ 1 , σ 2 , φ 1 e φ 2 .b) Sen<strong>do</strong> τ 1 = τ 2 = 0 e S 1 (x i ) ∼ N n(0;σ 2 R(φ) ) idêntico a S 2 (x j ) ∼ N n(0;σ 2 R(φ) ) , então Y 1será perfeitamente correlaciona<strong>do</strong> com Y 2 . Um problema escrito desta maneira, exigirá aestimação de <strong>do</strong>is parâmetros: σ e φ.(c) Sen<strong>do</strong> τ 1 ≠ τ 2 e S 1 (x i ) ∼ N n 0;σ 2 R(φ) ) (idêntico a S 2 (x j ) ∼ N n 0;σ 2 R(φ) ) então Y 1será parcialmente correlaciona<strong>do</strong> com Y 2 , provocan<strong>do</strong> uma dispersão difusa, dependen<strong>do</strong>da variância σ 2 . Um problema modela<strong>do</strong> desta maneira, exigirá a estimação de quatroparâmetros: τ 1 , τ 2 , σ, φ.(d) Sen<strong>do</strong> τ 1 = τ 2 = 0, S 0 (x i ) ∼ N n 0;σ20;1 R(φ 0 ) ) (idêntico a S 0 (x j ) ∼ N n 0;σ20;2 R(φ 0 ) ) , masescalona<strong>do</strong> por σ 2 (e S 1 (x i ) ∼ N n 0;σ21 R(φ 1 ) ) (diferente de S 2 (x j ) ∼ N n 0;σ22 R(φ 2 ) ) entãoY 1 será parcialmente correlaciona<strong>do</strong> com Y 2 . Um problema concebi<strong>do</strong> dessa maneira exigiráa estimação de sete parâmetros: σ0;1 2 , σ 0;2 2 , σ 1 2, σ 2 2, φ 0, φ 1 e φ 2 . Incluin<strong>do</strong>-se τ 1 ≠ τ 2 onúmero de parâmetros a serem estima<strong>do</strong>s poderá chegar a nove.Como exemplo de uma situação mais realística, ilustran<strong>do</strong> a situação contemplada em(d), consideran<strong>do</strong>-se estacionariedade na média e ε = 0 (sem perda de generalidade) o modelobivaria<strong>do</strong> pode ser escrito como:{ ( ) ( )Y1, j = µ 1 + S 0 xi + S1 xi( ) ( )(3.2)Y 2, j = µ 2 + S 0 x j + S2 x j i = 1,2,...,m; j = 1,2,...,n


71sen<strong>do</strong> S 0 (x i ), S 1 (x i ), S 0 (x j ) e S 2 (x j ) processos univaria<strong>do</strong>s independentes e com a mesma funcionalde correlação espacial.A covariância entre duas variáveis aleatórias Y 1 e Y 2 é definida como:Cov ( Y 1 (x);Y 2 (x) ) ( (Y1 )( ) )= E (x) − µ Y1 Y2 (x) − µ Y2em que µ Y1 = E ( Y 1 (x) ) e µ Y2 = E ( Y 2 (x) ) e define o coeficiente de correlação entre elas comosen<strong>do</strong>:em que σ 2 Y 1= Var ( Y 1 (x) ) e σ 2 Y 2= Var ( Y 2 (x) ) .ρ Y1 ;Y 2= Cov( Y 1 (x);Y 2 (x) )σ Y1 σ Y2Goovaerts (1997), define uma função que estima a correlação entre duas variáveis Y 1 eY 2 (nesta ordem), separadas por uma mesma distância h k ;k = 1,2,...,s (s a quantidade de paresque correspondem essa distância) como:onde ˆµ 1 = 1N(h)∑N(h)k=1C 1;2 (h) = 1N(h)∑y 1 (x k )y 2 (x k ′ N(h)) − µ ˆ 1µ ˆ 2k=1y 1 (x k ) , ˆµ 2 = 1N(h)∑N(h)k=1y 2 (x k ′ ) e N(h) é o número de pares pertencentesà mesma classe de distâncias e direção. Os estima<strong>do</strong>res ˆµ 1 e ˆµ 2 são, respectivamente, os estima<strong>do</strong>resdas médias µ 1 de Y 1 e µ 2 de Y 2 nas suas respectivas coordenadas <strong>do</strong> conjunto forma<strong>do</strong>pelas distâncias h. Um exemplo é apresenta<strong>do</strong> na Figura 3.2 para a distância h 1 (fixa) em queˆµ 1 seria a média das observações y(x i ) (círculos) <strong>do</strong> conjunto dessas distâncias e ˆµ 2 a média dasobservações y(x i ′ ) (estrelas) <strong>do</strong> mesmo conjunto.A covariância obtida para essas diferentes distâncias é chamada de função covariânciacruzada experimental. De maneira geral C (1;2) (h) ≠ C (1;2) (−h).A estimativa <strong>do</strong> correlograma cruza<strong>do</strong> será dada por:ρ 1;2 (h) = C (1;2)(h)√σ1 2σ 22em que, σ1 2 = 1N(h)∑(y 1 (x k )− ˆµ 1 ) 2 e σ2 2 N(h)= 1N(h)∑(y 2 (x k ′ N(h))− ˆµ 2) 2 sen<strong>do</strong> que σ1 2 e σ 2 2 sãok=1k=1as variâncias de Y 1 e Y 2 nas suas respectivas coordenadas <strong>do</strong> conjunto forma<strong>do</strong> pelas distânciash.


72Figura 3.2: Grid regular com locação amostral de duas variáveis com círculos representan<strong>do</strong> aprimeira e estrelas a segunda. As setas estabelecem a direção das correlações e os h, através deseus índices indicam o grupo de correlações entre variáveis separadas por uma mesma distância.como:Consideran<strong>do</strong>-se a Equação 3.2 a covariância entre Y(x i ) e Y(x j ) pode ser expressaCov ( Y 1 (x i );Y 2 (x j ) ) = Cov ( µ 1 + S 0 (x i )+S 1 (x i ) ; µ 2 + S 0 (x j )+S 2 (x j ) )ind.= Cov ( S 0 (x i );S 0 (x j ) ) (3.3)De forma semelhante ao resulta<strong>do</strong> obti<strong>do</strong> na Equação 2.8, a Equação (3.3) fica:Cov ( Y 1 (x i );Y 2 (x j ) ) = σ 01 σ 02 ρ(φ 0 ) (3.4)Análogamente as autocovariâncias de Y 1 e de Y 2 serão dadas por:Cov ( Y 1 (x);Y 1 (x) ) = σ 2 0ρ(φ 0 )+σ 2 1ρ(φ 1 ) (3.5)Cov ( Y 2 (x);Y 2 (x) ) = σ 2 0ρ(φ 0 )+σ 2 2ρ(φ 2 ) (3.6)Fazen<strong>do</strong>-se as parametrizações σ 01 = σ; σ 02 = ησ; σ 1 = ν 1 σ e σ 2 = ν 2 σ e substituin<strong>do</strong>nas Equações 3.4, 3.5 e 3.6 tem-se:Cov ( Y 1 (x);Y 2 (x ′ ) ) = σησρ(φ 0 ) = σ 2 ηρ(φ 0 )Var ( Y 1 (x) ) = σ 2 + ν1 2 σ 2 = σ 2 [ρ(φ 0 )+ν1 2 ρ(φ 1 )]Var ( Y 2 (x) ) = η 2 σ 2 + ν2 2 σ 2 = σ 2 [η 2 ρ(φ 0 )+ν2 2 ρ(φ 2 )]


73Logo:[Y1Y 2]([ ] [ ])µ1∼ N n ;σ 2 V(ν1 ;φ 0 ;φ 1 ) V(η;φ 0 )µ 2 V ′ (η;φ 0 ) V(η;ν 2 ;φ 0 ;φ 2 )(3.7)A literatura geralmente sugere que a estimativa <strong>do</strong>s parâmetros de um modelo geoestatísticobivaria<strong>do</strong> seja feita através <strong>do</strong> ajuste de certas funções de correlação, como as jámencionadas no Capítulo 2, aos semivariogramas relativos a Y 1 e Y 2 bem como ao semivariogramacruza<strong>do</strong>. Neste trabalho empregamos méto<strong>do</strong> basea<strong>do</strong> em verossimilhança aplica<strong>do</strong>s ádistribuição conjunta de Y 1 e Y 2 .3.4 PREDIÇÃO LINEAR ESPACIAL BIVARIADAIsaaks e Srivastava (1989) apresentam a cokrigagem como um méto<strong>do</strong> de estimação,envolven<strong>do</strong> a correlação cruzada entre variáveis secundárias e uma variável primária. A grandeutilidade <strong>do</strong> méto<strong>do</strong>, alegada pelos autores, é que as variáveis secundárias podem apresentarcaracterísticas favoráveis à sua obtenção, como baixo custo, fácil acesso, dentre outras, quepodem ser utilizadas para estimar variáveis primárias sujeitas a subamostragem.Consideram-se aqui <strong>do</strong>is processos estocásticos Y 1 e Y 2 distintos, mas ocorren<strong>do</strong> simultaneamenteem uma região. Por conveniência de notação, Y 1 foi a variável primária. No caso deuma única variável, para alguma coordenada onde não se tenha um valor medi<strong>do</strong>, este poderáser estima<strong>do</strong> por krigagem usan<strong>do</strong> uma combinação linear com pesos w associa<strong>do</strong>s a valoresn∑conheci<strong>do</strong>s, tal como: ŷ 0 = w i y i onde y i é o valor medi<strong>do</strong> na i-ésima coordenada x. No casoi=1de duas variáveis, a estimativa por cokrigagem, com um modelo linear de corregionalização,será obtida por uma combinação linear das duas variáveis, como:ŷ 1 (x 0 ) =n∑m∑a i y 1 (x i )+ b j y 2 (x j ) (3.8)i=1j=1onde ŷ 1 (x 0 ) é a estimativa da variável primária em uma particular localização x 0 não amostrada;y 1 (x) = ( y 1 (x 1 ),y 1 (x 2 ),...y 1 (x n ) ) são os da<strong>do</strong>s da variável primária observa<strong>do</strong>s em nlocalizações da área, y 2 (x i ) = (y 2 (x 1 ),y 2 (x 2 ),...y 2 (x m )) são os da<strong>do</strong>s da variável secundáriaobserva<strong>do</strong>s em m localizações da mesma área, que podem ser parcialmente ou totalmentecoincidentes ou isoladas com relação às localizações da variável primária; a 1 ,a 2 ,...,a n eb 1 ,b 2 ,...,b m são, respectivamente, os pesos de krigagem a serem determina<strong>do</strong>s associa<strong>do</strong>s às


74observações y 1 (x i ) e y 2 (x j ), i = 1,...,n; j = 1,...,m.Sen<strong>do</strong> ( ŷ 1 (x 0 ) − y 1 (x 0 ) ) o erro de predição na coordenada x 0 então:Var ( ŷ 1 (x 0 ) − y 1 (x 0 ) ) = w ′ C w (3.9)em que:a) w ′ = (a 1 ,a 2 ,...,a n ,b 1 ,b 2 ,...,b m ,−1),b) Y ∗ = ( Y 1 (x 1 ),...,Y 1 (x n ),Y 2 (x 1 ),...,Y 2 (x m ),Y 1 (x 0 ) ) ,c) C é a matriz de covariância de Y ∗ .Desenvolven<strong>do</strong> o la<strong>do</strong> direito da Equação 3.8 vem:n∑ n∑Var(ŷ 1 (x 0 ) − y 1 (x 0 )) = a i a j Cov(Y 1 (x i );Y 1 (x j ))+++ 2− 2− 2i=1m∑i=1n∑i=1j=1m∑b i b j Cov(Y 2 (x i );Y 2 (x j ))+j=1m∑a i b j Cov(Y 1 (x i );Y 2 (x j )) −j=1n∑a i Cov(Y 1 (x i );Y 1 (x 0 )) −i=1m∑b j Cov(Y 2 (x j );Y 1 (x 0 ))+j=1+ Cov(Y 1 (x 0 );Y 1 (x 0 )) (3.10)As condições a que os pesos de krigagem devem satisfazer são de que:n∑m∑a) Devem levar a uma estimativa não viciada, o que ocorrerá se a i = 1 e b j = 0, o quepode ser comprova<strong>do</strong> aplican<strong>do</strong>-se a definição de estima<strong>do</strong>r não-vicia<strong>do</strong> dada por Mood,Graybill e Boes (1974). De fato:⎛⎞E ( ŷ 1 (x 0 ) ) n∑m∑n∑= E ⎝ a i y 1 (x i )+ b j y 2 (x j ) ⎠ = µ 1 a i + µ 2i=1i=1j=1i=1 j=1m ∑j=1b j = µ 1 ;


75b) A variância <strong>do</strong> erro da<strong>do</strong> pela equação 3.10 deverá ser a menor possível, para escolhasconvenientes <strong>do</strong>s pesos.Minimizar a variância implica em igualar n derivadas parciais a zero, levan<strong>do</strong> a umsistema de n equações e n incógnitas. Devi<strong>do</strong> a condição de não tendenciosidade, que irá gerarmais uma equação sem parâmetros, o sistema será amplia<strong>do</strong> para n+1 equações e n incógnitas,cuja solução não é direta. Os multiplica<strong>do</strong>res de Lagrange são aplica<strong>do</strong>s para converter essesproblemas de minimização restrita em um problema irrestrito. Isaaks e Srivastava (1989)introduzem os multiplica<strong>do</strong>res de Lagrange ϑ 1 e ϑ 2 na Equação 3.10, o que resulta em:( ⎛ ⎞n∑ n∑Var(ŷ 1 (x 0 ) − y 1 (x 0 )) = w ′ C w+2ϑ 1 a i − 1)+2ϑ 2⎝ b i⎠ (3.11)i=1Sob a condição dada pelo item (a), a expressão 3.11 não muda. Ela poderá ser minimizadaderivan<strong>do</strong>-se a equação em relação a cada um <strong>do</strong>s pesos, inclusive os multiplica<strong>do</strong>res deLagrange e igualan<strong>do</strong>-se a zero, o que resulta em:∂n∑(Var(ŷ 1 (x 0 ) − y 1 (x 0 ))) = 2 a i Cov(Y 1 (x i );Y 1 (x k ))∂a k+ 2−∂∂b k(Var(ŷ 1 (x 0 ) − y 1 (x 0 ))) = 2+ 2i=1n∑b i Cov(Y 1 (x i );Y 2 (x k ))i=1j=12Cov(Y 1 (x 0 );Y 1 (x k ))+2ϑ 1 = 0 para k = 1,2,...,nn∑a i Cov(Y 1 (x i );Y 2 (x k ))i=1n∑b i Cov(Y 1 (x i );Y 2 (x k ))i=1− 2Cov(Y 1 (x 0 );Y 2 (x k ))+2ϑ 2 = 0 para k = 1,2,...,m( n∑ )∂(Var(ŷ 1 (x 0 ) − y 1 (x 0 ))) = 2 a i − 1) = 0∂ϑ 1i=1∂∂ϑ 2(Var(ŷ 1 (x 0 ) − y 1 (x 0 ))) = 2A variância <strong>do</strong> erro fica:n∑b i = 0i=1Var(ŷ 1 (x 0 ) − y 1 (x 0 )) = Cov ( Y 1 (x 0 );Y 1 (x 0 ) ) − ϑ 1 −−m∑b j Cov(Y 2 (x j );Y 1 (x 0 ))j=1n∑a i Cov ( Y 1 (x i );Y 1 (x 0 ) )i=1


76O méto<strong>do</strong> de cokrigagem poderá ser escrito em termos de semivariogramas desdeque as covariâncias cruzadas sejam simétricas. A continuidade espacial será modelada utilizan<strong>do</strong>semivariogramas posteriormente converti<strong>do</strong>s para as covariâncias equivalentes pelatransformação:C Y1 ;Y 2(u) = γ Y1 ;Y 2(∞) −γ Y1 ;Y 2(u)e emprega<strong>do</strong>s na matriz de krigagem dada por C w = D onde:⎛⎞ ⎛C(Y 1 ;Y 1 ) C(Y 1 ;Y 2 ) 1C(Y 2 ;Y 1 ) C(Y 2 ;Y 2 ) 1C =⎜⎝ 1 0 0 ⎟; w =⎜⎠ ⎝0 1 0⎞ ⎛ab−ϑ 1⎟; D =⎜⎠ ⎝−ϑ 2C(Y 1 ;Y 0 )C(Y 2 ;Y 0 )10⎞⎟⎠Este sistema de equações para a cokrigagem é válida somente para estimação pontual.Poderão ser estimadas as médias em um número suficientemente grande de pontos emcoordenadas de uma região e então se obter a média destas estimativas. Isaaks e Srivastava(1989) alertam que, para que a solução das equações existam e sejam únicas, o conjunto dasautocorrelações e das correlações cruzadas devem formar matrizes que sejam definidas positivas.Dizem ainda os autores que, se as variáveis forem obtidas nas mesmas coordenadas, asestimativas por cokrigagem e krigagem ordinária serão idênticas.A condição necessária que garantirá que a matriz de correlação seja definida positiva édada por:n∑ n∑ω ′ Cω = ω i ω j C (i; j) > 0i=1 j=1onde ω = (ω 1 ,ω 2 ,...,ω n ) ′ é o vetor de pesos de krigagem e pelo menos um de seus elementosdeve ser diferente de zero.Essa condição garante que a variância de qualquer variável aleatória formada pelacombinação linear ponderada pelos pesos ω de outras variáveis aleatórias será positiva, ouseja, tem-se a garantia de que a variância <strong>do</strong> erro de estimação dada por ( Ŷ(x 0 ) −Y(x 0 ) ) serápositiva.Ver Hoef e Barry (1998) usam o termo cokrigagem para referir-se a uma predição deuma variável primária em uma específica localização x 0 a partir de um conjunto multivaria<strong>do</strong>de da<strong>do</strong>s e o termo predição espacial quan<strong>do</strong> se deseja predizer um vetor de variáveis aleatórias(de diferentes tipos) também em uma específica localização x 0 . Eles destacam três problemascom a aplicação da cokrigagem tradicional. O primeiro surge quan<strong>do</strong> se pretende minimizaro erro médio quadrático de predição usan<strong>do</strong> o semivariograma cruza<strong>do</strong>, na forma porposta por


77Journel e Huijbregts (1978). O procedimento será viável, segun<strong>do</strong> eles, quan<strong>do</strong> a função decovariância cruzada for uma função par e de reflexão simétrica, ou seja, C (i; j) (h) = C (i; j) (−h).A condição de simetria é muito restritiva e pode tornar questionável o uso da função tradicional<strong>do</strong> semivariograma cruza<strong>do</strong>.O segun<strong>do</strong> problema será o de estimar o semivariograma cruza<strong>do</strong> quan<strong>do</strong> os da<strong>do</strong>s deambas as variáveis envolvidas forem toma<strong>do</strong>s nas mesmas coordenadas. Os autores propõemuma adaptação <strong>do</strong> que chamaram pseu<strong>do</strong>-variograma cruza<strong>do</strong>, da<strong>do</strong> por:2γ (k;m) (x i ;x j ) ≡ Var ( Y k (x i ) −Y m (x j ) )o que elimina a necessidade das variáveis estarem localizadas nas mesmas coordenadas.O terceiro problema é a dificuldade em produzir modelos de semivariogramas cruza<strong>do</strong>sváli<strong>do</strong>s que sejam consistentes com os modelos de semivariogramas conheci<strong>do</strong>s. Por modelosváli<strong>do</strong>s os autores se referem àqueles cuja variância de predição se mantém positiva.Uma outra forma de se derivar resulta<strong>do</strong>s de predição para os modelos decorregionalização aqui discuti<strong>do</strong>s pode ser pelas propriedades conhecidas da distribuição gaussianamultivariada. Assim, consideran<strong>do</strong>-se a intenção de se predizer Y 1 em uma coordenadax 0(Y1 (x 0 ) = Y 0)no modelo bivaria<strong>do</strong> da<strong>do</strong> pela Equação 3.7, utiliza-se a distribuição conjuntadada por:⎡ ⎤ ⎛⎡⎤ ⎡ ⎤⎞Y 0 µ 0 Σ 00 Σ 01 Σ 02⎢⎣Y 1⎥⎦ ∼ N ⎜⎢⎝⎣µ 1⎥⎦ ;σ2 ⎢⎣Σ 10 Σ 11 Σ 12⎥⎟⎦⎠Y 2 µ 2 Σ 20 Σ 21 Σ 22como µ 12 = µ 1 + Σ 12 Σ22 −1 (Y 2 − µ 2 ) e Σ 12 = Σ 11 − Σ 12 Σ −122Σ 21 então o preditor será da<strong>do</strong> por:[Y 0 |Y 1 ;Y 2]∼ N n(µ 0|12 ;Σ 0|12)(3.12)onde:[ ][ ] −1 ([ ]′ Σ11 Σ 12 Y1µ 0|12 = µ 0 + Σ 01 Σ 02Σ 21 Σ 22 Y 2−[µ1µ 2])e Σ 0|12 = Σ 00 − Σ 012


783.5 REDUÇÃO DO NÚMERO DE VARIÁVEIS AOS COM-PONENTES PRINCIPAISA análise de componentes principais – ACP é amplamente utilizada em pesquisas emais recentemente, vem sen<strong>do</strong> aplicada a conjuntos de variáveis com da<strong>do</strong>s autocorrelaciona<strong>do</strong>sem modelos geoestatísticos.Este tipo de análise estatística de da<strong>do</strong>s tem a finalidade de transformar linearmentevariáveis correlacionadas em seus componentes principais não correlaciona<strong>do</strong>s e organizar essescomponentes em ordem decrescente de suas variâncias. A idéia é reduzir a quantidade de da<strong>do</strong>saos componentes que retêm a maior parte da variância total <strong>do</strong> conjunto de variáveis. Deve-seaqui atentar para o fato de que, na presença de valores discrepantes (outliers) a variabilidade<strong>do</strong>s da<strong>do</strong>s poderá ser comprometida, alteran<strong>do</strong> o papel da variável porta<strong>do</strong>ra desses valores noprocesso de análise <strong>do</strong>s componentes <strong>do</strong> conjunto. Para processos gaussianos, os componentesescolhi<strong>do</strong>s podem ser ti<strong>do</strong>s como fatores.Seja Y = (Y 1 ,Y 2 ,...,Y p ) um processo estocástico p-dimensional onde cada variável Y k(k = 1,2,..., p) segue o modelo defini<strong>do</strong> pela Equação 2.3. É importante explicar a estruturade covariância desse processo para a redução de seu número de variáveis devi<strong>do</strong> a redundânciasou de uma interpretação correlacional (JOHNSON; WICHERN, 1992). Esse tipo de análise deda<strong>do</strong>s é ti<strong>do</strong> como um processo intermediário para investigações mais amplas como regressãomúltipla ou análise de agrupamentos.Considera-se o vetor Y e a partir dele, constrói-se a matriz de covariânciasΣ = E ( (Y − µ)(Y − µ) ′)sen<strong>do</strong> µ = (µ 1 , µ 2 ,..., µ p ) ′ o vetor das médias relativas a cada variável <strong>do</strong> vetor Y. Já os elementosda matriz de covariâncias amostrais são:s kk ′ = 1n − 1ou, em forma matricial, S = (n − 1) −1 (Y −Ȳ)(Y −Ȳ) ′ .n∑(y ik − ȳ k )(y ik ′ − ȳ k ′) k,k ′ = 1,2,..., p. (3.13)i=iDecompon<strong>do</strong>-se a matriz de covariâncias obtém-se os p pares de autovalores e autovetoresassocia<strong>do</strong>s (λ k ;e k ), tais que λ 1 ≥ λ 2 ≥ ... ≥ λ p .Para Kolman (1997) sen<strong>do</strong> Y um conjunto de vetores em um mesmo espaço vetorial,


79então um outro vetor Cp, nesse mesmo espaço vetorial será uma combinação linear <strong>do</strong>s vetoresde Y se existirem números reais a 1 ,...,a p tais que Cp = a 1 Y 1 ,a 2 Y 2 ,...a p Y p . Assim, segun<strong>do</strong>Reis (1997), pode-se escrever o vetor Y como uma combinação de seus elementos como:Cp 1 = a 11 Y 1 + a 12 Y 2 +...+a 1p Y pCp 2 = a 21 Y 1 + a 22 Y 2 +...+a 2p Y p.Cp p = a p1 Y 1 + a p2 Y 2 +...+a pp Y psen<strong>do</strong> Cp k a k-ésima componente principal (não correlacionada) cuja variância seja a maiorpossível, ou seja:• Var(Cp k ) = e ′ k Σe k = λ k ;• Cov(Cp j ;Cp k ) = e ′ j Σe k = 0 j ≠ k;p∑• Var(Y i ) =k=1p∑Var(Cp i ) = λ 1 + λ 2 +...+λ p .k=1A porcentagem de contribuição de cada componente é determinada como:⎛%CCp k = λ k⎝p∑j=1⎞−1λ j⎠ . (3.<strong>14</strong>)Desta forma, aquelas primeiras m variáveis Y k que acumularem maior porcentagem,poderão ser substituídas pelas m componentes principais, reduzin<strong>do</strong> assim, o número devariáveis sem grande perda na variabilidade <strong>do</strong> processo.Segun<strong>do</strong> Johnson e Wichern (1992) o coeficiente de correlação entre as componentese as variáveis primárias Y k é da<strong>do</strong> por:√λi√λiρ(Cp i ;Y k ) = e ik√ = e ikonde i;k = 1,2,..., p.VarYk σ iiApesar da correlação entre as p variáveis e seus componentes principais ajudar a interpretaro papel <strong>do</strong>s componentes, esta mede somente a contribuição univariada de um particularY k para formar a componente Cp k e não a sua importância na presença das demais. Quan<strong>do</strong>as variáveis Y k forem processos medi<strong>do</strong>s em escalas diferentes, recomenda-se utilizar a suapadronização para que possam ser comparáveis. O processo de seleção de componentes principaisa partir de variáveis padronizadas Z k se dá a partir da matriz de correlações R obtida


80como:R =( )V − 21 −1 (Σ V 2) − 1 −1(3.15)onde Σ é a matriz de covariâncias e:⎛V − 2 1 = ⎜⎝√⎞σ11 0 ... 0√ 0 σ22 ... 0.. . 0 ⎟⎠√0 0 ... σppDecompon<strong>do</strong> a matriz de correlações R obtém-se também os p pares de autovalores eautovetores ordena<strong>do</strong>s (λ k ;e k ). A k-ésima componente principal padronizada será:Cp k =p∑k=1e k Z k onde Z k = Y k −Ȳ k√skk. (3.16)A porcentagem de variação explicada por cada componente será dada pelaEquação 3.<strong>14</strong> e a correlação entre componente e variável padronizada será dada por:ρ(Cp k ,Z l ) = e kl√λk ; k;l : 1,2,..., p. (3.17)Wackernagel (1998) diz que é de vital importância tal tipo de análise para verificarse os da<strong>do</strong>s são intrinsecamente correlaciona<strong>do</strong>s, senão o méto<strong>do</strong> geoestatístico multivaria<strong>do</strong>poderá gerar resulta<strong>do</strong>s viesa<strong>do</strong>s.Para se detectar uma correlação intrínseca em da<strong>do</strong>s autocorrelaciona<strong>do</strong>s no espaço,há a necessidade de se verificar se os da<strong>do</strong>s seguem um modelo de correlação intrínseca. Nessemodelo, to<strong>do</strong> autovariograma de duas variáveis Y i , Y j serão proporcionais a um variograma geralγ(u), ou seja,onde os b i j são coeficientes.γ i j = b i j γ(u)para i, j = 1,2,...,nUma corregionalização (um conjunto de variáveis espacialmente correlacionadas) éintrinsecamente correlacionada quan<strong>do</strong> o quociente:γ i j (u)√γii γ j j (u) = b i j√ = r i jbii b j jé constante para qualquer distância u. Notar que a correlação entre duas variáveis não dependede u, diferentemente da autocorrelação de cada uma das variáveis separadamente.


81A correlação intrínseca pode ser avaliada determinan<strong>do</strong> suas componentes principaispara a seguir determinar o variograma cruza<strong>do</strong> entre os primeiros componentes principais. Nocaso de existência de correlação intrínseca, o variograma cruza<strong>do</strong> resultante será nulo, casocontrário, as componentes serão correlacionadas espacialmente em alguma região <strong>do</strong> espaço eentão o modelo deverá ser preteri<strong>do</strong> a favor de outros modelos de corregionalização.3.6 APLICAÇÃO COM MODELOS GEOESTATÍSTICOSMULTIVARIADOS3.6.1 Da<strong>do</strong>s da PesquisaOs da<strong>do</strong>s utiliza<strong>do</strong>s para a análise multivariada foram os mesmos apresenta<strong>do</strong>s naSeção 2.8.1. Entretanto o arquivo de da<strong>do</strong>s foi formata<strong>do</strong> às necessidades requeridas para essetipo de análise. A forma pela qual foi feita essa formatação está descrita em código próprio nosanexos desse trabalho.3.6.2 Recursos computacionaisNesta fase da análise, foi empregada a funçãolikfitBGCCM, implementada no pacotegeoR, que estima, pelo méto<strong>do</strong> da máxima verossimilhança os parâmetros <strong>do</strong>s componentes <strong>do</strong>modelo geoestatístico bivaria<strong>do</strong>, conforme a Equação 3.2. A função e seus principais argumentospadrão são da<strong>do</strong>s por:likfitBGCCM(geodata1, geodata2,ini.sigmasq, ini.phi,cov0.model="matern", cov1.model="matern",cov2.model="matern",kappa0=0.5, kappa1=0.5, kappa2=0.5,fc.min = c("optim", "nlminb"), ...)ondegeodata1 egeodata2 representam, respectivamente os objetos associa<strong>do</strong>s às variáveis Y 1e Y 2 <strong>do</strong> modelo bivaria<strong>do</strong>. A variável Y 2 foi considerada a variável secundária no caso bivaria<strong>do</strong>


82ou a componente representante de um conjunto de variáveis, determinada pela ACP no casomultivaria<strong>do</strong>. Maiores detalhes sobre os demais argumentos da função pode ser obtida diretamentena <strong>do</strong>cumentação desta função, disponível no pacote geoestatístico geoR (RIBEIRO JR;DIGGLE, 2001).A ACP foi desenvolvida diretamente no ambiente <strong>do</strong> R (R Development Core Team,2008) utilizan<strong>do</strong>-se coman<strong>do</strong>s fundamentais de operações com matrizes. Os roteiros dasanálises estão apresentadas pelo código fonte em anexo.3.6.3 Análise geoestatística <strong>do</strong>s da<strong>do</strong>s de produtividade de sojaAnálise <strong>do</strong>s Componentes PrincipaisNa área de plantio, juntamente com a produtividade de soja, foram coletadas 256 amostrasde solo. Foram medidas as variáveis químicas P, H, K, MO e SB. Considerou-se nestaanálise 150 observações aleatoriamente amostradas das 256 disponíveis de cada uma das cincovariáveis. As respectivas matrizes de média e covariâncias resultaram em:⎛¯X =⎜⎝4,1685,1210,33452,68555,029⎞⎟⎠⎛S =⎜⎝1,99 −0,16 0,03 1,99 −3,58−0,16 0,23 −0,00 −1,81 5,280,03 −0,00 0,01 0,<strong>14</strong> −0,011,99 −1,81 0,<strong>14</strong> 41,97 −42,25−3,58 5,28 −0,01 −42,25 151,79⎞⎟⎠Na diagonalização da matriz de correlação os autovalores Λ e os autovetores EIGresultantes foram:⎛Λ =⎜⎝166,45327,6221,8700,0380,006⎞⎟⎠EIG =⎛⎜⎝0,024 −0,028 0,999 −0,0<strong>14</strong> −0,0<strong>14</strong>−0,034 0,000 −0,013 −0,998 0,0530,000 −0,005 0,0<strong>14</strong> 0,053 0,9980,322 −0,946 −0,035 −0,011 −0,004−0,946 −0,323 0,015 0,031 −0,003⎞⎟⎠A porcentagem de explicação de cada componente resultou, respectivamente em


8384,93% <strong>14</strong>,09% 0,95% 0,02% e 0,00%. A<strong>do</strong>tou-se então a primeira componente principal –CP1, para representar o variável secundária no modelo geoestatístico bivaria<strong>do</strong>. Essa componenteficou composta da seguinte maneira:CP 1 = 0,024 P − 0,034 PH + 0,322 MO − 0,946 SBAjuste <strong>do</strong>s parâmetros <strong>do</strong> modelo bivaria<strong>do</strong>A Tabela 3.1 apresenta as estimativas por MV para o modelo bivaria<strong>do</strong> da<strong>do</strong> pelaEquação 3.2. Nessa tabela, µ 1 e µ 2 são estimativas <strong>do</strong> efeito sistemático <strong>do</strong> modelo, presentesrespectivamente nas variáveis primária (Soja) e secundária (iCone ou CP1), σ01 2 , σ 1 2, σ 02 2 eσ2 2 são, respectivamente, parâmetros de escala associa<strong>do</strong>s as matrizes de correlação R 0(φ 0 ) dasvariáveis primária e secundária, R 1 (φ 1 ) da variável primária e R 2 (φ 2 ) da variável secundária.φ 0 , φ 1 e φ 2 são parâmetros da função de correlação que, neste estu<strong>do</strong> foi a<strong>do</strong>tada a de Matèrncom κ = 0,5, que equivale a uma função exponencial.Tabela 3.1: Parâmetros estima<strong>do</strong>s para os modelos geoestatísticos bivaria<strong>do</strong>s por MV.Modelo µ 1 µ 2 σ01 2 σ1 2 σ02 2 σ2 2 φ 0 φ 1 φ 2S128iCone 2,7640 21,9 0,<strong>14</strong> 0,32 9,32 31,27 <strong>14</strong>,7 24,6 20,3S64iCone 2,8861 21,9 0,<strong>14</strong> 0,33 7,92 33,52 21,8 24,7 19,6S128CP1 2,7576 0,3 0,00 0,19 0,01 0,01 6,3 4,7 52,0S64CP1 2,8078 0,3 0,00 0,16 0,00 0,01 8,9 0,1 39,9IMAArg 25,500 24,0 9,31 50,48 103,30 0,10 722,6 1.488,7 1.675,2Obs.: µ 1 e µ 2 : parâmetros <strong>do</strong> efeito sistemático, σ01 2 , σ 1 2, σ 02 2 e σ 2 2 : parâmetros de escala associa<strong>do</strong>s aR 0 (φ 0 ), R 1 (φ 1 ) e R 2 (φ 2 ) respectivamente. S128 e S64: soja tomadas em 128 e 64 parcelas, iCone: Índicede Cone, CP1: primeira componente principal <strong>do</strong> conjunto de variáveis P, PH, K, MO e SB, Arg: Teorde Argila.Estatísticas descritivas da predição bivariada de produtividade de soja suportada poriCone e CP1A Tabela 3.2 mostra a média das predições multivariadas de soja utilizan<strong>do</strong> uma amostraaleatória de 128 parcelas de produtividade conhecida na área como variável primária e <strong>do</strong>iscenários para a variável secundária. O primeiro utiliza 150 amostras aleatórias de iCone namesma área e o segun<strong>do</strong> utiliza 150 amostras aleatórias da variável CP1. Essa Tabela mostraainda a média das predições multivariadas de soja utilizan<strong>do</strong> uma amostra aleatória de 64 parcelasde produtivade conhecida na área como variável primária e os <strong>do</strong>is cenários para variável


84secundária apresentada no caso anterior. Observa-se que são iguais às estimativas para Soja128nas duas concepções de variável secundária bem como o são no caso da Soja64.Tabela 3.2: Estatísticas descritivas das predições da produtividade de soja medida em 128 e64 pontos aleatórios condicionadas às observações de iCone e da CP1 e predições de IMAcondicionadas a 555 observações de Teor de Argila.Delineamento Mínimo Média Máximo D.P. C.V.(%) ER(%)S128iCone 1,8626 2,7708 3,7627 0,3135 11,3 0,8S64iCone 2,0243 2,8049 3,6266 0,2672 9,5 2,0S128CP1 2,0280 2,7583 3,4739 0,1949 7,1 0,3S64CP1 2,7943 2,8084 2,8244 0,0043 0,2 2,1IMAArg 17,740 25,750 37,150 3,3100 12,9 –Estimativas de soja em t ha −1 e estimativas de IMA em m 3 . D.P.: Desvio Padrão, C.V.: Coeficiente deVariação, ER(%): erro em relação ao valor referência de 2,75 t ha −1 .Na tabela 3.3, a porcentagem <strong>do</strong>s pontos estima<strong>do</strong>s por méto<strong>do</strong> de krigagem com modelobivaria<strong>do</strong>, incidentes em cada intervalo de classificação segun<strong>do</strong> os diferentes modelos,mostra a tendência <strong>do</strong> número de pontos preditos se concentrarem na classe central, quan<strong>do</strong>comparada com a distribuição percentual <strong>do</strong>s da<strong>do</strong>s originais. No caso em que se empregouCP1 como informação adicional no modelo esse efeito fica mais evidente, chegan<strong>do</strong> a concentrarto<strong>do</strong>s os pontos na classe de 2,61 a 3,16 t ha −1 , o que não permitiu representar um padrãoespacial pelo respectivo mapa.Tabela 3.3: Porcentagem <strong>do</strong>s pontos estima<strong>do</strong>s com modelo bivaria<strong>do</strong>, incidentes nos respectivosintervalo de classificação.Classe PM S128 e IC S64 e IC S128 e CP1 S64 e CP1 S256d1,19 a 2,34 1,8 8,3 4,2 2,3 0,0 20,32,34 a 2,61 2,5 22,8 18,3 17,5 0,0 19,92,61 a 2,85 2,7 28,4 34,2 51,9 100,0 20,72,85 a 3,16 3,0 28,8 33,6 25,7 0,0 19,13,16 a 4,<strong>14</strong> 3,7 11,7 9,7 2,6 0,0 19,9PM: ponto médio da classe, S128: soja em 128 amostras, S64: soja em 64 amostras, IC: iCone, CP1:primeira componente principal, S256d: da<strong>do</strong>s originais de soja classifica<strong>do</strong>s.Mapa da média da predição bivariada de produtividade de sojaA Figura 3.3 apresenta os mapas de produtividade de soja estima<strong>do</strong>s por méto<strong>do</strong>s dekrigagem condicional em modelos bivaria<strong>do</strong>s em uma malha de 690 pontos. No mapa à esquerdao modelo aplica<strong>do</strong> utilizou informações de soja em 128 pontos e iCone em 150 pontos


85da variável secundária. No mapa da direita, o modelo utilizou informações em 64 pontos sortea<strong>do</strong>sda variável principal (soja) e 150 pontos da variável secundária (iCone). Os pontosbrancos da figura correspondem às produtividades abaixo de 2,34 t ha −1 e os pontos pretos correspondemàs produtividades acima de 3,16 t ha −1 . Os demais pontos variam seu tom de cinzaproporcionalmente às classes que representam. Nessas figuras nota-se que os mapas que se utilizaramde informações de uma segunda variável indicaram um padrão de variabilidade espacialsemelhante ao descrito na Figura 2.13 da página 53, entretanto não definiram visualmente zonasde produtividade de amplas dimensões.0 20 40 60 80 100 120128 amostras0 20 40 60 80 100 12064 amostras20 40 60 80 100 120 <strong>14</strong>020 40 60 80 100 120 <strong>14</strong>0Figura 3.3: Mapas de produtividade de soja em modelos bivaria<strong>do</strong>s em uma malha regular de 690pontos. No modelo <strong>do</strong> mapa da esquerda utilizou-se 128 amostras de soja e no da direita, 64. A variávelsecundária foi 150 amostras de iConeA Figura 3.4 também apresenta mapas de produtividade de soja estima<strong>do</strong>s por méto<strong>do</strong>sde krigagem condicional em modelos bivaria<strong>do</strong>s em uma malha de 690 pontos. Na construçãoda figura da esquerda o modelo utilizou informações em 128 pontos sortea<strong>do</strong>s da variável principal(soja) e 150 pontos da variável secundária (CP1). No mapa da direita, o modelo utilizouinformações em 64 pontos sortea<strong>do</strong>s da variável principal (soja) e 150 pontos da variável secundária(CP1). Os pontos brancos da figura correspondem às produtividades abaixo de 2,34 tha −1 e os pontos pretos correspondem às produtividades acima de 3,16 t ha −1 . Os demais pontosvariam seu tom de cinza proporcionalmente às classes que representam. Tanto nessa figuracomo na Tabela 3.3 nota-se que o modelo que se utilizou de 128 amostras de soja na variávelprincipal, foram preditos poucos pontos que correspondem a valores baixos (2,3% <strong>do</strong> total) epoucos pontos que correspondem altos (2,6% <strong>do</strong> total), levan<strong>do</strong> a um mapa que ilustrou umpadrão espacial mais concentra<strong>do</strong> nas classes centrais. O efeito dessa concentração foi maiorno modelo que se utilizou de 64 amostras de soja. To<strong>do</strong>s os pontos foram estima<strong>do</strong>s dentro <strong>do</strong>intervalo central de 2,61 a 2,85 t ha −1 , intervalo esse que contém a produtividade média de 2,75


86t ha −1 obtida de fato na área. Tal resulta<strong>do</strong> não permitiu contruir um mapa capaz de identificarzonas diferenciadas de produtividade.0 20 40 60 80 100 120128 amostras0 20 40 60 80 100 12064 amostras20 40 60 80 100 120 <strong>14</strong>020 40 60 80 100 120 <strong>14</strong>0Figura 3.4: Mapas de produtividade de soja estima<strong>do</strong>s por MV em modelos bivaria<strong>do</strong>s em uma malharegular de 690 pontos. No modelo <strong>do</strong> mapa da esquerda utilizou-se 128 amostras de soja e no da direita,64. A variável secundária foi 150 amostras da CP13.6.4 Análise geoestatística <strong>do</strong>s da<strong>do</strong>s rendimento de P. Taeda L.Os da<strong>do</strong>s a que se refere essa pesquisa envolvem duas variáveis, o IMA e o Teor deArgila. A variável IMA, de interesse principal, foi obtida de uma amostragem de 18 localizaçõese a variável Teor de Argila (secundária) foi coletada em 555 localizações.Ajuste <strong>do</strong>s parâmetros <strong>do</strong> modelo bivaria<strong>do</strong> (IMA e Argila)Na Tabela 3.1 encontam-se as estimativas por MV para o modelo bivaria<strong>do</strong>. Nessatabela, µ 1 e µ 2 são estimativas <strong>do</strong> efeito sistemático <strong>do</strong> modelo presentes, respectivamente,nas variáveis primária (IMA) e secundária (Argila); σ01 2 , σ 1 2, σ 02 2 e σ 2 2 são, respectivamente,parâmetros de escala associa<strong>do</strong>s às matrizes de correlação R 0 (φ 0 ) das variáveis primária esecundária, R 1 (φ 1 ) da variável primária e R 2 (φ 2 ) da variável secundária. φ 0 , φ 1 e φ 2 sãoparâmetros da função de correlação que, neste estu<strong>do</strong>, foi a<strong>do</strong>tada a de Matèrn com κ = 0,5.Nesse modelo, considerou-se o efeito pepita relativo igual a zero.Estatísticas descritivas da predição bivariada <strong>do</strong> IMA suportada pelo Teor de ArgilaNa última linha da Tabela 3.2 encontra-se as medidas descritivas da média de prediçãode IMA, onde a média obtida de 25,73 m 3 ha −1 ano −1 é compatível, em ordem de grandeza,


87com o valor de 26,53 m 3 ha −1 ano −1 obti<strong>do</strong>s pela krigagem convencional com modelo ajusta<strong>do</strong>pelo méto<strong>do</strong> MV em 18 amostras. Esses resulta<strong>do</strong>s são ainda comparáveis com a literatura,conforme Mainardi, Schneider e Finger (1996) e Carvalho et al. (1999).Mapa da média da predição bivariada IMA suportada pelo Teor de ArgilaNa Figura 3.5 apresenta-se o mapa de predição bivariada de IMA condicionada ao Teorde Argila. Nesse mapa, 4,5% das predições de IMA ficaram abaixo de 20,5 m 3 ha −1 ano −1 ,17,7% ficaram entre 20,5 e 23,4 m 3 ha −1 ano −1 , 55,6% ficaram entre 23,4 e 28,3 m 3 ha −1ano −1 , 19,6% entre 28,3 e 32,5 m 3 ha −1 ano −1 e 2,7% acima de 32,5 m 3 ha −1 ano −1 . Essesresulta<strong>do</strong>s são muito próximos aos obti<strong>do</strong>s por predição bayesiana univariada (Tabela 2.13), entretantoo mapa desta figura definiu mais zonas de rendimento de IMA quan<strong>do</strong> comparada comaa Figura 2.22, tanto naquela com predições por krigagem baseada em MV (esquerda) quantoaquela obtida por predição bayesiana (direita). Os resulta<strong>do</strong>s <strong>do</strong>s agrupamento em classes indicaramainda uma concentração das predições bivariadas em direção às classes mais centrais,efeito esse não caracteriza<strong>do</strong> pelo mapa.Figura 3.5: Mapa de predição de IMA classificada pelos quartis, usan<strong>do</strong> krigagem convencionale Teor de Argila como variável secundária no modelo bivaria<strong>do</strong>.


883.6.5 Conclusões sobre o méto<strong>do</strong> multivaria<strong>do</strong>Conclusões sobre a estimação bivariada da produtividade de soja• Usar uma variável simples (iCone) ou uma variável composta (CP1) como suporte paraa descrição da variabilidade espacial de uma variável de interesse primário (soja) em128 amostras, não produziu diferenças nem na média de predição nem nos aspectos <strong>do</strong>srespectivos mapas temáticos. No caso de predições baseadas em 64 amostras o méto<strong>do</strong>produziu uma concentração na classe central quan<strong>do</strong> se utilizou CP1 como variável secundária.• O tamanho da amostra da variável de interesse primário (soja) produziu diferenças noaspecto <strong>do</strong>s mapas temáticos. A amostra de tamanho menor induziu um mapa com agrupamentomaior de zonas de classificação, compara<strong>do</strong> com os mapas com amostra detamanho maior.Conclusões sobre IMA e Teor de Argila• A média <strong>do</strong>s valores obti<strong>do</strong>s nos mapas, comparada a média <strong>do</strong>s valores nos mapas <strong>do</strong>caso univaria<strong>do</strong> não foram conclusivas.• O mapa da distribuição espacial bivariada de IMA condicionada à distribuição espacial<strong>do</strong> Teor de Argila definiu melhores zonas de manejo viáveis quan<strong>do</strong> comparada com osmapas produzi<strong>do</strong>s em <strong>do</strong>is méto<strong>do</strong>s univaria<strong>do</strong>s.


4 CONCLUSÕES E SUGESTÕES DE TRABALHOSFUTUROSConclusões• A abordagem fundamentada na declaração explícita de modelos associa<strong>do</strong>s a méto<strong>do</strong>sformais de inferência basea<strong>do</strong>s na informação contida na função de verossimilhançamostrou-se adequada em análise <strong>do</strong>s da<strong>do</strong>s, bem como aponta caminhos parageneralizações de procedimentos de análise tais como extensões multivariadas de modelos.• A a<strong>do</strong>ção de méto<strong>do</strong>s bayesianos, que incorporam a incerteza associada aos parâmetrosnos procedimentos de predição permitiu, nos exemplos analisa<strong>do</strong>s, uma melhor definiçãoe melhor caracterização da incerteza sobre zonas viáveis de manejo em experimentosagronômicos que envolvem a produção de mapas temáticos, sobretu<strong>do</strong> quan<strong>do</strong> se dispõede amostra pequena da variável de interesse. Permite estimar a média <strong>do</strong> processo gaussianosubjacente que reflete a produtividade total quan<strong>do</strong> compara<strong>do</strong> a uma estimação porkrigagem convencional.• Méto<strong>do</strong>s bivaria<strong>do</strong>s produzem mapas temáticos com variações espaciais mais definidas emaior quantidade de zonas de manejo quan<strong>do</strong> comparadas com krigagem convencionalunivariada ou méto<strong>do</strong>s geoestatísticos bayesianos univaria<strong>do</strong>s.• A formulação e a<strong>do</strong>ção de méto<strong>do</strong>s multivaria<strong>do</strong>s permite melhor uso da informação disponívelbem como abre possibilidade para a investigação de planos amostrais específicosao problema em questão que combinem da<strong>do</strong>s de diferentes naturezas.Proposição de trabalhos futuros decorrente <strong>do</strong>s resulta<strong>do</strong>s deste trabalho• Escrever e implementar computacionalmente uma solução bayesiana para o modelo bivaria<strong>do</strong>proposto neste trabalho.


90• Comparar diferentes formulações de modelos bivaria<strong>do</strong>s e multivaria<strong>do</strong>s e seum desempenhoem análise de da<strong>do</strong>s reais.• Comparar o efeito de diferentes tamanhos de amostras da variável principal e da variávelsecundária em modelos bivaria<strong>do</strong>s com base em da<strong>do</strong>s reais e da<strong>do</strong>s simula<strong>do</strong>s.• Qualificar as zonas de manejo produzidas por diferentes méto<strong>do</strong>s de estimação geoestatística.• Criar critérios de classificação basea<strong>do</strong>s em conceitos agronômicos.


91Referências BibliográficasABRAMOWITZ, M.; STEGUN, I. Handbook of Mathematical Functions. Ninth. New York:Dover, 1965.AGUIRRE, A.; FARIA, D. M. C. P. de. A utilização <strong>do</strong>s ”preços hedônicos”na avaliação socialde projetos. [S.l.], 1996. Disponível em: .ATTEIA, O.; DUBOIS, J. P.; WEBSTER, R. Geostatistical analysis of soil contamination inthe swiss jura. Environmental Pollution, n. 86, p. 315–327, 1994.BAKHSH, A. et al. Spatial distribution of soil attributes affecting crop yield. ASAE, n. 97,p. 1032, 1997.BALASTREIRE, L. A.; ELIAS, A. I.; AMARAL, J. R. Agricultura de precisão: Mapeamentoda produtividade da cultura de milho. Revista de Engenharia Rural, n. 8, p. 97–111, 1997.BARTLETT, M. Stochastic Process. USA: Cambridge University Press, 1955.BOGNOLA, I. A. Unidades de manejo para Pinus Taeda L. no planalto norte catarinense,com base em características <strong>do</strong> meio físico. 180 p. Tese (Tese de Doutora<strong>do</strong>) — <strong>Universidade</strong><strong>Federal</strong> <strong>do</strong> Paraná, Curitiba, 2007. Programa de Pós-graduação em Engenharia Florestal.BOLSTAD, W. M. Introduction to bayesian statistics. USA: John Wiley & Sons, 2004.BOX, G.; COX, D. An analysis of transformation. JRSSB, n. 26, p. 211–252, 1964.BRAGA, L. P. V. Geoestatística e aplicações. Anais <strong>do</strong> IX Simpósio Brasileiro de Probabilidadee Estatística <strong>do</strong> IME/USP - São Paulo, p. 36p, 1990.CAEIRO, S. et al. Delineation of estuarine management areas using multivariate geostatistic:the case of sa<strong>do</strong> estuary. Environmental Science e Tecnology, v. 37, n. 18, p. 4052–4054, 2003.CAMBARDELLA, C. A. et al. Field-scale variability of soil properties in central iowa soil.Soil Science Society of Ameriaca Journal, v. 58, p. 1501 – 1511, 1994.CAPELLI, N. L. Agricultura de precisão: Novas tecnologias para o processo produtivo.LIE/DMAQAG/ FEAGRI/UNICAMP, 1999.CARVALHO, A. P. de et al. Efeitos de Características de Solo sobre a Capacidade Produtivade Pinus taeta. Colombo, 1999.CARVALHO, J. R. P.; QUEIROZ, E. Uso da cokrigagem colocalizada na determinação dadistribuição espacial de precipitação. Campinas, 2002. Comunica<strong>do</strong> Técnico.COUTO, E. G.; CUNHA, C. N. Application of multivariate geostatistics to identify soillandscapes in the Pantanal of Mato Grosso - Brazil. Revista Agricultura Tropical, v. 6, n. 1, p.48–65, 2002.


92CRESSIE, N. Fitting variogram models by weighted least squares. Mathematical Geology,v. 17, n. 4, p. 563–586, 1985.DEGROOT, M. Probability and Statistics. [S.l.]: Addilson-Wesley, 1989.DIGGLE, P. J.; LOPHAVEN, S. Bayesian geostatistical design. Scandinavian Journal ofStatistics, v. 33, p. 55–64, 2006.DIGGLE, P. J.; RIBEIRO JR, P. J. Model-based Geostatistics. USA: Springer Series inStatistics, 2007.DIGGLE, P. J.; TAWN, J. A.; MOYEED, R. A. Model-based geostatistics. Royal StatisticalSociety, v. 43, n. 3, p. 299–350, 1998.DUDEWICZ, E.; MISHRA, S. Modern Mathematical Statistics. Singapore: John Wiley &Sons, 1988.EHLERS, R. S. Introdução à Inferência Bayesiana. Curitiba: <strong>Universidade</strong><strong>Federal</strong> <strong>do</strong> Paraná - Departamento de Estatística, 2006. Disponível em:.EINAX, J. W.; SOLDT, U. Multivariate geostatistical analysis of soil contamination. Freseniu’sJournal of Analytical Chemistry, v. 361, n. 1, p. 10–<strong>14</strong>, april 1998.FARACO, M. A. et al. Seleção de modelos de variabilidade espacial para elaboração de mapastemáticos de atributos físicos <strong>do</strong> solo e produtividade de soja. Revista Brasileira de Ciências<strong>do</strong> Solo, v. 32, n. 2, p. 463–476, 2008.FILZMOSER, P.; REIMANN, C. Robust multivariate methods in geostatistics. W. Gaul and G.Ritter, editors, Classification, Automation, and New Media, p. 429–436, 2002.FRASSON, F. R.; MOLIN, J. P. Análise da variabilidade espacial da produtividade de sojautilizan<strong>do</strong> recursos <strong>do</strong> software r. In: USP/ESALQ (Ed.). Congresso Brasileiro de Agriculturade Precisão. São Pedro-SP: USP/ESALQ, 2006. p. 1–10.GELMAN, A. et al. Bayesian Data Analysis. Second. Singapore: Chapman & Hall, 2003.GOMES, F. P. Estatística experimental. Piracicaba: ESALQ, 1963.GOOVAERTS, P. Geostatistics for Natural Resources Evaluation. Oxford: Oxford UniversityPress, 1997.HARTLEY, H. O.; RAO, J. N. K. Maximun likelihood estimation for the mixed analysis ofvariance model. Biometrika, v. 54, p. 93–108, 1967.ISAAKS, E. H.; SRIVASTAVA, R. M. Applied Geostatistics. New York: Oxford University,1989.JOHNSON, R. A.; WICHERN, D. W. Applied Multivariate Statistical Analysis. Third. USA:Prentice-Hall, 1992.JOURNEL, A. G.; HUIJBREGTS, C. J. Mining Geostatistics. Lon<strong>do</strong>n: Academic Press, 1978.KOLMAN, B. Introductory Linear Algebra with Applications. USA: Prentice Hall, 1997.


93KOLMAN, B. Bayesian statistics: an introduction. Third. New York: Hodder Arnold, 2004.KRIGE, D. G. A Statistical Approach to Some Mine Valuations and Allied Problems atWitwatersrand. Tese (Master’s thesis) — University of Witwatersrand, 1951.LINDLEY, D. V. The 1988 world memorial lectures: The present position in bayesian statistics.Statistical Science, n. 5, p. 44–89, 1990.MAINARDI, G. L.; SCHNEIDER, P. R.; FINGER, C. A. G. aes. Produção de Pinus taeda L.na região de Cambará <strong>do</strong> Sul, rs. Revista Ciência <strong>do</strong> Solo, v. 6, n. 1, p. 39–52, 1996.MATÈRN, B. Spatial Variation Analysis. Second. Berlin: Springer Verlag, 1986.MATHERON, G. Traite de geostatistique appliquee. Bureau de Recherches Geologiques etMinieres, v. <strong>14</strong>, p. 1246–1266, 1962.MATHERON, G. Principles of geostatistics. Economic Geology, v. 58, p. 1246–1266, 1963.MATHERON, G. The intrinsic ran<strong>do</strong>m function and their application. Advances in AppliedProbability, n. 5, p. 508–541, 1973.MOHAMED, S. B.; EVANS, E. J.; SHIEL, R. S. Mapping techniques and intensity of soilsampling for precision farming. Proceedings of the 3rd International Conference on PrecisionAgriculture, p. 217–226, 1996.MOLIN, J. P. Agricultura de precisão: mais um desafio para o agricultor brasileiro. PlantioDireto, n. 39(3), p. 26–27, 1997.MOLIN, J. P. Definição de unidades de manejo a partir de mapas de produtividade. EngenhariaAgrícola, Jaboticabal, v. 22, n. 1, p. 83–92, 2002.MOLIN, J. P. Fatores restritivos à a<strong>do</strong>ção da agricultura de precisão. Anais <strong>do</strong> II CongressoBrasileiro de Soja, Embrapa Soja, Londrina, v. 180, n. 2, p. 221–229, 2002.MONTGOMERY, D. C.; PECK, E. A. Introduction to Linear Regression Analysis. USA:Cambridge University Press, 1955.MOOD, A. M.; GRAYBILL, F. A.; BOES, D. C. Introduction to the Theory of Statistics. Third.Singapore: McGraw-Hill, 1974.OLIVEIRA, M. C. N. Méto<strong>do</strong>s de estimação de parâmetros em modelos geoestatísticos comdiferentes estruturas de covariâncias: uma aplicação ao teor de cálcio no solo. Tese (Tese deDoutora<strong>do</strong>) — <strong>Universidade</strong> de São Paulo/ESALQ, 2003.PANNATIER, Y. Variowin 2.2: Software for Epatial Data Analysis in 2D. New York: Springer,1996.PATTERSON, H. D.; THOMPSON, R. Recovery of inter-block information when blocks sizesare inequal. Biometrika, v. 58, p. 545–554, 1971.PAULINO, C. D.; TURKMAN, M. A. A.; MURTEIRA, B. Estatística Bayesiana. Lisboa:Fundação Calouste Gulbenkian, 2003. 446p.


94PEBESMA, E. J.; WESSELING, C. G. Gstat: a program for geostatistical modelling,prediction and simulation. Computers and Geosciences, v. 1, n. 24, p. 17–31, 1998.PERRY, S. H. V.; IEMMA, A. F. Procedimento “mixed´´ <strong>do</strong> sas para análise de modelosmistos. Scientia Agricola, v. 56, n. 4, p. 959–967, 1999.PREVEDELLO, B. M. S. Variabilidade espacial de parâmetros de solo e planta. 166 p. Tese(Tese de Doutora<strong>do</strong>) — <strong>Universidade</strong> de São Paulo, São Paulo, 1987. Curso <strong>do</strong> Pós-graduaçãoem Nutrição de Plantas.R Development Core Team. R: A Language and Environment for Statistical Computing.Vienna, Austria, 2008. ISBN 3-900051-07-0. Disponível em: .REICHARDT, K.; VIEIRA, S. R.; LIBARDI, P. L. Variabilidade espacial de solos eexperimentação de campo. Revista Brasileira de Ciência <strong>do</strong> Solo, v. 10, n. 1, p. 1–6, 1986.REIS, E. Estatística Multivariada Aplicada. Lisboa: Silabo, 1997.RIBEIRO JR, P. J.; DIGGLE, P. J. Bayesian inference in gaussian model-based geostatistics.Lancaster-UK, 1999. Maths. and Stats. Dept.RIBEIRO JR, P. J.; DIGGLE, P. J. geoR: A package for geostatistical analysis. R-NEWS, v. 01,n. 2, 2001. ISSN 1609-3631.ROSOLEN, C. A. et al. Crescimento radicular de plântulas de milho afeta<strong>do</strong> pela resistência<strong>do</strong> solo à penetração. Pesquisa Agropecuária Brasileira, v. 34, n. 5, p. 821–828, 1999.SCHABENBERGER, O.; GOTWAY, C. A. Statistical Methods for Spatial Data Analysis. NewYork: Chapman-Hall, 2005.SOUZA, E. G. et al. Variabilidade espacial <strong>do</strong>s atributos químicos <strong>do</strong> solo em um latossoloroxo distrófico da região de Cascavel-PR. Engenharia Agrícola, v. 18, n. 3, p. 80–92, 1999.SOUZA, M. Z.; MARQUES JR, J.; PEREIRA, G. T. Variabilidade espacial <strong>do</strong> pH, Ca, Mge V% <strong>do</strong> solo em diferentes formas <strong>do</strong> relevo sob cultivo de cana-de-açúcar. Revista CiênciaRural, v. 34, n. 6, p. 1763–1771, nov-dez 2004.TRAGMAR, B. B.; YOST, R. S.; UEHARA, G. Application of geostatistics to spatial studiesof soil properties. Advances in Agronomy, v. 38, p. 45 – 94, 1985.VER HOEF, J. M.; BARRY, R. P. Constructing and fitting models for cokriging andmultivariable spatial prediction. Journal of Statistical Planning and Inference, v. 69, p.275–294, 1998.VER HOEF, J. M.; CRESSIE, N. Multivariate spatial prediction. Mathematical Geology, v. 25,n. 2, p. 219–240, 1993.WACKERNAGEL, H. Principal component analysis for autocorrelated data: a geoestatisticalperspective. Techinical Report 22/98-G - Centre de Géostatistique - Ecole des Mines de Paris,1998. Disponível em: .WAKERNAGEL, H. Multivariate geostatistics: an introduction with applications. Third.Germany: Springer, 2003.


95WALLER, L. A.; GOTWAY, C. A. Applied spatial statistics for public health data. USA: JohnWiley & Sons, 1965. (Wiley series in probability and statistics).WOLLENHAUPT, N. C.; WOLKOWSKI, R. P. Grid soil sampling. better crops with plantfood. NORCROSS, v. 78, n. 4, p. 6–9, 1994.YANG, C. et al. Spatial variability of field topography and wheat yield in the palouse region ofthe pacific northwest. American Society of Agricultural Engineers, v. 41, n. 1, p. 17–27, 1998.


ANEXO A -- Figuras: Validação Cruzada


97data1.5 3.01.5 3.0predicted0.0 0.4 0.8theoretical probCoord Y0 50x+ xx++x + xxxxx++xx+ x++x+xxxx + xx x++ +x ++ + x+ x+x x+xx+xx xxxx+++xx++xx + xxxx+ x +x xx+++x x+x++ x+ xx+ x+ + x+ xxCoord Y0 500 50 150Coord XDensity0.0 0.4 0.8−1.5 −0.5 0.5 1.5data − predicteddata − predicted−1.5 0.0 1.52.4 2.6 2.8 3.0predicteddata − predicted−1.5 0.0 1.5observed prob0.0 0.4 0.8x+ xxx+++x xxxx+x++ x +x x++ xxxxx ++xx x ++ ++ x x ++ + x+ x+x x+xxxx+++xxxxx+ x xxxx + ++ +x xx+++x + x++ x+ xx+ x+ + x+ xx0 50 150Coord XDensity0.0 0.6 1.2−3 −2 −1 0 1 2 3std residualsstd residuals−3 0 22.4 2.6 2.8 3.0predictedstd residuals−3 0 21.5 2.0 2.5 3.0 3.5 4.0data1.5 2.0 2.5 3.0 3.5 4.0dataFigura A.1: Erros de predição por Validação cruzada. Predição nas mesmas coordenadas damalha de da<strong>do</strong>s de estimação <strong>do</strong> modelo com a estratégia de retirar um ponto por vez e estimálocom o modelo.


98data1.5 3.01.5 3.0predicted0.0 0.4 0.8theoretical probCoord Y0 50xx +xxx+x+xxx xx xx++ +++xx xxxx +xx+ x+ x x+x x++x+++ x+ x+ xx++ xx xx+xx+x++ x + + xx + xxCoord Y0 500 50 150Coord XDensity0.0 0.4 0.8−1.5 −0.5 0.5 1.5data − predicteddata − predicted−1.5 0.0 1.52.5 2.6 2.7 2.8 2.9 3.0predicteddata − predicted−1.5 0.0 1.5observed prob0.0 0.4 0.8xx +xxx+ xx+xxx++ x x+x+xx+xxxx+xx+ x+ x x+x x+ +x++ x+ x++ + xxx x+ xx+x+ x +x++ x + xx xx0 50 150Coord XDensity0.0 0.2−4 −2 0 2std residualsstd residuals−4 0 2 42.5 2.6 2.7 2.8 2.9 3.0predictedstd residuals−4 0 2 41.5 2.0 2.5 3.0 3.5 4.0data1.5 2.0 2.5 3.0 3.5 4.0dataFigura A.2: Erros de predição por Validação cruzada. Predição em 128 coordenadas externas àmalha de da<strong>do</strong>s de estimação <strong>do</strong> modelo.


99data1.5 3.01.5 3.0predicted0.0 0.4 0.8theoretical probCoord Y0 50xx x+x xxxxx+x xx +xx+ ++ + + x++xx x++x +x+x xx xx+ x+ +xxxxxx+x+ + xx+x+xx + xxx+ x++ ++ x++++ + x x+ + x + xCoord Y0 500 50 150Coord XDensity0.0 0.4 0.8−1.5 −0.5 0.5 1.5data − predicteddata − predicted−1.5 0.0 1.52.78 2.80 2.82predicteddata − predicted−1.5 0.0 1.5observed prob0.0 0.4 0.8xx x+x xxxxx+x xx +xx+ ++ + + x++xx x++x +x+x xx xx+ x+ +xxxxxx+x+ + xx+x+xx + xxx+ x++ + + x++++ + x x+ + + x + x0 50 150Coord XDensity0.00 0.15 0.30−4 −2 0 2std residualsstd residuals−4 0 2 42.78 2.80 2.82predictedstd residuals−4 0 2 41.5 2.0 2.5 3.0 3.5 4.0data1.5 2.0 2.5 3.0 3.5 4.0dataFigura A.3: Erros de predição por Validação cruzada. Predição em 192 coordenadas externas àmalha de da<strong>do</strong>s de estimação <strong>do</strong> modelo.


ANEXO B -- Código fonte R das análises estatísticas


101Listagem B.1: Análise univariada de da<strong>do</strong>s de soja## ############################################################# A n a l i s e G e o e s t a t i s t i c a U n i v a r i a d a −− SOJA##5 ## A p l i c a c a o de meto<strong>do</strong>s g e o e s t a t i s t i c o s m u l t i v a r i a d o s## em problemas de mapeamento de v a r i a v e i s <strong>do</strong> s i s t e m a## solo −p l a n t a .#### Da<strong>do</strong>s : Soja 9810 ## Manejo c o n v e n c i o n a l em 256 p o n t o s a m o s t r a i s#### Edson A n t o n i o A l v e s da S i l v a , Prof . MSc .#### O r i e n t a d o r : Paulo J u s t i n i a n o R i b e i r o Jr . , Prof . PhD .15 ##20 #### Cria<strong>do</strong> em : 16 de Marco de 2008## R e v i s a d o em : 05 de j u l h o de 2008#### ########################################################### Limpan<strong>do</strong> a workspace## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−##o b j e c t s ( )25 rm( l i s t = l s ( a l l =TRUE) )o l d p a r


102}45 }}## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−## Entrada de da<strong>do</strong>s ( r e q u e r conexao com a i n t e r n e t )##50 Da<strong>do</strong>s256


10385 Da<strong>do</strong>s64S


104## Da<strong>do</strong>s256 $SB ,## Da<strong>do</strong>s256 $ iCone ,## Da<strong>do</strong>s256 $PROD) ,130 ## byrow=F , n c o l =7)#### nc


105160 ## o tamanho minimo <strong>do</strong> ponto a s e r e s t i m a d o p e l a krigagem#### Conversao <strong>do</strong>s o b j e t o s SOJA para o f o r m a t o geodata## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−Soja256 . geo


106## summary ( Soja256 . geo )## round ( sd ( Soja256 . geo $ data ) , 4 )## round ( sd ( Soja256 . geo $ data ) / mean ( Soja256 . geo $ data ) * 1 0 0 , 2 )##205 ## summary ( Soja128 . geo )## max ( Soja128 . geo $ data )## round ( sd ( Soja128 . geo $ data ) , 4 )## round ( sd ( Soja128 . geo $ data ) / mean ( Soja128 . geo $ data ) * 1 0 0 , 2 )##210 ## summary ( Soja128 . comp . geo )## round ( sd ( Soja128 . comp . geo $ data ) , 4 )## round ( sd ( Soja128 . comp . geo $ data ) / mean ( Soja128 . comp . geo $ data ) * 1 0 0 , 2 )#### summary ( Soja128S . geo )215 ## round ( sd ( Soja128S . geo $ data ) , 4 )## round ( sd ( Soja128S . geo $ data ) / mean ( Soja128S . geo $ data ) * 1 0 0 , 2 )#### mean ( Soja128S . comp . geo $ data )## round ( sd ( Soja128S . comp . geo $ data ) , 4 )220 ## round ( sd ( Soja128S . comp . geo $ data ) / mean ( Soja128S . comp . geo $ data ) * 1 0 0 , 2 )#### mean ( Soja64S . geo $ data )## round ( sd ( Soja64S . geo $ data ) , 4 )## round ( sd ( Soja64S . geo $ data ) / mean ( Soja64S . geo $ data ) * 1 0 0 , 2 )225 ##230 #### mean ( Soja192S . comp . geo $ data )## round ( sd ( Soja192S . comp . geo $ data ) , 4 )## round ( sd ( Soja192S . comp . geo $ data ) / mean ( Soja192S . comp . geo $ data ) * 1 0 0 , 2 )#### V e r i f i c a n d o a n e c e s s i d a d e de t r a n s f o r m a c a o## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−## lambda = 1 −−> nao t r a n s f o r m a r## lambda = 0 . 5 −−> t r a n s f o r m a c a o r a i z quadrada235 ## lambda = 0 . 0 −−> t r a n s f o r m a c a o l o g#### r e q u i r e (MASS )## p o s t s c r i p t ( ’ boxcox . ps ’ , h o r i z o n t a l =FALSE , p o i n t s i z e =12 , w i d t h =10 , h e i g h t=3)## par ( mfrow=c ( 1 , 3 ) , mgp=c ( 2 , 0 . 8 , 0 ) , mar=c ( 5 , 2 , 1 , 1 ) )240 ## boxcox ( Soja256 . geo , lambda=seq ( 0 . 2 5 , 1 . 5 , l e n =20) )## boxcox ( Soja128 . geo , lambda=seq ( − 0 . 5 , 1 . 5 , l e n =20) )## boxcox ( Soja128 . comp . geo , lambda=seq ( 0 , 2 . 5 , l e n =20) )


107## boxcox ( Soja128S . geo , lambda=seq ( −1 ,2 , l e n =20) )## boxcox ( Soja128S . comp . geo , lambda=seq ( 0 , 2 , l e n =20) )245 ## boxcox ( Soja64S . geo , lambda=seq ( −2 ,3 , l e n =20) )## boxcox ( Soja192S . comp . geo , lambda=seq ( 0 , 1 . 5 , l e n =20) )## dev . o f f ( )#### boxcox ( P150S . geodata , lambda=seq ( −1.2 ,0 , l e n =20) )250 ## boxcox ( PH150S . geodata , lambda=seq ( −4 ,0 , l e n =20) )## boxcox ( K150S . geodata , lambda=seq ( −0.8 ,1 , l e n =20) )## boxcox ( MO150S . geodata , lambda=seq ( −0.4 ,3 , l e n =20) )## boxcox ( SB150S . geodata , lambda=seq ( 0 . 3 5 , 1 . 5 , l e n =20) )## boxcox ( iCone150S . geodata , lambda=seq ( 0 , 1 . 8 , l e n =20) )255 #### S p a t i a l −p l o t ( a n t i g o post −p l o t )## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−Soja256 . geo . c l a s s


108285 #### −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−## P l o t Geodata## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−## p l o t ( Soja256 . geo )290 ## p l o t ( Soja128 . geo )## p l o t ( Soja128 . comp . geo )## p l o t ( Soja128S . geo )## p l o t ( Soja128S . comp . geo )## p l o t ( Soja64S . geo )295 ## p l o t ( Soja192S . comp . geo )#### −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−## A j u s t e de modelos por maxima v e r o s s i m i l h a n c a## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−300 #### GlobalSoja256 . l i k


109# f i x . n u g g e t=TRUE ,# n u g g e t =0 ,330 # method . l i k =’REML’ ,kappa = 0 . 5 )##Soja128S . l i k## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−335 ## Amostra a l e a t o r i a 128 p o n t o s complementares## Soja128S . comp . l i k


110375 ##par ( mfcol =c ( 5 , 2 ) , mar=c ( 3 , 3 , . 2 , . 2 ) , mgp=c ( 1 . 5 , 0 . 6 , 0) )p l o t ( Soja256 . v a l i d )dev . o f f ( )par ( par . o r i )## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−Soja128S . v a l i d


111##415 ## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−KC256


112##summary ( Soja64S .KC$ p r e d i c t , d i g i t s =5)mean ( Soja64S .KC$ p r e d i c t )round ( sd ( Soja64S .KC$ p r e d i c t ) , 4 )460 round ( sd ( Soja64S .KC$ p r e d i c t ) * 100 / mean ( Soja64S .KC$ p r e d i c t ) , 1 )round ( ( mean ( Soja64S .KC$ p r e d i c t ) −2.7496) * 100 / 2 . 7 4 9 6 , 2 )#### −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−## M A P A D E P R E D I C A O465 ## U N I V A R I A D A ( C l a s s i f i c a d o )#### −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−#### e x t r a i n d o as p r e d i c o e s470 ## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−## Global ( 2 5 6 )S256K . pred 4.0000 ( ALTA )490 #### Global ( 2 5 6 )S256K . c l a s s


113S128SK . c l a s s


1<strong>14</strong>t i t l e ( main="256 amostras" )#### −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−## 128 a m o s t r a s545 image ( seq ( 5 , 1 5 0 , by =5) ,seq ( 5 , 1 1 5 , by =5) ,t ( matrix ( Soja128S .KC$ p r e d i c t , byrow=T , ncol =30) ) ,c o l =gray ( seq ( 1 , 0 , l =5) ) ,ann=FALSE)550 ##t i t l e ( main="128 amostras" )#### −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−## 64 a m o s t r a s555 image ( seq ( 5 , 1 5 0 , by =5) ,seq ( 5 , 1 1 5 , by =5) ,t ( matrix ( Soja64S .KC$ p r e d i c t , byrow=T , ncol =30) ) ,c o l =gray ( seq ( 1 , 0 , l =5) ) ,ann=FALSE)560 t i t l e ( main="64 amostras" )#### l e g e n d ( 0 , −5, c(”< 2 ,34” ,## ” ( 2 , 3 4 ; 2 , 6 1 ) ” ,## ” ( 2 , 6 1 ; 2 , 8 5 ) ” ,565 ## ” ( 2 , 8 5 ; 3 , 1 6 ) ” ,## ”> 3 ,16” ) ,## h o r i z=T ,## f i l l =gray ( seq ( 1 , 0 , l =5) ) ,## cex =1.0)570 ## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−dev . o f f ( )######575 ## I N F E R E N C I A B A Y E S I A N A#### ######################################################## D e f i n i n d o o modelo para Soja256580 ## − Kappa = 1 ,6## − Funcao de c o r r e l a c a o de Matern## − Sem t r a n f o r m a c a o nos da<strong>do</strong>s ( lambda =1)## − P r i o r i s : p h i


115## b e t a


116par ( mfrow=c ( 1 , 2 ) , mar=c ( 5 , 4 , 1 , 0 . 5 ) )h i s t ( Soja64 . kb ) # b e t a e sigmasq625 ## dev . o f f ( )#### Mapas por p r e d i c a o b a y e s i n a ( c l a s s i f i c a d o s )## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−Soja256 . kb . c l a s s


117## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−##summary ( Soja256 . kb$ p r e d i c t i v e $mean , d i g i t s =5)665 sd ( Soja256 . kb$ p r e d i c t i v e $mean )100 * sd ( Soja256 . kb$ p r e d i c t i v e $mean ) / mean ( Soja256 . kb$ p r e d i c t i v e $mean )( mean ( Soja256 . kb$ p r e d i c t i v e $mean ) −2.7496) * 100 / 2.7496##summary ( Soja128S . kb$ p r e d i c t i v e $mean , d i g i t s =5)670 sd ( Soja128S . kb$ p r e d i c t i v e $mean )100 * sd ( Soja128S . kb$ p r e d i c t i v e $mean ) / mean ( Soja128S . kb$ p r e d i c t i v e $mean )( mean ( Soja128S . kb$ p r e d i c t i v e $mean ) −2.7496) * 100 / 2.7496##summary ( Soja64S . kb$ p r e d i c t i v e $mean , d i g i t s =5)675 sd ( Soja64S . kb$ p r e d i c t i v e $mean )100 * sd ( Soja64S . kb$ p r e d i c t i v e $mean ) / mean ( Soja64S . kb$ p r e d i c t i v e $mean )( mean ( Soja64S . kb$ p r e d i c t i v e $mean ) −2.7496) * 100 / 2.7496### Box Cox da e s t i m a t i v a de b e t a680 XX


118Listagem B.2: Análise univariada de da<strong>do</strong>s de IMA## ######################################################## A n a l i s e G e o e s t a t i s t i c a U n i v a r i a d a − Pinus t a e d a L .##5 ## T i t u l o : A p l i c a c a o de meto<strong>do</strong>s g e o e s t a t i s t i c o s m u l t i v a r i a d o s## em problemas de mapeamento de v a r i a v e i s <strong>do</strong> s i s t e m a## solo −p l a n t a .#### Da<strong>do</strong>s : Fazenda Mobasa10 ## Area de r e f l o r e s t a m e n t o de P . Taeda L .#### Edson A n t o n i o A l v e s da S i l v a , Prof . MSc .#### O r i e n t a d o r : Paulo J u s t i n i a n o R i b e i r o Jr . , Prof . PhD .15 ##20 #### Cria<strong>do</strong> em : 21 de Marco de 2008## R e v i s a d o em : 05 de J u l h o de 2008#### ###################################################### IMA + A r g i l a ( Azul ) −−> 18 p o n t o s## ARGILA ( Vermelho ) −−> 555 p o n t o s#### −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−25 ## Limpan<strong>do</strong> a workspace##o l d p a r


11945 }e l s e{ i f ( x


12080 sd ( IMA18$ARG1)sd ( IMA18$ARG1) * 100 / mean ( IMA18$ARG1)##summary ( Arg555 $Arg )sd ( Arg555 $Arg )85 sd ( Arg555 $Arg ) * 100 / mean ( Arg555 $Arg )##q u a n t i l e ( IMA18$IMA)#### −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−90 #### Layout#### −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−## Para s a l v a r o g r a f i c o no f o r m a t o p o s t s c r i p t ( ps ou eps ) ,95 ## descomente a l i n h a s e g u i n t e e a u l t i m a l i n h a ( dev . o f f )#### p o s t s c r i p t ( ’ LayoutMobasa . ps ’ , h o r i z o n t a l =FALSE )par ( mfrow=c ( 1 , 2 ) ,mgp=c ( 2 , 0 . 8 , 0 ) , mar=c ( 0 , 0 . 5 , 0 , 0 . 5 ) )##100 p l o t ( borda , x l a b ="" , y l a b ="" , axes =FALSE , t y p e =’l’ )p o i n t s ( IMA18 [ , 1 : 2 ] , x l a b ="" , y l a b ="" , pch =20)##p l o t ( borda , x l a b ="" , y l a b ="" , axes =FALSE , t y p e =’l’ )p o i n t s ( Arg555 [ , 1 : 2 ] , x l a b ="" , y l a b ="" , pch =20)105 ## dev . o f f ( )#### −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−## Geran<strong>do</strong> os a r q u i v o s geodatar e q u i r e ( geoR )110 IMA18 . geo


121r e q u i r e (MASS)##125 ## p o s t s c r i p t ( ’ boxcoxIMA . eps ’ ,## h o r i z o n t a l =FALSE ,## w i d t h =4 , h e i g h t =3.2 ,## p o i n t s i z e =10)par ( mgp=c ( 2 , 0 . 8 , 0 ) , mar=c ( 5 , 2 , 1 , 1 ) )130 boxcox ( IMA18 . geo , lambda=seq ( −1 ,3 , l e n =20) )## dev . o f f ( )#### −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−## M A X I M A V E R O S S I M I L H A N C A135 ## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−## A j u s t a n d o um modelo e x p o n e n c i a l por maxima v e r o s s i m i l h a n c a## Usan<strong>do</strong> a a r g i l a como co−v a r i a v e lIMA18 . l i k


122##165 ## D e f i n i n d o o modelo para IMA## − Kappa = 0 ,5## − Funcao de c o r r e l a c a o de Matern## − Sem t r a n f o r m a c a o nos da<strong>do</strong>s ( lambda =1)## − P r i o r i s : p h i


123## dev . o f f ( )#### −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−## M A P A S210 ## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−#### Mapa da krigagem e e s t i m a c a o b a y e s i a n a## u n i v a r i a d a e c l a s s i f i c a d a − Pinus Taeda L .## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−215 ## c l a s s i f i c a n d o os da<strong>do</strong>s e s t i m a d o s p e l a krigagem## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−## C l a s s i f i c a n d o a p r e d i c a o por krigagemIMA . k . c l a s s


124## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−j p e g (’/home /edson /DOCUMENTOS /DEFESA /IMA18.jpg’ ,250 width = 600 , h e i g h t =600 ,u n i t s = "px" ,q u a l i t y = 150)par ( mfrow=c ( 1 , 1 ) ,mgp=c ( 0 , 0 , 0 ) , mar=c ( 0 , 0 , 0 , 0 ) , b t y =’n’ , x a x t =’n’ , y a x t =’n’ )image (IMA . k . c l a s s , l o c =gr , c o l =gray ( seq ( 1 , 0 , l =11) ) ,255 x l a b ="" , y l a b ="" , axes =F , b o r d e r s = borda )dev . o f f ( )#### −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−## F I M260 ## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


125Listagem B.3: Análise bivariada de da<strong>do</strong>s de soja## ######################################################## A n a l i s e G e o e s t a t i s t i c a M u l t i v a r i a d a##5 ## Da<strong>do</strong>s : Soja 98#### Aluno : Edson A n t o n i o A l v e s da S i l v a , Prof . MSc .## O r i e n t a d o r : Paulo J u s t i n i a n o R i b e i r o Jr . , Prof . PhD .##10 ## Cria<strong>do</strong> em : 23 de Marco de 2008## R e v i s a d o em : 05 de J u l h o de 2008#### ######################################################15 ## Modelo : ( Y1 , Y2 ) onde## Y1 : P r o d u t i v i d a d e## Y2 : I n d i c e de Cone ( R e s i s t . a P e n e t r a c a o )#### −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−20 rm( l i s t = l s ( a l l =TRUE) )o b j e c t s ( )o l d p a r


126## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−##45 Da<strong>do</strong>s256


12785#### m a t r i z de c o v a r i a n c i a sMatS


128130 ###### iConeiCone150S . geo


129170 #### ######################################################## P r e d i c o e s de Y1 c o n d i c i o n a d a s a Y2##175 ## g r i d de p r e d i c a o ( 4 . 4 6 6 p o n t o s )gr


130round ( prop . t a b l e ( t a b l e ( S64S IC . pred $ p r e d i c ) ) * 1 0 0 , 1 )##215 S128S CP1 . pred $ p r e d i c t


131255 ann=FALSE ,y l a b ="" , x l a b ="" )##t i t l e ( main="64 amostras" )##260 dev . o f f ( )#### −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−## Soja e CP1## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−265 p o s t s c r i p t (’/home /edson /DOCUMENTOS /TESE /PosDEFESA /VersaoFinal /MapaSojaBiCP.ps’ ,h o r i z o n t a l =FALSE ,p o i n t s i z e =10 ,width =10 , h e i g h t = 3 . 8 )##270 par ( mfrow=c ( 1 , 2 ) ,mgp=c ( 2 , 0 . 8 , 0 ) ,mar=c ( 5 , 2 , 1 , 1 ) )#### −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−275 ## 128image ( S128S CP1 . pred ,l o c =gr ,c o l =gray ( seq ( 1 , 0 , l =5) ) ,ann=FALSE ,280 y l a b ="" , x l a b ="" )##t i t l e ( main="128 amostras" )#### −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−285 ## 64image ( S64S CP1 . pred ,l o c =gr ,c o l =gray ( seq ( 1 , 0 , l =5) ) ,ann=FALSE ,290 y l a b ="" , x l a b ="" )##t i t l e ( main="64 amostras" )##dev . o f f ( )295 #### −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


132## F I M## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−


133Listagem B.4: Análise bivariada de da<strong>do</strong>s de IMA## ######################################################## A n a l i s e G e o e s t a t i s t i c a M u l t i v a r i a d a##5 ## Pinus Taeda L .## Da<strong>do</strong>s : Mobasa#### Aluno : Edson A n t o n i o A l v e s da S i l v a , Prof . MSc .## O r i e n t a d o r : Paulo J u s t i n i a n o R i b e i r o Jr . , Prof . PhD .10 #### Cria<strong>do</strong> em : 23 Marco de 2008## R e v i s a d o em : 06 J u l h o de 2008#### Modelo : ( Y1 , Y2 ) onde15 ## Y1 : IMA## Y2 : Teor de A r g i l a#### ###########################################################20 rm( l i s t = l s ( a l l =TRUE) )o b j e c t s ( )## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−## F U N C A O D E C L A S S I F I C A C A O## C l a s s i f i c a em 5 grupos s e p a r a d o s por p e r c e n t i s25 ## Q u a n t i l e s : 0 ,2 −− 0 ,4 −− 0 ,6 −− 0 ,8##C l a s s


13445 ####IMA18


135sd ( IMA18Arg . pred $ p r e d i c t ) * 100 / mean ( IMA18Arg . pred $ p r e d i c t )( mean ( S128 IC . pred $ p r e d i c t ) −2.7496) *100 / 2.7496##85 ## C l a s s i f i c a n d o as p r e d i c o e s em c l a s s e s## −−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−IMA18Arg . pred $ p r e d i c t

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!