aplicação de geoestatística para reamostragem de dados srtm

connepi2009.ifpa.edu.br

aplicação de geoestatística para reamostragem de dados srtm

APLICAÇÃO DE GEOESTATÍSTICA PARA REAMOSTRAGEM DE DADOSSRTMThaís Regina Benevides Trigueiro ARANHA (1); Mércia Maria Peixoto RODRIGUES (2);Ane France Menezes BRAZ (3); Renata de Araújo RAFAEL (4); Eugênio Pacelli FernandesLEITE (5)(1)Instituto Federal de Educação, Ciência e Tecnologia da Paraíba - IFPB, Av. Juarez Távora, 3000, apt. 101, Torre,João Pessoa - PB, e-mail: thais_benevides@hotmail.com; (2) IFPB, e-mail: mellrodriguesjp@hotmail.com; (3) IFPB, e-mail: ane_france5@hotmail.com; (4) IFPB, e-mail: renatarafael_@hotmail.com;(5) IFPB, e-mail: eupafale@gmail.com.brRESUMOOs dados SRTM têm sido amplamente utilizados para a representação digital do relevo de áreas, em especial,tendo em vista a realização de estudo hidrológicos. Como ampliação das possibilidades de uso dos referidosdados, no presente estudo, foram utilizadas análises geoestatísticas para a reamostragem dos valores SRTM,de forma a representar o relevo de uma subacia do rio Camaratuba, no litoral norte do estado da Paraíba. Osprocedimentos geoestatísticos adotados, envolvendo análise exploratória de dados, modelagem desemivariograma empírico, interpolação por krigagem ordinária e por krigagem universal, estãoimplementados na biblioteca geoR, do sistema estatístico R. Os dados de entrada para o R foram pontos comatributos latitudes, longitudes e altitudes, gerados de forma aleatória, a partir de imagens SRTM, com o SIGGRASS. Com os procedimentos adotados, foram realizadas análises quanto à verificação de continuidadeespacial e considerando, também, a existência de tendência ou não nos valores de altitudes. A reamostragemdos dados SRTM possibilitaram a obtenção de nova informação geográfica, com resolução espacial de 45 m,em detrimento da resolução original, que é de 90 m. No caso, os procedimentos de interpolação espacial porkrigagem universal, quando se considerou tendência nos dados, apresentaram resultados mais satisfatórios,colaborando de forma mais efetiva para alcançar o objetivo proposto. O modelo de elevação obtido,processados também com o uso do geoprocessamento, permitem a obtenção de mapas de declividade,aspecto, relevo sombreado e de curvatura, todos passíveis de utilização em estudos ambientais.Palavras-chave: Interpolação espacial, dados SRTM, geoestatística.


1. INTRODUÇÃOA bacia hidrográfica, dentro de uma visão integrada, deve ser a unidade de caracterização, de diagnóstico, doplanejamento e gestão ambiental, com vistas ao desenvolvimento regional sustentável. Para tanto, o apoiotecnológico, em especial, com o uso do geoprocessamento, mostra-se de essencial importância, pois osimpactos ambientais podem ser mensurados e corrigidos mais facilmente, com uso de geotecnologias.Produtos cartográficos derivados de mapas digitais de elevação, por exemplo, são fundamentais à concepçãode modelos ambientais, com vistas ao gerenciamento adequado dos recursos hídricos, em baciashidrográficas.A disponibilidade gratuita de dados e sistemas computacionais, em tal direção, em muito tem contribuídopara a realização dos estudos supracitados. São exemplos dessa natureza o projeto SRTM (Shuttle RadarTopographic Mission) liderado pela NASA, e a existência de softwares livres, como o sistema deinformações geográficas GRASS e o sistema estatístico R, capazes de trabalhar de forma integrada, comdados espaciais.A bacia do rio Camaratuba, com área presente em alguns municípios do litoral norte do estado da Paraíba,está predominantemente inserida na unidade Geoambiental dos Tabuleiros Costeiros. Esta unidadegeomorfológica acompanha o litoral de todo o nordeste e apresenta altitudes médias variando de 50 a 100metros, com vertentes dos rios ali presentes, bastante escarpadas e com vales estreitos. Tal condiçãodemanda técnica de interpolação espacial adequada e eficiente para a representação do relevo da área,objetivo principal do presente estudo.Com o propósito citado, o trabalho apresenta uma metodologia para reelaboração do modelo de elevação deuma subbacia do rio Camaratuba, localizado no município de Juru, no Estado da Paraíba, através dereamostragem de dados SRTM.2. FUNDAMENTAÇÃO TEÓRICAA geoestatística, cuja origem deu-se na área de mineração, teve seus procedimentos iniciais baseados naestatística clássica, cuja hipótese principal é de que as variações de um atributo espacial variam localmente,de forma aleatória. Krige (1951), trabalhando com dados de concentração de ouro, concluiu que somente ainformação dada pela variância seria insuficiente para explicar o fenômeno em estudo. Para tal, serianecessário levar em consideração a distância entre observações. A partir daí surgiu o conceito dageoestatística, que leva em consideração a localização geográfica e a dependência espacial entre as amostrasde atributos especais em estudo. Matheron (1963), baseado nas observações de Krige, desenvolveu a teoriadas variáveis regionalizadas em que uma variável regionalizada é uma função numérica com distribuiçãoespacial, que varia de um ponto a outro, com continuidade aparente, mas cujas variações não podem serrepresentadas por uma função matemática simples.Para a realização de estudos com variáveis regionalizadas, que apresentam continuidade espacial,usualmente, conta-se com a função variograma, denominação usual do semi-variograma, que relaciona ametade da variância (semivariância) das diferenças entre valores observados, com a distância de separaçãoentre os referidos pontos. Assim, o semivariograma define o modelo de variabilidade espacial maiscomumente utilizado. O semivariograma, na sua forma clássica, pode ser assim calculado:^γ (h) =1 N h2∑[ z(xi + h)− z(xi)][Eq. 01]2Nhi=jO valor de h (lag) representa a distância para comparação de observações a serem usadas como pares para ocálculo de semivariâncias [z(x i + h) – z(x i )]. O valor de h pode ser uma distância exata, para amostrasregularmente espaçadas, em uma direção definida, ou pode ser uma faixa com tolerâncias angular e dedistância para qualquer direção, com amostras regularmente ou irregularmente espaçadas.Um semivariograma típico é representado pelo gráfico constante na Figura 1. Ao gráfico, semivariograma éajustado a curva de um modelo teórico existente, cuja equação deverá ser usada para o cálculo dassemivariâncias e, consequentemente, para o cálculo de ponderações com que cada observação entrará paraestimativa de valores não amostrados, nos procedimentos de krigagem.


Figura 1 – Semivariâncias (o) e modelo de semivariograma teórico ajustado (-).No gráfico anterior τ 2 corresponde ao efeito pepita, σ 2 ao patamar e φ ao alcance da dependência espacial.Os modelos teóricos variam bastante, a exemplo das equações apresentadas a seguir (RIBEIRO Jr eDIGGLE, 2001):• Modelo Esférico:r (h)=• Modelo Potência-exponencial:3h ⎛ h ⎞1–1,5 + 0,5 ⎜ ⎟ , se h < φ [Eq. 02]φ ⎝ φ ⎠0, para outra forma⎡ ⎛ h ⎞r (h)= exp ⎢−⎜ ⎟⎢⎣⎝φ⎠⎤⎥ , 0 < k ≤ 2 [Eq. 03]⎥⎦Os parâmetros a que se referem as expressões anteriores são especificados, como segue:φ - corresponde ao alcance;h - distância (m);k - parâmetro extra de suavização (Kappa).Como vários modelos teóricos podem ser ajustados ao mesmo gráfico semivariograma, estabelecido a partirdos dados amostrais, uma questão fundamental durante as análises geoestatistica é a definição de um modeloteórico, mais adequado à realização dos procedimentos de interpolação espacial. Além do critério visual deajuste da curva do modelo teórico às semivariâncias, a utilização de validação cruzada e de critériosnuméricos, contribui de forma a possibilitar uma avaliação sem a subjetividade, observada na avaliaçãovisual. No segundo caso, uma estatística bastante utilizada é o critério de informação de Akaike (AIC), quepossibilita a realização da seleção do modelo mais satisfatório, para se proceder com a interpolação. O AICtrata-se um índice para apreciação de ajuste de modelos, que depende do logaritmo da função deverossimilhança e do número de parâmetros do modelo em apreço. O AIC é obtido pela expressão:kAIC = - 2 l(0) + 2 k [Eq. 04]onde l(0) é o logaritmo de máxima verossimilhança e k é o número de parâmetros do modelo avaliado. Omenor valor estimado para o AIC indica o modelo mais apropriado para os dados (Anselin, 1995).Os procedimentos de interpolação espacial por krigagem, nas análises geoestatísticas, podem ocorrer dediversas maneiras, dependendo dos procedimentos adotados. A krigagem baseia-se em modelos estatísticosda variabilidade espacial, ajustados à realidade que é definida pelas amostras de pontos conhecidos.Fornecem estimadores exatos com propriedades de não tendenciosidade e eficiência. Os tipos de krigagenscomumente usados são a krigagem ordinária e a krigagem universal, cujas equações são apresentadas, asseguir (DRUCK et.al., 2004):


• Krigagem ordináriaonde:• Krigagem universal^^nZ (x)= ∑λ iZ(x i)[Eq. 05]i=1nZ (x)= t(x) + ∑λ iZ(x i)[Eq. 06]i=1^Z (x) é o valor estimado para uma dada posição;λ i ( ^Z i ) são ponderações que estabelecem a contribuição com que cada observação de Z contribui para aestimativa de ^Z (x);t(x) é uma componente de tendência.Se há tendência nos dados, o semivariograma dos resíduos, obtidos com base em superfície estabelecida poruma equação, pode apresentar melhor estrutura.3. METODOLOGIA3.1 Área de estudoA bacia do rio Camaratuba, no litoral norte do estado da Paraíba, tem a maior parte da área inserida nosTabuleiros Costeiros, uma unidade geomorfológica que acompanha o litoral do nordeste e apresenta altitudesmédias variando de 50 a 100 metros. Os rios da bacia, de forma predominante apresentam vertentes bastanteescarpadas e com vales estreitos. Tal condição demanda técnica de interpolação espacial adequada e eficientepara a representação do relevo da área, objetivo principal do presente estudo. A bacia é uma das unidades degestão dos recursos hídricos do estado da Paraíba. O uso da água da bacia predominantemente é para oabastecimento humano e para o cultivo da cana-de-açucar. A área de estudo do presente trabalho, é uma subbaciado Rio Camaratuba, conforme ilustrado na figura a seguir.Figura 2 – Bacias hidrográficas do estado da Paraíba, com destaque para a bacia do rio Camaratuba e a área deestudo (Fonte: adapatado da Aesa - www.aesa.pb.gov.br)


3.2 Dados geográficosOs dados SRTM são produtos de radar interferométrico oriundos de um projeto, em 2000, de cooperaçãoentre a NASA e outros órgãos americanos, além das agências espaciais da Alemanha e Itália. Os dados têmresolução de 1 arco segundo para os EUA e de 3 arco segundo, ou 90 m, para as demais localidades dacobertura do projeto.Os dados SRTM , distribuídos no formato hgt tem sido corrigidos e distribuídos em formato de dadoespacial, por meio de imagens geotiff. O projeto Brasil em Relevo, desenvolvido pela EmbrapaMonitoramento por Satélite, disponibilizou mosaicos SRTM para todo o Brasil (MIRANDA, 2005),utilizados no presente estudo.3.3 Procedimentos com geoestatística• Análise exploratória de dados: As análises exploratórias dos dados foram realizadas para conhecer avariável em estudo, no caso altitudes, e resumi-la através de estatísticas descritivas e de gráficos histogramas,boxplot e postplot. Esse último gráfico possibilita a observação da distribuição espacial dos quartis, noespaço amostral.• Geração de semivariograma: A geração do semivariograma, no estudo da continuidade espacial, deusecom base no estimador clássico de semivariâncias (equação 01), considerando e não considerando aocorrência de tendência nos dados amostrados.• Ajuste e seleção de modelos: Os ajustes dos modelos aos gráficos semivariogramas procederam-secom base nos mínimos quadrados, observando procedimento característico do sistema computacionalutilizado, citado no item seguinte. A seleção dos modelos teóricos (equações 02 e 03), a serem utilizados nakrigagem, deu-se pela estatística AIC, conforme estabelecido pela equação 04.• Interpolação por krigagem: Na realização dos procedimentos de interpolação espacial por krigagem,considerou-se ocorrência de tendência nos dados, quando foi utilizada a krigagem universal (equação 06) e,sem considerar tendência, foi utilizada krigagem ordinária (equação 05).3.4 Ambientes computacionais de estatística/geoestatística e sistema de informaçõesgeográficas (SIG)Para realização de análises estatísticas e geoestatísticas foi utilizado o sistema estatístico R (R DevelopmentCore Team, 2009) com a biblioteca geoR (RIBEIRO Jr e DIGGLE,2001). O R é uma linguagem e ambientepara computação estatística e gráfica. A biblioteca geoR, que é executada no R, é específica para realizaçãode análises de dados espaciais. Para a realização das análises geoestatísticas, todavia, foram gerados 1921dados pontuais de relevo, a partir de imagem SRTM em formato geotiff, de forma aleatória, utilizando osistema de informações geográficas (SIG) GRASS (GRASS Development Team, 2009). No GRASS tambémrealizaou-se mudança do sistema de coordenadas geográficas das imagens geotiff, originalmente em graus,para UTM (m). Os sistemas computacionais utilizados são todos livres, com base na licença GNU/GPL.4. RESULTADOS E DISCUSSÃO4.1 Análises exploratória dos dadosO sumário de estatísticas descritivas dos valores de altitudes, amostrados dos dados SRTM, são apresentadosno Tabela 1, a seguir.Tabela 1 – Estatísticas descritivas dos valores de altitudes (m) utilizados como dados pontuais.Mínimo 1 o Quartil Mediana Média 3 o Quartil Máximo32 81 111 113 148 212


De acordo com o observado na tabela anterior, os valores de altitudes variaram de 32 m a 212 m. Aproximidade dos valores da média e da mediana sugerem a distribuição normal dos dados, não obrigatória nocaso das análises geoestatísticas. A aproximação com a normalidade, que os dados amostrais apresentam,pode também ser observada no gráfico boxplot, da Figura 3, que segue. Na referida figura, observa-se que alinha da mediana, apresenta-se próxima à posição central da caixa do gráfico, com distânciasaproximadamente iguais entre os valores do 1 o e do 4 o quartil, nas extremidades inferior e superior da caixa,respectivamente.Figura 3 – Gráfico boxplot dos valores de altitudes.Ainda em consonância com o explanado anteriormente, o histograma da distribuição de frequência dosvalores das altitudes (Figura 4) não apresenta assimetria acentuada.Figura 4 – Distribuição espacial dos quartis (1), altitudes em função dos eixos de coordenadas (2 e 3) ehistograma (4).Contudo, ainda com relação à Figura 4, que contém, além dos histograma, o gráfico postplot e a distribuiçãodos valores amostrais em função dos eixos de coordenadas, é possível verificar tendência nos dados, nadireção sudeste-noroeste. A representação da distribuição espacial de quartis (o = 1 o quartil, = 2 o quartil, += 3 o quartil e x = 4 o quartil), bem como a distribuição dos valores com relação aos eixos degeorrefenciamento permitem observar tal constatação. No primeiro caso, a gradação das cores é sistemáticana direção citada e, no segundo, os valores acompanham a diagonal dos eixos x e y, denotando, com isto,tendência de aumento de valores em dada direção.Tendo em vista tal ocorrência, considerou-se a possibilidade de se trabalhar com os resíduos entre os valoresamostrais e uma superfícies de tendência modelada por meio de uma função polinomial de ordem dois. Destaforma, os dados residuais plotados apresentaram-se conforme a Figura 5.


Figura 5 – Distribuição espacial dos quartis (1), resíduos em função dos eixos de coordenadas (2 e 3) ehistograma (4).Os resíduos considerados apresentaram melhora significativa do espalhamento dos valores em função doseixos de georrefenciamento e também simetria do histograma da distribuição de frequências. Todavia adistribuição espacial do quartis (primeiro gráfico) apresentou valores em condição de agrupamento bastantesemelhante à figura anterior.Considerando as observações anteriores, o semivariograma empírico foi modelado considerando e nãoconsiderando tendência.4.2 Modelagem do semivariograma empíricoApós a verificação de diversas estruturas para construção do semivariograma empírico, considerando e nãoconsiderando tendência nos dados, foram estabelecidos os gráficos semivariogramas, constantes na Figura 6.A superfície de tendência, no segundo caso, foi estabelecida com base em função polinomial de segundograu e o semivriograma foi então estabelecido com os resíduos entre as observações e a superfície detendência. Os dois semivariogramas construídos apresentam estrutura compatível com a existência dedependência espacial, conforme observa-se na figura que segue.Figura 6 – Semivariograma empírico para os dados e resíduos, sem considerar e considerando tendência nasobservações.4.3 Ajuste e seleção de modelosAos semivariogramas estabelecidos foram ajustados os modelos teóricos esférico (equação 02) e potênciaexponencial(equação 03), cujas curvas apresentaram semelhança e possibilidades de ajustarem-se, de formamais efetiva, às estruturas dos semivariogramas empíricos. Os modelos esférico e potência-exponencialforam ajustados ao semivariograma em que não se considerou tendência nos dados e os modelos esférico e


potência-exponencial, ao semivariograma elaborados com os resíduos, em que se considerou tendência nosdados. Com a definição dos valores dos parâmetros das equações dos modelos teóricos (taus, sigma, phi e k),procedeu-se à obtenção do AIC para cada modelo, cujos valores estão na Tabela 02, que segue.Tabela 2 – Critérios de Informação de Akaike (AIC) para os modelos teóricos selecionadosModeloSemivariograma com os dadosValores de AICSemivariograma com os resíduosEsférico 13415,99 12916,5Potência-exponencial 12918,5 11477,05Como pode ser observado pela tabela anterior, os modelos semivariogramas construídos com os resíduos, emque se percebeu tendência nos dados de altitudes, obtiveram os menores valores de AIC, ou seja, as curvasapresentaram melhor ajuste às semivariâncias, dos semivariogramas empíricos. Entre os dois modelos emque se considerou tendência, o potência-exponencial apresentou um menor valor de AIC.Os valores dos parâmetros das equações, estabelecidos com os procedimentos de minimização numérica,para os modelos que apresentaram os melhores resultados de AIC, foram 0,000 de efeito pepita (τ) nos doiscasos, patamar (σ) de 941,3358 e 957,3363 e alcance (φ) de 1700,1673 e 750,2986 para os modelos esféricoe potência-exponencial, respectivamente, com semivariograma dos resíduos. A Figura 7 apresenta ilustraçãocom os semivariogramas considerados e curvas de modelos teóricos ajustados, que apresentaram menoresvalores de AIC. Como pode-se observar, as curvas dos modelos ajustados contemplam às semivariâncias deforma mais efetiva, nos dois casos em que se trabalhou com os semivariogramas dos resíduos (Figura 7 b1 eb2) . No caso específico do modelo potência-exponencial o parâmetro k de suavização da curva (equação 3)foi determinante para um melhor ajuste das curvas as semivariâncias.(a1)(a2)(b1)(b2)Figura 7: Modelos de semivariogramas ajustados (a1 e b1 - esférico e a2 e b2 - potência-exponencial)


4.4 Interpolação espacial por krigagemOs procedimentos de interpolação espacial foram efetuados utilizando krigagem, com os modelos desemivariogramas esférico e potência-exponencial (equações 02 e 03). Quando o semivariograma empírico foielaborado com os dados, o tipo de krigagem foi ordinária e, quando o semivariograma foi construído com osresíduos, considerando tendência, o tipo de krigagem foi universal.A partir do sumário dos valores preditos (Quadro 1) em relação aos valores observados (Tabela 1), pode-seobservar que, para a krigagem dos dados onde houve a remoção da tendência, o modelo que melhor seajustou aos dados observados foi o potência-exponencial, confirmando assim a avaliação dos resultadospreditos com o AIC.Observou-se ainda, através dos mapeamentos dos erros padrão aplicado aos quatro modelos (Quadro 1), queos menores valores do erro foram também observados com o modelo potência-exponencial.Quadro 1 – Sumário dos valores preditos e do erro de predição dos procedimentos de interpolação espacial porkrigagem.Valores preditosInterpolador Modelo Mínimo 1 o Quartil Mediana Média 3 o Quartil MáximoKrigagemEsférico 33,36 76,21 100,40 105,60 133,20 207,50ordinária Potência-exponencial 32,81 75,94 100,30 105,60 132,50 211,30KrigagemEsférico 32,68 76,01 100,30 105,60 132,20 211,50universal Potência-exponencial 32,87 75,72 100,20 105,60 132,30 211,80Erros padrão da prediçãoInterpolador Modelo Mínimo 1 o Quartil Mediana Média3 oQuartilMáximoKrigagemEsférico 13,47 14,56 14,95 14,98 15,36 16,75ordinária Potência-exponencial 1,433 8,170 9,620 9,470 10,870 14,310KrigagemEsférico 1,068 6,693 7,945 7,822 9,030 12,040universal Potência-exponencial 0,2315 3,4380 4,4620 4,4660 5,4470 8,7530A Figura 8 ilustra em (a) a grade dos valores preditos para área restrita à bacia hidrográfica em estudo e em(b), o erro padrão de predição. Em (a) as tonalidades em verde representam as cotas mais baixas,correspondente a vales e leitos dos rios. As cotas mais altas variam gradativamente do verde até chegar aobranco, onde verificam-se maiores valores de altitudes. Em (b) os valores predominantes do erro padrão (raízda variância da krigagem) encontram-se até 6 m.(a)(b)


Figura 8 – Resultado da krigagem com o modelo potência-exponencial com ajuste no semivariograma dosresíduos (a) e mapeamento do erro padrão da predição (b).As superfícies de elevação produzidas (Figura 8) podem ser exportadas na forma de grade ASCII, passível deserem importadas para ambientes computacionais SIG.5. CONSIDERAÇÕES FINAISO uso de procedimentos geoestatísticos possibilitou a reamostragem dos dados SRTM, de tal forma apermitir a elaboração de modelos digitais de elevação, com resolução de 45 m em vez dos 90 moriginalmente apresentados pelos dados em questão. Desta forma, o novo dado produzido constitui-se eminformação geográfica com maior efetividade para utilização em estudos ambientais.A informação geográfica produzida pode ser utilizada em SIG como requisito à execução de modelos, bemcomo para obtenção de novas camadas de informações, na forma de mapas topográficos, de aspecto, dedeclividade e de curvatura do terreno. Com a nova camada de informação, em ambiente SIG, também épossível estabelecer a rede de drenagem e outras características fisiográficas da área, de forma mais apurada,tendo em vista à caracterização de bacias hidrográficas.Os métodos e técnicas implementados no sistema estatístico R e na biblioteca geoR, apresentaram-se capazesde permitir experimentação na escolha das opções a serem observados durante os procedimentos deinterpolação espacial, utilizando métodos estocásticos.Os procedimentos adotados colaboram como incentivo à utilização de sistemas computacionais livres e dedados geográficos disponibilizados de forma gratuita na internet, de forma a subsidiar a realização de estudosde suporte à tomada de decisão em relação ao planejamento, manejo e gestão de recursos hídricos.REFERÊNCIASANSELIN, L. SpaceStat version 1.80: user´s guide. Morgantown: Regional Research Institute, WestVirginia University, 1995.DRUCK, Suzana. Analise espacial de Dados Geográficos. Planaltina-DF: Ed. EMBRAPA. 2004.MATHERON, G. Principles of geostatistics. Economic Geology. El Paso, V. 58, p.11246-66, 1963.MIRANDA, E. E. Brasil em Relevo. Coordenação do Projeto Brasil em Relevo. Embrapa Monitoramentopor Satélite. Campinas. 2005. URL http://www.relevobr.cnpm.embrapa.brR DEVELOPMENT CORE TEAM. R: A language and environment for statistical computing. RFoundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0. 2009, URL http://www.Rproject.org.RIBEIRO Jr., P.J. & DIGGLE, P.J. geoR: A package for geostatistical analysis. R-NEWS, Vol 1, Nº 2, 15-18. ISSN 1609-3631. 2001.

More magazines by this user
Similar magazines