25 O uso de regressão logÃstica para espacialização de ...
25 O uso de regressão logÃstica para espacialização de ...
25 O uso de regressão logÃstica para espacialização de ...
Transforme seus PDFs em revista digital e aumente sua receita!
Otimize suas revistas digitais para SEO, use backlinks fortes e conteúdo multimídia para aumentar sua visibilidade e receita.
30 | O <strong>uso</strong> <strong>de</strong> regressão logística <strong>para</strong> espacialização <strong>de</strong> probabilida<strong>de</strong>sValidação do mo<strong>de</strong>loAssim como a maioria dos métodos, a regressão logísticanecessita <strong>de</strong> novos dados (nova amostra) ou <strong>de</strong> umaamostra reservada dos dados <strong>para</strong> verificar se o mesmomo<strong>de</strong>lo po<strong>de</strong> ser satisfatoriamente ajustado a estesnovos dados. Ou seja, é preciso <strong>de</strong>terminar se os coeficientese os erros-padrão obtidos a partir dos dadosutilizados <strong>para</strong> elaboração do mo<strong>de</strong>lo são similares aosobtidos <strong>para</strong> os dados <strong>de</strong> validação.O <strong>uso</strong> <strong>de</strong> regressão logística na análise espacialFizemos uma consulta bibliográfica (www.webofscience.com) a partir das palavras-chave “regressão logística” e“Sistemas <strong>de</strong> Informação Geográfica” e obtivemos 93trabalhos publicados ao longo <strong>de</strong> 58 anos. O <strong>uso</strong> dasregressões logísticas associado a Sistemas <strong>de</strong> InformaçãoGeográfica começou a ser mais praticado a partir<strong>de</strong> 1990 (Figura 3). De 1999 até 2003 foram publicados,em média, 14 trabalhos por ano.FIGURA 3 – Número <strong>de</strong> publicações encontradas no sitewww.webofscience.com, referente ao emprego <strong>de</strong> regressãologística em Sistemas <strong>de</strong> Informação Geográfica (SIG).EXEMPLOS DE APLICAÇÃO DA REGRESSÃO LOGÍSTICAAqui vamos citar três exemplos on<strong>de</strong> técnicas <strong>de</strong> regressãologística simples são utilizadas. O leitor po<strong>de</strong>ráre<strong>para</strong>r que o <strong>uso</strong> po<strong>de</strong> ter variação na escalaespacial empregada, po<strong>de</strong>ndo ser usada <strong>de</strong>s<strong>de</strong> a <strong>de</strong>tecção<strong>de</strong> respostas <strong>de</strong> Odonata à proporção <strong>de</strong> florestascircundando igarapés na Amazônia central atémo<strong>de</strong>los <strong>de</strong> <strong>de</strong>sflorestamento em função da malhaviária na Amazônia Legal. Outra característica relevantediz respeito às diferentes formas com que estesmo<strong>de</strong>los po<strong>de</strong>m ser usados. Há casos, como no exemploda probabilida<strong>de</strong> <strong>de</strong> ocorrência <strong>de</strong> espécies <strong>de</strong>Odonata em função da quantida<strong>de</strong> <strong>de</strong> floresta, on<strong>de</strong>os resultados não são reprojetados, ou seja, não háespacialização das probabilida<strong>de</strong>s, pois estávamos interessadossimplesmente em saber se há influência daquantida<strong>de</strong> <strong>de</strong> floresta preservada ao longo dos pequenoscursos d’água sobre a ocorrência <strong>de</strong> <strong>de</strong>terminadasespécies.No estudo realizado com distribuição <strong>de</strong> árvores naMil Ma<strong>de</strong>ireira Itacoatiara Ltda, as probabilida<strong>de</strong>s <strong>de</strong>ocorrência <strong>de</strong> cada espécie foram projetadas no espaço,utilizando como base os mapas <strong>de</strong> altitu<strong>de</strong> e <strong>de</strong>clivida<strong>de</strong>(variáveis in<strong>de</strong>pen<strong>de</strong>ntes). Neste caso, foi utilizadauma regressão logística múltipla e o mo<strong>de</strong>lo po<strong>de</strong> serconsi<strong>de</strong>rado espacialmente explícito, pois po<strong>de</strong>mos localizar,no espaço, todas as probabilida<strong>de</strong>s.Outro exemplo em que o espaço continua implícito,mas as probabilida<strong>de</strong>s não são projetadas no mapa, é otrabalho sobre a importância das unida<strong>de</strong>s <strong>de</strong> conservaçãoe terras indígenas, ajudando a conter o <strong>de</strong>smatamentona Amazônia brasileira. Nesse caso, a regressãologística foi utilizada <strong>para</strong> enten<strong>de</strong>r a probabilida<strong>de</strong> <strong>de</strong>uma área florestada ser convertida em área <strong>de</strong>sflorestada,consi<strong>de</strong>rando se está localizada <strong>de</strong>ntro ou fora<strong>de</strong> uma terra indígena ou unida<strong>de</strong> <strong>de</strong> conservação, e adistância que está da malha viária.O que tentamos aqui, por meio <strong>de</strong>stes exemplos, éoferecer ao leitor um panorama geral <strong>de</strong> alguns <strong>uso</strong>sque po<strong>de</strong>mos ter com regressão logística, e tambémchamar atenção <strong>para</strong> o <strong>uso</strong> da técnica com problemasespaciais.Mudanças na fauna <strong>de</strong> odonatas em igarapésamazônicos, em função <strong>de</strong> alterações na coberturavegetalEste estudo, realizado na Amazônia central, estima aprobabilida<strong>de</strong> <strong>de</strong> ocorrência <strong>de</strong> espécies <strong>de</strong> odonatasem função da quantida<strong>de</strong> <strong>de</strong> floresta. Neste estudo, opesquisador Dr. Paulo <strong>de</strong> Marco estava interessado emsaber se existe influência da quantida<strong>de</strong> <strong>de</strong> floresta preservadaao longo dos pequenos cursos <strong>de</strong> água sobre aocorrência <strong>de</strong> <strong>de</strong>terminadas espécies <strong>de</strong> odonatas. Oresultado ajuda a avaliar se a largura da mata ripáriaprevista no Código Florestal Brasileiro é suficiente <strong>para</strong>manter o conjunto <strong>de</strong> espécies <strong>de</strong> odonatas.Probabilida<strong>de</strong> <strong>de</strong> ocorrência <strong>de</strong> uma espécie =exp ( % <strong>de</strong> cobertura florestal * coeficiente +Intercepto + erro) / [1 + exp (% <strong>de</strong> cobertura florestal* coeficiente + Intercepto+ erro)]MEGADIVERSIDADE | Volume 3 | Nº 1-2 | Dezembro 2007
Venticinque, Carneiro, Moreira & Ferreira | 31FIGURA 4 – Exemplo <strong>de</strong> como a paisagem é tratada nesteestudo. A análise é realizada utilizando o valor <strong>de</strong> coberturaflorestal contida <strong>de</strong>ntro das áreas <strong>de</strong> influência. No caso <strong>de</strong>steestudo, os anéis são distanciados 50 metros.Po<strong>de</strong>mos notar nos resultados (Tabela 3) que somenteuma espécie respon<strong>de</strong>u às alterações na cobertura <strong>de</strong>forma negativa, ou seja, quanto maior era a porcentagem<strong>de</strong> cobertura florestal menor era a probabilida<strong>de</strong><strong>de</strong> encontrar a espécie. As <strong>de</strong>mais espécies não respon<strong>de</strong>ramà proporção <strong>de</strong> mata ao redor dos pontos amostrais,na área do estudo.Uso <strong>de</strong> regressão logística <strong>para</strong> mo<strong>de</strong>lar adistribuição espacial <strong>de</strong> espécies arbóreas naAmazônia centralO presente trabalho é parte dos resultados apresentadosna dissertação <strong>de</strong> mestrado <strong>de</strong> Juliana Stropp Carneiro,sob a orientação do Dr. Eduardo Venticinque(Carneiro, 2004). Este trabalho teve como objetivo elaborarmo<strong>de</strong>los preditivos <strong>de</strong> ocorrência <strong>de</strong> Anibaroseaodora (pau-rosa), Cariniana micrantha, Caryocarvillosum, Dinizia excelsa, Dipteryx odorata, Goupiaglabra, Manilkara bi<strong>de</strong>ntata, Manilkara huberi, Parkiamultijuga, Parkia pendula, Peltogyne paniculata ePseudopipta<strong>de</strong>nia psilostachya em função da topografia.Estimamos a probabilida<strong>de</strong> <strong>de</strong> ocorrência dos indivíduoscom regressão logística múltipla, sendo a variáveldicotômica a presença e a ausência dos indivíduos,e as variáveis contínuas a altitu<strong>de</strong> e a <strong>de</strong>clivida<strong>de</strong> doterreno. As informações sobre a ocorrência das árvoresforam cedidas pela Mil Ma<strong>de</strong>ireira Itacoatiara Ltda. Osdados sobre a ocorrência dos indivíduos arbóreos foramcoletados pela empresa durante a prospecção e omapeamento das árvores com DAP ≥ 40 cm. As informaçõessobre a ocorrência das árvores consistem emum arquivo do tipo pontos, em formato shapefile, coma lista <strong>de</strong> espécies e as coor<strong>de</strong>nadas da localização dosindivíduos em UTM. Convertemos esse arquivo <strong>para</strong> oformato matricial e obtivemos um arquivo do tipo GRID,com células <strong>de</strong> 93 m. Elaboramos o Mo<strong>de</strong>lo Digital doTerreno a partir dos dados do Shuttle Radar TopographyMission (SRTM) e adquirimos os dados sobre altitu<strong>de</strong>no site http://seamless.usg.gov. Para a correção geométrica,utilizamos como base uma imagem LandsatTM 7 (órbita/ponto 230/62) georreferenciada (projeçãoUTM – zona 21; datum WGS 84). Posteriormente, coregistramosa imagem SRTM com a base dos igarapésda área <strong>de</strong> interesse digitalizada. Para obter os parâmetrosda regressão logística, exportamos os dados doArcView 3.2 e os analisamos em um pacote estatístico.Posteriormente, aplicamos as equações obtidas nosmo<strong>de</strong>los logísticos aos temas <strong>de</strong> altitu<strong>de</strong> e <strong>de</strong>clivida<strong>de</strong>e obtivemos os mapas <strong>de</strong> probabilida<strong>de</strong> <strong>de</strong> ocorrência<strong>de</strong> indivíduos (ver anexo). Deste modo, estes mapasexpressam a probabilida<strong>de</strong> <strong>de</strong> ocorrência dos indivíduosem células <strong>de</strong> 93 m, dada a altitu<strong>de</strong> e <strong>de</strong>clivida<strong>de</strong>daquela célula.TABELA 3 – Análise <strong>de</strong> regressão logística <strong>para</strong> a <strong>de</strong>pendência da presença <strong>de</strong> algumas espécies <strong>de</strong>Odonata em relação à proporção <strong>de</strong> mata ao redor dos pontos amostrais, na área do Projeto DinâmicaBiológica <strong>de</strong> Fragmentos Florestais (PDBFF), Manaus, AM. Valores entre parênteses são os erros padrõesdos parâmetros estimados.ESPÉCIE COEFICIENTE BO % DE MATA X 2 (VALOR DE p)Argia sp.1 -1,086 (1,138) 2,305 (1,631) 2,145 (0,143)Argia sp. 2 2,665 (1,461) -3,233 (1,861) 3,656 (0,050)Chalcopteryx scintilans -0,782 (1,114) 1,490 (1,549) 0,954 (0,329)Dicterias atrosanguinea -0,080 (1,094) -0,181 (1,504) 0,014 (0,904)MEGADIVERSIDADE | Volume 3 | Nº 1-2 | Dezembro 2007
32 | O <strong>uso</strong> <strong>de</strong> regressão logística <strong>para</strong> espacialização <strong>de</strong> probabilida<strong>de</strong>sPara <strong>de</strong>terminar a capacida<strong>de</strong> preditiva do mo<strong>de</strong>lo,obtivemos a tabela <strong>de</strong> sucesso <strong>de</strong> predição <strong>para</strong> cadaum dos mo<strong>de</strong>los gerados. Esta tabela é composta pelasvariáveis expressas abaixo:∑resposta = Pi ,on<strong>de</strong> Pi é a probabilida<strong>de</strong> estimada <strong>para</strong> as células <strong>de</strong>presença;∑referência = Pj ,on<strong>de</strong> Pj é a probabilida<strong>de</strong> estimada <strong>para</strong> as células <strong>de</strong>ausência;respostaÍndice <strong>de</strong> acerto <strong>de</strong> presença = ,Nion<strong>de</strong> Ni é o número <strong>de</strong> células <strong>de</strong> presença;referênciaÍndice <strong>de</strong> acerto <strong>de</strong> ausência = ,Njon<strong>de</strong> Nj é o número <strong>de</strong> células <strong>de</strong> ausência.As variáveis Índice <strong>de</strong> acerto <strong>de</strong> presença, Índice <strong>de</strong>acerto <strong>de</strong> ausência e Índice <strong>de</strong> acerto total refletem arelação entre a distribuição observada e a esperada,indicando o nível <strong>de</strong> acerto do mo<strong>de</strong>lo.Ainda com o objetivo <strong>de</strong> <strong>de</strong>terminar se as probabilida<strong>de</strong>sgeradas pelos mo<strong>de</strong>los refletem aumento noacerto <strong>de</strong> ocorrência <strong>de</strong> um indivíduo, com<strong>para</strong>mos aprobabilida<strong>de</strong> <strong>de</strong> acerto usando o mo<strong>de</strong>lo com a probabilida<strong>de</strong><strong>de</strong> acerto ao acaso.A análise <strong>de</strong> regressão logística indicou associaçãoentre a ocorrência dos indivíduos e a topografia <strong>para</strong>10 espécies. As espécies D. excelsa, A. rosaeodora e C.villosum tiveram o padrão <strong>de</strong> distribuição distinto das<strong>de</strong>mais, em relação à topografia. D. excelsa teve relaçãopositiva tanto com a <strong>de</strong>clivida<strong>de</strong> quanto com a altitu<strong>de</strong>,sugerindo que a probabilida<strong>de</strong> <strong>de</strong> encontrar indivíduos<strong>de</strong>ssa espécie é maior em lugares altos e íngremes, ouseja, no início dos platôs. Já a ocorrência <strong>de</strong> C. villosumteve relação positiva com a <strong>de</strong>clivida<strong>de</strong> e negativa coma altitu<strong>de</strong>, indicando que esta espécie ocorre nas vertentese em baixas altitu<strong>de</strong>s. A. rosaeodora mostrou-senegativamente relacionada com as variáveis topográficasanalisadas, ocorrendo em locais <strong>de</strong> altitu<strong>de</strong> e <strong>de</strong>clivida<strong>de</strong>baixas, estando assim associada às regiões <strong>de</strong>baixio. Entretanto as espécies C. micrantha, G. glabra,M. huberi, M. bi<strong>de</strong>ntata, P. multijuga, P. pendula eP. psilostachya evi<strong>de</strong>nciaram semelhanças na maneiraem que se distribuem ao longo da toposeqüência.Essas espécies mostraram-se associadas a locais <strong>de</strong> altitu<strong>de</strong>elevada e baixa <strong>de</strong>clivida<strong>de</strong>, características que<strong>de</strong>finem os ambientes <strong>de</strong> platô. As espécies D. odoratae P. paniculata não tiveram a distribuição estruturadapela topografia.Os mapas <strong>de</strong> probabilida<strong>de</strong> <strong>de</strong> ocorrência das espéciesestudadas representam a configuração espacial dadistribuição prevista <strong>para</strong> cada espécie. Nos mapas dasespécies que têm sua ocorrência influenciada pela topografia,é possível visualizar concordância entre asprobabilida<strong>de</strong>s mapeadas e a variável topográfica <strong>de</strong>maior influência sobre a distribuição <strong>de</strong> seus indivíduos.A Figura 5 ilustra o exemplo do mapa <strong>de</strong> probabilida<strong>de</strong><strong>de</strong> ocorrência <strong>de</strong> P. multijuga. Neste caso, o índice <strong>de</strong>acerto <strong>de</strong> presença foi maior que a probabilida<strong>de</strong> <strong>de</strong>encontrar indivíduos ao acaso, indicando que o mo<strong>de</strong>loé capaz <strong>de</strong> prever a distribuição <strong>de</strong>sta espécie naárea on<strong>de</strong> foi elaborado.O mo<strong>de</strong>lo preditivo foi capaz <strong>de</strong> prever corretamentea ocorrência <strong>de</strong> A. rosaeodora, C. micrantha, C. villosum,D. excelsa, M. huberi, M. bi<strong>de</strong>ntata, P. multijuga, P. pendulae P. psilostachya na área on<strong>de</strong> foi elaborado. Esse resultadoindica que, em <strong>de</strong>terminados compartimentos dapaisagem, a topografia po<strong>de</strong> condicionar a distribuição<strong>de</strong> algumas espécies. Em geral, as características edáficasdas florestas <strong>de</strong> terra firme da Amazônia central se alteramao longo do gradiente <strong>de</strong> altitu<strong>de</strong>. Dessa forma, atopografia é uma medida indireta das mudanças do ambientena paisagem (Tuomisto & Ruokolainen, 1994) e,portanto, as diferentes respostas das espécies frente àsposições topográficas refletem a influência que a variaçãoambiental po<strong>de</strong> ter sobre a estrutura espacial <strong>de</strong>ssasespécies. No caso do trabalho aqui apresentado, a liberaçãodos dados SRTM na Internet foi fundamental <strong>para</strong>alcançar os objetivos propostos. Vale lembrar que jáexistem imagens do SRTM com resolução <strong>de</strong> 30 metrosdisponíveis <strong>para</strong> os Estados Unidos da América e, em breve,é provável que tenhamos acesso a esta informação<strong>para</strong> a região Amazônica. Caso isso ocorra, po<strong>de</strong>remosfazer mo<strong>de</strong>los ainda mais precisos, baseados na topografia.Outro fato importante é a ausência <strong>de</strong> custo <strong>para</strong>se trabalhar com estas imagens. Se conseguirmos gerarbons mo<strong>de</strong>los preditivos sobre a distribuição <strong>de</strong> espéciesarbóreas com dados provenientes do SRTM, passaremosa ter uma ferramenta eficiente e <strong>de</strong> baixo custo<strong>para</strong> mo<strong>de</strong>lar a distribuição <strong>de</strong>stas espécies.MEGADIVERSIDADE | Volume 3 | Nº 1-2 | Dezembro 2007
Venticinque, Carneiro, Moreira & Ferreira | 33Altitu<strong>de</strong>45.556 - 54.59354.593 - 63.6363.63 - 72.66772.667 - 81.70481.704 - 90.74190.741 - 99.77899.778 - 108.815108.815 - 117.852117.852 - 1<strong>25</strong>.889Declivida<strong>de</strong>Regressão Logística8.75 - 9.8397.661 - 8.756.571 - 7.6615.482 - 6.5714.392 - 5.4823.303 - 4.3922.213 - 3.3031.124 - 2.2130.034 - 1.124EspacializaçãoParkiamultijugaProbabilida<strong>de</strong><strong>de</strong> ocorrência1 presença0 ausência0.000 - 0.9800.098 - 0.1960.196 - 0.2940.294 - 0.3920.392 - 0.4900.490 - 0.5880.588 - 0.6860.686 - 0.7840.784 - 0.8820.882 - 0.980FIGURA 5 – Mapa <strong>de</strong> probabilida<strong>de</strong> <strong>de</strong> ocorrência <strong>de</strong> Parkia multijuga, obtido a partir dos dados <strong>de</strong> ocorrência dos indivíduos,altitu<strong>de</strong> e <strong>de</strong>clivida<strong>de</strong>, na área da Mil Ma<strong>de</strong>ireira Itacoatiara Ltda.MEGADIVERSIDADE | Volume 3 | Nº 1-2 | Dezembro 2007
34 | O <strong>uso</strong> <strong>de</strong> regressão logística <strong>para</strong> espacialização <strong>de</strong> probabilida<strong>de</strong>s- 66 - 63 - 60Rondônia- 9- 12Limites do EstadoEstradasProteção integralUso sustentávelTerras indígenasÁreas <strong>de</strong>smatadas- 57- 54 - 51 - 48Pará0- 3- 6- 9- 6- 63 - 60 - 57 - 54 - 51 - 48Mato Grosso- 9- 12- 15- 18FIGURA 6 – Proporção <strong>de</strong> área <strong>de</strong>smatada em função da distância das estradas, <strong>de</strong>ntro (tracejado) e fora (contínua) <strong>de</strong> áreasprotegidas, em Rondônia, no Pará e no Mato Grosso.MEGADIVERSIDADE | Volume 3 | Nº 1-2 | Dezembro 2007
Venticinque, Carneiro, Moreira & Ferreira | 35O aumento do po<strong>de</strong>r <strong>de</strong> predição provi<strong>de</strong>nciado pelomo<strong>de</strong>lo é influenciado pelos fatores que estruturamespacialmente as espécies. Assim, se o mo<strong>de</strong>lo contemplaos fatores prepon<strong>de</strong>rantes na ocorrência dasespécies, o po<strong>de</strong>r <strong>de</strong> predição é maior. Deste modo,a compreensão dos fatores que interferem na distribuiçãoespacial das espécies e sua incorporação aos mo<strong>de</strong>lospreditivos po<strong>de</strong>m provi<strong>de</strong>nciar mo<strong>de</strong>los maispróximos da realida<strong>de</strong>. Portanto, a incorporação <strong>de</strong> informaçõesda variação ambiental, bem como estudosaprofundados da relação espécie-ambiente (Pitman etal., 2001) e a análise da distribuição das árvores emescala regional, po<strong>de</strong>m contribuir <strong>para</strong> a mo<strong>de</strong>lagemda distribuição espacial das árvores. Dado o contextoem que se insere a análise da configuração espacial davegetação, a análise dos dados sobre variáveis ambientaisrelacionadas com a ocorrência <strong>de</strong> espécies po<strong>de</strong>ser proveitosa <strong>para</strong> a compreensão da distribuição dadiversida<strong>de</strong> na Amazônia.Unida<strong>de</strong>s <strong>de</strong> conservação e terras indígenas ajudama conter <strong>de</strong>smatamento na Amazônia brasileiraO objetivo <strong>de</strong>ste tópico foi testar diferenças no nível<strong>de</strong> <strong>de</strong>smatamento <strong>de</strong>ntro e fora <strong>de</strong> unida<strong>de</strong>s <strong>de</strong> conservação(proteção integral e <strong>uso</strong> sustentável) e terrasindígenas (<strong>de</strong>nominadas aqui como áreas protegidas)em relação à distância das estradas, nos Estados <strong>de</strong>Rondônia, Pará e Mato Grosso, <strong>para</strong> ilustrar a importância<strong>de</strong> unida<strong>de</strong>s <strong>de</strong> conservação como redutores doefeito do <strong>de</strong>smatamento na Amazônia. Estes estadosforam escolhidos como estudos <strong>de</strong> caso <strong>de</strong>vido a suaimportância na participação do <strong>de</strong>smatamento da Amazônia,já que somam cerca <strong>de</strong> 70% do total da área<strong>de</strong>smatada nesta região entre 2000-2001 (INPE, 2003).Os Estados <strong>de</strong> Rondônia, Pará e Mato Grosso têm cerca<strong>de</strong> 29,2%, 20,4%, e 28,4% <strong>de</strong> sua área já <strong>de</strong>smatada, respectivamente.A análise <strong>de</strong>monstra que a proporção total da área<strong>de</strong>smatada fora das áreas protegidas sempre foi significativamentemais elevada do que no interior <strong>de</strong>stas.Uma diferença que po<strong>de</strong> variar <strong>de</strong> 9,8 a 19,6 vezes, <strong>de</strong>pen<strong>de</strong>ndodo estado analisado. A regressão logísticatambém permite <strong>de</strong>monstrar que a proporção do <strong>de</strong>smatamento<strong>de</strong>cai exponencialmente em função da distânciadas estradas. Contudo, o <strong>de</strong>smatamento <strong>de</strong>ntrodas áreas protegidas é sempre menor do que fora <strong>de</strong>lasnos três estados analisados, mesmo quando estas áreassituam-se próximas a estradas. Isso <strong>de</strong>rruba a crença<strong>de</strong> que as áreas protegidas sofreriam menos <strong>de</strong>smatamentosomente pelo fato <strong>de</strong> estarem situadas mais distantesdas estradas (Figura 6).AGRADECIMENTOSAgra<strong>de</strong>cemos à Mil Ma<strong>de</strong>ireira Itacoatiara Ltda. pela disponibilizaçãoda base <strong>de</strong> dados, ao Projeto DinâmicaBiológica <strong>de</strong> Fragmentos Florestais (PDBFF), ao WWF –Brasil, Projeto Experimento <strong>de</strong> Gran<strong>de</strong> Escala daBiosfera-Atmosfera da Amazônia (LBA) e ao ProjetoGeoma, pelo suporte financeiro (Bolsa <strong>de</strong> MarceloMoreira). À Marina Antongiovanni, Amanda Mortati eAna Albernaz pela revisão do texto. Ao Dr. Paulo DeMarco por nos autorizar a usar seus dados em um dosexemplos.REFERÊNCIAS BIBLIOGRÁFICASCarneiro, J.S. 2004. Mapeamento preditivo da vegetação: <strong>uso</strong><strong>de</strong> SIG <strong>para</strong> mo<strong>de</strong>lar a distribuição espacial <strong>de</strong> espéciesarbóreas na Amazônia central. 2004. Dissertação <strong>de</strong> Mestrado.Instituto Nacional <strong>de</strong> Pesquisas da Amazônia (INPA),Manaus.Cook, D.R. & S. Weisberg. 1984. Residuals and influence inregression. Chapman and Hall, New York.Cox, D.R. 1970. The analysis of binary data. Methuen, Londres.Hensher, D. & L.W. Johnson. 1981. Applied discrete choicemo<strong>de</strong>lling. Croom Helm, London.Hosmer, D.W. & S. Lemeshow. 1989. Applied logistic regression.John Wiley & Sons, Inc., New York.INPE. 2003. Disponível em: http://www.obt.inpe.br/pro<strong>de</strong>s(acessado em janeiro 2007).Penha, R.N. 2002. Um estudo sobre regressão logística binária.Disponível em: http://www.iem.efei.br/dpr/td/producao2002/PDF/Renata.PDF (acessado em novembro <strong>de</strong> 2003).Pitman, N.C.A., J. Terborgh, M.R. Silman, P.V. Núñez, D.A. Neill,C.E. Cerón, W.A. Palacios & M. Aulestia. 2001. Dominanceand distribution of tree species in upper Amazonian terrafirme forests. Ecology 82: 2101-2117.Pregibon, D. 1981. Logistic regression diagnostics. Annals ofStatistics 9: 705-724.Steinberg, D. & P. Colla. 1998. Logistic regression. In: Wilkinson,L. (ed). SYSTAT 8.0 Statistics. pp. 517-584. Chicago.Tuomisto, H. & K. Ruokolainen. 1994. Distribution of Pteridophytaand Melastomataceae along an edaphic gradient in anAmazonian rain forest. Journal of Vegetation Science 5: <strong>25</strong>-34.ANEXOComo espacializar regressão logística no ArcViewversão 3.2A espacialização da regressão logística no ArcView 3.2se inicia pela <strong>de</strong>terminação dos temas a serem relacionados.Para isso, <strong>de</strong>fine-se o tema que contém a variável<strong>de</strong>pen<strong>de</strong>nte binária (1/0 – presença e ausênciaMEGADIVERSIDADE | Volume 3 | Nº 1-2 | Dezembro 2007
36 | O <strong>uso</strong> <strong>de</strong> regressão logística <strong>para</strong> espacialização <strong>de</strong> probabilida<strong>de</strong>sdo fenômeno <strong>de</strong> interesse) e o tema que representa avariável preditora contínua. No caso da regressão logísticamúltipla, é possível estabelecer dois ou maistemas referentes às variáveis preditoras. Após essa <strong>de</strong>terminação,é feita a análise estatística dos dados, afim <strong>de</strong> se obter os parâmetros da regressão logística.Finalmente, os parâmetros da regressão são incorporadosao ArcView 3.2 e então realizadas as operações <strong>para</strong>sua espacialização. Os tópicos abaixo <strong>de</strong>screvem<strong>de</strong>talhadamente esses três procedimentos:Obtenção dos temas referentes à variáveldicotômica e contínuaOs temas (camadas digitais) <strong>de</strong>ste tópico <strong>de</strong>vem estarem formato GRID e apresentar a mesma resolução espacial,número <strong>de</strong> linhas e colunas. O arquivo GRID referenteao tema da variável binária <strong>de</strong>ve ter os valoresdas células 0 e 1. Assim, se a representação do eventofor do tipo ponto, linha ou polígono, é necessário convertero arquivo <strong>para</strong> GRID e atribuir o valor 1 e 0 àscélulas correspon<strong>de</strong>ntes à presença e ausência do evento,respectivamente. A conversão <strong>para</strong> GRID e a associaçãodo valor 1 às células <strong>de</strong> presença po<strong>de</strong> ser feita apartir do menu do ArcView 3.2 e a associação do valor0 po<strong>de</strong> ser feita a partir da extensão Grid PIG Tolls(http://arcscripts.esri.com ou http://arcscripts.esri.com/<strong>de</strong>tails.asp?dbid=11872). Este tema será utilizadonas operações <strong>de</strong> obtenção dos valores a seremutilizados na análise estatística. Assim, é necessário quea tabela associada a ele tenha quatro campos, como naFigura 7.Os campos value e count são criados automaticamentepelo ArcView 3.2 e indicam o valor numérico do pixel(value) e o respectivo número <strong>de</strong> pixels (count) com valor0 e 1. Os campos presença e ausência são criadospelo usuário, sendo que o campo presença apresentavalor 1 <strong>para</strong> presença e 0 <strong>para</strong> ausência e o campoausência valor 1 <strong>para</strong> ausência e 0 <strong>para</strong> presença. Atéaqui <strong>de</strong>finimos o tema referente à variável categórica.O próximo passo é <strong>de</strong>terminar os temas com as variáveiscontínuas. Isso é <strong>de</strong>finido pela experiência e peladisponibilida<strong>de</strong> <strong>de</strong> dados do usuário.Obtenção dos dados <strong>para</strong> a análise estatísticaNeste tópico será <strong>de</strong>scrito como obter os valores dasvariáveis contínuas na área <strong>de</strong> estudo do evento <strong>de</strong> interesse.Para isso, realizaremos algumas operaçõesmatemáticas na função MAP CALCULATOR do ArcView3.2, com os temas <strong>de</strong>finidos anteriormente. O esquemadas operações entre as camadas é mostrado naFigura 8.• Obtenção dos valores da variável contínua nas células<strong>de</strong> presença do evento <strong>de</strong> interesse:[GRID variável contínua] ÷ [GRID variável categórica“campo presença =1”]• Obtenção dos valores da variável contínua nas células<strong>de</strong> ausência do evento <strong>de</strong> interesse:[GRID variável contínua] ÷[GRID variável categórica“campo ausência=1”]Os GRIDs gerados por essas operações <strong>de</strong>vem serexportados no formato ASCII Raster (opção disponívelno menu do programa). A planilha da primeira operaçãocontém os valores das variáveis contínuas nos pixelsreferentes à presença e a da segunda, os valores referentesà ausência. O valor “-9999” é atribuído à ausência<strong>de</strong> dados.As planilhas po<strong>de</strong>m ser editadas no Excel. Sugerimosa elaboração <strong>de</strong> uma única planilha com duascolunas: uma contendo a variável contínua e outra ainformação <strong>de</strong> presença e ausência. No caso da regressãologística múltipla, a planilha po<strong>de</strong> conter três oumais colunas. A partir <strong>de</strong>ssas planilhas é possível seobter os parâmetros necessários <strong>para</strong> espacialização daregressão logística em um pacote estatístico.Espacialização da regressão logística no ArcView 3.2A equação da regressão logística simples po<strong>de</strong> serespacializada no ArcView 3.2 a partir das seguintesoperações:• ([GRID variável contínua]) * coeficiente - > [GRID A]• ([GRID A] + Constante) - > [GRID B]• ([GRID B] .Exp) - > [GRID C]• ([GRID C] + 1) - > [GRID D]• ([GRID C] / [GRID D]) - > [GRID E]Já <strong>para</strong> a equação da regressão logística múltipla,sua espacialização é feita com as operações indicadasabaixo.• ([GRID variável contínua 1] * (coeficiente )) + ([GRID1variável contínua 2] * (coeficiente )) - > A2• ([GRID A] + Constante) - > [GRID B]• ([GRID B] .Exp) - > [GRID C]• ([GRID C] + 1) - > [GRID D]• ([GRID C] / [GRID D]) - > [GRID E]Todas essas operações po<strong>de</strong>m ser realizadas a partirda função MAP CALCULATOR do módulo Spatial Analystdo ArcView 3.2.MEGADIVERSIDADE | Volume 3 | Nº 1-2 | Dezembro 2007
Venticinque, Carneiro, Moreira & Ferreira | 37FIGURA 7 – Tabela <strong>de</strong> atributos do arquivo formato GRID da variável <strong>de</strong>pen<strong>de</strong>nte. Os pontos eram um arquivo que estava emformato vetorial que foi transformado <strong>para</strong> GRID. Os pixels em vermelho correspon<strong>de</strong>m a pelo menos uma presença e os pixelsem ver<strong>de</strong> às ausências.(A) (B) (C)–=Variável contínua117,852 - 126,889108,815 - 117,85299,778 - 108,81590,741 - 99,77881,704 - 90,74172,667 - 81,70463,63 - 72,66754,593 - 63,6345,556 - 54,593Presença e ausência0 ausência1 presençaValores contínuos - presença117,852 - 126,889108,815 - 117,85299,778 - 108,81590,741 - 99,77881,704 - 90,74172,667 - 81,70463,63 - 72,66754,593 - 63,6345,556 - 54,593No Data(A1) (B1) (C1)–=Variável contínua117,852 - 126,889108,815 - 117,85299,778 - 108,81590,741 - 99,77881,704 - 90,74172,667 - 81,70463,63 - 72,66754,593 - 63,6345,556 - 54,593Presença e ausência0 presença1 ausênciaValores contínuos - presença117,852 - 126,889108,815 - 117,85299,778 - 108,81590,741 - 99,77881,704 - 90,74172,667 - 81,70463,63 - 72,66754,593 - 63,6345,556 - 54,593No DataFIGURA 8 – Representação das operações <strong>para</strong> obtenção dos valores das variáveis contínuas nas células <strong>de</strong> ausência e presençado evento <strong>de</strong> interesse. A e A1 são variáveis contínuas; B é a variável dicotômica com valor 1 <strong>para</strong> presença; B1 é a variáveldicotômica com 1 <strong>para</strong> ausência; C são os valores das células da camada digital da variável contínua com presença e C1 amesma operação <strong>para</strong> as células com ausência.MEGADIVERSIDADE | Volume 3 | Nº 1-2 | Dezembro 2007