modelo - Gbif.es

gbif.es
  • No tags were found...

modelo - Gbif.es

IX Taller GBIF deModelización deNichos Ecológicos(sesión 1)Blas M. BenitoBlas M. Benito


LOS ALUMNOS• ¿Quién eres?• ¿Cual es tu interés en este taller?• ¿Cual es tu experiencia en SIG?• ¿Has trabajado con Modelos deNicho Ecológico?• ¿Qué esperas de este taller?


¿QUÉ ES UN MODELO?Descripción simplificada de un sistema físico real, en laque aparecen algunas de sus propiedades (Joly 1988).Los objetivos de un modelo son:• Ofrecer una versión “manejable” del sistema• Facilitar la comprensión de la estructura del sistema• Generar y testar hipótesis• Explorar escenarios alternativos (¿qué pasaría si...?)• Predicción a corto plazo• Apoyo a la toma de decisiones


HAY DISTINTOS TIPOS DE MODELOSNo se pueden clasificar en conjuntos cerrados,sino en gradientes.• Estadísticos (empíricos) vs. teóricos(mecanicistas)


HAY DISTINTOS TIPOS DE MODELOS• Estadísticos (empíricos) vs. teóricos(mecanicistas)• Simples vs. complejos


¿QUÉ ES UNA SIMULACIÓN?Es una ejecución de un modelo complejo y dinámico conunos valores determinados para el conjunto deparámetros.¿Para qué sirve?:• Replicar características del mundo real in silicomediante programas de ordenador.• Estudiar sistemas complejos cuando los modelossimples no pueden capturar la necesaria complejidad.• Crear un “mundo” en el que el investigador tieneacceso a todas las leyes, componentes y susinteracciones.


¿QUÉ ES UNA SIMULACIÓN?


PRESENCIAYNICHO ECOLÓGICO


LA PRESENCIA...presencia / ausencia


LA PRESENCIA...presencia / ausenciaabundancia


LA PRESENCIA...presencia / ausenciaabundanciaestructura hábitat / población


LA PRESENCIA...presencia / ausenciaabundanciaestructura hábitat / poblaciónprocesos ecológicoscondicionesrecursosinteracciones -interacciones +


LA PRESENCIA...presencia / ausenciaabundanciasimplificaciónestructura hábitat / poblaciónprocesos ecológicoscondicionesrecursosinteracciones -interacciones +tiempo - historia biogeográfica - perturbaciones


EL NICHO ECOLÓGICOorganismover McInerny y Etienne 2012 J Biogeogr


EL NICHO ECOLÓGICOfactoresabióticosorganismover McInerny y Etienne 2012 J Biogeogr


factoresabióticosEL NICHO ECOLÓGICOcondicionesorganismover McInerny y Etienne 2012 J Biogeogr


factoresabióticosEL NICHO ECOLÓGICOcondicionesorganismorecursosver McInerny y Etienne 2012 J Biogeogr


factoresabióticosEL NICHO ECOLÓGICOcondicionesrecursosorganismofactoresbióticosver McInerny y Etienne 2012 J Biogeogr


EL NICHO ECOLÓGICOfactoresabióticoscondicionesrecursosorganismofactoresbióticosinteraccionesnegativasinteraccionespositivasver McInerny y Etienne 2012 J Biogeogr


EL NICHO ECOLÓGICOfactoresabióticoscondicionesrecursosdinámicapoblacionalorganismofactoresbióticosinteraccionesnegativasinteraccionespositivasver McInerny y Etienne 2012 J Biogeogr


MODELOS CORRELATIVOSCON INTERACCIONES


MODELOS ECO-FISIOLÓGICOSfactoresabióticosorganismo= mecanismo ecológico explícito


MODELOS ECO-FISIOLÓGICOS


MODELOS HÍBRIDOSfactoresabióticosorganismo


MODELOS HÍBRIDOS


Y TAL VEZ EN EL FUTURO...factoresabióticoscondicionesrecursosdinámicapoblacionalorganismofactoresbióticosinteraccionesnegativasinteraccionespositivas


MODELOS DENICHO ECOLÓGICO


DETERMINACIÓN EXPERIMENTALscienceasaverb.wordpress.com


DETERMINACIÓN DESCRIPTIVAscienceasaverb.wordpress.com


MODELOS DE NICHO ECOLÓGICO


MODELOS DE NICHO ECOLÓGICO


UNA ASUNCIÓN IMPORTANTE:EQUILIBRIO CON EL CLIMAHutchinson (1957):“Una especie está en equilibrio con el clima siaparece en todas las áreas climáticamenteapropiadas y está ausente de todas las que nolo son”¿Están realmente las especies en equilibrio conel clima?


¿DINÁMICO O ESTÁTICO?• No se sabe qué especies tienen nichos dinámicos, niqué condiciones ecológicas que lo hacen posible• Algunos estudios indican cambios en periodosmenores a 100 años (¿especiación o adaptación?)• Nicho dinámico es esencial para posibilitar laespeciación, por lo que debe? haber especies connicho dinámico• Las grandes poblaciones de especies muyextendidas presentan nichos muy conservados (flujogenético de centro a periferia previene la expansiónde nicho)


ENMs or SDMs?El concepto “Modelo de Nicho Ecológico”engloba dimensiones que no podemosconsiderar (ni medir!) en la metodologíadescrita anteriormente.Un término que no tiene esta restricción es“Modelo de Distribución de Especies” (enadelante, MDE).Esto solo es semántica, ¡pero los revisores de artículos la tienenmuy en cuenta!


ENMs or SDMs?


EL PROCESO DE MODELADO


FORMULACIÓN TEÓRICA• Definición de objetivos• Conocimiento sobre la especie de trabajo• Selección de factores potencialmenteimportantes• Selección de herramientas que se van autilizar, formatos, recursos informáticos,etc• Diseño inicial del flujo de trabajo


FLUJO DE TRABAJO


tamaño de muestrasesgo de los datosPRESENCIAprecisión de la georreferenciación


UN REGISTRO DE PRESENCIA...Debería contener, al menos:• Una coordenada X• Una coordenada Y• Un nombre de taxon (correctamente identificado)Otros datos interesantes serían:• Precisión de las coordenadas• Fecha de recolección• Y cualquier otro dato esencial para el trabajo en curso¡FUNDAMENTAL!: conocer el sistema de referencia


TIPOS DE PRESENCIAS...SOLO-PRESENCIAPRESENCIAPRESENCIA-AUSENCIAPSEUDO-AUSENCIAAUSENCIABACKGROUND+ confiabilidad -


SOLO-PRESENCIAVENTAJAS• Alta disponibilidad (colecciones → GBIF)• “Impepinables” (salvo incertidumbretaxonómica)INCONVENIENTES• No permiten calcular probabilidad depresencia• No informan sobre sesgo en el muestreo• Atención a precisión de coordenadas


SOLO-PRESENCIA


PRESENCIA-AUSENCIAVENTAJAS• Permiten calcular probabilidad de presencia• Tienen en cuenta el sesgo en el muestreoINCONVENIENTES• ¿Cuándo y cómo una ausencia es unaausencia?• Falsas ausencias (especies crípticas)• Baja disponibilidad


AUSENCIATRES TIPOS:• De contingencia: en áreas idóneas,debido a restricciones dispersivas,históricas o biológicas• Ambientales: por ausencia de hábitatidóneo idóneas• Metodológicas: por sesgo de en elmuestreoLobo et al. 2010


AUSENCIA


PSEUDO-AUSENCIAVENTAJAS• Es fácil generarlasINCONVENIENTES• No son ausencias reales• Criterio ecológico discutible• No tienen en cuenta el sesgo del muestreo


PSEUDO-AUSENCIA


BACKGROUND:VENTAJAS• Es fácil generarlas• Su uso está muy extendido (muchabibliografía!)INCONVENIENTES• No funcionan bien para métodos declasificación (Random Forest, Support VectorMachines)• Tienen que ponderarse al trabajar con métodosde regresión


BACKGROUND:


TAMAÑO DE MUESTRA• Los MDE son sensibles al tamaño de muestra• Pero el tamaño de muestra apropiadodepende de:– Algoritmo– Extensión del área de distribución de laespecie– Especificidad ecológica de la especiemodelada


TAMAÑO DE MUESTRAEffects of sample size on the performance of species distributionmodels (Wisz et al 2008, Diversity and Distributions)


SESGO• El muestreo debe hacerse a lo largo de todos losrangos ecológicos significativos para la especie• Un esfuerzo de muestro insuficiente (solo cercade carreteras) o mal dirigido (obviandogradientes importates) desemboca en unSESGO• Efecto negativo directo en MDE, porque semodelan simultáneamente la distribución de laespecie y el esfuerzo de muestreo,condicionando el resultado


AUTOCORRELACIÓN ESPACIAL• Registros de presencia cercanos suelentener las mismas combinaciones de valorespara las variables ambientales →pseudorreplicación• Viola la premisa de independencia entrelas observaciones• Para reducirla, basta con ampliar ladistancia entre puntos de presencia, si esque están muy cercanos


PRECISIÓN DE LAGEORREFERENCIACIÓN• Es muy variable, según la fuente (GBIF,desde metros hasta decenas de miles demetros)• Debe ser acorde a la resolución de lasvariables ambientales usadas comopredictoras• Los algoritmos de modelado toleran bienerrores de geolocalización (Graham et al2008)


PARTICIÓN DE DATOS• Datos independientes → cross validation• No hay datos independientes → kfold• Pocas presencias → leave one out


FUENTES DE REGISTROS DEPRESENCIA• Colecciones → GBIF• Mapas de vegetación• Muestreo en campo con GPS• Planes de conservación y recuperación deespecies amenazadas• Atlas de flora y faunaCada fuente es útil para objetivos distintos, enfunción de la resolución, extensión geográfica ycantidad de los datos


¡FORMATOS Y MÁS FORMATOS!Las distintas fuentes proporcionan los datos endistintos formatos• Formato:– Estructura “informática” del fichero– Estructura de los datos que contiene elficheroY los programas de modelado requieren quelas presencias estén formateadas dedeterminada manera.


FORMATOS DE DESTINOMaxEnt• extensión .csv• separado por comaOpenModeller• extensión .txt• separado por tabuladoresNota: En OpenModeller abundance=0indica ausencia


VARIABLESdisponibilidadresolución espacialseleccióncolinealidadinteracción


VARIABLES AMBIENTALES• Deben tener dos características:– Afectar directa o indirectamente a la distribuciónde la especie– Se pueden representar como mapas digitales enun SIG• Resolución espacial acorde a datos de presencia• Jerarquía de influencia (clima vs. topografía y usosdel suelo según escala)• Baja colinealidad• Interacción entre variables


VARIABLES TOPOGRÁFICAS


VARIABLES CLIMÁTICAS


VARIABLES ANTRÓPICAS


TELEDETECCIÓN


VARIABLES TEMÁTICAS


VARIABLES BIOLÓGICAS


ALGORITMOvariedad de técnicascomplejidad de configuracióndistintos resultados


ALGORITMOGran diversidad de métodos, que requierendistintos tipos de datos• Envueltas bioclimáticas• Modelos de similaridad ecológica• Métodos de regresión• Métodos de aprendizaje artificial


DISTINTOS RESULTADOS...


...Y DISTINTO PODER PREDICTIVO* * *


MODELOmodelo en el espacio ecológicomodelo en el espacio geográfico


MODELOespacio ecológicoespacio geográfico


EVALUACIÓNvariedad de técnicasno hay normasignoran componente espacial


EVALUACIÓNArtículo clave:Fielding AH y Bell JF 1997. A review ofmethods for the assessment of prediction errorsin conservation presence/absence models.Environmental Conservation 24(1), 38-49(1739 citas en mayo de 2013)


EVALUACIÓN


MATRIZ DE CONFUSIÓNA → presencias acertadasD → ausencias acertadasB → ausencias fallidas (falsos positivos o error decomisión)C → presencias fallidas (falsos negativos o error deomisión)sensibilidad → S = A/(A+C)true skill statistic → TTS = S + E – 1especificidad → E = D/(B+D)kappa → K =[(A+D)-(((A+C)*(A+B)+(B+D)*(C+D))/N)][N-(((A+C)*(A+B)+(B+D)*(C+D))/N)]


ANÁLISISumbral de corteensambladomáscara


ANÁLISISDepende en gran medida del objetivo delmodelo. Algunos ejemplos:• Aplicación de un umbral de corte(continuo → binario)• Aplicación de máscaras• Ensamblado de modelos• Suma de modelos binarios• Uso en modelos híbridos (MDE + “otra cosa”)


UMBRAL DE CORTE


ENSAMBLADO DE MODELOS


ENSAMBLADO DE MODELOS


ENSAMBLADO DE MODELOSPROMEDIO DE LOSMODELOS ANTERIORES


MODELOS DE RIQUEZABenito et al. 2013 MEE


INTERPRETACIÓNpoco consenso...¡crucial!


INTERPRETACIÓNDiagrama BAM• A - ambiente abiótico(hábitat óptimo)• B - ambiente biótico• M - hábitat accesible• RN - nicho realizado• P - presenciaSoberón 2005 Biodiversity Informatics


INTERPRETACIÓNDependerá del objetivo, datos de partida(presencias y variables) y diseño del modelo.Según Soberón (2005):“Whether the result is interpreted as the species'distribution, the spatial extent of its fundamentalniche, or some other phraseology, thesealgorithms only find regions that 'resemble'those where occurrence points are located.”


INTERPRETACIÓNOtra cuestión importante está en la naturalezabiológica de la observación:• ¿Se reproduce la especie en ese lugar?• ¿Se alimenta la especie en ese lugar?• ¿Busca la especie refugio u otros recursos enese lugar?Todas estas cuestiones nos ayudarán acontestar a la pregunta ¿QUÉ ESTAMOSMODELANDO?


INTERPRETACIÓN


APLICACIONESDE LOS MODELOS DEDISTRIBUCIÓN DE ESPECIES


APLICACIONES DE LOS MDE• Cartografía de especies o comunidades• Muestreo de especies raras• Modelado de riqueza de especies• Planificación de conservación• Análisis de invasiones biológicas• Análisis de paleodistribuciones• Cambio climático y migración


CARTOGRAFÍA DE ESPECIES OCOMUNIDADESElgene O. Box (1981) Predicting physiognomicvegetation types with climate variables.Vegetatio 45, 127-139• Objetivo: modelo terrestre de vegetación• Métodos: envueltas bioclimáticas• Resultados: 85 % acierto en tipos de plantas y 50 %en estructura de la vegetación• Conclusiones: Un modelo muy simple y generalpuede predecir características de la vegetaciónmundial con una precisión aceptable


Elgene O. Box (1981)Variables predictivas:• TMAX = temperatura media del mes más cálido (Cº)• TMIN = temperatura mínima del mes más frio (Cº)• DTY = rango de temperatura media anual (Cº)• PRCP = precipitación media anual (mm)• MI = índice anual de humedad• PMAX = precipitación del mes más húmedo (mm)• PMIN = precipitación del mes más seco (mm)• PMTMAX = precipitación del mes más cálido (mm)


Elgene O. Box (1981)Modelo de envueltas bioclimáticas:


Elgene O. Box (1981)


MUESTREO DE ESPECIES RARASGuisan et al. 2005. Using niche-based models toimprove the sampling of rare species. ConservationBiology 20(2), 501-511• Objetivo: Mejorar datos de presencia de especiesraras• Métodos: MDE como guía para buscar poblaciones• Resultados: Ahorro de un 70 % en el esfuerzo demuestreo• Conclusiones: Los MDE son útiles para localizarpoblaciones desconocidas de especies raras


Esquema metodológico:Guisan et al. 2005


Modelo inicial:Guisan et al. 2005


Modelo mejorado:Guisan et al. 2005


MODELADO DE RIQUEZALehmann et al. 2002. Assessing New Zealand ferndiversity from spatial predictions of speciesassemblages. Biodiversity and Conservation 11,2217-2238• Objetivo: Modelo espacial de diversidad de arbustos• Métodos: Suma de MDE comparada con prediccióndirecta de riqueza• Resultados: Alta congruencia entre modelos• Conclusiones: La suma de MDE permite identificarhotspots y establecer objetivos para conservación yrestauración


Lehmann et al. 2002


PLANIFICACIÓN DE CONSERVACIÓNDunwu et al. 2002. Ecological niche modelingof the sympatric giant and red pandas on amountain-range scale. Biodiversity andConservation 18, 2127-2141• Objetivo: Recomendar áreas de reservas parapandas rojo y gigante• Métodos: Solapamiento de modelos• Resultados: Reservas actuales están mal diseñadas• Conclusiones: Los MDE ayudan a un diseño de• reservas más coherente


Dunwu et al. 2002


ANÁLISIS DE INVASIONESBIOLÓGICASBroenninmann et al. 2007. Evidence ofclimatic niche shift during biological invasions.Ecology Letters 10, 701-709• Objetivo: Comprobar cambios en nicho ecológicodurante invasión biológica• Métodos: MDE de especie invasora en rango nativo eninvadido• Resultados: La especie cambia sus requerimientosecológicos durante la invasión• Conclusiones: Los MDE predicen áreas deintroducción de especies invasoras, pero no rangos deinvasión


Broenninmann et al. 2007


Broenninmann et al. 2007


ANÁLISIS DE PALEODISTRIBUCIONESLorenzen et al. 2011. Species-specificresponses of Late Quaternary megafauna toclimate and humans. Nature 479, 359-364• Objetivo: Aclarar efecto del clima y el hombre en ladistribución de a megafauna del Cuaternario• Métodos: MDE, registro fósil, ADN• Resultados: Especies presentan respuestasdiferentes a cambio de clima y efecto humano• Conclusiones: El cambio del clima explica algunasextinciones, pero otras no pueden entenderse sin laacción del hombre


Lorenzen et al. 2011


Lorenzen et al. 2011


Lorenzen et al. 2011


Lorenzen et al. 2011


CAMBIO CLIMÁTICO Y MIGRACIÓNSkov y Svenning 2004. Potential impact ofclimatic change on the distribution of forestherbs in Europe. Ecography 27, 366-380• Objetivo: Evaluar consecuencias del CambioClimático en la distribución plantas europeas• Métodos: Envueltas bioclimáticas difusas• Resultados: Observan pérdidas moderadas dehábitat para todas las especies• Conclusiones: La escasa dispersión natural deestas plantas va a impedirles migrar al ritmo exigidopor el cambio climático


Skov y Svenning 2004


Skov y Svenning 2004


Skov y Svenning 2004


EL ENTORNO DE TRABAJO


HERRAMIENTASPROGRAMACIÓN– R – cran.r-project.org– Notepad++ - notepad-plus-plus.org– NppToR - npptor.sourceforge.netSISTEMAS DE INFORMACIÓN GEOGRÁFICA– Quantum GIS + GRASS – qgis.org / grass.fbk.euMODELOS DE DISTRIBUCIÓN– Openmodeller – openmodeller.sourceforge.net– MaxEnt – www.cs.princeton.edu/~schapire/maxent/– Dismo - cran.r-projext.org/.../dismo


●Código abierto, uso gratuito y alta potencia●Un estándar para análisis estadístico en elámbito académico●Comunidad de desarrollo muy activa:evoluciona muy rápido!●Posibilidades casi infinitas!●Lenguaje de programación poco intuitivo


NOTEPAD++• Editor de texto plano de código abierto• Facilita la escritura de scripts• Conecta con R mediante NppToR


QUANTUM GIS + GRASS●Código abierto, multiplataforma y usogratuito●Comunidad de desarrollo muy activa:evoluciona muy rápido!●Interfaz gráfico muy intuitivo●Extensible mediante complementos●GRASS: ¡ideal para preparar las variablesambientales para nuestros modelos!


OpenModeller• En realidad son dos “programas”– Una librería de algoritmos de modelado– Un interfaz gráfico para generar modelos• Su interfaz gráfico es fácil de usar• Su alto número de algoritmos le da una granflexibilidad para trabajar con distintasespecies• Tiene un problema: muchos algoritmos, conmuchos parámetros para cada algoritmo


MaxEnt• Método general para hacerpredicciones a partir de informaciónincompleta• Permite trabajar con un número bajo deregistros de presencia• Multiplataforma (requiere Java), códigocerrado pero uso gratuito• Ofrece muy buenos resultados• Su interfaz gráfico es muy sencillo


Dismo + Raster●Dos librerías de R, una para hacermodelos de distribución y otra paraprocesar mapas ráster●Está desarrollada por investigadorespunteros en modelos de distribución●Aún está inmadura, pero ya es útil parahacer modelos de distribución


INTRODUCCIÓN BÁSICAA LOS SIG


SISTEMAS DE COORDENADASFuente:wiki.brown.edu


COORDENADAS GEOGRÁFICASFuentes:publib.boulder.ibm.com y s3.amazonaws.com


COORDENADAS PROYECTADASFuente: http://www.cartovirtual.es/


EL GEOIDEFuente: www.esa.int


EL DATUMWGS84(epsg 4326)Fuente:www.icsm.gov.au


EL DATUMED50(epsg 4230)Fuente:www.icsm.gov.au


PARA ACLARARLODe nuestros datos geográficos necesitamosconocer:• El tipo de coordenadas (geográficas oproyectadas)• El sistema de proyección (si es que sonproyectadas)• El datum


PARA SIMPLIFICAR EL ASUNTO...Están los códigos EPSG (European PetroleumSurvey Group)Son códigos numéricos para cada sistema decoordenadas de referenciahttp://spatialreference.org/


SISTEMAS DE REFERENCIA MÁSUSADOS (si trabajas en España...)• EPSG 4326: coordenadas geográficas con datumWGS84; GPS, mayoritaria en servidores de datos SIG enla red• EPSG 23030: proyección utm del huso 30 con datumED50; España peninsular y Baleares• EPSG 4258: coordenadas geográficas con datumETRS89 (equivalente a WGS84), la oficial de Europa• EPSG 3042: proyección utm del huso 30 con datumETRS89 (equivalente a WGS84), va a ser oficial en pocotiempo (ya debería serlo!)


LA INFORMACIOŃ GEOGRÁFICAFuente:gis.ci.meriden.ct.us


MODELO RÁSTER Y VECTORIALFuente:cookbook.hlurb.gov.ph


REPRESENTACIÓN DEL TERRENOFuente: www.innovativegis.com


Fuente: webhelp.esri.comRESOLUCIÓN


RESOLUCIÓN (10 m)


RESOLUCIÓN (100 m)


RESOLUCIÓN (1000 m)


RESOLUCIÓN (10000 m)


RESOLUCIÓN


FUNDAMENTOS DEQUANTUM GIS + GRASS


ANTES DE EMPEZAR...Mueve la carpeta taller1 a C: (o acualquier otra ruta MUY corta),vamos a trabajar con el material quecontiene


QUANTUM GIS●Código abierto y uso gratuito●Comunidad de desarrollo muy activa:evoluciona muy rápido!●Interfaz gráfico muy intuitivo●Extensible mediante complementos


INTERFAZ GRÁFICO


INTEGRACIÓN CON OTROSPROGRAMAS


PREPARANDO LA SESIÓNConfiguración (puede cambiar con la versión) >Propiedades del proyecto●●●Ajuste del sistema de coordenadas delproyecto (EPSG 4326)Desactivar transformación de SRC al vueloUnidades de capaConfiguración > Opciones●Empezar siempre con EPSG 4326●Desactiva “Activar reproyección al vuelo por defecto”●Para capas nuevas, activa “Usar SRC del proyecto”


TRABAJO CON PUNTOSVisualización de tablas con coordenadasde puntos: puntos.csvSeleccionamos los puntos que estándentro de las variablesGuardamos el resultado comopuntos2.csv


Importar mapas ráster a la vista (elevacion.asc)●Escala de color (pseudocolor)● Transparencia● MetadatosTRABAJO CON RÁSTER●Zoom (ver celdas)●Visualiza el resto de mapas (hfp.asc, ndvi.asc)●Ponle escalas de color●¿Tienen los mapas la misma extensión yresolución?


QUANTUM GIS y GRASS●Quantum GIS no tiene mucha potencia paraprocesar raster (está mejorando!)●Pero tiene un complemento que lo conectacon GRASS que SÍ tiene la potencianecesaria●Complementos> Administrarcomplementos> GRASS, y OK●Complementos> GRASS


Quantum GIS y GRASS


QUANTUM GIS y GRASS


GISBASE, LOCATION Y MAPSET●GRASS guarda sus mapas en un árbol dedirectorios de 3 niveles●DIRGRASS (carpeta raíz)●●●LOCATION A (=”proyecto”)●●●PERMANENTmapset_a1mapset_a2LOCATION BLOCATION C


GISBASE, LOCATION Y MAPSET●DIRGRASS, carpeta de ruta corta y sinespacios para guardar todos nuestrosproyectos de GRASS.●LOCATION (nombre de una regióngeográfica), una carpeta que contiene datosde una zona, todos con el mismo sistemade referencia●MAPSET (nombre de un tema), carpetas paraorganizar mis datos dentro de la LOCATION


MI PRIMERA VEZ...CON GRASS• Vamos a crear una carpeta GISBASE:C:\taller1\intro_sig\dirgrass_prueba• Vamos a crear una Location llamada'piberica' (de 'Península Ibérica')– proyección = EPSG 4326– region = Spain• Creamos un mapset llamado 'variables'


IMPORTAMOS LOS MAPAS RÁSTER• Árbol de módulos> Administración dearchivos> Importa a GRASS> Importaráster a GRASS desde la vista deQGIS> Importar ráster cargado.• Importamos los tres mapas con susnombres iguales• Recargamos el Explorador, eliminamoslos mapas antiguos de la vista de Qgisy añadimos los nuevos


DOS CONCEPTOS CLAVES ENGRASS MUY ÚTILES PARAMODELOS DE DISTRIBUCIÓN:REGIÓN Y MÁSCARA


REGIÓN Y MÁSCARASon dos “herramientas” que nospermiten seleccionar con rapidez yexactitud:• la extensión del área de trabajo• la resolución espacial• las celdas raster a las que se aplicanlos cálculos


REGIÓN: MALLA VIRTUAL


REGIÓN: MALLA VIRTUAL


REGIÓN: MALLA VIRTUAL


REGIÓN• Determina:– Extensión del área de trabajo– Resolución• Se establece con: Configuración de laregión> g.region.multiple.raster• Ajústala al mapa 'elevacion'. A partir deahora, el resultado de cualquier operacióntendrá la misma resolución y extensiónque ese ráster


REGIÓN• Para ver las características de laregión: shell - Consola de GRASS– Teclea: g.region -p– La resolución es 0º 0' 30'' (~1 km)• Desde aquí podemos cambiar laresolución de la región:– Teclea: g.region -a res=0:05:00– La nueva resolución es ~10 km


REGIÓN• Exporta el mapa 'hfp': Administraciónde archivos> Exportar desde GRASS>Exportar ráster desde GRASS>r.out.arc (exporta a formato compatiblecon MaxEnt, OpenModeller y R!).• Guárdalo con el nombre 'hfp_10km.asc'• Abre este nuevo mapa en Qgis ycompáralo con 'elevacion'


REGIÓN• ATENCIÓN: para aplicar la resoluciónestablecida por la región, GRASS usacomo método de remuestreo el “vecinomás próximo”.• Es un buen método para hacer pruebas deforma rápida, pero no es el mejor métodode remuestreo para hacer un trabajo deproducción serio.


REGIÓN• Para cambiar “de verdad” la resolución del mapausamos Ráster> Desarrollar mapa> Cambiarresolución> r.resamp.stats– Entrada = hfp– Método = Average– Salida = hfp_nuevo• Ahora 'hfp_nuevo' es nuestro único mapa con laresolución 0:05:00• Borra hfp, y cambia el nombre de hfp_nuevo ahfp• Repite la operación con 'elevacion' y 'ndvi'


MÁSCARA• Siempre se nombra MASK• Delimita las celdas a las que se lesaplica cualquier cálculo en GRASS• Valor 1 para celdas válidas• Valor * (nulo) para celdas no válidas• Todas las operaciones ráster deGRASS buscan el mapa MASK, y siexiste, lo usan (excepto la importaciónde mapas)


MÁSCARA


REGION + MÁSCARA


REGION + MÁSCARA


MÁSCARA• La máscara, de forma ideal, debe tener valoresnulos para todas aquellas celdas en las que algunade las variables tiene valores nulos.• Para generar una máscara con estascaracterísticas, usaremos Ráster> Análisisespacial> Mapas de superposicion> r.series– marca “propagar nulos”– nombres: ndvi,hfp,elevacion (sin espacios!)– operación: count– mapa de salida: temporal


MÁSCARA• Las celdas de 'temporal' con valor 3 son las quenecesitamos.• Para transformar 'temporal' en el MASK final:Ráster> Análisis espacial> Máscara> r.mask– Mapa ráster...: temporal– Valores de categoría...: 3• El resultado no es un ráster, sino una reclasifiación(al vuelo) del mapa 'temporal'• Para generar MASK como un mapa ráster, en laterminal teclea:r.mapcalc MASK=MASK


MÁSCARA• Para comprobar que funciona, exporta a.asc los mapas hfp y ndvi, y visualízalos enQgis, y compáralos con los que tienes enGRASS• Ya sabes generar capas con la mismaextensión y resolución, tal y como lasquieren todos los programas de modelado!.• Y por eso GRASS es perfecto para trabajarcon modelos de distribución (por eso, y pormás cosas!)


PREPARACIÓN DEVARIABLES AMBIENTALES


DIRECTORIO DE TRABAJO• Vamos a trabajar en el directorio deGRASSC:\taller1\preparacion_variables\dirgrass_pi• Dentro tienes la localidad 'location_pi',que engloba la península ibérica a unaresolución aproximada de 10km• En el mapset 'variables' hay un buenconjunto de variables predictoras


VARIABLES• bio1 - bio19:variables bioclim• covbare, covherb ycovtree: % cobertura• hfp: human footprint• ndvi: índice devegetación• sunh: horas de sol• sunr: radiación solar• tdiv: diversidadtopográfica• telev: elevación• tslope: pendiente• *_av, *_mn, *_mx,*_ra: media, mínimo ,máximo y rango de lavariable


FUENTESTipo Dataset Sitio webClimate BIOCLIM http://www.worldclim.org/Topography SRTM http://www.glcf.umd.edu/data/srtm/VegetationindexVegetationstructureHumaninfluenceLand usesGIMMSMODISVCFHumanfootprintGLOBCOVERhttp://www.glcf.umd.edu/data/gimmhttp://www.glcf.umd.edu/data/vcf/http://www.wcs.org/humanfootprint/http://ionia1.esrin.esa.int/


EXPORTAMOS VARIABLES• Exportaremos todas las variables a .asc a unacarpeta llamadaC:\taller1\preparacion_variables\variables• El fichero 1_exporta.grass es un script para exportartodas las variables• Cópialo a C:• Abre “shell - Consola de GRASS” en el árbol demódulos• Teclea “cd C:\taller1\preparacion_variables”• Teclea “ls” y comprueba que el script está• Teclea “sh exporta.grass” y pulsa Enter


¿QUÉ ES R?• ¿Un programa para hacer análisis estadístico?• ¿Un lenguaje de programación?• ¿Un entorno para análisis y gráficos?


PERO...• No tiene interfaz gráfico (en realidad sí, perono vamos a verlos)• Requiere escribir código en una línea decomandos para trabajar con sus distintaslibrerías y funciones• Hay que leer mucha documentación paraentender como se utilizan las distintasfunciones


SIN EMBARGO...• Enorme cantidad de funcionalidades más allá dela estadística (ventaja, e inconveniente!)• Permite automatizar tareas de análisis de unaforma relativamente sencilla• Código abierto y gratuito• Se actualiza varias veces al año• Multiplataforma• Te obliga a aprender estadística!!


PRIMEROS PASOS CON R• Abre Notepad++ y R 2.14.2• Abre NppToR desde la bandeja del sistema y abre'settings'• En 'Pass line' pon F8 y pulsa save• Abre con Notepad++ el ficheroC:/taller1/intro_R/introduccion.R• Ahora, cada vez que selecciones una línea deintroduccion.R y pulses F8, esta se ejecutará en R


ANÁLISIS DE CORRELACIÓN DEVARIABLES PREDICTIVASCON R


ANÁLISIS DE CORRELACIÓN• Permite identificar variables redundantes• Si hay redundancia en una pareja devariables, descartamos una y retenemosla de interpretación biológica más sencilla• Qgis + GRASS no tiene las herramientasnecesarias para este análisis! (GRASS“alone” sí, pero eso es otra historia...)• R tiene todo lo necesario para un buenanálisis de correlación!


ANÁLISIS DE CORRELACIÓN• Vuelve a la carpetapreparacion_variables• Abre correlacion.R con Notepad++


ANÁLISIS DE CORRELACIÓN• Con el árbol de correlación a la vista:– Establecemos un umbral de distanciamínima (por ejemplo, 0.5)– De cada grupo de variables con elnodo por debajo de 0.5seleccionamos solo una variable (laque consideremos oportuna)– Existen varios conjuntos de variablescon baja correlación. Elige el tuyo!


VARIANCE INFLATION FACTOR• Se calcula en R con la función vif delpaquete HH• VIF = 1/(1-Ri^2)• Ri^2 es el R cuadrado de la regresiónde la variable i frente al resto de lasvariables• Si el VIFi > 5, la información contenidaen i ya está contenida en el resto depredictores, y podemos eliminar i


VARIABLES SELECCIONADAS• bio3• bio5• bio11• bio12• hfp• tdiv• covherb• ndvi_av• ndvi_ra• sunh_mn• sunh_mx• sunr_mx


ELIMINAMOS VARIABLES QUENO SIRVEN• En la carpeta 'variables' deja solo lasvariables seleccionadas (borra lasdemás)• Ya hemos terminado una parte muyimportante de la primera fase delproceso de modelado• Ahora, vamos a preparar unos registrosde presencia


PREPARACIÓN DEREGISTROS DE PRESENCIA


DESCARGA DATOS GBIF• Ve con el navegador web al portal de datos deGBIF: http://data.gbif.org• Busca 'Lynx pardinus'• Si no funciona, hay datos de presencia en lacarpeta “presencias_gbif”• Acepta los términos de uso• Explore > Occurrences


DESCARGA DATOS GBIF-Download > Spreadsheet of results-Format options: Comma separated values; Scientific name(interpreted); Latitude; Longitude; Coordinate precision-Download now, descomprime el fichero, y cambia elnombre del fichero de presencia a presencia.csv-Ábrelo con Calc (la hoja de cálculo de Libre Office),poniendo 'Tabulador' como separador (es MUYrecomendable cambiar la configuración de idioma a inglésUSA!!)-Vamos a eliminar todas las columnas menos 'Scientificname', 'Latitude', 'Longitude' y 'Coordinate precision'


DESCARGA DATOS GBIF-Fíjate en los valores de 'Coordinate precision'.¿Qué significan?-Ahora que lo sabes, y hemos visto que todosson iguales, puedes eliminar la columna-Finalmente vamos a guardar el resultado enformato MaxEnt (que también sirve para R).Este va a ser nuestro “estándar” particular defichero de presencias.


FORMATO OBJETIVO• nombre: presencia.csv• separado por comasSpecies,Long,LatLynx_pardinus,-6.58,36.98Lynx_pardinus,-6.36,36.97Lynx_pardinus,-3.84,36.82Lynx_pardinus,-3.84,36.91...


PREPARACIÓN DE PRESENCIASGBIFficheroimportarpresenciaseliminarduplicadosfiltrar porresoluciónreducirdensidadficheromaxentficheroopenmodellergenerarbackgroundgenerarpseudo-ausenciasgenerarausenciasguardarficheros


PREPARACIÓN DE PRESENCIASTrabajaremos con el scriptprepara_presencia.R


YA TENEMOS NUESTRASVARIABLES Y PRESENCIASLISTAS PARA JUGAR...MAÑANA!

More magazines by this user
Similar magazines