18.05.2013 Views

Darwin Core - Instituto Nacional de Biodiversidad

Darwin Core - Instituto Nacional de Biodiversidad

Darwin Core - Instituto Nacional de Biodiversidad

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

De cómo los archivos<br />

<strong>Darwin</strong> <strong>Core</strong> han<br />

cambiado el panorama <strong>de</strong><br />

la publicación <strong>de</strong> datos <strong>de</strong><br />

biodiversidad<br />

Manuel Vargas,<br />

<strong>Instituto</strong> <strong>Nacional</strong> <strong>de</strong> <strong>Biodiversidad</strong> (INBio), Costa Rica


•Resumen<br />

•Esta presentación ofrece una perspectiva general <strong>de</strong> los nuevos<br />

métodos <strong>de</strong> publicación <strong>de</strong> datos <strong>de</strong> biodiversidad basados en<br />

estándares y protocolos <strong>de</strong>sarrollados por organizaciones como TDWG<br />

(Biodiversity Information Standards) y GBIF (Global Biodiversity<br />

Information Facility).<br />

Es una traducción <strong>de</strong> la que presentación que fue preparada<br />

originalmente en inglés por GBIF para su reunión anual <strong>de</strong> nodos en<br />

2011 en Buenos Aires, Argentina, y traducida por el personal <strong>de</strong>l INBio<br />

(<strong>Instituto</strong> <strong>Nacional</strong> <strong>de</strong> <strong>Biodiversidad</strong> <strong>de</strong> Costa Rica) para las sesiones en<br />

español <strong>de</strong> ese mismo evento. Ambos documentos pue<strong>de</strong>n<br />

encontrarse en http://www.gbif.org/orc. Posteriormente fue adaptada<br />

para la tutoría Costa Rica-Chile, en febrero y marzo <strong>de</strong> 2012.


Contexto: Intercabio <strong>de</strong> datos<br />

ABCD (Estándar TDWG)<br />

• > 1200 conceptos<br />

• XML<br />

• Utilizado en BioCASE y TapirLink<br />

<strong>Darwin</strong> <strong>Core</strong> (pre-estándard v. 1.2, 47 versiones distintas)<br />

• 48 conceptos, especímenes<br />

• XML<br />

• Utilizado en DiGIR<br />

<strong>Darwin</strong> <strong>Core</strong> (pre-estándard v. 1.4)<br />

• 46 conceptos (mas extensiones), especímenes<br />

• XML<br />

• Utilizado en TapirLink<br />

<strong>Darwin</strong> <strong>Core</strong> (Estándar TDWG )<br />

• 172 conceptos (156 presentes en el “<strong>Darwin</strong> <strong>Core</strong> Simple”),<br />

información <strong>de</strong> biodiversidad.<br />

• CSV, XML, RDF, JSON, …<br />

• Utilizado en texto plano, TapirLink, Archivos <strong>Darwin</strong> <strong>Core</strong>…


Archivo <strong>Darwin</strong> <strong>Core</strong><br />

Datos primarios<br />

<strong>de</strong> biodiversidad<br />

Datos<br />

taxonómicos<br />

http://www.someplace.org/data.zip<br />

Metadatos


Archivo <strong>Darwin</strong> <strong>Core</strong><br />

Paquete completo<br />

• Términos <strong>Darwin</strong> <strong>Core</strong> estándar para un recurso <strong>de</strong> datos en un<br />

solo archivo zip.<br />

• Registros taxonómicos o registros <strong>de</strong> occurrencias<br />

• Metadatos <strong>de</strong>l recurso <strong>de</strong> datos en EML


Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />

Beneficios<br />

• Formato simple (Archivos <strong>de</strong> texto plano)<br />

• Recolección eficiente (un solo archivo)<br />

• Almacenamiento eficiente (compreso)<br />

• Fácil acceso (sin software especializado)<br />

• Extensible (Archivos relacionados en un<br />

zip)<br />

Formato recomendado para<br />

publicar datos en GBIF


Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />

Anatomía<br />

DwC-A tienen un archivo <strong>de</strong> metadatos en<br />

formato EML


Lenguage para Metadatos<br />

Ecológicos (EML)<br />

Para <strong>de</strong>scribir recursos <strong>de</strong> datos<br />

Incluso si no estan publicados.<br />

• Título y resumen (Abstract)<br />

• Cita y Atrabución<br />

• Contactos y Autores<br />

• Alcance geográfico<br />

• Métodos <strong>de</strong> muestreo.<br />

• Bibliografía<br />

• Y mucho más…


Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />

Anatomía<br />

Archivos siempre tienen un archivo central en<br />

formato <strong>de</strong> texto plano


Tipos <strong>de</strong> archivos centrales<br />

Registros basados en información taxonómica<br />

– una especie por registro.<br />

Ó<br />

Registros basados en información <strong>de</strong> occurencies<br />

– úna occurrencia por registro.


Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />

Anatomía<br />

DwC-A always have a core data file as text


Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />

Anatomía<br />

El principal contiene una columna “ID”,<br />

única para cada registro en el archivo.


Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />

Anatomía<br />

Las columnas estan mapeadas a<br />

Términos <strong>Darwin</strong> <strong>Core</strong>


Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />

Anatomía<br />

Columnas que no estan mapeadas a un<br />

término <strong>Darwin</strong> <strong>Core</strong> pue<strong>de</strong>n incluirse,<br />

pero son ignoradas<br />

“Wingspan” no es un<br />

término <strong>Darwin</strong> <strong>Core</strong>


Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />

Anatomía<br />

Dos formas <strong>de</strong> mapear términos<br />

<strong>Darwin</strong> <strong>Core</strong> a las columnas<br />

1) Renombrar los encabezados <strong>de</strong> las<br />

columnas en el archivo


Archivos <strong>Darwin</strong> <strong>Core</strong>:<br />

Anatomía<br />

Dos formas <strong>de</strong> mapear términos<br />

<strong>Darwin</strong> <strong>Core</strong> a las columnas<br />

2) Mapear las columnas a los<br />

términos en un archivo meta.xml


Archivos <strong>Darwin</strong> <strong>Core</strong>:<br />

Anatomía<br />

meta.xml mapea las columnas en el archivo <strong>de</strong><br />

datos principal (species.txt)<br />

Más <strong>de</strong> como crear un archivo meta.xml<br />

en las pesentaciónes veni<strong>de</strong>ras…


Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />

Anatomía<br />

DwC-A pue<strong>de</strong> incluir archivos <strong>de</strong><br />

extensión<br />

Species.txt<br />

Se relaciona al principal por medio <strong>de</strong>l “ID”<br />

Common_names.txt<br />

Extenciones permiten que varios registros esten vínculados al registro principal


GBIF: extensiones <strong>de</strong>finidas<br />

http://rs.gbif.org/extension/


Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />

Anatomía<br />

Varias extensiones pue<strong>de</strong>n estar<br />

ligadas al principal


Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />

Anatomía<br />

Todos los archivos se almacenan<br />

en una sola carpeta


Archivos <strong>Darwin</strong> <strong>Core</strong>:<br />

• Archivos <strong>de</strong> datos.<br />

• Archivo meta.xml<br />

• Metadatos.<br />

Anatomía<br />

Se comprime la carpeta.<br />

Esto es un DwC-A


Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />

Publicación<br />

http://www.organisation.org /my_data.zip<br />

DwC-A en un servidor web pue<strong>de</strong>n<br />

ser accedidos por un URL.<br />

Comparta este URL para “publicar” su información


Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />

Opciones para publicar


GBIF: Plantillas para<br />

hojas <strong>de</strong> cálculo


IPT


Centros para alojamiento <strong>de</strong> datos (Hosting)


Asistente para mapeo<br />

<strong>Darwin</strong> <strong>Core</strong><br />

http://tools.gbif.org/dwca-assistant/<br />

Meta-archivo


Asistente para mapeo <strong>Darwin</strong> <strong>Core</strong>


Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />

Opciones para publicación<br />

• GBIF: Plantillas para hojas <strong>de</strong> calculo :<br />

• La información ya esta en una hoja <strong>de</strong> cálculo.<br />

• Creación <strong>de</strong> archivos se simplifíca.<br />

• IPT:<br />

• Crear/administrar varios DwC-A para varios recursos <strong>de</strong> datos.<br />

• Administra DwC-A para multiples organisaciones.<br />

• Los metadatos van <strong>de</strong>acuerdo al Perfil <strong>de</strong> metadatos EML <strong>de</strong> GBIF.<br />

• Creado por usted mismo:<br />

• Permite automatizar la generación <strong>de</strong> los DwC-A<br />

• Personalización.<br />

• Hosting center:<br />

• Economía <strong>de</strong> escala.<br />

• Infraestructura y soporte.<br />

• Combinaciones…

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!