Darwin Core - Instituto Nacional de Biodiversidad
Darwin Core - Instituto Nacional de Biodiversidad
Darwin Core - Instituto Nacional de Biodiversidad
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
De cómo los archivos<br />
<strong>Darwin</strong> <strong>Core</strong> han<br />
cambiado el panorama <strong>de</strong><br />
la publicación <strong>de</strong> datos <strong>de</strong><br />
biodiversidad<br />
Manuel Vargas,<br />
<strong>Instituto</strong> <strong>Nacional</strong> <strong>de</strong> <strong>Biodiversidad</strong> (INBio), Costa Rica
•Resumen<br />
•Esta presentación ofrece una perspectiva general <strong>de</strong> los nuevos<br />
métodos <strong>de</strong> publicación <strong>de</strong> datos <strong>de</strong> biodiversidad basados en<br />
estándares y protocolos <strong>de</strong>sarrollados por organizaciones como TDWG<br />
(Biodiversity Information Standards) y GBIF (Global Biodiversity<br />
Information Facility).<br />
Es una traducción <strong>de</strong> la que presentación que fue preparada<br />
originalmente en inglés por GBIF para su reunión anual <strong>de</strong> nodos en<br />
2011 en Buenos Aires, Argentina, y traducida por el personal <strong>de</strong>l INBio<br />
(<strong>Instituto</strong> <strong>Nacional</strong> <strong>de</strong> <strong>Biodiversidad</strong> <strong>de</strong> Costa Rica) para las sesiones en<br />
español <strong>de</strong> ese mismo evento. Ambos documentos pue<strong>de</strong>n<br />
encontrarse en http://www.gbif.org/orc. Posteriormente fue adaptada<br />
para la tutoría Costa Rica-Chile, en febrero y marzo <strong>de</strong> 2012.
Contexto: Intercabio <strong>de</strong> datos<br />
ABCD (Estándar TDWG)<br />
• > 1200 conceptos<br />
• XML<br />
• Utilizado en BioCASE y TapirLink<br />
<strong>Darwin</strong> <strong>Core</strong> (pre-estándard v. 1.2, 47 versiones distintas)<br />
• 48 conceptos, especímenes<br />
• XML<br />
• Utilizado en DiGIR<br />
<strong>Darwin</strong> <strong>Core</strong> (pre-estándard v. 1.4)<br />
• 46 conceptos (mas extensiones), especímenes<br />
• XML<br />
• Utilizado en TapirLink<br />
<strong>Darwin</strong> <strong>Core</strong> (Estándar TDWG )<br />
• 172 conceptos (156 presentes en el “<strong>Darwin</strong> <strong>Core</strong> Simple”),<br />
información <strong>de</strong> biodiversidad.<br />
• CSV, XML, RDF, JSON, …<br />
• Utilizado en texto plano, TapirLink, Archivos <strong>Darwin</strong> <strong>Core</strong>…
Archivo <strong>Darwin</strong> <strong>Core</strong><br />
Datos primarios<br />
<strong>de</strong> biodiversidad<br />
Datos<br />
taxonómicos<br />
http://www.someplace.org/data.zip<br />
Metadatos
Archivo <strong>Darwin</strong> <strong>Core</strong><br />
Paquete completo<br />
• Términos <strong>Darwin</strong> <strong>Core</strong> estándar para un recurso <strong>de</strong> datos en un<br />
solo archivo zip.<br />
• Registros taxonómicos o registros <strong>de</strong> occurrencias<br />
• Metadatos <strong>de</strong>l recurso <strong>de</strong> datos en EML
Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />
Beneficios<br />
• Formato simple (Archivos <strong>de</strong> texto plano)<br />
• Recolección eficiente (un solo archivo)<br />
• Almacenamiento eficiente (compreso)<br />
• Fácil acceso (sin software especializado)<br />
• Extensible (Archivos relacionados en un<br />
zip)<br />
Formato recomendado para<br />
publicar datos en GBIF
Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />
Anatomía<br />
DwC-A tienen un archivo <strong>de</strong> metadatos en<br />
formato EML
Lenguage para Metadatos<br />
Ecológicos (EML)<br />
Para <strong>de</strong>scribir recursos <strong>de</strong> datos<br />
Incluso si no estan publicados.<br />
• Título y resumen (Abstract)<br />
• Cita y Atrabución<br />
• Contactos y Autores<br />
• Alcance geográfico<br />
• Métodos <strong>de</strong> muestreo.<br />
• Bibliografía<br />
• Y mucho más…
Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />
Anatomía<br />
Archivos siempre tienen un archivo central en<br />
formato <strong>de</strong> texto plano
Tipos <strong>de</strong> archivos centrales<br />
Registros basados en información taxonómica<br />
– una especie por registro.<br />
Ó<br />
Registros basados en información <strong>de</strong> occurencies<br />
– úna occurrencia por registro.
Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />
Anatomía<br />
DwC-A always have a core data file as text
Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />
Anatomía<br />
El principal contiene una columna “ID”,<br />
única para cada registro en el archivo.
Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />
Anatomía<br />
Las columnas estan mapeadas a<br />
Términos <strong>Darwin</strong> <strong>Core</strong>
Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />
Anatomía<br />
Columnas que no estan mapeadas a un<br />
término <strong>Darwin</strong> <strong>Core</strong> pue<strong>de</strong>n incluirse,<br />
pero son ignoradas<br />
“Wingspan” no es un<br />
término <strong>Darwin</strong> <strong>Core</strong>
Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />
Anatomía<br />
Dos formas <strong>de</strong> mapear términos<br />
<strong>Darwin</strong> <strong>Core</strong> a las columnas<br />
1) Renombrar los encabezados <strong>de</strong> las<br />
columnas en el archivo
Archivos <strong>Darwin</strong> <strong>Core</strong>:<br />
Anatomía<br />
Dos formas <strong>de</strong> mapear términos<br />
<strong>Darwin</strong> <strong>Core</strong> a las columnas<br />
2) Mapear las columnas a los<br />
términos en un archivo meta.xml
Archivos <strong>Darwin</strong> <strong>Core</strong>:<br />
Anatomía<br />
meta.xml mapea las columnas en el archivo <strong>de</strong><br />
datos principal (species.txt)<br />
Más <strong>de</strong> como crear un archivo meta.xml<br />
en las pesentaciónes veni<strong>de</strong>ras…
Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />
Anatomía<br />
DwC-A pue<strong>de</strong> incluir archivos <strong>de</strong><br />
extensión<br />
Species.txt<br />
Se relaciona al principal por medio <strong>de</strong>l “ID”<br />
Common_names.txt<br />
Extenciones permiten que varios registros esten vínculados al registro principal
GBIF: extensiones <strong>de</strong>finidas<br />
http://rs.gbif.org/extension/
Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />
Anatomía<br />
Varias extensiones pue<strong>de</strong>n estar<br />
ligadas al principal
Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />
Anatomía<br />
Todos los archivos se almacenan<br />
en una sola carpeta
Archivos <strong>Darwin</strong> <strong>Core</strong>:<br />
• Archivos <strong>de</strong> datos.<br />
• Archivo meta.xml<br />
• Metadatos.<br />
Anatomía<br />
Se comprime la carpeta.<br />
Esto es un DwC-A
Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />
Publicación<br />
http://www.organisation.org /my_data.zip<br />
DwC-A en un servidor web pue<strong>de</strong>n<br />
ser accedidos por un URL.<br />
Comparta este URL para “publicar” su información
Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />
Opciones para publicar
GBIF: Plantillas para<br />
hojas <strong>de</strong> cálculo
IPT
Centros para alojamiento <strong>de</strong> datos (Hosting)
Asistente para mapeo<br />
<strong>Darwin</strong> <strong>Core</strong><br />
http://tools.gbif.org/dwca-assistant/<br />
Meta-archivo
Asistente para mapeo <strong>Darwin</strong> <strong>Core</strong>
Archivo <strong>Darwin</strong> <strong>Core</strong>:<br />
Opciones para publicación<br />
• GBIF: Plantillas para hojas <strong>de</strong> calculo :<br />
• La información ya esta en una hoja <strong>de</strong> cálculo.<br />
• Creación <strong>de</strong> archivos se simplifíca.<br />
• IPT:<br />
• Crear/administrar varios DwC-A para varios recursos <strong>de</strong> datos.<br />
• Administra DwC-A para multiples organisaciones.<br />
• Los metadatos van <strong>de</strong>acuerdo al Perfil <strong>de</strong> metadatos EML <strong>de</strong> GBIF.<br />
• Creado por usted mismo:<br />
• Permite automatizar la generación <strong>de</strong> los DwC-A<br />
• Personalización.<br />
• Hosting center:<br />
• Economía <strong>de</strong> escala.<br />
• Infraestructura y soporte.<br />
• Combinaciones…