Aurelio Sanabria (asanabria@inbio.ac.cr) Analista/Desarrollador de software INBio, Costa Rica Buenos Aires (Argentina) 28 de setiembre de 2011 Curso capacitación.

Post on 29-Jan-2016

213 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

Transcript

Aurelio Sanabria (asanabria@inbio.ac.cr)Analista/Desarrollador de softwareINBio, Costa Rica

Buenos Aires (Argentina)28 de setiembre de 2011

Curso capacitación sobre publicación de datos de biodiversidad y fitness-for-use en la Red GBIF.Edición 2011

Introducción a las nuevas opciones para publicar datos de biodiversidad.

Opciones para publicar datos

Glosario

Data Publisher / Data ProviderData Resource / Data setData resource type (e.g., Metadata,

Occurrence, Taxon)Data recordData record element, term, field, column,

property, attribute, concept (e.g., basisOfRecord, scientificName)

Data valueEstándares, Vocabularios

Proveedores de datos

Instituciones con varias unidades organizacionales, cada una con múltiples recursos de datos.

Instituciones, grupos o individuos con varios recursos de datos.

Instituciones o individuos con un solo recurso de datos. (data set).

Tipos de recursos de datos

Datos primarios de biodiversidad (Especímenes, Observaciones, ecología)

• El tipo de datos principal es la occurencia de un organismo.

Catálogos taxonómicos*, y Checklist de especies

• El tipo de datos principal es un Taxon

* Para distingir nuestros esfuersos de los del Catálogo de la vida – GBIF únicamente provee los medios.

Metadatos enriquecidos – Principalmente enfocado en recursos de datos de Occurencias y Taxones.

Registros de datos

Recurso de datos tipo: Taxon

Recurso de datos tipo: Occurrencia

Campos de datos

Recurso de datos tipo: Taxon

Recurso de datos tipo: Occurrencia

Valores de los datos

Recurso de datos tipo: Taxon

Recurso de datos tipo: Occurrencia

Estándares para datos

Datos primarios deBiodiversidad

Datos taxonómicos

Darwin Core

• 172 Términos• Ratificado en el 2009• Archivos de texto• Extensible

Metadatos

Lenguage para metadatos ecológicos (EML)

• Descripciones de recursos de datos• GBIF Profile

Opciones para publicar datos

Opciones para publicar datos

Si TAPIR permite 1000 registros por solicitud.

Para transferir un recurso de datos de 260 000 registros:• 260 solicitudes / Tranferencia total de datos 500MB.• Duración de la recolección: 2 horas.• De esos 500 MB solo 32MB de los datos tranferidos son

"utilizados".

Ejemplo: Tapir

Opciones para publicar datos

Para tranferir un recurso de datos de 260 000 registros:• 1 solicitud / Transferencia total de datos: 3MB.• Duración de la recolección: de minutos a segundos.

Ejemplo: Archivo Darwin Core

ArchivoDarwin Core

Ejemplo: Archivo Darwin Core

ArchivoDarwin Core

Comparado a Tapir/DiGIR/BioCASE:• 260 solicitudes / Transferencia total de datos: 500MB.• Duración de la recolección: 2 horas.

Para tranferir un recurso de datos de 260 000 registros:• 1 solicitud / Transferencia total de datos: 3MB.• Duración de la recolección: de minutos a segundos.

• Utiliza un formato simple (texto plano)

• Almacenamiento eficiente (compressed)

• Recolección eficiente (un archivo)

• Fácil acceso (Sin software especializado)

• Extensible (varios archivos en un solo zip)

Archivos Darwin Core:Beneficios

Este es el formato recomendadopara publicar datos en GBIF

Encontrado los datos

El registro de GBIF

GBIF: Portal de datos

GBIF: Centro de recursos en línea(http://www.gbif.org/orc/)

Bibliografía

Aurelio Sanabria (asanabria@inbio.ac.cr)Analista/Desarrollador de softwareINBio, Costa Rica

Buenos Aires (Argentina)28 de setiembre de 2011

Training course on biodiversity data publishing and fitness-for-use in the GBIF Network, 2011 edition

Introducción a las nuevas opciones para publicar datos de biodiversidad.

top related