Top Banner
Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006 WWW.GBIF.ORG A tecnologia da Informação e o GBIF
32

Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Mar 07, 2015

Download

Documents

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

GLOBALBIODIVERSITYINFORMATIONFACILITY

Francisco Pando

Data Digitalization Workshop

Braga, 5 a 7 de Julho, 2006

WWW.GBIF.ORG

A tecnologia da Informação e o GBIF

Page 2: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Sumario

Objetivo y visión de GBIF

Red de datos

Esquemas de datos

Puntos y nombres

Protocolos

Registro de bases de datos

Portales

Estrategias, opciones e implementaciones para compartir datos

Page 3: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Objetivo de GBIF

GBIF se propone hacer accesible por Internet toda la información disponible sobre los organismos vivos conocidos a nivel mundial

Otra manera de verlo; se propone cambiar la cultura de “mi dato es mio, mira mis resultados” (en ciencia y en gestión)

“datos de todos para todos”

Page 4: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Modelo de datos: redes centralizadasModelo de datos: redes centralizadas

Page 5: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Red de datos distribuidosRed de datos distribuidos

Col 1

Col 2

Col 3

Col 4

Col 5

programa

buscar

interface

Win2000Brahms

LinuxMySQL

Win98Access

Win98biota FreeeBSD

PostgreSQL

Communication Protocol

Data Model

Figure 4. Diagram showing the complexity of integrating data from biological collections

Page 6: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Los elementos de la redLos elementos de la red

Figure 5. GBIF Network: major classes of nodesGBIF is responsible for running the network, establishing standards, and developing tools. The portal is the hub for the development of any service that must be centralized such as the registry of metadata and for serving data from the biodiversity data index to the end user.

Page 7: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Más en detalleMás en detalle

ProtocolProviderPortalRegistry

Page 8: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Tecnologias usadasTecnologias usadas• XML data exchange based on Providers, Services and Biodiversity Data Records

• UDDI registry for technical (access) metadata

• Descriptive metadata retrieved through service interfaces

• Specimen/observation exchange using DiGIR-Darwin Core or BioCASE-ABCD

• Taxonomic name data from Catalogue of Life (annual checklist for first release, moving to service-based approach as possible)

• Java (and JSP) components being developed centrally for GBIF Portal

• Current portal development using Tomcat, Xerces, Log4J, MySQL

• Components to be packaged for reuse as appropriate

Page 9: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Mapeo de datosMapeo de datos

Portal

ProfileSchema

Data Provider System

Data

DiGIRProvider

Data MapSchema

Data Provider System

Data

DiGIRProvider

Data MapSchema

Page 10: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Esquemas datosEsquemas datos

Darwin Core Sencillo (50 elementos) La unidad es el registro 500 bases de datos www.gbif.net

ABCD Contenido elaborado y detallado (+500

elementos) La unidad es el archivo 170 bases de datos en www.gbif.net

Page 11: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

La base para el acceso unificado:

La base para el acceso unificado: Perfil común:

Cada base de datos se traduce a un “perfil común”, que es una tabla con una lista estandarizada de campos que se pueden consultar de manara uniforme

Estándares: ”Darwin Core” ABCD Schema www.tdwg.org

Page 12: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Darwin Core, desarrollos en cursoDarwin Core, desarrollos en curso Soporte para imágenes

Extensiones

Page 13: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Darwin Core, extensionesDarwin Core, extensiones

Page 14: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Integración de nombres y especímenesIntegración de nombres y especímenes

Page 15: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

ProtocolosProtocolos

DIGIR para Darwin Core

Biocase para ABCD

Page 16: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Vida despues de DIGIRVida despues de DIGIR

TAPIR http://www.gbif.org/News/NEWS1129877273 http://ww3.bgbm.org/protocolwiki/ Unificar protocolos de la red de datos de

GBIF Expansión del registro (UDDI), soporte

para redes temáticas, portales nacionales, extensiones de Darwin core

Toolkit para portales de datos en desarrollo

Page 17: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

RegistroRegistroA tener en cuenta:

•Un nombre caracteristico•Una descrición que oriente al usuario•Condiciones de uso adicionales•Como citar el uso de este recurso

Page 18: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Portales de GBIFPortales de GBIF

Portal actual (prototipo) Portal para nodos Nuevo portal (en desarrollo)

Page 19: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Portal actual (prototipo)Portal actual (prototipo)

Search only by scientific or vernacular names (optional country filter)

Page 20: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Portal actual (prototipo)Portal actual (prototipo)

Data resources with specimens or observations

Occurrence Detail

Download records

Georeferenced recordsCountries from which

species is recorded

Page 21: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Portal para NodosPortal para Nodos

En desarrollo Para que los nodos puedan servir:

Datos de las colecciones de su ámbito (país)

Datos relevantes para su ámbito Adaptable a sus necesidades (idioma,

nombres comunes,…) Proporcionar una ayuda para que los

nodos puedan servir a sus comunidades

Page 22: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Nuevo portalNuevo portal

Estilo www.biologybrowser.com Web services API interfaz Servicios añadidos de indexado y

validación

Page 23: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Torres & Pando 2nd ENBI Forums 2005

23Data resources

Resource crawler

Interpretation and validation

Data despatcher

Synchronised data stores

Web applications

Mirrored access

Clients

Portalarchitecture(new versionD. Hobern)

Page 24: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

¿Más o menos claro?¿Más o menos claro?

ProtocolProviderPortalRegistry

Page 25: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Estandares para la integración de datos y la iinteroperabilidad

Estandares para la integración de datos y la iinteroperabilidad

http://www.tdwg.org/standrds.html

Page 26: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

Apoyo técnico: [email protected]

”Turn-key package”

Basado en PHP y código del proyecto DiGIR

Para Linux y Windows

Registro con el UDDI del GBIF

Page 27: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

De las bases de datos al acceso via InternetDe las bases de datos al acceso via Internet

¿De quien son esos datos?

¿Todo, todo?

¿Como de limpio?

¿Como?

Page 28: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

¿De quien son esos datos?¿De quien son esos datos?

Page 29: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

¿Todo, todo?¿Todo, todo?

El proveedor de los datos retiene el control sobre lo que hace accesible: Hace pruebas Decide diluir la precisión de registros

de especies amenazadas o de datos de interés económico

No hace pública los datos de investigaciones en curso

Page 30: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

¿Como de limpio?¿Como de limpio?

La perfección no existe El dato malo tampoco; un dato no es

bueno o malo intrínsicamente, sino que su bondad depende del uso

Hacer los datos públicos ayuda a su mejoramiento

Hay herramientas para mejorar los datos y GBIF estatrabajando en esto:

http://www.secretariat.gbif.net/datatester/index.jsphttp://www.gbif.org/prog/digit/data_quality

Page 31: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

¿Como?¿Como?

Distribuído Centralizado

ParticipantPortal A

ParticipantPortal C

Data Warehouse

ParticipantPortal B

Data Warehouse

GBIFPortal

GBIFRegistry

GBIFIndex

Page 32: Global Biodiversity Information Facility GLOBAL BIODIVERSITY INFORMATION FACILITY Francisco Pando Data Digitalization Workshop Braga, 5 a 7 de Julho, 2006.

Global Biodiversity Information Facility

A vuestra disposición:A vuestra disposición:

Francisco Pando

Nodes Liaison Officer

GBIF Secretariat

Universitetsparken 15

2100 Kobenhavn, Dinamarca

[email protected]

Tél.: + 45 35 32 1470

Fax: + 45 35 32 1480