WHERE AND WHEN WHERE AND WHEN Dónde y Cuando Dónde y Cuando Calidad de datos Isabel Ortega Maqueda Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES Unidad de Coordinación GBIF-ES [email protected][email protected]-------------------------------------------------- -------------------------------------------------- --------- --------- Taller de calidad de datos en Bases de datos de Taller de calidad de datos en Bases de datos de Biodiversidad Biodiversidad Real Jardín Botánico de Madrid (España) Real Jardín Botánico de Madrid (España) 13-14 Septiembre 2007 13-14 Septiembre 2007 Basado Basado Chapman, A.D. and J. Wieczorek Chapman, A.D. and J. Wieczorek (eds). 2006. Guide to Best Practices for (eds). 2006. Guide to Best Practices for Georeferencing. GBIF Georeferencing. GBIF y Enrique Muñoz López, Juan Carlos Enrique Muñoz López, Juan Carlos Hernández Barrios y Javier Colin López Hernández Barrios y Javier Colin López , , 2004 2004 : Georreferenciación de localidades : Georreferenciación de localidades de colectas biológicas de la Conabio. de colectas biológicas de la Conabio.
35
Embed
WHERE AND WHEN Dónde y Cuando Calidad de datos Isabel Ortega Maqueda Unidad de Coordinación GBIF-ES ortega@gbif.es-----------------------------------------------------------
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
WHERE AND WHENWHERE AND WHEN
Dónde y CuandoDónde y Cuando
Calidad de datos
Isabel Ortega MaquedaIsabel Ortega MaquedaUnidad de Coordinación GBIF-ES Unidad de Coordinación GBIF-ES
Taller de calidad de datos en Bases de datos de BiodiversidadTaller de calidad de datos en Bases de datos de BiodiversidadReal Jardín Botánico de Madrid (España) Real Jardín Botánico de Madrid (España)
13-14 Septiembre 200713-14 Septiembre 2007Basado Basado Chapman, A.D. and J. Wieczorek (eds). 2006. Chapman, A.D. and J. Wieczorek (eds). 2006. Guide to Best Practices for Georeferencing. GBIF Guide to Best Practices for Georeferencing. GBIF yyEnrique Muñoz López, Juan Carlos Hernández Barrios y Enrique Muñoz López, Juan Carlos Hernández Barrios y Javier Colin LópezJavier Colin López, 2004, 2004: Georreferenciación de : Georreferenciación de localidades de colectas biológicas de la Conabio. localidades de colectas biológicas de la Conabio. Biodiversitas nº 54 Biodiversitas nº 54
Muchas colecciones históricas de museos y Muchas colecciones históricas de museos y herbarios tienen una información muy básica de la herbarios tienen una información muy básica de la localidad, y constituye un gran esfuerzo convertir localidad, y constituye un gran esfuerzo convertir estas descripciones a coordenadas geográficas. estas descripciones a coordenadas geográficas.
Esto se hace más notable si tenemos en cuenta que: Esto se hace más notable si tenemos en cuenta que:
– los los colectores en general carecían de mapas en general carecían de mapas detallados de la zona detallados de la zona
– que muchos nombres de localidades ya que muchos nombres de localidades ya no están en uso
– no aparecen en los mapas actuales ni en los actuales ni en los gaceteros publicadosgaceteros publicados
Georreferenciando...Georreferenciando... La La georreferenciación de localidades consiste de localidades consiste
en la asignación de coordenadas geográficas a en la asignación de coordenadas geográficas a partir de la descripción textual del lugar de partir de la descripción textual del lugar de recolección.recolección.
La La descripción de una localidad debe contener debe contener el mayor número de elementos geográficos que el mayor número de elementos geográficos que nos permita localizar con la mayor precisión nos permita localizar con la mayor precisión posible el sitio de recolección.posible el sitio de recolección.
Atomización de la localidadAtomización de la localidadUn posible estándar podría ser:
ESPAÑA. SEGOVIA: Basardilla, 2,5 Km. al SO por la Ctra. Sg-160, muy próximo al poblado de Don Toribio, en el cruce del puente sobre el río Pirón, 1470 m,
PaísProvinciaMunicipioLocalidad principalDistanciaDirecciónVía de accesoLocalidad de referenciaReferencia complementariaAltitudCoordenadasDatumIncertidumbre
Más campos de la base de datosMás campos de la base de datos
Otros datos que conviene añadir son:Otros datos que conviene añadir son:
- Estado de verificación de las coordenadas. de las coordenadas.- Fuente de referencia utilizada en la georreferenciación. utilizada en la georreferenciación.- Responsable de la georreferenciación. de la georreferenciación.- Fecha en la que ha sido georreferenciada. en la que ha sido georreferenciada.- Notas.
Es importante Es importante no perder la información original, sino sino añadir un nuevo registro con las coordenadas y los datos añadir un nuevo registro con las coordenadas y los datos calculados. Esto nos permite calculados. Esto nos permite enriquecer la base de datosenriquecer la base de datos y tener elementos de chequeo con la información original.y tener elementos de chequeo con la información original.
Método de RadiopuntoMétodo de RadiopuntoA partir de la descripción A partir de la descripción de la localidad obtenemos de la localidad obtenemos un par de coordenadas un par de coordenadas (x,y)(x,y) asociadas a una asociadas a una medida de longitud que medida de longitud que será su será su incertidumbre (i):incertidumbre (i):
Esta distancia define Esta distancia define el radio del área más probable en donde se en donde se encontraría el sitio de encontraría el sitio de recolección.recolección.
Cálculo de incertidumbresCálculo de incertidumbres
A. Extensión de la localidadB. Datum desconocidoC. Imprecisión en la medición de la distanciaD. Imprecisión en la medición de la direcciónE. Imprecisión en la toma de coordenadasF. Escala del mapa
La magnitud de la incertidumbre depende de la precisión con La magnitud de la incertidumbre depende de la precisión con
la que se ha descrito el sitio y depende de estas variablesla que se ha descrito el sitio y depende de estas variables::
Todos estos elementos se cuantifican de Todos estos elementos se cuantifican de manera individual para después sumar sus valores y obtener para después sumar sus valores y obtener un único valor de incertidumbre máxima.
Definir el procedimiento a seguirDefinir el procedimiento a seguir
1.1. OrganizaciónOrganización::
Definir los nir los estándares y métodos a utilizar.a utilizar.
Separar la informatización de la colección, la informatización de la colección, de la tarea de georreferenciación.
2.2. Depuración:Depuración:
Ordenar la base de datos usando el la base de datos usando el colector, la fecha de recolección y la localidad
Ver si hay registros de la si hay registros de la misma localidad georreferenciados y y validados.validados.
Excluir las localidades que no poseen elementos suficientes para las localidades que no poseen elementos suficientes para ser georreferenciadas y ser georreferenciadas y documentar este hecho.
Puente sobre el río Pirón, 4 Km. N de PeñarrubiaPuente sobre el río Pirón, 4 Km. N de Peñarrubia..
Cualquier localidad que se tome como referencia Cualquier localidad que se tome como referencia (población, río, valle) tiene una extensión determinada.(población, río, valle) tiene una extensión determinada.
La incertidumbre debida a la extensión es la distancia La incertidumbre debida a la extensión es la distancia máxima entre dos puntos dentro de la población. Si máxima entre dos puntos dentro de la población. Si conocemos que la referencia es el centro de la conocemos que la referencia es el centro de la población, la incertidumbre es generalmente la mitad población, la incertidumbre es generalmente la mitad del cálculo anterior. del cálculo anterior.
En colecciones históricas se debe tener en cuenta que En colecciones históricas se debe tener en cuenta que la extensión de la población ha cambiado con el tiempo.la extensión de la población ha cambiado con el tiempo.
Extensión de la localidadExtensión de la localidad
5 Km. al lago Vättern.5 Km. al lago Vättern.
Este tipo de localidades generan Este tipo de localidades generan una gran incertidumbre por la una gran incertidumbre por la falta de precisión en la dirección.falta de precisión en la dirección.
Las coordenadas 58.30N, Las coordenadas 58.30N, 14.56E marcan el centro del 14.56E marcan el centro del lago. lago.
La distancia del centro al punto La distancia del centro al punto más lejano es de 61.2 Km.más lejano es de 61.2 Km.
Máxima incertidumbre: 61.2 Km.Máxima incertidumbre: 61.2 Km.
Se denomina Se denomina Datum Datum a un conjunto de parámetros a un conjunto de parámetros cuyos valores, una vez definidos, permiten la cuyos valores, una vez definidos, permiten la referenciación precisa de localizaciones sobre la referenciación precisa de localizaciones sobre la superficie terrestre.superficie terrestre.
Aplicable a la cartografía o a las coordenadas Aplicable a la cartografía o a las coordenadas capturadas con GPS. capturadas con GPS.
La incertidumbre por no conocer el datum puede La incertidumbre por no conocer el datum puede variar de 0 a 500 m. En zonas concretas, 3.500 m.variar de 0 a 500 m. En zonas concretas, 3.500 m.
Si se conoce el datum, la incertidumbre es 0 Km.Si se conoce el datum, la incertidumbre es 0 Km.
Está definida por el grado de precisión con que se registra una distancia, con o sin decimales significativos
5.33 Km. NE de Conil, Cádiz
Si se han registrado fracciones, estas han podido ser interpretadas a la hora de grabarlas en la base de datos. Ej. 1 y ¾ E de Grazalema se habrá grabado como 1.75 Km. E de Grazalema. El recolector ha grabado la distancia con una precisión de ¼.
C - C - Imprecisión en la medición de la distanciaImprecisión en la medición de la distancia
Depende de cómo se especifique Depende de cómo se especifique la dirección de la descripción de la de la descripción de la localidad (localidad (Offset-> -> Desvío o desplazamiento) o desplazamiento)
Es importante registrar si la distancia se toma “Es importante registrar si la distancia se toma “por carretera” o “por aire” (en línea recta y sin tener en cuenta el relieve).” (en línea recta y sin tener en cuenta el relieve).
A 9.5 Km. SE de Belmonte (A 9.5 Km. SE de Belmonte (por carreterapor carretera))
E - E - Imprecisión en la toma de coordenadasImprecisión en la toma de coordenadas
Definida por el nivel de precisión con el que fueron Definida por el nivel de precisión con el que fueron registradas un par de coordenadas: registradas un par de coordenadas: Incluir siempre el mayor número de decimales posible. posible.
42.51830 N, 10.45673 E 42.51830 N, 10.45673 E Incertidumbre: 2 mIncertidumbre: 2 m
Debemos Debemos registrar siempre el siempre el Datum.. Chapman y Wieczorek recomiendan el sistema de Chapman y Wieczorek recomiendan el sistema de
coordenadas decimales y registrar y registrar hasta 5 decimales. Si usamos Si usamos UTM, siempre debemos registrar la Zona., siempre debemos registrar la Zona.
El nivel de precisión de El nivel de precisión de la utilización de un la utilización de un mapa está definido por mapa está definido por su su escala..
En el ejemplo, precisión En el ejemplo, precisión asociada a una línea de asociada a una línea de 0.5 mm.0.5 mm.
Testeo de las coordenadasTesteo de las coordenadas
Chequear la localidad contra Chequear la localidad contra localidades ya existentes y validadas en la base de datos. y validadas en la base de datos.
Chequear contra una Chequear contra una referencia externa: ¿es la : ¿es la localidad coherente con las localidades de localidad coherente con las localidades de recolección del colector?recolección del colector?
Chequear contra una referencia externa usando un Chequear contra una referencia externa usando un GIS: ¿se sitúa la localidad en tierra o en el mar?: ¿se sitúa la localidad en tierra o en el mar?
Chequear los puntos que quedan Chequear los puntos que quedan fuera de los límites del espacio geográfico.
Chequear los puntos que quedan Chequear los puntos que quedan fuera de los límites en el espacio medioambiental.
Testeo de las coordenadas ya asignadas:Testeo de las coordenadas ya asignadas:
WHEN...WHEN...Es importante registrar la Es importante registrar la fecha de captura, recolección , recolección u observación del especimen. La fecha está muy ligada u observación del especimen. La fecha está muy ligada al proceso de georreferenciación. La información al proceso de georreferenciación. La información proporcionada es de gran utilidad para determinar proporcionada es de gran utilidad para determinar otros valores de la base de datos: de la base de datos:
Ordenar los registros por los registros por Colector y y Fecha permitirá permitirá detectar las detectar las localidades improbableslocalidades improbables para ese colector en para ese colector en ese día. ese día.
Ejemplo: en 1910 las comunicaciones eran lentas y en un día no se podían recorrer grandes distancias. Dos localidades muy separadas con el mismo día y el mismo colector se considerarían erróneas.
Con Con localidades históricas, la fecha permitirá investigar , la fecha permitirá investigar cual es el nombre actual y podremos acceder a mapas cual es el nombre actual y podremos acceder a mapas datados en aquella época para georreferenciarlas.datados en aquella época para georreferenciarlas.
Cuándo??Cuándo?? El El año de recolección en las colecciones en las colecciones históricas
permite conocer los cambios que han podido sufrir permite conocer los cambios que han podido sufrir países (fronteras), ciudades (extensión), carreteras países (fronteras), ciudades (extensión), carreteras (cambios de trazado), cauces de río, etc. a lo largo del (cambios de trazado), cauces de río, etc. a lo largo del tiempo, importante a la hora de calcular tiempo, importante a la hora de calcular incertidumbre de la localidad.
Los historiadores han llevado a cabo recientes Los historiadores han llevado a cabo recientes desarrollos de desarrollos de itinerarios de colectores según la según la información de la información de la localidad y la fecha. Son muy útiles a . Son muy útiles a la hora de detectar errores en otros registros de ese la hora de detectar errores en otros registros de ese colector.colector.
Registrar la hora del día puede ser útil para futuros del día puede ser útil para futuros estudios (fauna).estudios (fauna).