Page 1
Material del curso sobre Tecnologías Semánticas en la Web de Datos
red.es, 29/11/2012
Ontology Engineering Group
Asunción Gómez-‐Pérez, Oscar Corcho García
Licencia de uso: Creative Commons Attribution-‐NonCommercial-‐ShareAlike 3.0 Unported (CC BY-‐NC-‐SA 3.0)
Más información sobre cursos disponible en: http://cursos.oeg-‐upm.net/
Page 2
26/11/12
1
Tecnologías Semánticas en la Web de datos
Asunción Gómez-Pérez, Oscar Corcho Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid http://www.oeg-upm.net
[email protected]
Agradecimientos: Garijo, D. Vila, L.Vilches, B. Villazón
Curso en Red.es. 29 de Noviembre de 2012
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Indice
1. Web de Linked Data: Conceptos Básicos A. Gómez Pérez (30 min.)
2. RDF, RDF Schema y SPARQL O. Corcho (90 min.)
3. Vocabularios A. Gómez Pérez (90 min.)
4. Herramientas de publicación de datos para portales de datos abiertos
O. Corcho (30 min.)
2
Page 3
26/11/12
2
Web de Linked Data: Conceptos Básicos
Asunción Gómez-Pérez, Oscar Corcho Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid http://www.oeg-upm.net
[email protected]
Agradecimientos: D. Vila
Curso en Red.es. 29 de Noviembre de 2012
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Índice
1. Concepto 2. Fundamentos 3. Proceso
4
Page 4
26/11/12
3
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Consultas complejas usando datos de diferentes páginas Web
5
http://www.aemet http://www.viaf.org/
*Picture attribution: http://commons.wikimedia.org/wiki/User:Gugerell
Turista alemán entusiasta de Cervantes dispuesto a conocer más sobre el trabajo y la vida de Cervantes
http://www.bne.es/
http://elviajero.elpais.com/
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
M. Cervantes
Don Quixote
Hebrew
creador
Traducido a
1960
Año de publicación
VIAF
localizado
Integración de datos
6
M. Cervantes Alcalá de Henares
Alcalá de Henares
Lugar de nacimiento
Igual a
Alcalá de Henares
20º
Temperatura
M. Cervantes
El Quijote
autor
1605 Año de
Publicación
BNE
Ubicado en
BD BNE
BD VIAF
BD AEMET
BD IGN
Alcalá de Henares
Tapas Siglo de Oro
guía
BD Prisa
BD DBpedia
Page 5
26/11/12
4
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 7
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 8 http://www.emtmadrid.es/
Page 6
26/11/12
5
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Integración de datos
9
Catas tro
BD AEMET
BD DBpedia
BD IGN
C/ Alcalá, 54
1446403VK4714E0001AZ
971m2
refCatastral
superficie
28014
codPostal
1910
añoConstrucción
C/ Alcalá, 54 Madrid
Madrid
city
sameAs
Madrid
20º
Temperatura
C/ Alcalá, 54
Cafetería Simpatía
vcard:adr
11012723 NúmeroPortal
L-20
Código Local
Ayto Madrid
10 Asunción Gómez Pérez
Page 7
26/11/12
6
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Agregar Información
11
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Madrid Arena #madridarena
Tagcloud
hashtag
isTagCloudOf
Agregar información
12
BD DBpedia
BD ElPaís
BD Havas
BD Twitter
Event Media
Madrid Arena
Madrid
lugar
España
país
#madridarena
http://elpais.com/elpais/2012/11/01/inenglish/1351773824_923902.html
noticia
Madrid Arena
Fiesta Halloween 2012
lugar
Diviertt organizador
31/10/2012
fecha
Page 8
26/11/12
7
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 13
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Generación de RDF
Enlazado
Visualización de datos y
conocimientos
Linked Data
Page 9
26/11/12
8
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Índice
1. Concepto 2. Fundamentos 3. Proceso
15
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Linked Data: ¿Por qué es importante?
• Facilita la integración de datos • De fuentes heterogéneas • En distintos formatos • Distinto nivel de detalle • En distintos idiomas • De distintos países
© Adaptada de “5min Introduction to Linked Data”- Olaf Hartig
Page 10
26/11/12
9
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Fundamentos Identificadores únicos: URI identifica o nombra recursos
Modelos en RDF(S)
Cer El Quijote Cervantes Es creador de
Cer Obra Persona Es creador de
Es una Es una
http://datos.bne.es/resource/XX1718747 http://datos.bne.es/resource/XX3383563
http://iflastandards.info/ns/fr/frbr/frbrer/C1005 http://iflastandards.info/ns/fr/frbr/frbrer/C1001
Enlaces a otros conjuntos de datos Same As
http://viaf.org/viaf/17220427
Cervantes
Same As Same As
http://dbpedia.org/resource/Miguel_de_Cervantes
Cervantes
Navegación de datos
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Fundamentos Alineando Modelos con Owl EquivalentClass
EquivalentClass
Same As
http://xmlns.com/foaf/0.1/Person Persona
http://schema.org/Person Persona
EquivalentClass
Lecciones aprendidas 1. Reutilización de modelos existentes 2. Alineación de datos y conceptos.
Municipio
Persona
lugar de nacimiento
http://iflastandards.info/ns/fr/frbr/frbrer/C1005
http://dbpedia.org/resource/Municipalities_of_Spain
http://dbpedia.org/page/Alcal%C3%A1_de_Henares
Alcalá de Henares
Es un
http://geo.linkeddata.es/ontology/Municipio
Municipio
http://geo.linkeddata.es/resource/Alcalá de Henares
Alcalá de Henares
Es un
Page 11
26/11/12
10
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
El modelo (Ontología) y los datos
19
Obra
Lengua
traducción
Año Fecha de publicación
Biblioteca
Ubicado en
Persona Es creador de
Se refiere a
El Quijote Cervantes
Es creador de
Catalán
traducción
1960 Fecha de publicación
BNE
Ubicado en
Se refiere a
Vida de Cervantes
Ontología
Datos
Lugar de nacimiento Lugar
Lugar de nacimiento
Alcalá de Henares
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
El modelo (Ontología) y los datos (datasets)
20
http://iflastandards.info/ns/fr/frbr/frbrer/C1001
http://iflastandards.info/ns/fr/frbr/frbrer/C1002
traducción
Año
Fecha de publicación
http://xmlns.com/foaf/0.1/Organization
Localizado en
http://iflastandards.info/ns/fr/frbr/frbrer/C1005
Es creador de
Tiene subject
http://datos.bne.es/resource/XX3383563 http://datos.bne.es/resource/XX1718747 Es autor
http://datos.bne.es/resource/XX1924295
translation
1960 Fecha de publicación
BNE
Localizado en
Tiene subject
http://datos.bne.es/resource/bimo0002045496
Vida de Miguel de Cervantes Saavedra
Don Quijote de la Mancha Cervantes Saavedra, Miguel de
Catalán
Ontología
Datos http://datos.bne.es/#
idioma
trabajo
Biblioteca
Persona
http://geo.linkeddata.es/ontology/Municipio
Lugar de nacimiento
http://geo.linkeddata.es/resource/Alcalá de Henares
Lugar de nacimiento
Page 12
26/11/12
11
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Índice
1. Concepto 2. Fundamentos 3. Proceso
21
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Especificación @ BNE
Especificar
Modelar
• Registros en formato MARC 21 • 3.9 millones de registros bibliográficos • 4.2 millones de registros de autoridades • Versión: Noviembre 2011
22
AUTHORITY BIBLIOGRAPHIC
Persons Corporate bodies Conferences Titles Subject
76576 Maps
320727 Sound recordings
166017 Gravings, drawings, pictures
35770 Manuscripts
143959 Ancient books
2696560 Modern books
178473 Scores
3021 Electronic resources
156634 Serials
96672 Videos
Generar RDF
Publicar
Explotar
Enlazar
Page 13
26/11/12
12
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
La Ontología: basada en vocabularios IFLA
Especificar
Modelar
Generar RDF
Publicar
Explotar
Enlazar
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
La herramienta Marimba genera RDF
BNE
Especificar
Modelar
Generar RDF
Publicar
Explotar
Enlazar
Page 14
26/11/12
13
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Marimba enlaza con otros recursos: VIAF, DNB, SUDOC, LIBRIS, DBpedia
BNE
http://datos.bne.es/resource/XX1718747
Same As Same As
Same As
Same As
Same As
LIBRIS
http://libris.kb.se/resource/auth/45369
SUDOC
http://www.idref.fr/026774771/id
DNB
http://d-nb.info/gnd/11851993X
DBpedia
http://dbpedia.org/resource/Miguel_de_Cervantes
VIAF http://viaf.org/viaf/17220427
Especificar
Modelar
Generar RDF
Publicar
Explotar
Enlazar
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Especificar
Modelar
Generar RDF
Publicar
Explotar
Enlazar
Marimba enlaza con otros recursos: VIAF, DNB, SUDOC, LIBRIS, DBpedia
Page 15
26/11/12
14
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Publicar
Publicar los datos Describir el recurso con VOID Para facilitar el descubrimiento
• Registrar en CKAN tu recurso
• Utilizar sitemap4rdf para generar el sitemap
• Cargar el sitemap en Google y Sindice
Especificar
Modelar
Generar RDF
Publicar
Explotar
Enlazar
Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012
Explotar
select distinct COUNT(?Obras) where { http://datos.bne.es/resource/XX1718747 <http://iflastandards.info/ns/fr/frbr/frbrer/P2010> ?Obras }
URI Cervantes
Is author
Consultas en SPARQL
Interfaz Web Especification
Model
RDF generation
Publication
Exploitation
Especificar
Modelar
Generar RDF
Publicar
Explotar
Enlazar
http://linkeddata3.dia.fi.upm.es/bne-demo