Top Banner
Material del curso sobre Tecnologías Semánticas en la Web de Datos red.es, 29/11/2012 Ontology Engineering Group Asunción GómezPérez, Oscar Corcho García Licencia de uso: Creative Commons Attribution NonCommercialShareAlike 3.0 Unported (CC BYNCSA 3.0) Más información sobre cursos disponible en: http://cursos.oegupm.net/
15

01. Introducción. Tecnologías Semánticas en la Web de Datos

Jun 27, 2015

Download

Technology

Primera entrega. Material del curso sobre Linked Data impartido en la entidad pública empresarial Red.es por Asunción Gómez-Pérez y Oscar Corcho (Ontology Engineering Group - Universidad Politécnica de Madrid).
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 01. Introducción. Tecnologías Semánticas en la Web de Datos

Material  del  curso  sobre  Tecnologías  Semánticas    en  la  Web  de  Datos  

red.es,  29/11/2012  

Ontology  Engineering  Group  

Asunción  Gómez-­‐Pérez,  Oscar  Corcho  García  

 

Licencia  de  uso:  Creative  Commons  Attribution-­‐NonCommercial-­‐ShareAlike  3.0  Unported  (CC  BY-­‐NC-­‐SA  3.0)  

     Más  información  sobre  cursos  disponible  en:  http://cursos.oeg-­‐upm.net/    

 

Page 2: 01. Introducción. Tecnologías Semánticas en la Web de Datos

26/11/12

1

Tecnologías Semánticas en la Web de datos

Asunción Gómez-Pérez, Oscar Corcho Facultad de Informática, Universidad Politécnica de Madrid

Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid http://www.oeg-upm.net

[email protected]

Agradecimientos: Garijo, D. Vila, L.Vilches, B. Villazón

Curso en Red.es. 29 de Noviembre de 2012

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Indice

1.  Web de Linked Data: Conceptos Básicos A. Gómez Pérez (30 min.)

2.  RDF, RDF Schema y SPARQL O. Corcho (90 min.)

3.  Vocabularios A. Gómez Pérez (90 min.)

4.  Herramientas de publicación de datos para portales de datos abiertos

O. Corcho (30 min.)

2

Page 3: 01. Introducción. Tecnologías Semánticas en la Web de Datos

26/11/12

2

Web de Linked Data: Conceptos Básicos

Asunción Gómez-Pérez, Oscar Corcho Facultad de Informática, Universidad Politécnica de Madrid

Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid http://www.oeg-upm.net

[email protected]

Agradecimientos: D. Vila

Curso en Red.es. 29 de Noviembre de 2012

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Índice

1.  Concepto 2.  Fundamentos 3.  Proceso

4

Page 4: 01. Introducción. Tecnologías Semánticas en la Web de Datos

26/11/12

3

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Consultas complejas usando datos de diferentes páginas Web

5

http://www.aemet http://www.viaf.org/

*Picture attribution: http://commons.wikimedia.org/wiki/User:Gugerell

Turista alemán entusiasta de Cervantes dispuesto a conocer más sobre el trabajo y la vida de Cervantes

http://www.bne.es/

http://elviajero.elpais.com/

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

M. Cervantes

Don Quixote

Hebrew

creador

Traducido a

1960

Año de publicación

VIAF

localizado

Integración de datos

6

M. Cervantes Alcalá de Henares

Alcalá de Henares

Lugar de nacimiento

Igual a

Alcalá de Henares

20º

Temperatura

M. Cervantes

El Quijote

autor

1605 Año de

Publicación

BNE

Ubicado en

BD BNE

BD VIAF

BD AEMET

BD IGN

Alcalá de Henares

Tapas Siglo de Oro

guía

BD Prisa

BD DBpedia

Page 5: 01. Introducción. Tecnologías Semánticas en la Web de Datos

26/11/12

4

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 7

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 8 http://www.emtmadrid.es/

Page 6: 01. Introducción. Tecnologías Semánticas en la Web de Datos

26/11/12

5

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Integración de datos

9

Catas tro

BD AEMET

BD DBpedia

BD IGN

C/ Alcalá, 54

1446403VK4714E0001AZ

971m2

refCatastral

superficie

28014

codPostal

1910

añoConstrucción

C/ Alcalá, 54 Madrid

Madrid

city

sameAs

Madrid

20º

Temperatura

C/ Alcalá, 54

Cafetería Simpatía

vcard:adr

11012723 NúmeroPortal

L-20

Código Local

Ayto Madrid

10 Asunción Gómez Pérez

Page 7: 01. Introducción. Tecnologías Semánticas en la Web de Datos

26/11/12

6

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Agregar Información

11

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Madrid Arena #madridarena

Tagcloud

hashtag

isTagCloudOf

Agregar información

12

BD DBpedia

BD ElPaís

BD Havas

BD Twitter

Event Media

Madrid Arena

Madrid

lugar

España

país

#madridarena

http://elpais.com/elpais/2012/11/01/inenglish/1351773824_923902.html

noticia

Madrid Arena

Fiesta Halloween 2012

lugar

Diviertt organizador

31/10/2012

fecha

Page 8: 01. Introducción. Tecnologías Semánticas en la Web de Datos

26/11/12

7

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012 13

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Generación de RDF

Enlazado

Visualización de datos y

conocimientos

Linked Data

Page 9: 01. Introducción. Tecnologías Semánticas en la Web de Datos

26/11/12

8

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Índice

1.  Concepto 2.  Fundamentos 3.  Proceso

15

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Linked Data: ¿Por qué es importante?

•  Facilita la integración de datos •  De fuentes heterogéneas •  En distintos formatos •  Distinto nivel de detalle •  En distintos idiomas •  De distintos países

© Adaptada de “5min Introduction to Linked Data”- Olaf Hartig

Page 10: 01. Introducción. Tecnologías Semánticas en la Web de Datos

26/11/12

9

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Fundamentos Identificadores únicos: URI identifica o nombra recursos

Modelos en RDF(S)

Cer El Quijote Cervantes Es creador de

Cer Obra Persona Es creador de

Es una Es una

http://datos.bne.es/resource/XX1718747 http://datos.bne.es/resource/XX3383563

http://iflastandards.info/ns/fr/frbr/frbrer/C1005 http://iflastandards.info/ns/fr/frbr/frbrer/C1001

Enlaces a otros conjuntos de datos Same As

http://viaf.org/viaf/17220427

Cervantes

Same As Same As

http://dbpedia.org/resource/Miguel_de_Cervantes

Cervantes

Navegación de datos

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Fundamentos Alineando Modelos con Owl EquivalentClass

EquivalentClass

Same As

http://xmlns.com/foaf/0.1/Person Persona

http://schema.org/Person Persona

EquivalentClass

Lecciones aprendidas 1. Reutilización de modelos existentes 2. Alineación de datos y conceptos.

Municipio

Persona

lugar de nacimiento

http://iflastandards.info/ns/fr/frbr/frbrer/C1005

http://dbpedia.org/resource/Municipalities_of_Spain

http://dbpedia.org/page/Alcal%C3%A1_de_Henares

Alcalá de Henares

Es un

http://geo.linkeddata.es/ontology/Municipio

Municipio

http://geo.linkeddata.es/resource/Alcalá de Henares

Alcalá de Henares

Es un

Page 11: 01. Introducción. Tecnologías Semánticas en la Web de Datos

26/11/12

10

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

El modelo (Ontología) y los datos

19

Obra

Lengua

traducción

Año Fecha de publicación

Biblioteca

Ubicado en

Persona Es creador de

Se refiere a

El Quijote Cervantes

Es creador de

Catalán

traducción

1960 Fecha de publicación

BNE

Ubicado en

Se refiere a

Vida de Cervantes

Ontología

Datos

Lugar de nacimiento Lugar

Lugar de nacimiento

Alcalá de Henares

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

El modelo (Ontología) y los datos (datasets)

20

http://iflastandards.info/ns/fr/frbr/frbrer/C1001

http://iflastandards.info/ns/fr/frbr/frbrer/C1002

traducción

Año

Fecha de publicación

http://xmlns.com/foaf/0.1/Organization

Localizado en

http://iflastandards.info/ns/fr/frbr/frbrer/C1005

Es creador de

Tiene subject

http://datos.bne.es/resource/XX3383563 http://datos.bne.es/resource/XX1718747 Es autor

http://datos.bne.es/resource/XX1924295

translation

1960 Fecha de publicación

BNE

Localizado en

Tiene subject

http://datos.bne.es/resource/bimo0002045496

Vida de Miguel de Cervantes Saavedra

Don Quijote de la Mancha Cervantes Saavedra, Miguel de

Catalán

Ontología

Datos http://datos.bne.es/#

idioma

trabajo

Biblioteca

Persona

http://geo.linkeddata.es/ontology/Municipio

Lugar de nacimiento

http://geo.linkeddata.es/resource/Alcalá de Henares

Lugar de nacimiento

Page 12: 01. Introducción. Tecnologías Semánticas en la Web de Datos

26/11/12

11

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Índice

1.  Concepto 2.  Fundamentos 3.  Proceso

21

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Especificación @ BNE

Especificar

Modelar

•  Registros en formato MARC 21 •  3.9 millones de registros bibliográficos •  4.2 millones de registros de autoridades •  Versión: Noviembre 2011

22

AUTHORITY BIBLIOGRAPHIC

Persons Corporate bodies Conferences Titles Subject

76576 Maps

320727 Sound recordings

166017 Gravings, drawings, pictures

35770 Manuscripts

143959 Ancient books

2696560 Modern books

178473 Scores

3021 Electronic resources

156634 Serials

96672 Videos

Generar RDF

Publicar

Explotar

Enlazar

Page 13: 01. Introducción. Tecnologías Semánticas en la Web de Datos

26/11/12

12

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

La Ontología: basada en vocabularios IFLA

Especificar

Modelar

Generar RDF

Publicar

Explotar

Enlazar

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

La herramienta Marimba genera RDF

BNE

Especificar

Modelar

Generar RDF

Publicar

Explotar

Enlazar

Page 14: 01. Introducción. Tecnologías Semánticas en la Web de Datos

26/11/12

13

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Marimba enlaza con otros recursos: VIAF, DNB, SUDOC, LIBRIS, DBpedia

BNE

http://datos.bne.es/resource/XX1718747

Same As Same As

Same As

Same As

Same As

LIBRIS

http://libris.kb.se/resource/auth/45369

SUDOC

http://www.idref.fr/026774771/id

DNB

http://d-nb.info/gnd/11851993X

DBpedia

http://dbpedia.org/resource/Miguel_de_Cervantes

VIAF http://viaf.org/viaf/17220427

Especificar

Modelar

Generar RDF

Publicar

Explotar

Enlazar

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Especificar

Modelar

Generar RDF

Publicar

Explotar

Enlazar

Marimba enlaza con otros recursos: VIAF, DNB, SUDOC, LIBRIS, DBpedia

Page 15: 01. Introducción. Tecnologías Semánticas en la Web de Datos

26/11/12

14

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Publicar

Publicar los datos Describir el recurso con VOID Para facilitar el descubrimiento

•  Registrar en CKAN tu recurso

•  Utilizar sitemap4rdf para generar el sitemap

•  Cargar el sitemap en Google y Sindice

Especificar

Modelar

Generar RDF

Publicar

Explotar

Enlazar

Tecnologías Semánticas en la Web de Datos. Red.es. 29 de noviembre de 2012

Explotar

select distinct COUNT(?Obras) where { http://datos.bne.es/resource/XX1718747 <http://iflastandards.info/ns/fr/frbr/frbrer/P2010> ?Obras }

URI Cervantes

Is author

Consultas en SPARQL

Interfaz Web Especification

Model

RDF generation

Publication

Exploitation

Especificar

Modelar

Generar RDF

Publicar

Explotar

Enlazar

http://linkeddata3.dia.fi.upm.es/bne-demo