Top Banner
1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance et traçabilité 4. RDF dans les pages HTML 5. Liens avec les bases de données
101

SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

May 05, 2020

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

1

SEMAINE 07 : vers plus d’intégration de données

1.  VoID pour les bases RDF

2.  DCAT pour les jeux de données

3.  PROVenance et traçabilité

4.  RDF dans les pages HTML

5.  Liens avec les bases de données

Page 2: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

2

SEMAINE 07 : vers plus d’intégration de données

1.  VoID pour les bases RDF 2.  DCAT pour les jeux de données

3.  PROVenance et traçabilité

4.  RDF dans les pages HTML

5.  Liens avec les bases de données

Page 3: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

3

VoID (Vocabulary of Interlinked Datasets) schéma pour annoter des jeux de données publiées et liées en RDF

© W3C

Page 4: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

4

VoID (Vocabulary of Interlinked Datasets) schéma pour annoter des jeux de données publiées et liées en RDF

© W3C

Page 5: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

5

VoID (Vocabulary of Interlinked Datasets) schéma pour annoter des jeux de données publiées et liées en RDF

© W3C

Page 6: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

6

jeu de données et jeux de liens

déclarer un jeu de données :DBpedia a void:Dataset .

déclarer un jeu de liens :DBpedia_Geonames a void:Linkset .

Page 7: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

7

ex. description du dataset DBpedia :DBpedia a void:Dataset; void:sparqlEndpoint <http://dbpedia.org/sparql>; void:feature :RDFXML ; void:subset :DBpedia2Geonames ; void:uriLookupEndpoint <http://lookup.dbpedia.org/api/search.asmx/KeywordSearch? QueryString=> ; dcterms:modified "2008-11-17"^^xsd:date; dcterms:title "DBPedia"; dcterms:description "RDF data extracted from Wikipedia"; dcterms:publisher :DBpedia_community; dcterms:license <http://creativecommons.org/licenses/by-sa/3.0/>; dcterms:source <http://dbpedia.org/resource/Wikipedia>.

Page 8: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

8

ex. DBpedia est un dataset :DBpedia a void:Dataset; void:sparqlEndpoint <http://dbpedia.org/sparql>; void:feature :RDFXML ; void:subset :DBpedia2Geonames ; void:uriLookupEndpoint <http://lookup.dbpedia.org/api/search.asmx/KeywordSearch? QueryString=> ; dcterms:modified "2008-11-17"^^xsd:date; dcterms:title "DBPedia"; dcterms:description "RDF data extracted from Wikipedia"; dcterms:publisher :DBpedia_community; dcterms:license <http://creativecommons.org/licenses/by-sa/3.0/>; dcterms:source <http://dbpedia.org/resource/Wikipedia>.

Page 9: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

9

ex. DBpedia a un point d’accès SPARQL :DBpedia a void:Dataset; void:sparqlEndpoint <http://dbpedia.org/sparql>; void:feature :RDFXML ; void:subset :DBpedia2Geonames ; void:uriLookupEndpoint <http://lookup.dbpedia.org/api/search.asmx/KeywordSearch? QueryString=> ; dcterms:modified "2008-11-17"^^xsd:date; dcterms:title "DBPedia"; dcterms:description "RDF data extracted from Wikipedia"; dcterms:publisher :DBpedia_community; dcterms:license <http://creativecommons.org/licenses/by-sa/3.0/>; dcterms:source <http://dbpedia.org/resource/Wikipedia>.

Page 10: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

10

ex. DBpedia est disponible en RDF/XML :DBpedia a void:Dataset; void:sparqlEndpoint <http://dbpedia.org/sparql>; void:feature :RDFXML ; void:subset :DBpedia2Geonames ; void:uriLookupEndpoint <http://lookup.dbpedia.org/api/search.asmx/KeywordSearch? QueryString=> ; dcterms:modified "2008-11-17"^^xsd:date; dcterms:title "DBPedia"; dcterms:description "RDF data extracted from Wikipedia"; dcterms:publisher :DBpedia_community; dcterms:license <http://creativecommons.org/licenses/by-sa/3.0/>; dcterms:source <http://dbpedia.org/resource/Wikipedia>.

Page 11: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

11

ex. DBpedia a des sous ensembles :DBpedia a void:Dataset; void:sparqlEndpoint <http://dbpedia.org/sparql>; void:feature :RDFXML ; void:subset :DBpedia2Geonames ; void:uriLookupEndpoint <http://lookup.dbpedia.org/api/search.asmx/KeywordSearch? QueryString=> ; dcterms:modified "2008-11-17"^^xsd:date; dcterms:title "DBPedia"; dcterms:description "RDF data extracted from Wikipedia"; dcterms:publisher :DBpedia_community; dcterms:license <http://creativecommons.org/licenses/by-sa/3.0/>; dcterms:source <http://dbpedia.org/resource/Wikipedia>.

Page 12: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

12

ex. DBpedia a un accès par mots-clefs :DBpedia a void:Dataset; void:sparqlEndpoint <http://dbpedia.org/sparql>; void:feature :RDFXML ; void:subset :DBpedia2Geonames ; void:uriLookupEndpoint <http://lookup.dbpedia.org/api/search.asmx/KeywordSearch? QueryString=> ; dcterms:modified "2008-11-17"^^xsd:date; dcterms:title "DBPedia"; dcterms:description "RDF data extracted from Wikipedia"; dcterms:publisher :DBpedia_community; dcterms:license <http://creativecommons.org/licenses/by-sa/3.0/>; dcterms:source <http://dbpedia.org/resource/Wikipedia>.

Page 13: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

13

ex. combiner avec d’autres vocabulaires :DBpedia a void:Dataset; void:sparqlEndpoint <http://dbpedia.org/sparql>; void:feature :RDFXML ; void:subset :DBpedia2Geonames ; void:uriLookupEndpoint <http://lookup.dbpedia.org/api/search.asmx/KeywordSearch? QueryString=> ; dcterms:modified "2008-11-17"^^xsd:date; dcterms:title "DBPedia"; dcterms:description "RDF data extracted from Wikipedia"; dcterms:publisher :DBpedia_community; dcterms:license <http://creativecommons.org/licenses/by-sa/3.0/>; dcterms:source <http://dbpedia.org/resource/Wikipedia>.

Page 14: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

14

ex. Geonames dataset :Geonames a void:Dataset; void:sparqlEndpoint <http://geosparql.appspot.com/query>; void:triples "107983838"^^xsd:integer ; dcterms:subject <http://dbpedia.org/resource/Location> .

Page 15: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

15

ex. Geonames dataset :Geonames a void:Dataset; void:sparqlEndpoint <http://geosparql.appspot.com/query>; void:triples "107983838"^^xsd:integer ; dcterms:subject <http://dbpedia.org/resource/Location> .

:DBpedia2Geonames a void:Linkset ; void:linkPredicate owl:sameAs ; void:target :DBpedia ; void:target :Geonames .

Page 16: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

16

SEMAINE 07 : vers plus d’intégration de données

1.  VoID pour les bases RDF

2.  DCAT pour les jeux de données 3.  PROVenance et traçabilité

4.  RDF dans les pages HTML

5.  Liens avec les bases de données

Page 17: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

17

DCAT (Data Catalog Vocabulary) décrire n’importe quel jeu de données

© W3C

Page 18: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

18

DCAT (Data Catalog Vocabulary) décrire n’importe quel jeu de données

© W3C

Page 19: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

19

DCAT (Data Catalog Vocabulary) décrire n’importe quel jeu de données

© W3C

Page 20: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

20

DCAT (Data Catalog Vocabulary) décrire n’importe quel jeu de données

© W3C

Page 21: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

21

exemple de DCAT un feuille de tableur mise en ligne (ex. un fichier Excel au format CSV)

<census> a dcat:Dataset ; dcat:distribution <census-spreadsheet> .

<census-spreadsheet> a dcat:Distribution ; dcat:downloadURL <http://example.org/dist1.csv> ; dcat:format [ rdfs:label "CSV" ] ; dcat:mediaType "text/csv" .

Page 22: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

22

exemple de DCAT un feuille de tableur mise en ligne (ex. un fichier Excel au format CSV)

<census> a dcat:Dataset ; dcat:distribution <census-spreadsheet> .

<census-spreadsheet> a dcat:Distribution ; dcat:downloadURL <http://example.org/dist1.csv> ; dcat:format [ rdfs:label "CSV" ] ; dcat:mediaType "text/csv" .

Page 23: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

23

exemple de DCAT un feuille de tableur mise en ligne (ex. un fichier Excel au format CSV)

<census> a dcat:Dataset ; dcat:distribution <census-spreadsheet> .

<census-spreadsheet> a dcat:Distribution ; dcat:downloadURL <http://example.org/dist1.csv> ; dcat:format [ rdfs:label "CSV" ] ; dcat:mediaType "text/csv" .

Page 24: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

24

SEMAINE 07 : vers plus d’intégration de données

1.  VoID pour les bases RDF

2.  DCAT pour les jeux de données

3.  PROVenance et traçabilité

4.  RDF dans les pages HTML

5.  Liens avec les bases de données

Page 25: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

25

CSV sur le Web, CSV-LD, Linked CSV contextes pour interpréter et générer du CSV

conventions pour lier et publier des fichiers CSV

Page 26: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

26

sources, provenance et traçabilité documenter les flux et transformations des données

Page 27: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

27

traçabilité des données origines et transformations subies

Page 28: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

28

PROV-O: ontologie de provenance décrire les entités et les activités de la création d’une ressource

© W3C

Page 29: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

29

PROV-O: ontologie de provenance décrire les entités et les activités de la création d’une ressource

© W3C

Page 30: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

30

PROV-O: ontologie de provenance décrire les entités et les activités de la création d’une ressource

© W3C

Page 31: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

31

ex. un graphique produit à partir de deux sources ex:compose prov:used ex:dataSet1 ; prov:used ex:regionList . ex:composition prov:wasGeneratedBy ex:compose . ex:illustrate prov:used ex:composition . ex:chart1 prov:wasGeneratedBy ex:illustrate

© W3C

Page 32: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

32

ex. un graphique produit à partir de deux sources ex:compose prov:used ex:dataSet1 ; prov:used ex:regionList . ex:composition prov:wasGeneratedBy ex:compose . ex:illustrate prov:used ex:composition . ex:chart1 prov:wasGeneratedBy ex:illustrate

© W3C

Page 33: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

33

les traces génèrent beaucoup de données

© W3C

Page 34: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

34

SEMAINE 07 : vers plus d’intégration de données

1.  VoID pour les bases RDF

2.  DCAT pour les jeux de données

3.  PROVenance et traçabilité

4.  RDF dans les pages HTML 5.  Liens avec les bases de données

Page 35: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

35

RDFa: une syntaxe particulière pour RDF

Page 36: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

36

RDFa signifie RDF dans des attributs de HTML

<body vocab="http://purl.org/dc/terms/>

<div resource="http://lib.com/books/0684853949">

<h2 property="title">The Man Who Mistook His

Wife For a Hat</h2>

<h3 property="creator">Oliver Sacks</h3>

...

Page 37: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

37

contenu HTML+RDFa (…) <body vocab="http://purl.org/dc/terms/"> <div resource="/books/web_semantique"> <h2 property="title">Le Web Sémantique</h2> <p>Date: <span property="created">2012-05-01</span></p> <h3 property="creator" resource="#fg">Fabien</h3> </div> <div vocab="http://xmlns.com/foaf/0.1/" resource="#fg" typeof="Person"> <p> <span property="name">Fabien Gandon</span>, phone: <a property="phone" href="tel:+33492965170">+33492965170</a> mail: <a property="mbox" href="mailto:[email protected]">[email protected]</a></p> </div>

...

Page 38: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

38

contenu HTML+RDFa (rendu navigateur) (…) <body vocab="http://purl.org/dc/terms/"> <div resource="/books/web_semantique"> <h2 property="title">Le Web Sémantique</h2> <p>Date: <span property="created">2012-05-01</span></p> <h3 property="creator" resource="#fg">Fabien</h3> </div> <div vocab="http://xmlns.com/foaf/0.1/" resource="#fg" typeof="Person"> <p> <span property="name">Fabien Gandon</span>, phone: <a property="phone" href="tel:+33492965170">+33492965170</a> mail: <a property="mbox" href="mailto:[email protected]">[email protected]</a></p> </div>

...

Page 39: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

39

contenu HTML+RDFa (lu par un parseur RDFa) (…) <body vocab="http://purl.org/dc/terms/"> <div resource="/books/web_semantique"> <h2 property="title">Le Web Sémantique</h2> <p>Date: <span property="created">2012-05-01</span></p> <h3 property="creator" resource="#fg">Fabien</h3> </div> <div vocab="http://xmlns.com/foaf/0.1/" resource="#fg" typeof="Person"> <p> <span property="name">Fabien Gandon</span>, phone: <a property="phone" href="tel:+33492965170">+33492965170</a> mail: <a property="mbox" href="mailto:[email protected]">[email protected]</a></p> </div>

...

@prefix ns1: <http://purl.org/dc/terms/> . @prefix ns2: <http://xmlns.com/foaf/0.1/> . </books/web_semantique> ns1:title "Le Web Sémantique" ; ns1:created "2012-05-01" ; ns1:creator <#fg>. <#fg> a ns2:Person; ns2:mbox <mailto:[email protected]>; ns2:name "Fabien Gandon" ; ns2:phone <tel:+33492965170> .

Page 40: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

40

anatomie d’un contenu HTML+RDFa (…) <body vocab="http://purl.org/dc/terms/"> <div resource="/books/web_semantique"> <h2 property="title">Le Web Sémantique</h2> <p>Date: <span property="created">2012-05-01</span></p> <h3 property="creator" resource="#fg">Fabien</h3> </div> <div vocab="http://xmlns.com/foaf/0.1/" resource="#fg" typeof="Person"> <p> <span property="name">Fabien Gandon</span>, phone: <a property="phone" href="tel:+33492965170">+33492965170</a> mail: <a property="mbox" href="mailto:[email protected]">[email protected]</a></p> </div>

...

schémas utilisés

Page 41: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

41

anatomie d’un contenu HTML+RDFa (…) <body vocab="http://purl.org/dc/terms/"> <div resource="/books/web_semantique"> <h2 property="title">Le Web Sémantique</h2> <p>Date: <span property="created">2012-05-01</span></p> <h3 property="creator" resource="#fg">Fabien</h3> </div> <div vocab="http://xmlns.com/foaf/0.1/" resource="#fg" typeof="Person"> <p> <span property="name">Fabien Gandon</span>, phone: <a property="phone" href="tel:+33492965170">+33492965170</a> mail: <a property="mbox" href="mailto:[email protected]">[email protected]</a></p> </div>

...

sujets de triplets

Page 42: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

42

anatomie d’un contenu HTML+RDFa (…) <body vocab="http://purl.org/dc/terms/"> <div resource="/books/web_semantique"> <h2 property="title">Le Web Sémantique</h2> <p>Date: <span property="created">2012-05-01</span></p> <h3 property="creator" resource="#fg">Fabien</h3> </div> <div vocab="http://xmlns.com/foaf/0.1/" resource="#fg" typeof="Person"> <p> <span property="name">Fabien Gandon</span>, phone: <a property="phone" href="tel:+33492965170">+33492965170</a> mail: <a property="mbox" href="mailto:[email protected]">[email protected]</a></p> </div>

...

typage

Page 43: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

43

anatomie d’un contenu HTML+RDFa (…) <body vocab="http://purl.org/dc/terms/"> <div resource="/books/web_semantique"> <h2 property="title">Le Web Sémantique</h2> <p>Date: <span property="created">2012-05-01</span></p> <h3 property="creator" resource="#fg">Fabien</h3> </div> <div vocab="http://xmlns.com/foaf/0.1/" resource="#fg" typeof="Person"> <p> <span property="name">Fabien Gandon</span>, phone: <a property="phone" href="tel:+33492965170">+33492965170</a> mail: <a property="mbox" href="mailto:[email protected]">[email protected]</a></p> </div>

...

propriétés & valeurs

Page 44: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

44

anatomie d’un contenu HTML+RDFa (…) <body vocab="http://purl.org/dc/terms/"> <div resource="/books/web_semantique"> <h2 property="title">Le Web Sémantique</h2> <p>Date: <span property="created">2012-05-01</span></p> <h3 property="creator" resource="#fg">Fabien</h3> </div> <div vocab="http://xmlns.com/foaf/0.1/" resource="#fg" typeof="Person"> <p> <span property="name">Fabien Gandon</span>, phone: <a property="phone" href="tel:+33492965170">+33492965170</a> mail: <a property="mbox" href="mailto:[email protected]">[email protected]</a></p> </div>

...

propriétés & objets

Page 45: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

45

schema.org=

Listes des classes Screencast site

Page 46: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

46

exemple de RDFa utilisant schema.org <div vocab="http://schema.org/" typeof="Product"> <img rel="image" src="dell-30in-lcd.jpg" /> <span property="name">Dell UltraSharp 30" LCD Monitor</span> <div rel="hasAggregateRating" > <div typeof="http://schema.org/AggregateRating"> <span property="ratingValue">87</span> out of <span property="bestRating">100</span> based on <span property="ratingCount">24</span> user ratings </div> </div> <div rel="offers" > <div typeof="http://schema.org/AggregateOffer"> <span property="lowPrice">$1250</span> to <span property="highPrice">$1495</span> from <span property="offerCount">8</span> sellers </div> </div>

(…)

Page 47: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

47

exemple de RDFa utilisant schema.org <div vocab="http://schema.org/" typeof="Product"> <img rel="image" src="dell-30in-lcd.jpg" /> <span property="name">Dell UltraSharp 30" LCD Monitor</span> <div rel="hasAggregateRating" > <div typeof="http://schema.org/AggregateRating"> <span property="ratingValue">87</span> out of <span property="bestRating">100</span> based on <span property="ratingCount">24</span> user ratings </div> </div> <div rel="offers" > <div typeof="http://schema.org/AggregateOffer"> <span property="lowPrice">$1250</span> to <span property="highPrice">$1495</span> from <span property="offerCount">8</span> sellers </div> </div>

(…)

Page 48: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

48

principe similaire dans OGP: le bouton « I like »

Listes des classes Screencast site Imdb avec bouton

Page 49: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

49

code OGP <html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="en-US" xmlns:fb="https://www.facebook.com/2008/fbml">

<head prefix="og: http://ogp.me/ns# fb: http://ogp.me/ns# YOUR_NAMESPACE:

http://ogp.me/ns/apps/YOUR_NAMESPACE#">

<meta property="fb:app_id" content="YOUR_APP_ID" />

<meta property="og:type" content="YOUR_NAMESPACE:recipe" />

<meta property="og:title" content="Stuffed Cookies" />

<meta property="og:image" content="http://example.com/cookie.jpg" />

<meta property="og:description" content="The Turducken of Cookies" />

<meta property="og:url" content="http://example.com/cookie.html">

<script type="text/javascript">

function postCook()

{ FB.api('/me/YOUR_NAMESPACE:cook' + '?recipe=http://example.com/cookie.html','post', (…) }); } </script>

</head>

<body>

(…)

<form>

<input type="button" value="Cook" onclick="postCook()" />

</form>

</body>

</html>

Page 50: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

50

code OGP <html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="en-US" xmlns:fb="https://www.facebook.com/2008/fbml">

<head prefix="og: http://ogp.me/ns# fb: http://ogp.me/ns# YOUR_NAMESPACE:

http://ogp.me/ns/apps/YOUR_NAMESPACE#">

<meta property="fb:app_id" content="YOUR_APP_ID" />

<meta property="og:type" content="YOUR_NAMESPACE:recipe" /> <meta property="og:title" content="Stuffed Cookies" /> <meta property="og:image" content="http://example.com/cookie.jpg" /> <meta property="og:description" content="The Turducken of Cookies" /> <meta property="og:url" content="http://example.com/cookie.html"> <script type="text/javascript">

function postCook()

{ FB.api('/me/YOUR_NAMESPACE:cook' + '?recipe=http://example.com/cookie.html','post', (…) }); } </script>

</head>

<body>

(…)

<form>

<input type="button" value="Cook" onclick="postCook()" />

</form>

</body>

</html>

Page 51: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

51

les données de ces pages sont accessibles à tous

si vous appliquez un parseur à ces pages, vous récupérez vous aussi leurs données…

Page 52: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

52

alternative algorithmique: transformations GRDDL

•  prononcé “GRIDEUL”

•  signifie “Gleaning Resource Descriptions from Dialects of Languages”

•  au lieu de baliser les données on fournit un mécanisme d’extraction.

•  fonctionne pour HTML et XML

Page 53: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

53

GRDDL : associer une transformation à une source

Transformation associée directement à la source:

detect

profile GRDDL source

document XHTML +

hCalendar RDF

fetch transformations

source and

stylesheet

glean-hcal.xsl

apply transformations

Page 54: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

54

GRDDL : associer une transformation à une source

Transformation associée directement à la source:

Transformation indirectement associée par un profil attaché à la source:

detect

profile GRDDL source

document XHTML +

hCalendar RDF

fetch transformations

source and

stylesheet

glean-hcal.xsl

apply transformations

fetch

profile XHTML and

profile

XHTML +

embedded RDF

fetch profile transformations

XHTML, profile and

profile transformation

glean-

profile

apply profile

transformations to

extract URIs of source

transformations

XHTML and URIs of transformations

fetch embedded RDF transformations

extract-

rdf.xsl

XHTML and embedded RDF transformations

apply transformations RDF

Page 55: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

55

GRDDL en HTML

<head profile="http://www.w3.org/2003/g/data-view">

<title>The man who mistook his wife for a hat</title>

<link rel="transformation"

href="http://www.w3.org/2000/06/ dc-extract/dc-extract.xsl" />

<meta name="DC.Subject" content="clinical tales" />

(…)

« je contiens des données »

Page 56: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

56

GRDDL en HTML

<head profile="http://www.w3.org/2003/g/data-view">

<title>The man who mistook his wife for a hat</title>

<link rel="transformation"

href="http://www.w3.org/2000/06/ dc-extract/dc-extract.xsl" />

<meta name="DC.Subject" content="clinical tales" />

(…)

« voici comment les obtenir »

Page 57: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

57

GRDDL en XML: ex. du feuille de calcul Excel <?xml version="1.0"?>

<?mso-application progid="Excel.Sheet"?>

<Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet"

xmlns:grddl="http://www.w3.org/2003/g/data-view#"

grddl:transformation="excel2rdf.xsl">

(…)

Page 58: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

58

GRDDL en XML <?xml version="1.0"?>

<?mso-application progid="Excel.Sheet"?>

<Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet"

xmlns:grddl="http://www.w3.org/2003/g/data-view#"

grddl:transformation="excel2rdf.xsl">

(…)

« je contiens des données »

Page 59: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

59

GRDDL en XML <?xml version="1.0"?>

<?mso-application progid="Excel.Sheet"?>

<Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet"

xmlns:grddl="http://www.w3.org/2003/g/data-view#"

grddl:transformation="excel2rdf.xsl">

(…) « voici comment les obtenir »

Page 60: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

60

SEMAINE 07 : vers plus d’intégration de données

1.  VoID pour les bases RDF

2.  DCAT pour les jeux de données

3.  PROVenance et traçabilité

4.  RDF dans les pages HTML

5.  Liens avec les bases de données

Page 61: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

61

transformation d’une base relationnelle en RDF •  transformation par défaut

[A Direct Mapping of Relational Data to RDF]

Page 62: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

62

transformation d’une base relationnelle en RDF •  transformation par défaut

[A Direct Mapping of Relational Data to RDF]

•  transformation personnalisée [R2RML: RDB to RDF Mapping Language]

correspondances

schéma

Page 63: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

63

transformation par défaut / correspondance directe

Règles de génération des triplets:

1.  les cellules d’une même ligne ont un sujet commun

2.  les noms des colonnes donnent les noms des relations

3.  la valeur d’une cellule donne la valeur de objet

4.  les liens entre tables

nom prenom age gandon fabien 39 buttier thomas 38

#s1  :nom  "gandon"  #s1  :prenom  "fabien"    #s1  :age  "39"  #s2  :nom  "bu7er"  #s2  :prenom  "thomas"    #s2  :age  "38"  #s3  …    

Page 64: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

64

transformation personnalisée d’une BD en RDF

correspondances

schéma ISBN Author Title Release 006251587X auth45 Weaving the Web 2000-11-07

ID FullName url

auth45 Tim  Berners-­‐Lee     h-p://www.w3.org/People/Berners-­‐Lee/  

http://isbnplus.org/006251587X

Tim  Berners-­‐Lee    

h@p://www.w3.org/People/Berners-­‐Lee/  

Weaving  the  Web  

2000-­‐11-­‐07

dc:Ktle  

dc:date  

foaf:name  

dc:creator  

Page 65: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

65

transformation personnalisée d’une BD en RDF

:Author_Table rdf:type rr:TriplesMap ; rr:subjectMap [ rr:termtype "BlankNode" ; rr:column "ID" ; ] ; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate foaf:name ]; rr:objectMap [ rr:column "FullName" ] ] ; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate foaf:homepage ]; rr:objectMap [ rr:column "url" ; rr:termtype "IRI" ] ] .

correspondances

schéma ISBN Author Title Release 006251587X auth45 Weaving the Web 2000-11-07

ID FullName url

auth45 Tim  Berners-­‐Lee     h-p://www.w3.org/People/Berners-­‐Lee/  

http://isbnplus.org/006251587X

Tim  Berners-­‐Lee    

h@p://www.w3.org/People/Berners-­‐Lee/  

Weaving  the  Web  

2000-­‐11-­‐07

dc:Ktle  

dc:date  

foaf:name  

dc:creator  

Page 66: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

66

transformation personnalisée d’une BD en RDF

:Author_Table rdf:type rr:TriplesMap ; rr:subjectMap [ rr:termtype "BlankNode" ; rr:column "ID" ; ] ; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate foaf:name ]; rr:objectMap [ rr:column "FullName" ] ] ; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate foaf:homepage ]; rr:objectMap [ rr:column "url" ; rr:termtype "IRI" ] ] .

correspondances

schéma ISBN Author Title Release 006251587X auth45 Weaving the Web 2000-11-07

ID FullName url

auth45 Tim  Berners-­‐Lee     h-p://www.w3.org/People/Berners-­‐Lee/  

http://isbnplus.org/006251587X

Tim  Berners-­‐Lee    

h@p://www.w3.org/People/Berners-­‐Lee/  

Weaving  the  Web  

2000-­‐11-­‐07

dc:Ktle  

dc:date  

foaf:name  

dc:creator  

Page 67: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

67

transformation personnalisée d’une BD en RDF

:Author_Table rdf:type rr:TriplesMap ; rr:subjectMap [ rr:termtype "BlankNode" ; rr:column "ID" ; ] ; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate foaf:name ]; rr:objectMap [ rr:column "FullName" ] ] ; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate foaf:homepage ]; rr:objectMap [ rr:column "url" ; rr:termtype "IRI" ] ] .

correspondances

schéma ISBN Author Title Release 006251587X auth45 Weaving the Web 2000-11-07

ID FullName url

auth45 Tim  Berners-­‐Lee     h-p://www.w3.org/People/Berners-­‐Lee/  

http://isbnplus.org/006251587X

Tim  Berners-­‐Lee    

h@p://www.w3.org/People/Berners-­‐Lee/  

Weaving  the  Web  

2000-­‐11-­‐07

dc:Ktle  

dc:date  

foaf:name  

dc:creator  

Page 68: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

68

transformation personnalisée d’une BD en RDF

:Author_Table rdf:type rr:TriplesMap ; rr:subjectMap [ rr:termtype "BlankNode" ; rr:column "ID" ; ] ; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate foaf:name ]; rr:objectMap [ rr:column "FullName" ] ] ; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate foaf:homepage ]; rr:objectMap [ rr:column "url" ; rr:termtype "IRI" ] ] .

correspondances

schéma ISBN Author Title Release 006251587X auth45 Weaving the Web 2000-11-07

ID FullName url

auth45 Tim  Berners-­‐Lee     h-p://www.w3.org/People/Berners-­‐Lee/  

http://isbnplus.org/006251587X

Tim  Berners-­‐Lee    

h@p://www.w3.org/People/Berners-­‐Lee/  

Weaving  the  Web  

2000-­‐11-­‐07

dc:Ktle  

dc:date  

foaf:name  

dc:creator  

Page 69: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

69

transformation personnalisée d’une BD en RDF

correspondances

schéma ISBN Author Title Release 006251587X auth45 Weaving the Web 2000-11-07

ID FullName url

auth45 Tim  Berners-­‐Lee     h-p://www.w3.org/People/Berners-­‐Lee/  

http://isbnplus.org/006251587X

Tim  Berners-­‐Lee    

h@p://www.w3.org/People/Berners-­‐Lee/  

Weaving  the  Web  

2000-­‐11-­‐07

dc:Ktle  

dc:date  

foaf:name  

dc:creator  

:Book_Table rdf:type rr:TriplesMap ; rr:subjectMap [ rr:template "http://isbnplus.org/{ISBN}"; ]; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate dc:title ]; rr:objectMap [ rr:column "Title" ] ] ; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate dc:date ]; rr:objectMap [ rr:column "Release" ; ] ] ; …

Page 70: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

70

transformation personnalisée d’une BD en RDF

correspondances

schéma ISBN Author Title Release 006251587X auth45 Weaving the Web 2000-11-07

ID FullName url

auth45 Tim  Berners-­‐Lee     h-p://www.w3.org/People/Berners-­‐Lee/  

http://isbnplus.org/006251587X

Tim  Berners-­‐Lee    

h@p://www.w3.org/People/Berners-­‐Lee/  

Weaving  the  Web  

2000-­‐11-­‐07

dc:Ktle  

dc:date  

foaf:name  

dc:creator  

:Book_Table rdf:type rr:TriplesMap ; rr:subjectMap [ rr:template "http://isbnplus.org/{ISBN}"; ]; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate dc:title ]; rr:objectMap [ rr:column "Title" ] ] ; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate dc:date ]; rr:objectMap [ rr:column "Release" ; ] ] ; …

Page 71: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

71

transformation personnalisée d’une BD en RDF

correspondances

schéma ISBN Author Title Release 006251587X auth45 Weaving the Web 2000-11-07

ID FullName url

auth45 Tim  Berners-­‐Lee     h-p://www.w3.org/People/Berners-­‐Lee/  

http://isbnplus.org/006251587X

Tim  Berners-­‐Lee    

h@p://www.w3.org/People/Berners-­‐Lee/  

Weaving  the  Web  

2000-­‐11-­‐07

dc:Ktle  

dc:date  

foaf:name  

dc:creator  

:Book_Table rdf:type rr:TriplesMap ; rr:subjectMap [ rr:template "http://isbnplus.org/{ISBN}"; ]; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate dc:title ]; rr:objectMap [ rr:column "Title" ] ] ; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate dc:date ]; rr:objectMap [ rr:column "Release" ; ] ] ; …

Page 72: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

72

transformation personnalisée d’une BD en RDF

correspondances

schéma ISBN Author Title Release 006251587X auth45 Weaving the Web 2000-11-07

ID FullName url

auth45 Tim  Berners-­‐Lee     h-p://www.w3.org/People/Berners-­‐Lee/  

http://isbnplus.org/006251587X

Tim  Berners-­‐Lee    

h@p://www.w3.org/People/Berners-­‐Lee/  

Weaving  the  Web  

2000-­‐11-­‐07

dc:Ktle  

dc:date  

foaf:name  

dc:creator  

:Book_Table rdf:type rr:TriplesMap ; rr:subjectMap [ rr:template "http://isbnplus.org/{ISBN}"; ]; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate dc:title ]; rr:objectMap [ rr:column "Title" ] ] ; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate dc:date ]; rr:objectMap [ rr:column "Release" ; ] ] ; …

Page 73: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

73

transformation personnalisée d’une BD en RDF

correspondances

schéma ISBN Author Title Release 006251587X auth45 Weaving the Web 2000-11-07

ID FullName url

auth45 Tim  Berners-­‐Lee     h-p://www.w3.org/People/Berners-­‐Lee/  

http://isbnplus.org/006251587X

Tim  Berners-­‐Lee    

h@p://www.w3.org/People/Berners-­‐Lee/  

Weaving  the  Web  

2000-­‐11-­‐07

dc:Ktle  

dc:date  

foaf:name  

dc:creator  

:Book_Table rdf:type rr:TriplesMap ; … rr:refPredicateObjectMap [ rr:refPredicateMap [ rr:predicate dc:creator ]; rr:refObjectMap [ rr:parentTriplesMap :Author_Table ; rr:joinCondition "{child}.Author= {parent}.ID" ] ].

Page 74: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

74

SEMAINE 07 : vers plus d’intégration de données

1.  VoID pour les bases RDF

2.  DCAT pour les jeux de données

3.  PROVenance et traçabilité

4.  RDF dans les pages HTML

5.  Liens avec les bases de données

6.  LDP, RIF, etc.

Page 75: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

75

d’autres moyens d’accès SPARQL, HTTP,… Linked Data Platform (LDP), …

LDP +

Page 76: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

76

Plateforme des données liées (accès RESTful) accès HTTP complet aux données: consulter, ajouter, modifier, effacer.

GET /people/fab HTTP/1.1 Host: data.inria.fr ?

Page 77: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

77

Plateforme des données liées (accès RESTful) accès HTTP complet aux données: consulter, ajouter, modifier, effacer.

PUT http://data.inria.fr/people/fab HTTP/1.1 Host: data.inria.fr

Content-Type: text/turtle

<fab> a foaf:Person ;

rdfs:label "Fabien" ;

foaf:mbox <[email protected]> .

!

Page 78: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

78

Rule Interchange Format (RIF) spécifier et échanger des règles de raisonnement sur le Web

Page 79: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

79

RIF a aussi des fragments / profils

RIF CORE

RIF BLD

RIF PRD

Page 80: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

RIF Core: ajout uniquement sous ensemble le plus commun

employee1 [function-> “executive”

bonus -> 10 ]

Page 81: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

RIF Core: ajout uniquement sous ensemble le plus commun

employee1 [function-> “executive”

bonus -> 10 ]

<employee1> :function "executive" ; :bonus "10" .

FRAMES RIF

TRIPLETS RDF

Page 82: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

RIF Core: ajout uniquement sous ensemble le plus commun

employee1 [function-> “executive”

bonus -> 10 ]

ForAll ?emp (?emp [ bonus -> 15 ] :- ?emp [ function -> “executive” ] )

Page 83: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

RIF Core: ajout uniquement sous ensemble le plus commun

employee1 [function-> “executive”

bonus -> 10 ]

ForAll ?emp (?emp [ bonus -> 15 ] :- ?emp [ function -> “executive” ] )

employee1 [function -> “executive”

bonus -> 10

bonus -> 15 ]

Page 84: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

84

RIF CORE clauses de Horn monotones sur des frames conclusion :- hyp1 and hyp2 and hyp3 …

1.  frames & listes au lieu des triplets

2.  IRI pour constantes

3.  tester l’existence

4.  tester appartenance à une classe

5.  tester l’égalité

CORE

Page 85: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

85

RIF BLD (Basic Logic Dialect) toujours monotone, pas de changements concl1 & concl2 &… :- hyp1 and hyp2 and hyp3 …

1. conjonction en conclusion

2. fonctions, prédicats et arguments nommés

3. disjonction en condition (OU / OR)

4. égalité en conclusion

5. sous-classes

CORE BLD

Page 86: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

86

RIF PRD (Production Rules Dialect) règles de production complètes en chaînage avant Modify(…) :- hyp1 and hyp2 and hyp3 …

1.  ajouter, effacer, modifier, exécuter

2.  instancier des frames

3.  négation par l’échec

Pas monotone

CORE BLD PRD

Page 87: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

87

Standards RIF et Standards Web Sémantique

Pour aller plus loin: document RIF SWC, syntaxe et sémantique pour combiner RIF + RDF + RDFS + OWL (RL)

Page 88: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

88

Standards RIF et Standards Web Sémantique

Pour aller plus loin: document RIF SWC, syntaxe et sémantique pour combiner RIF + RDF + RDFS + OWL (RL)

? ? ? ! ! ! ? ? ? ! ! !

? ? ? ! ! ! … &

Page 89: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

89

ex. chaînage avant

Tirer récursivement toutes les conclusions des faits connus et inférés

? ? ? ! ! ! ? ? ? ! ! !

? ? ? ! ! ! …

Page 90: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

90

exemple de règle

« si un membre d’une équipe est intéressé par un sujet alors l’équipe est aussi intéressée par ce sujet »

?person :interestedBy ?topic ?person :member ?team → ?team :interestedBy ?topic

Page 91: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

91

CONCLUSION

nous avons vu :

•  les données liées : LD, RDF, SPARQL

•  les schémas liés : RDFS, OWL, SKOS, DC, FoaF

•  les standards liés

Page 92: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

92

URL,  URI,  IRI    

RDF    

HTTP,  SPARQL,  LDP    

RDFS  &  OWL    

PROV-­‐O  

LES  FINS  ET  LES  MOYENS  

idenGfier    

décrire  et  lier    

interroger    

raisonner    

tracer      

Page 93: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

93

h-p://fabien.fr#me    

#me  type  man    

select  *  {?r  type  ?t}    

man  subClassOf  male    

wasA-ributedTo  #me  

LES  FINS  ET  LES  MOYENS  

idenGfier    

décrire  et  lier    

interroger    

raisonner    

tracer      

Page 94: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

94

vue trois-tiers

RDFa,  GRDDL…    

Page 95: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

95

vue trois-tiers

RDFa,  GRDDL…        LDP,  HTTP,  JSON-­‐LD…    

Page 96: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

96

vue trois-tiers

RDFa,  GRDDL…        LDP,  HTTP,  JSON-­‐LD…        R2RML,  SPARQL,  RDF…  

Page 97: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

97

beaucoup d’outils

h@p://www.w3.org/2001/sw/wiki/Tools  

Page 98: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

98

Web 1.0, 2.0, 3.0…

Page 99: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

99

price  

convert?  

person  

contact?  

other  sellers?  

Web 1.0, 2.0, 3.0…

Page 100: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

100

un et un seul web un espace unique dans tous les sens du terme:

données

personnes documents

programmes

métadonnées

Page 101: SEMAINE 07 : vers plus d’intégration de données...1 SEMAINE 07 : vers plus d’intégration de données 1. VoID pour les bases RDF 2. DCAT pour les jeux de données 3. PROVenance

101

celui qui contrôle les métadonnées contrôle le web et à travers le world-wide web une part grandissante de notre monde

fabien, gandon, @fabien_gandon, http://fabien.info